Workflow
腾讯研究院
icon
搜索文档
中国公众对生成式AI的看法与使用行为|年度调研
腾讯研究院· 2025-09-24 15:03
腾讯研究院在2025年9月的最新调研发现,生成式人工智能在中国受访成年人中已近乎全面普及,并从根本上融入了他们的日常工作和学习。 而在这种广泛参与背后,是一种相对复杂,且充满张力的心态: 人们既对技术造就的社会进步抱有很高的期望,又对就业前景、信息环境的真实性以及社 会公平等问题,表现出深层焦虑。 公众普遍将AI视为一种强大的生产力工具,大多数人使用它来完成文本生成、信息检索和内容优化等任务。虽然多数人对于为这些服务付费持开放态度,显 示出市场潜力,但他们对价格仍然敏感,百元人民币以下的月度订阅是主流选择。 对于未来,公众普遍持有一种审慎的乐观态度。尽管绝大多数人相信AI对社会的总体影响将是积极的,但他们也清醒地认识到其潜在的负面后果,特别是就 业市场的结构性冲击、虚假信息的泛滥以及个人隐私等风险。 腾讯研究院这项针对3570名成年人的调查,探讨了中国公众对生成式AI的认知、态度以及使用方式。以 下是本报告的主要发现: 公众的AI参与: 广泛、高频,以 实用为导向 本次大规模调研的首要发现,是生成式AI在调研对象中 惊人的渗透率。 96.2%的调研对象表示他们曾使用过AIGC产品或功能。这一数据表明,AIGC ...
腾讯研究院AI速递 20250924
腾讯研究院· 2025-09-24 00:01
英伟达与OpenAI战略合作 - 英伟达宣布与OpenAI建立战略合作关系,OpenAI将部署高达10吉瓦的英伟达系统,相当于400-500万块GPU算力 [1] - 英伟达计划在系统部署期间向OpenAI累计投资高达1000亿美元,首阶段系统将于2026年下半年基于英伟达Vera Rubin平台投入运营 [1] - 双方将共同优化模型及基础设施软件、硬件的技术路线图,以推动OpenAI实现通用人工智能使命,消息公布后英伟达股价上涨近4% [1] 无问芯穹基础设施智能体蜂群 - 无问芯穹发布基础设施智能体蜂群,通过多智能体协同架构覆盖模型筛选、资源运营、排障和集群运维等多个模块,实现基础设施全生命周期智能管理 [2] - 该解决方案彻底改变传统IaaS→PaaS→MaaS→Agent应用间层层堆叠的生产模式,以智能体为自治核心构建高度协同系统,显著提升资源利用率和运维效率 [2] - 通过与捏TA和Soul等客户合作,成功将迭代速度提升5倍,实现了运维能力百倍拓展,推动"AI基础设施范式"向"Agentic Infra"的转变 [2] 阿里开源多模态模型Qwen3-Omni - 阿里通义开源原生全模态大模型Qwen3-Omni,能无缝处理文本、图像、音频和视频输入,支持实时流式响应并同时生成文本与语音输出 [3] - 该模型在36项音频及音视频基准测试中获得32项开源SOTA与22项总体SOTA,超越Gemini-2.5-Pro等闭源强模型,支持119种文本语言、19种语音理解语言和10种语音生成语言 [3] - 阿里同步开源Qwen3-TTS-Flash语音合成模型和Qwen-Image-Edit-2509图像编辑模型,前者支持17种音色、10种语言和多种方言,后者新增多图编辑和单图一致性增强功能 [3] Kimi Agent会员服务 - Kimi推出Agent会员服务,之前打赏的金额在首次订阅Agent会员后可全额返还为会员时间 [4] - 会员服务采用音乐节拍命名:免费版为Adagio(慢板),付费版有49元的Andante(行板)和99元的Moderato(中速),海外还有199美元的Vivace [4] - 付费和免费用户主要区别在于Agent使用次数,中高档订阅会送等额API兑换券,高等级会员支持深度研究并发和高峰时段优先访问 [4] 清华大学MiniCPM-V 4.5模型 - 清华大学自然语言处理实验室和面壁智能发布MiniCPM-V 4.5技术报告,该模型以8B参数规模超越GPT-4o-latest和Qwen2.5-VL-72B等大型模型 [5] - 模型采用三大创新技术:统一3D-Resampler架构实现高密度视频压缩、面向文档的统一OCR知识学习范式、可控混合快速/深度思考的多模态强化学习 [6] - MiniCPM-V 4.5在OpenCompass综合评测中取得77.0的平均分,推理效率极高,在VideoMME上时间开销仅为同级模型的1/10,已在HuggingFace和ModelScope两大平台累计下载超22万次 [6] ima新版本功能升级 - ima推出最新版本,正式上线鸿蒙电脑版,至此实现鸿蒙系统手机、平板和电脑三端全覆盖,用户可在多设备间实现协同工作 [7] - AI播客生成功能全面升级,采用分段生成技术支持"边生成边播放",大幅减少等待时间,提升用户体验 [7] - 新版本的界面设计与之前版本略有不同,优化了整体使用流程,保留了核心功能特性 [7] 智元机器人GO-1开源模型 - 智元机器人开源通用具身基座大模型GO-1,采用全球首个Vision-Language-Latent-Action (ViLLA)架构,该架构通过引入隐式动作标记成功弥合图像-文本输入与机器人执行动作间的语义鸿沟 [8] - 模型采用三层协同设计:基于InternVL-2B构建的多模态理解层、隐式规划器和基于扩散模型的动作专家,虽仅基于AgiBot G1数据预训练,但已在松灵机器人、方舟机器人等不同本体和多种仿真环境中完成验证 [8] - 智元机器人同时推出Genie Studio一站式开发平台,为开发者提供全栈解决方案,包括数据采集、管理、模型训练、微调、评测与部署,同时支持LeRobot通用数据格式以适配其他机器人平台 [8] Transformer到GPT-5的技术演进 - Transformer八人小组成员Lukasz Kaiser在OpenAI从事GPT-5和"o1"、"o3"推理模型研发,是唯一一位未创业继续坚守技术前线的"Transformer八子" [9] - Kaiser早在2017年提出了"One Model To Learn Them All"概念,预见到大模型跨领域学习的潜力,并预言AI的下一阶段关键在于教会模型"思考" [9] - 据Kaiser预测,未来AI计算力将从大规模预训练转向在少量高质量特定数据上进行海量推理计算,更接近人类智慧模式,预示着又一次范式转移 [9] 心理学增强AI智能体技术 - 一篇名为《心理学增强AI智能体》的论文提出"MBTI-in-Thoughts"技术,只需在提示词开头加上"请用INTJ的视角回答"等简单指令,就能显著提升模型表现 [10] - 研究发现不同MBTI人格的AI在处理同一任务时表现差异明显:F型(情感型)更擅长写故事、煽情,E型(外向型)在幽默感和可读性上更强,T型(思考型)在策略游戏中更理性冷静 [10] - 这种方法本质是对人格概念的"终极压缩",让AI瞬间解压人类思维模式、行为逻辑、语言风格的统计总和,可用于组建互补性格的"AI团队"以应对不同任务需求 [11]
游戏经济,正在兴起
腾讯研究院· 2025-09-23 16:43
文章核心观点 - 游戏经济是文化经济与数字经济融合发展的新型经济形态,具有三重涟漪效应和四大核心特性,对文化产业和外部产业具有广泛赋能价值 [6][7][8][9][11][19] 游戏经济的概念与定位 - 游戏经济定义为以游戏产业为核心,融合软硬件技术研发、IP内容制作与用户服务,实现文化资源转化与跨界应用的新型经济形态 [8][9] - 游戏是文化产业最具创新活力的组成部分,既是数字文化新生态的基石,也是数字经济的发动机和数字文明的变革先锋队 [7] - 游戏经济具有双重引擎作用:一方面助力文化经济持续增长(文化经济化与经济文化化),另一方面驱动数字经济快速发展(数实融合新标杆) [8][9] 游戏经济的三重涟漪效应 核心经济层(游戏及关联产业) - 2024年国产游戏全球销售额超过4500亿元,参照国际硬件销售额为软件1倍以上的经验,中国游戏核心产业经济规模已近万亿元 [11] - 游戏产业链覆盖上游云服务与引擎技术、中游研发发行与平台运营、下游IP授权与衍生品开发,就业宽口径人数达274.3万人(2020年) [11][12] - 电竞显示器2025年一季度出货量258万台(同比增长56%),4K高端产品增速达71.5%;电竞消费参与度86.2%(2024年) [13] - 杭州亚运会电竞赛事吸引3.5亿人观看,产生经济效益2.6亿元,间接带动旅游关联产业1.82亿元 [13] 文化产业驱动层 - 全球最具价值132个IP中游戏原始IP占比15.9%,影游融合作品如《超级马力欧兄弟大电影》《我的世界》电影全球票房超23亿美元 [14] - 游戏音乐2024年产值达3.69亿元(同比增长21.78%),远超音乐市场大盘增速 [14] - 《黑神话:悟空》带动山西省2024年国内游客接待量同比增长27.24%(约为全国平均水平2倍) [14] 外部产业辐射层 - 全国网吧、电竞馆和电竞酒店等场所总量达10.36万家,营收规模约900亿元(2024年) [15] - 游戏技术(图形交互、虚拟现实、数字引擎等)广泛应用于影视制作、工业可视化、建筑信息模型等领域 [15] - 游戏化思维催生数字疗法产品(如《腾讯脑力锻炼》《专数达》),部分已获批国内医疗器械证并投入临床使用 [15] 游戏经济的四大特性 文化表现力 - 游戏用户超6亿人,青年与中年群体为消费主力,2024年1-9月文娱领域头部市场超70%收入由精品游戏贡献 [20] - 81.6%受访者认游戏融合传统文化优化体验,84.2%肯定文化元素吸引力,游戏促进全球文化生态融合与创新 [21] 科技创新力 - 62%受访者认可游戏科技对国家技术创新的作用,81%认同游戏促进AI技术发展 [22] - 游戏引擎成为跨领域"技术公地",游戏是AI天然试验场,为智能体训练与生成式AI落地提供支持 [22] - 游戏科技驱动虚拟与现实空间深度融合,构建技术驱动的动态互构网络 [23] 产业连接力 - 小游戏市场2021-2024年复合增长率达182.3%,呈现爆发式增长 [24] - 游戏与文旅融合通过IP实景化、文化数字化、技术赋能体验及游戏化运营四种模式实现 [25] 消费持续力 - Roblox 2024年向开发者支付9.2亿美元(约66亿人民币)分成 [26] - 2025年ChinaJoy吸引超40万人次观展,带动周边服务消费约6.61亿元 [27] - 多元商业模式互补:买断制(3A游戏)、服务型游戏(GaaS模式)、游戏内广告(IAA模式)及功能游戏 [27] 发展路径建议 - 建立健全游戏经济研究与测算体系,包括统计标准、全产业链监测、就业统计和乘数效应研究 [30] - 发挥游戏对文化产业和数字经济的带动作用,建立跨行业合作平台、培养复合型人才、加大软硬件领域投资 [31] - 释放游戏经济外溢效应,鼓励教育、医疗、工业等跨界融合,给予税收优惠和政策扶持,设立专项技术研发基金 [33]
腾讯研究院AI速递 20250923
腾讯研究院· 2025-09-23 00:01
联发科天玑9500芯片发布 - 采用第三代3nm工艺和全大核架构 集成超300亿晶体管 NPU性能比上代提升111% 功耗降低56% [1] - 采用超性能+超能效双NPU架构 首次引入存算一体设计和BitNet 1.58 bit量化推理框架 支持端侧模型训练 [1] - 支持128K长文本处理 4K画质图像生成 vivo和OPPO等厂商旗舰新机将搭载该芯片 [1] OpenAI计算资源投入与新产品 - 已投入160亿美元租用计算资源 计划在2024-2030年间投入3500亿美元租赁服务器 2030年单年预计花费1000亿美元 [2] - 与甲骨文签署5年3000亿美元算力合同 额外追加1000亿美元用于备用服务器 [2] - 预告未来几周推出计算密集型新产品 Pro用户需额外付费 [2] 谷歌开源Deep Research新范式 - 突破传统Agent"规划-检索-生成"模式 提出新的研究框架 采用"扩散式降噪"过程 [3] - 让Agent基于草稿发现信息缺口 从外部搜寻证据 反复优化研究内容 [3] - 引入多版本智能自我批判和报告级降噪技术 在GAIA等任务上全面优于OpenAI DeepResearch [3] DeepSeek发布V3.1终极版本 - 发布DeepSeek-V3.1的终极(Terminus)版本 针对用户反馈进行改进 [4] - 缓解中英文混杂 偶发异常字符等语言一致性问题 优化Code Agent与Search Agent表现 [5] - 在官方App 网页端 小程序与DeepSeek API模型同步上线 开源版本可在Hugging Face和ModelScope平台下载 [5] 可灵AI 2.5视频模型突破 - 在运动能力和表情表演方面实现重大突破 准确表现人物微表情变化与复杂情绪 维持角色一致性 [6] - 完美衔接下落 奔跑 骑摩托等连续动作 保持环境交互真实感细节 理解复杂因果关系 [6] - 在动作戏上表现极佳 生成高质量跑酷 跨越 战斗和爆炸场景 已对超级创作者灰度内测 [6] 美团高效推理模型发布 - 发布高效推理模型LongCat-Flash-Thinking 在逻辑 数学 代码和智能体等多领域达到全球开源模型最先进水平 [7] - 首创领域并行强化学习训练方法 采用异步弹性共卡系统实现三倍提速 设计双路径推理框架提升智能体能力 [7] - 在推理基准测试上全面领先开源模型 在AIME和LiveCodeBench等测试中与GPT-5等顶级闭源模型表现相当 [7] 百度开源视觉理解模型 - 发布视觉理解模型Qianfan-VL并全面开源 提供3B 8B和70B三种规格 支持OCR识别和教育垂类等场景 [8] - 基于开源模型开发 在自研昆仑芯P800上完成全流程计算 支持单任务5000卡规模并行计算 [8] - 具备思维链能力 OCR全场景识别和复杂版面文档理解能力 在多项基准测试中表现优异 [8] 亚太区科技创新人才评选 - 公布2025年度"35岁以下科技创新35人"亚太区入选名单 35位创新者来自AI 机器人 材料等领域 [10] - 夏斐 閔世媛等多位入选者在人工智能领域取得突破 包括具身智能 非参数大语言模型等方向 [10] - 中国入选者最多 截至2024年共完成11届评选 中国共82人入选 领先新加坡76人 [10] 图像生成模型发展趋势 - 图像模型未来会从创意工具转变为信息查询工具 最大挑战是把LLM的"世界知识"融入图像模型 [11] - 现有图像模型质量"上限"已接近顶点 但"下限"仍有巨大提升空间 未来将专注于提高"模型可表达性" [11] - 未来交互界面将整合文本 图像 语音等多种模态 AI模型与传统工具将长期共存 [11]
邱泽奇:所谓“智能鸿沟”,可能源于我们的自大
腾讯研究院· 2025-09-22 16:48
AI对人类认知的影响 - AI使用是否降智并非非黑即白问题 这种提问方式类似工业时代的低效质疑[3] - 人类思维具有跳跃性和相变性 目前脑科学尚未合理解释这些现象[3][8] - AI学习基于人类知识库 类似阅读图书但缺乏视觉感知和情感识别能力[3][7] - 人工智能存在讨好使用者的缺陷 需通过多角度挑战促使其迭代优化[3][15] - 私域AI陪伴市场潜力巨大 包括AI社交陪伴应用/玩具/宠物等方向[4][14] AI的知识局限性 - 大模型无法获取未授权学术资源 例如2016-2018年全球1万种科学期刊发表的超过30万篇论文[7] - AI主要减少高级知识分子与大众的知识差异 但远未覆盖人类知识整体[7] - 机器学习依赖海量语料 但人类难以判断其背景价值观的潜在问题[3][12] - 符号主义路径代表Alpha Zero在限定场景有效 但泛化能力仍不足[9] 人机交互模式 - 主动质疑AI输出可促进思维锻炼 形成人机互生的良性循环[10][11] - 需区分AI的事实性归纳与价值观输出 对后者需保持持续警惕[12] - 不同AI模型存在显著差异 建议通过多品牌比较选择性使用[3][15] - 交互过程类似阅读百科全书 但需结合东方伦理认知与西方事物认知的双重传统[7] 教育体系变革 - 基础能力培养更为关键 包括语言能力/逻辑能力/认知能力[13][14] - 教育重点应从知识传授转向认知提升 大学课堂应减少知识性内容[14] - 鼓励学生使用AI探讨知识性与探索性问题 教师角色转向引导讨论[14] - IQ测量模式可能过时 EQ对成功贡献更大 智能评估需摆脱固定模式[11] 智能平权与多样性 - AI既带来知识平权 也可能扩大使用群体间的能力差距[16] - 数字鸿沟本质是高位视角的观察偏差 应尊重个体生活方式的多样性[5][16] - 人类生命约3万天 幸福感获取方式存在显著个体差异[5][16] - 需允许不同智能应用层次共存 避免单一标准衡量智能价值[16]
腾讯研究院AI速递 20250922
腾讯研究院· 2025-09-22 00:01
浏览器与生产力工具AI升级 - Chrome进行2008年以来最大更新 集成Gemini AI助手到浏览器右上角 支持跨标签页对话和内容总结 [1] - 地址栏升级为"Omnibox全能框" 可智能推荐问题并直接开启AI模式进行复杂查询 [1] - 利用Gemini Nano增强安全保护 识别有害网站 自动管理垃圾通知 一键修复泄露密码 已向美国用户开放 [1] - Notion发布3.0版本 引入Agent功能 可自主执行所有Notion操作 为时隔7年重大更新 [2] - Agent能自主工作长达20分钟 跨工具完成复杂任务 如整合客户反馈 更新知识库 生成入职计划 [2] - 新版本引入个性化"记忆库" 即将推出"自定义Agent"支持自动运行和团队共享 创建专属AI团队成员 [2] 3D设计与视频生成技术突破 - 腾讯发布混元3D Studio 整合3D资产生产全流程 将生产周期从天级缩短到分钟级 [3] - 工作台提供概念设计 几何建模 组件拆分 低模拓扑 贴图 绑骨蒙皮 动画等全方位3D创作管线 [3] - 平台搭载混元3D 3.0模型 具备分割生成 UV展开 材质编辑等创新功能 已集成于混元3D AI创作引擎 [3] - 阿里云开源通义万相动作生成模型Wan2.2-Animate 支持驱动人物 动漫形象和动物照片 [4] - 模型提供角色模仿和角色扮演两种模式 人物一致性和生成质量大幅提升 [4] - 通过骨骼信号 隐式特征和光照融合LoRA技术 在主观评测中超越Runway Act-two等闭源模型 [4] - Luma AI发布Ray3全球首个推理视频模型 将AI视频从实验性生成推进到专业可用 [5] - Draft Mode仅用20秒生成预览 成本为最终渲染1/5 支持精细控制 允许涂鸦引导演员动作和镜头运动 [6] - 模型支持保真运动 物理模拟 复杂人群 光照交互和写实细节 原生支持10 12 16-bit HDR视频输出 [6] 音频与语音技术进展 - ElevenLabs推出Studio 3.0 将旁白 音乐 音效 字幕和视频编辑整合到一条时间线 [7] - 支持从10,000+AI声音中选择 自动生成专属配乐 文本提示生成音效 语音校正和隔离 一键多语言字幕 [7] - 工具适用于视频创作者 播客主 有声书作者和AI电影人 所有功能可通过API调用 [7] - 小米开源首个原生端到端语音模型Xiaomi-MiMo-Audio 参数规模70亿 预训练数据超1亿小时 [8] - 模型具备自然对话 音频字幕 长时间音频理解等多种能力 首次实现语音领域基于ICL的少样本泛化 [8] - 在MMSU MMAU等基准测试实现SOTA 可用于语音续写 语音编辑和音频理解 [8] 生物科技与AI交叉创新 - Retro Biosciences宣布年底启动实验药RTR242首次人体试验 可激活衰老细胞自噬系统 [9] - 公司使命是清理大脑中堆积变异蛋白和损伤分子 以延长人类10年健康寿命 [9] - 实验室中干细胞标记表达量提升50倍 公司计划募资10亿美元与Altos Labs竞争 [9] - Arc研究所和斯坦福大学团队利用Evo模型构建全球首个AI生成功能性噬菌体基因组 [10] - 所有功能性基因组携带67-392个新突变 部分基因组整合远缘噬菌体蛋白质并保持功能 [11] - 实验验证AI设计基因组能感染特定宿主菌株 展示AI协调复杂突变能力 [11] 开发工具与代码生成应用 - OpenAI公开Codex7种核心应用场景 包括代码理解 重构迁移 性能优化 提升测试覆盖率等 [12] - 技术团队用Codex快速理解陌生代码 批量修改多文件 优化性能瓶颈 生成单元测试 [12] - 公开6条最佳实践 包括用提问模式分析 迭代改进开发环境 构建详细提示等 [12]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-09-20 10:33
芯片与硬件 - 华为发布昇腾AI芯片计划[3] - Meta推出三款AI眼镜产品[4] - 魅族发布AI眼镜StarV Snap[3] - 宇树科技发布UnifoLM-WMA-0模型[3] 模型与技术进展 - OpenAI推出GPT-5-Codex模型[3] - xAI发布Grok 4 Fast模型[3] - DeepSeek-R1模型登上Nature封面[4] - 腾讯混元发布AI绘画微调功能[3] - 阿里推出通义DeepResearch[4] - 哔哩哔哩推出IndexTTS2音频技术[4] - UCLA开发光学生成图像技术[4] - Math公司推出AI高斯科技[4] 应用与产品创新 - Utopai推出AI原生影视应用[3] - MiniMax发布Music 1.5应用[3] - 腾讯发布混元3D 3.0应用[3] - 美团推出「懒人点餐」AI应用[3] - 小红书推出FireRedTTS-2应用[3] - Meta AI推出MobileLLM-R1应用[3] - Gemini应用登顶App Store[3] - 可灵发布新版数字人[3] - 阿尔巴尼亚任命AI部长[3] - 昆仑万维推出Agent Studio平台[3] - World Labs发布新成果Marble[3] - OpenAI推出企业应用市场[4] - Anthropic参与企业应用市场[4] - 腾讯推出智能体开发平台3.0[4] - ima支持音频文件处理[4] - YouTube推出AI创作工具[4] - OpenAI在编程竞赛中登顶[4] - 天工超级智能体推出AI Developer[4] - 德国癌症研究中心开发疾病预测AI[4] - Shopify推出生产级Agent[4] - DeepMind提出虚拟代理经济[5] 资本与行业动态 - Figure获得具身智能领域最高估值[4] - OpenAI与微软签署合作备忘录[4] - xAI裁减标注团队[4] - MiniMax面临侵权诉讼[4] 行业观点与趋势 - 红杉美国提出AI产业新格局观点[4] - DeepMind提出「科学API」概念[4] - Fastly提出「AI保姆」观点[4] - Anthropic发布AI经济指数[4] - OpenAI发布ChatGPT使用报告[4] - 腾讯汤道生提出智能化全球化观点[4] - 华为提出智能世界2035愿景[4]
探元计划及其共创项目入选世界互联网大会案例集——以数字技术赋能文化遗产高质量传承
腾讯研究院· 2025-09-19 15:48
世界互联网大会文化遗产数字化案例集发布 - 2025世界互联网大会文化遗产数字化论坛发布《世界互联网大会文化遗产数字化案例集(2025)》,从全球数百个申报项目中遴选出40项代表性案例[1] - "探元计划2024"成功入选案例集,其三个创新资助项目同步入选,包括龙门石窟微痕浅浮雕三维建模、长城遗产价值挖掘方案及云冈石窟缪子成像技术项目[1] 探元计划2024项目概况 - 项目由国家文物局科技教育司指导,中国文物信息咨询中心、腾讯SSV数字文化实验室、腾讯研究院及社会价值投资联盟联合发起[7] - 聚焦文博场景"防、保、研、管、用"共性需求,通过高精度三维扫描、人工智能大模型等技术实现壁画修复、丝织品复原等关键技术突破[7] - 构建跨域共享的文化数字化融合共创空间,探索"技术普惠+双价值导向"创新路径[7] 龙门石窟微痕浅浮雕数字化项目 - 龙门石窟研究院联合武汉大学在腾讯探元计划资助下,针对微痕特征提取难题开展技术研发[8] - 项目实现采集设备成本大幅降低及采集工作效率大幅提升,提升石窟寺保护利用水平[8] 长城遗产数字化保护方案 - 天津大学通过无人机低空航测获取超200万张高清图像及厘米级三维数据,解决山脊沙漠等区域采集难题[10] - 依托WebGIS搭建长城全线实景三维数据库,结合目标检测技术自动提取遗产空间特征,形成大尺度线性文化遗产数字化保护框架[10] 云冈石窟缪子成像技术应用 - 腾讯探元计划与云冈研究院、兰州大学共建项目,利用宇宙射线缪子强穿透性实现非侵入式三维密度成像[12] - 技术规避传统钻探对文物的破坏性,为大型文物内部结构探测提供新范式[12] 探元计划系统性创新路径 - 创新"场景方+技术方+平台方"共建模式,打破领域壁垒形成可持续跨界协作生态[14] - 攻克AI虚拟修复与高精度采集等核心技术,形成可复用标准化数字保护解决方案[15] - 项目成果惠及文化传播与公共教育,通过多终端提升可视化与国际传播力,带动数字文化科技企业发展[16]
硅谷大厂裁员背后的组织变革丨硅谷AI转型录NO.1
腾讯研究院· 2025-09-19 15:48
硅谷AI驱动的系统性变革 - 硅谷大公司正进行长期的、系统性的组织重构和裁员,这与AI的引入紧密相关,并非短期现象 [8] - 2024年全年科技行业裁员超过9万人,2025年至8月已裁员8万人,显示调整的剧烈程度 [9] - 公司调整组织架构的逻辑在于,顶尖AI人才能创造“百倍工程师”或“千倍工程师”的价值,为聘请此类人才可能需要裁撤100甚至1000个岗位 [10] - 企业业绩良好与裁员并存,管理层主要出于应对AI变革的压力进行调整,而非单纯因为业绩不佳 [10] AI时代的新工作范式与组织形态 - AI工具提升了沟通效率并使工作交付更标准化,降低了对人际沟通的依赖,使得一人可管理更大团队,推动组织走向扁平化 [12] - 企业人才结构呈现“杠铃形态”,中间管理层剧烈缩减,同时争抢顶尖核心人才 [10][12] - 许多初级岗位招聘困难,部分原因在于教育体系技能培训落后于AI时代需求,促使更多学生更早地选择创业或独立创造商业价值 [14] - 主流趋势是打破“前台、中台、后台”的部门划分,转向更“端到端”的小团队模式,团队为明确KPI负责 [27] AI Coding对创业与商业本质的影响 - 硅谷黑客马拉松文化发生根本转变,参与者普遍利用AI Coding独立实现想法,讨论焦点从技术实现转向如何获客和盈利 [16] - “差一个程序员”的时代已经结束,创业讨论的核心回归到如何赚钱、如何找到客户等商业本质问题 [16][17] - 开发人员的角色发生变化,被要求思考如何通过开发组件赋能业务人员,销售、产品、开发等角色的界限日益模糊 [18] - 出现要求开发人员参与销售并直接抽成的新薪酬体系,推动通才型角色发展 [18] 企业AI转型的挑战与合伙人制探索 - 大公司的AI转型仍处于早期阶段,更多关注生产力提升,而非组织颠覆性变革,推动阻力较大 [20][22] - 推动新业务的省力方式是新成立部门或公司,聚集对AI和业务感兴趣的人重新思考流程,避免既有利益格局阻碍 [20] - 合伙人制被认为是更适合AI时代的组织模式,其核心是让参与者自负盈亏,绩效与产出直接挂钩,激励追求十倍、百倍的生产力提升 [21] - “四大”会计师事务所等传统行业也开始将类似合伙人的激励下放给更多级别员工,推动全员更像合伙人 [21] - 大公司推动AI落地困难点在于:员工离客户和业务远,难以思考如何创造新营收;学习使用新工具需要消耗冗余时间,公司缺乏支撑 [23] AI时代的核心竞争力与未来趋势 - 人的主观能动性取代具体技能,成为AI时代最重要的核心竞争力,个人抱负越大,从AI获得的正向影响可能越大 [5][29][32] - 企业更回归本质,聚焦于制造和销售,大量其他功能或组织正被外包化和工具化 [5][28] - 未来招聘更看重候选人的主观能动性和把事情做成的欲望,而非特定技能 [29] - 未来三大趋势预测:公司将继续高薪聘请顶尖人才推动彻底改革;小团队独角兽公司将更普遍,“赚钱大于融资”理念成为主流;全球化将成为一个更核心的公司卖点 [32][33]
腾讯研究院AI速递 20250919
腾讯研究院· 2025-09-19 00:01
华为昇腾AI芯片路线图及产品发布 - 华为发布昇腾AI芯片4年5款产品路线图,包括2026年Q1推出的昇腾950PR、2026年Q4的昇腾950DT、2027年Q4的昇腾960和2028年Q4的昇腾970 [1] - 新芯片系列支持低精度数据格式,昇腾950PR在FP8/MXFP8/HiF8精度下算力达1PFLOPS,MXFP4下达2PFLOPS,采用自研HiBL 1.0内存 [1] - 华为推出全球最强算力超节点和集群,包括Atlas 950 SuperPoD支持8192张卡无收敛全互联,Atlas 960 SuperCluster算力规模可达百万卡 [1] OpenAI与谷歌Gemini在编程竞赛表现 - OpenAI在ICPC 2025编程竞赛中5小时内解决全部12个问题,成绩相当于人类排名第1位,使用GPT-5和一款实验性推理模型共同完成 [2] - 谷歌Gemini 2.5 Deep Think解决10个问题,总用时677分钟,达到金牌级表现,若与大学队伍对比排名第2 [2] - 两家公司模型均未针对ICPC进行专门训练,Gemini在半小时内解决了竞赛中无任何大学队伍解出的C题,展示出AI在复杂推理和编程问题上的突破性进展 [2] Meta智能眼镜产品发布 - Meta发布三款新智能眼镜,其中Meta Ray-Ban Display是首款带有彩色光波导HUD显示屏和Meta Neural Band肌电神经接口的AI眼镜,售价799美元 [2] - Ray-Ban Meta (Gen 2)作为小改款主力机型,电池续航翻倍,支持3K分辨率录制,新增Conversation Focus功能增强人声频率,售价379美元 [2] - Oakley Meta Vanguard针对运动人群,采用运动防风镜外形,中央广角摄机,9小时续航,支持与Strava和佳明设备整合,售价499美元 [2] DeepSeek-R1论文登上Nature封面 - DeepSeek-R1论文以封面文章登上Nature,证明大语言模型的推理能力可以通过纯强化学习提升,无需人工标注的推理过程 [3] - 研究团队提出"群体相对策略优化"(GRPO)算法,帮助模型演化出更多样化、复杂的推理行为,在21个主流基准测试上表现优异 [3] - Nature社论将DeepSeek-R1评为"第一个在经过同行评审后发表的主流LLM",认为这是朝着AI透明化迈出的可喜一步,有助于遏制AI行业的过度炒作 [3] 阿里开源深度研究Agent模型 - 阿里开源首个深度研究Agent模型:通义DeepResearch,拥有3B激活参数,性能对标基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent [4][5] - 该模型在HLE、BrowseComp、BrowseComp-ZH、GAIA等七大Agent评测集中表现优异,模型、框架和方案已在Github、Hugging Face和魔搭社区全面开源 [4][5] - 研究团队构建了合成数据驱动的完整训练链路,以Qwen3-30B-A3B模型为基础,设计了ReAct和基于自研IterResearch的Heavy两种推理模式,解决了"认知空间窒息"与"不可逆噪声污染"问题 [5] 天工超级智能体上线Vibe Coding Agent - 天工超级智能体(Skywork Super Agents)正式上线Vibe Coding Agent—AI Developer,帮助非专业开发人员通过自然语言交互快速构建、部署和管理全栈Web应用程序 [6] - AI Developer不仅能生成前端页面,还可与Supabase深度集成,实现数据库、用户鉴权、文件存储、实时更新和调用外部服务等后端功能 [6] - 该功能还提供Stripe支付和Resend邮箱服务集成,支持用户打造包含付款和邮件通知功能的应用,大大降低了全栈开发的门槛 [6] AI疾病预测工具Delphi-2M - 来自德国癌症研究中心等机构的研究团队开发出新型AI工具Delphi-2M,可预测个人罹患1000多种疾病的风险,有些疾病甚至可提前数十年预测 [7] - Delphi-2M基于改进的GPT架构构建,利用40万英国生物银行参与者数据训练,能够为个体提供长达20年的潜在疾病风险估计 [7] - 模型在大规模外部验证中表现稳定(AUC值0.67),有望增强个性化健康风险认知,为精准医疗提供依据,但研究团队强调该模型更适合作为现有诊断流程的补充工具而非替代方案 [7] AI虚拟代理经济研究 - Google DeepMind发布论文《虚拟代理经济》,认为自主AI代理正形成新经济层,以超越人类理解的速度和规模进行交易与协作 [8] - 默认发展路径会导致"高频协商"主宰经济,富人的AI代理在每次经济互动中都占优势,最终形成算法固化的数字鸿沟和阶级结构 [8] - 研究者提出构建"公平经济"的方案,包括平均分配"数字货币"和建立以"信任"为核心的数字基础设施,强调重构社会运行机制,使AI经济服务于人类长远福祉 [8]