腾讯研究院AI速递 20260129
腾讯研究院·2026-01-29 00:03

生成式AI产品与模型发布 - OpenAI推出由GPT-5.2驱动的新一代云端LaTeX工作区Prism,整合了起草、修改、协作和出版功能,支持智能文献搜索、草图转LaTeX、语音编辑,并允许无限协作者共同写作,对所有ChatGPT用户免费开放 [1] - Google在全球正式上线AI Plus低价计划,定价为每月7.99美元,首两个月享五折优惠,套餐包含Gemini 3 Pro、Flow视频创作、NotebookLM研究辅助、200GB云存储,并支持最多6人家庭共享 [2] - 腾讯混元图像3.0图生图模型正式开源,该模型基于80B参数混合专家架构,在LMArena图片编辑榜单位列全球第七,支持增删改、风格变换、老照片修复、多图融合等多样化编辑能力 [4] - 昆仑天工发布Mureka V8音乐大模型,基于MusiCoT技术实现音乐性、编曲完成度、人声表达全面提升,在中文歌曲生成主观评分中超越Suno,已与太合音乐集团达成战略合作,平台已为全球8000多家客户提供服务 [5][6] - Vidu发布Q2参考生Pro模型,全球首创支持特效、表情、纹理、动作、人物、场景六大参考类型的“万物可参考”能力,实现视频精细化编辑,支持任意元素增删改替换和风格切换 [7] - 蚂蚁灵波开源发布其第一款具身智能基座模型LingBot-VLA,该模型基于约20000小时覆盖9种双臂机器人构型的真实数据训练,在GM-100基准测试中整体超越Pi0.5,并采用Mixture-of-Transformers架构 [8] 行业竞争与战略动向 - Google推出AI Plus计划被视为对OpenAI ChatGPT Go的直接回应,现有Google One Premium 2TB用户将自动获得全部AI Plus权益 [2] - 爆火开源项目Clawdbot因收到Anthropic律师函指控商标侵权,被迫更名为Moltbot,更名过程中GitHub故障导致旧ID在10秒内被加密货币骗子抢注 [3] - OpenAI认为2025年AI改变了软件开发,并预测2026年科学领域将迎来同样变革,Prism是通向AI加速科研发现的先行者 [1] - 昆仑天工计划每年迭代2-3个版本,目标成为全球AI音乐领域第一平台 [6] 技术进展与性能表现 - OpenAI副总裁凯文·韦尔表示GPT-5的推理能力已跻身人类前沿,在GPQA博士级测试中得分率达92%,远超GPT-4的39% [12] - 蚂蚁灵波的研究首次揭示VLA模型在真实机器人数据上的Scaling Law,数据从3000小时扩展至20000小时后性能持续提升且未饱和 [8] - 腾讯混元图像3.0的训练过程构建了千万量级图生图数据覆盖80多个任务,并采用自研MixGRPO算法对齐用户偏好 [4] 领导层观点与行业预测 - OpenAI CEO奥特曼在开发者座谈会上承认GPT-5.2为专注推理和编码牺牲了写作能力,表示“我们搞砸了”,后续版本会补上 [10] - 奥特曼预测到2027年底GPT-5.2级别智能成本至少降低100倍,未来每个人的App都将是个性化定制版本 [10] - 奥特曼认为AI时代最重要的技能是高能动性、善于产生想法和适应变化,工程师定义会变但需求不会少 [10] - OpenAI副总裁凯文·韦尔认为大语言模型最大价值是发现跨学科关联和被遗忘的研究成果,正探索让模型具备“认知谦逊”和自我事实核查能力 [12] - 韦尔预测2026年将成为AI赋能科研的关键年,一年后未深度使用AI工具的科研人员将错失提升效率的机会 [12] 前沿科技与教育发展 - 中国科学院大学星际航行学院正式揭牌成立,由朱俊强院士任院长,将构建涵盖14个一级学科的课程体系,并新增22门核心课程,涵盖星际动力与推进、行星动力学、星际社会学与治理等前沿方向 [9] - 学院将新建6个特色教学实践平台,定位为抢占科技制高点的关键举措,将为国家深空探测、空间科学研究等重大战略需求提供人才支撑 [9]