腾讯混元
搜索文档
腾讯研究院AI速递 20260608
腾讯研究院· 2026-06-08 00:03
OpenAI与Anthropic的人才与技术动态 - OpenAI自研芯片项目核心成员Clive Chan离职并加入竞争对手Anthropic,他曾是OpenAI硬件团队的第二位员工,亲历自研芯片项目全程,看好其成为AGI重要引擎[1] - Anthropic继5月吸引Karpathy加盟后,再次从OpenAI引入芯片人才,该公司在H轮融资后估值达到9650亿美元,逼近万亿美元市值[1] - OpenAI为ChatGPT推出名为Dreaming V3的全新记忆架构,该功能首次向数亿免费用户开放,Plus和Pro用户的记忆容量实现翻倍[1] - Dreaming V3通过后台“做梦”回放对话以提炼用户长期记忆,新增透明化的“记忆摘要”页面供用户管理,在三项测试中事实召回成功率达82[1]8%、偏好遵循率达71[1]3%并具备时间感知能力[1] - OpenAI通过优化将dreaming功能所需算力降低约5倍,从而使得向免费用户开放成为可能,该技术被视为补齐AI持续学习能力的关键拼图[1] 谷歌与Anthropic的产品发布与运营事件 - 谷歌发布Gemma 4全系列量化感知训练检查点,旨在让模型能在手机、笔记本等消费级硬件上本地运行,同时保持与量化前几乎持平的质量[2] - 该量化感知训练技术将量化过程嵌入训练阶段,其质量优于传统的训练后量化,其中E2B模型内存占用压缩至1GB,12B模型约8GB,26B MoE模型约16GB[2] - Anthropic的Claude服务发生大面积宕机,故障期间API疑似返回了其他用户的推理输出,引发对跨租户隔离失效和数据泄露的担忧[2] - 官方对数据泄露传闻未予置评,安全研究者指出共享缓存、连接复用等多层组件均为潜在泄漏点,同日OpenAI也因系统故障误封大量账号引发用户担忧[2] 腾讯在AI算法与产品应用上的进展 - 腾讯混元提出Stem稀疏注意力算法并被ICML-26收录,该算法从“因果信息流”角度理解块级稀疏,仅用25%的算力即逼近稠密注意力的精度[3] - 算法核心创新包括Token位置衰减按位置线性分配预算并向初始token倾斜,以及输出感知度量兼顾路由概率与Value信号幅值来挑选token[3] - 配套的HPC-Stem与HPC-BSA算子针对Hopper架构优化,在128K上下文长度下,首字延迟降低3[3]7倍,跳块开销控制在2[3]5%以内[3] - 腾讯文档发布行业首创的AI原生编辑能力“人机双写”,AI从旁挂助手转变为可与用户在同一文件实时协同操作的“文档里的同事”[3] - 该功能通过与WorkBuddy深度融合,原生接入Agent内核并叠加自研编辑引擎与专业Skill,覆盖文档、表格、PPT、智能表全品类,产出可自动归档并沉淀为团队上下文[3] - 腾讯通过Skill、MCP协议和OpenAPI开放生态,允许开发者与企业自有AI助手调用腾讯文档的百余项接口和十余项专业Skill以实现自动化操作[3] 京东与Anthropic在AI视频与工程实践上的创新 - 京东开源长音视频生成框架JoyAI-Echo,旨在解决长视频角色一致性、声音稳定性与生成速度三大难题,多项核心指标领先并跻身全球第一梯队[4] - 该框架通过跨模态音视频记忆库保持角色一致,记忆驱动后训练使速度提升约7[4]5倍,Director Agent导演智能体支持局部重绘,轻量化实时超分最高可达1472×2560分辨率[4] - 代码与模型权重全部开源,目标赋能虚拟动漫、数字人直播、品牌营销等场景,推动AI视频创作平民化[4] - Claude Code核心建设者Boris Cherny指出“品味”正被AI模型快速学习,他依靠数百个Claude实例分析需求,其中约20%的想法可用,并预计未来大部分会变得更好[4] - 他认为软件工程史是抽象层级不断提升的历史,自己已半年未手写代码,工作转变为协调多个Agent,公司最青睐通才型人才,并建议创始人“少招人、多给token”以实现复利降本[4] Anthropic的AI自进化趋势与腾讯的AI战略方向 - Anthropic披露Claude正加速AI发展并疑似走上递归自我提升路径,截至5月,其超过80%的代码由Claude自身编写,工程师季度交付量是2021-2025年间的8倍[5] - Claude在开放编程任务上的成功率在半年内从26%跃升至76%,独立完成任务的时长翻倍速度从7个月缩短至4个月,最新模型Mythos可连续工作16小时[5] - 在研究层面,Claude将训练加速从人类的4倍提升至52倍,并将AI安全研究差距缩小97%,人类目前仅剩研究品味这一优势[5] - Anthropic描绘了停滞、人类掌舵、完全递归自我提升三种未来,并呼吁在可验证机制下,愿意减速甚至暂停发展以避免失控[5] - 腾讯汤道生提出公司做AI的核心是“实用、好用、可规模化”,强调扎根真实场景以获取用户需求与数据[5] - 腾讯姚顺雨阐释AI“下半场”重在寻找好问题,认为腾讯的优势在于丰富产品场景提供的上下文以及基于信任的文化,并强调模型与产品必须进行协同设计以建立互信[5]