腾讯研究院AI速递 20260311

一、Claude推出多智能体代码审查系统 - Anthropic为Claude Code引入多智能体代码审查系统，自动调度智能体团队并行审查代码，部署后获得实质性审查意见的PR比例从16%飙升至54% [1] - 在超千行大型PR中，84%会收到审查意见，平均发现7.5个问题，被标记为不正确的审查结果不到1% [1] - 审查基于Token计费，平均每次15至25美元，支持自定义审查规则，目前面向团队版和企业版用户提供研究预览 [1] 二、LeCun创办企业完成巨额种子轮融资 - 图灵奖得主Yann LeCun创办的AMI Labs完成10.3亿美元种子轮融资，估值达35亿美元，团队分布在巴黎、纽约、蒙特利尔和新加坡 [2] - 公司目标是构建基于JEPA架构的世界模型，面向工业控制、机器人、可穿戴设备和医疗等高可靠性场景 [2] - DiT架构提出者谢赛宁加盟担任首席科学官，首个实际应用推出前至少需要一年研究时间，首个合作伙伴为医疗AI独角兽Nabla [2] 三、微软发布Copilot Cowork全面接管Office - 微软发布Copilot Cowork全面接管Excel、Word、PPT和Outlook，采用Anthropic Claude模型驱动推理，可在后台持续推进十余个任务 [3] - 四大核心场景包括自动整理日程、准备客户会议、深度调研生成交付物、执行从竞品分析到产品发布的计划 [3] - 定价为M365企业版基础上额外30美元/月，新推出的E7套餐99美元/月，目前处于有限客户研究预览阶段 [3] 四、腾讯混元开源世界模型强化学习框架 - 腾讯混元3D团队开源业界首个面向世界模型的强化学习后训练框架WorldCompass，解决预训练世界模型指令失效问题 [4] - 框架通过切片级采样降低计算复杂度，并引入基于3D基础模型的交互跟随评分与视觉质量评分互为正则 [4] - 在复合动作场景下交互准确率从20%提升至55%，在斯坦福WorldScore基准上取得更优评分 [4] 五、智谱上线AutoClaw本地版本 - 智谱正式上线AutoClaw，macOS和Windows均支持一键安装，自动接入飞书等即时通讯工具，提供免费额度 [5][6] - 内置智谱专为OpenClaw场景优化的Pony-Alpha-2模型，集成AutoGLM Browser-Use能力 [6] - 封装50+主流Skills与API覆盖多场景，支持接入DeepSeek、Kimi、MiniMax、GLM等任意模型的API [6] 六、Claude与军事系统合作应用于美伊冲突 - 美国军方在美伊冲突中利用Palantir的Maven智能系统嵌入Claude模型，首日解析150+信息流提供1000+打击选项 [7] - Maven系统整合多源数据，Claude自动生成目标建议和精确坐标，将传统需数周的战斗计划变为实时行动 [7] - 截至目前美以已打击超3000目标，使用Maven后原本2000人的工作量20人即可完成 [7] 七、Figure机器人实现全程自主家务 - 估值390亿美元的Figure发布最新进展，搭载Helix 02系统的机器人全程自主完成客厅整理 [8] - Helix 02采用三层系统架构，分别负责语义推理任务拆解、高频感知转化和基于人类运动数据训练的全身控制 [8] - 团队仅补充新数据即让系统掌握复杂技能，替代了109504行手工C++控制代码 [8] 八、AI发布全球科学家社区O-DataMap - AI系统OALL发布O-DataMap，将全球论文中的实验数据映射到二维坐标系，首次将人类科技研究铺成可导航地图 [9] - 三层使用场景包括判断领域热度与成熟度、定位单篇研究的知识谱系、获得研究空白评估和期刊定位建议 [9] - 地图实时生长，AI流水线持续解析新论文，输入学者姓名或论文可看到其影响力如何跨领域扩散 [9] 九、a16z发布全球AI产品Top100报告 - a16z第六版全球AI产品Top100显示ChatGPT周活9亿用户领先，但Claude付费订阅同比增长超200%、Gemini增长258% [10] - ChatGPT走超级应用路线覆盖85+品类，Claude聚焦专业用户，两个平台仅11%应用重合 [10][11] - OpenClaw成为GitHub star数最高项目，Manus被Meta以约20亿美元收购，通用Agent与Vibe Coding工具重塑竞争格局 [11] 十、陶哲轩对谈OpenAI高管讨论AI与数学 - OpenAI内部核心指标“自主运行刻度”已从去年的几分钟向几天迈进，模型犯错概率显著下降 [11] - 陶哲轩表示AI已成为日常研究工具，埃尔德什问题长尾中已有二三十个在最低限度人类监督下被AI解决 [11] - OpenAI的Mark Chen指出数学的形式化验证系统为强化学习提供了“无限次廉价试错”机制 [11]