腾讯研究院AI速递 20260302
腾讯研究院·2026-03-02 01:11

Anthropic与OpenAI的竞争及用户迁移 - Anthropic因坚守“不进行大规模监视、不开发自主武器”两条红线与五角大楼谈判破裂,遭特朗普政府全面封杀并被定性为“供应链威胁”[1] - Claude应用在遭封杀后24小时内,一路飙升登顶美国和加拿大App Store免费榜第一[1] - 大量用户晒出注销ChatGPT Plus截图转投Claude,全网掀起抵制OpenAI运动,网友分享通过导出聊天记录并转换格式实现向Claude无缝迁移的教程[1] - OpenAI公布与五角大楼的协议,声称设置三条红线:禁止大规模国内监控、禁止指挥自主武器系统、禁止高风险自动化决策,并称其方案比Anthropic更完善[2] - OpenAI与五角大楼的协议采用纯云端部署、OpenAI自主运维安全防护体系、涉密工作人员全程参与,若违约OpenAI有权终止协议[2] - 外界质疑OpenAI协议中“所有合法目的使用”等措辞极其模糊容易被突破,这正是Anthropic所拒绝的部分,网友断言红线很快会被突破[2] - Anthropic与苏黎世联邦理工学院联合研究显示,其提出的ESRC自动化流水线仅用公开模型和标准API即可实现大规模在线去匿名化,开盒成本降至几美元[9] - 在跨平台匹配实验中,AI在90%精确率下正确识别67%用户,跨越一年时间跨度仍能达到67.3%召回率,传统方法在同等任务中几乎完全失败[9] - 测试的所有防御方法效果均不乐观,唯一有效防御是平台不公开用户历史发言,监控能力已不需要专有模型,这为Anthropic拒绝大规模监控的立场提供了依据[9] AI智能体与机器人技术进展 - Claude Code团队成员复盘开发经验,指出构建智能体最核心环节是设计动作空间,必须为智能体提供与其能力相匹配的工具[3] - 关键迭代包括:打造专属“向用户提问”工具替代格式化输出、随模型能力升级将“待办清单”替换为支持跨智能体协同的“任务系统”[3] - 搜索工具从RAG方案转向Grep自主搜寻,确立渐进式信息披露模式,通过构建专属指南子智能体在不增加工具数量的前提下扩展能力[3] - 荣耀在MWC 2026发布全球首款“机器人手机”Robot Phone,集成行业最小4DoF云台系统和2亿像素传感器,支持三轴机械防抖和AI自动跟踪拍摄[4] - 荣耀CEO提出AHI(增强人类智能)理念,强调AI要以人为中心兼具IQ和EQ,并宣布与ARRI达成影像战略合作[4] - 荣耀同步发布折叠屏旗舰Magic V6,折叠厚度仅8.75mm刷新行业纪录,搭载超7000mAh电池和骁龙8至尊版芯片,现场有人形机器人表演太空步和后空翻[4] - 清华与斯坦福联合提出VLAW框架,首次实现VLA策略与动作条件世界模型的双向迭代优化,解决世界模型“盲目乐观”和物理保真度不足问题[5] - VLAW框架采用四步工作流,实测显示校准后的世界模型假阳性率大幅降低,20秒长时程虚拟试错仍保持物理合理性,在五类复杂操控任务中支撑机器人性能大幅提升[6] AI在数学与软件开发领域的前沿突破 - 谷歌DeepMind最新AI智能体Aletheia在FirstProof挑战赛中,零人工干预自主解出10道世界级未解数学难题中的6道,取得首届全场最佳成绩[7] - Aletheia系统内置“生成者-验证者”双模块互搏机制,遇到无把握的问题直接输出“未找到解法”,其攻克第7题耗费的算力是解决Erdő s-1051问题的16倍[7] - 数学家陶哲轩称AI已成为“初级合著者”,AI正让数学家首次有能力从“个案研究”转向“大样本普查”,系统性扫描人类没精力碰的问题长尾[7] - Cursor创始人指出AI软件开发已从Tab补全、同步Agent进入第三时代,特征是云端Agent能在更长时间尺度上独立处理复杂任务[8] - Cursor内部超35%合并的PR由运行在云端虚拟机的自主Agent创建,Agent用户数量已达Tab用户的2倍,过去一年Agent使用量增长超15倍[8] - 行业专家评论建议开发者将80%时间用于当前有效方式、20%探索下一步方向,开发者角色正从逐行编码转向定义问题、制定评审标准和管理Agent工厂[8]

腾讯研究院AI速递 20260302 - Reportify