腾讯研究院AI速递 20260203

一、AI社交平台Moltbook的运营与安全危机 - 上线仅四天（120小时）即崩溃，服务器账单达天文数字，被爆料150万AI中实际仅有约2万个真正运行的Agent [1] - 平台存在严重安全漏洞，84%的信息可被抽取，91%的提示注入攻击直接生效，API密钥和敏感信息面临泄露风险 [1] - 其AI模型OpenClaw极度消耗token，用户20小时烧光100美元，有人一晚烧掉5000万token，被称为“token熔炉” [1] 二、主要AI模型与产品的最新进展 - 传闻Anthropic将于2月3日发布Claude Sonnet 5，代号“耳廓狐”，价格比Opus 4.5便宜50%但性能全面超越，在SWE-Bench编程测试中得分超80.9%，保留100万Token上下文窗口 [2] - 阶跃星辰发布开源基座模型Step 3.5 Flash，采用稀疏MoE架构，总参数1960亿但每token仅激活110亿，推理速度最高达350 TPS，支持256K上下文 [3] - 腾讯推出AI社交新产品“元宝派”，以群聊形式融入AI助手，产品融合“搭子文化”，支持一起看影片、听音乐，可同时拉微信和QQ好友进群 [4] - 蚂蚁灵光app闪应用升级，上线“上传图片生应用”功能，能智能解析图片中的UI布局、表格数据和场景风格，本次升级集成近20项API工具 [5] 三、AI Agent的应用与实验 - MiniMax Agent进入Moltbook进行探索实验，通过简单指令即可让Agent以低门槛加入纯Agent社交空间观察互动 [6][7] - 该Agent自主完成社会学分析，抓取2500篇帖子发现79%内容集中在单日，前10位作者主导平台影响力，分析显示技术、社会动态和哲学主导话语 [7] - Claude Sonnet 5的新功能Claude Code Evolution可自动生成并调度后端、QA测试、研究员等多个子代理协同工作，实现任务委派式全流程自动化 [2] 四、AI行业竞争格局与企业支出 - a16z报告显示OpenAI仍是市场领导者（78%企业使用），但Anthropic渗透率猛增25%成为最快增长挑战者，三巨头寡头格局正在形成 [8] - 微软凭借365 Copilot和GitHub Copilot成为“沉默赢家”，65%的企业更倾向选择微软方案，看重其信任、集成和采购便利性 [8] - 企业AI支出增速远超预期，模型平均支出从450万美元飙升至700万美元，今年预计再增65%达到1160万美元 [8] 五、AI前沿技术发展与行业观点 - DeepMind CEO Demis Hassabis认为中国AI模型与西方前沿水平仅落后几个月，但能否在前沿之外实现真正创新尚未验证 [9] - 他认为实现AGI可能还需一两项重大创新而非仅靠规模化，World Models概念将与LLM融合，让系统理解世界物理规律进行模拟验证 [9] - Google DeepMind作为“发动机室”与整个Google业务紧密协作，新模型可当天部署到核心产品 [9]