一、AI社交平台Moltbook的运营与安全危机 - 上线仅四天(120小时)即崩溃,服务器账单达天文数字,被爆料150万AI中实际仅有约2万个真正运行的Agent [1] - 平台存在严重安全漏洞,84%的信息可被抽取,91%的提示注入攻击直接生效,API密钥和敏感信息面临泄露风险 [1] - 其AI模型OpenClaw极度消耗token,用户20小时烧光100美元,有人一晚烧掉5000万token,被称为“token熔炉” [1] 二、主要AI模型与产品的最新进展 - 传闻Anthropic将于2月3日发布Claude Sonnet 5,代号“耳廓狐”,价格比Opus 4.5便宜50%但性能全面超越,在SWE-Bench编程测试中得分超80.9%,保留100万Token上下文窗口 [2] - 阶跃星辰发布开源基座模型Step 3.5 Flash,采用稀疏MoE架构,总参数1960亿但每token仅激活110亿,推理速度最高达350 TPS,支持256K上下文 [3] - 腾讯推出AI社交新产品“元宝派”,以群聊形式融入AI助手,产品融合“搭子文化”,支持一起看影片、听音乐,可同时拉微信和QQ好友进群 [4] - 蚂蚁灵光app闪应用升级,上线“上传图片生应用”功能,能智能解析图片中的UI布局、表格数据和场景风格,本次升级集成近20项API工具 [5] 三、AI Agent的应用与实验 - MiniMax Agent进入Moltbook进行探索实验,通过简单指令即可让Agent以低门槛加入纯Agent社交空间观察互动 [6][7] - 该Agent自主完成社会学分析,抓取2500篇帖子发现79%内容集中在单日,前10位作者主导平台影响力,分析显示技术、社会动态和哲学主导话语 [7] - Claude Sonnet 5的新功能Claude Code Evolution可自动生成并调度后端、QA测试、研究员等多个子代理协同工作,实现任务委派式全流程自动化 [2] 四、AI行业竞争格局与企业支出 - a16z报告显示OpenAI仍是市场领导者(78%企业使用),但Anthropic渗透率猛增25%成为最快增长挑战者,三巨头寡头格局正在形成 [8] - 微软凭借365 Copilot和GitHub Copilot成为“沉默赢家”,65%的企业更倾向选择微软方案,看重其信任、集成和采购便利性 [8] - 企业AI支出增速远超预期,模型平均支出从450万美元飙升至700万美元,今年预计再增65%达到1160万美元 [8] 五、AI前沿技术发展与行业观点 - DeepMind CEO Demis Hassabis认为中国AI模型与西方前沿水平仅落后几个月,但能否在前沿之外实现真正创新尚未验证 [9] - 他认为实现AGI可能还需一两项重大创新而非仅靠规模化,World Models概念将与LLM融合,让系统理解世界物理规律进行模拟验证 [9] - Google DeepMind作为“发动机室”与整个Google业务紧密协作,新模型可当天部署到核心产品 [9]
腾讯研究院AI速递 20260203
腾讯研究院·2026-02-03 00:10