AI能力评测与AGI进展 - METR最新测试显示,Claude Mythos在人类需要16小时完成的长线任务上达到了50%的成功率,其表现直接撑爆了评测框架的上限,导致16小时以上区间已无足够样本进行准确测量[1] - AI能力呈现“超指数级”增长,Claude Mythos的表现已经超过了2027年对AGI的预测线,从2021年处理8秒任务到2026年处理16小时任务,每一代的能力跃升幅度更大、间隔更短[1] - Palo Alto的测试发现,Claude Mythos辅助进行漏洞分析,能在3周内完成顶级渗透团队1年的工作量,并将攻击链压缩到25分钟,标志着安全攻防进入“AI对抗AI”的新阶段[1] AI Agent与桌面操作能力演进 - Peekaboo v3.0正式版上线后一日内进行了三次更新,其作为OpenClaw的专属Computer Use工具,使得AI能够观看屏幕、点击按钮并操作真实的macOS桌面系统[2] - 该工具的核心价值在于将桌面转化为Agent可理解的工作场域,它不仅向模型提供屏幕截图,还整理出控件、窗口、文本和按钮之间的关系,形成可追踪和复盘的操作现场记录[2] - Peekaboo补齐了执行环节后,OpenClaw实现了从“会聊天”到“会干活”的升级,从消息系统向操作系统边缘推进,有望成为AI操作个人电脑的本地控制层[2] AI与办公软件及知识管理集成 - QClaw上线了“文件空间”功能,用户通过一次授权即可打通本地文件、腾讯文档和ima知识库,从而告别在多应用间反复搬运文件的低效操作[3] - 该产品通过接入腾讯文档实现了底层账号与权限的深度集成,AI生成的内容可以直接保存为协作文档并生成分享链接,同事点击链接即可在网页端进行协同编辑[3] - ima知识库实现了双向沉淀,用户碎片化收藏的文章和研报可以主动参与到工作流中,同时AI的产出也能一键保存回ima知识库,成为个人“第二大脑”的新养分[3] 微信生态AI能力与商业赋能 - 微信支付发布了面向AI的Skill技能包、AI友好文档和AI友好API三大工具,开发者通过“唤起AI—加载Skill—说出需求”的流程即可快速接入微信支付功能[4] - 微信AI小程序成长计划进一步升级,全面放开了参与门槛,并新增了对工具类小程序的变现激励、We分析资源的普惠以及针对教育行业的专项支持等扶持政策[4] - 企业微信5.0.8版本上线了“记录面聊”功能以承接线下头脑风暴,小游戏推出了IAP激励计划,首发最高提供5000万元不分成激励,同时微信小店推出了0保证金试运营等六项新商家权益[4] AI电商与消费场景应用 - 千问App与淘宝已完成全面打通,基于淘宝40亿的商品库及20年的购物数据,用户仅需一句话即可完成商品挑选、对比及下单购买,系统能精准理解模糊的消费意图[5][6] - 淘宝App上线了“千问AI购物助手”,提供包括AI问答、AI试穿、AI计算优惠、AI低价帮抢以及一句话下单退换货在内的多项功能[6] - AI种草功能支持通过图片、视频或链接快速查找同款商品,AI试穿功能允许任意搭配上下装并根据潮流提供搭配建议,AI省钱功能则可一键生成领券凑单方案[6] 行业领袖对AI发展的观点 - 英伟达CEO黄仁勋在卡内基梅隆大学的演讲中指出,AI推翻了旧的计算规则,使得所有人都重新站在了同一条起跑线上,他反对“AI抢饭碗”的焦虑论调[7] - 黄仁勋以自身经历为例,强调失败是学习、谦逊和品格锤炼的时刻,韧性才是重新出发的力量[7] - 其核心观点是,AI本身不会取代人,但会用AI的人会取代不会用AI的人,并指出需要同时做好安全推进AI、制定周全政策、让AI被广泛使用以及鼓励每个人参与这四件事[7] AI时代的企业竞争与组织建设 - 有观点认为,在AI时代,产品、技术和赛道都在快速收敛,真正难以被抄袭和复制的是公司的组织形态,这构成了新的竞争壁垒[8] - 伟大的公司本质上是“组织发明”,其竞争的核心不只是市场或薪酬,而是身份认同,最强的使命必然会让一部分人不想加入,从而让对的人极度渴望加入[8] - 每一个情绪承诺背后必须有结构承诺(如职权、薪酬、决策权)作为支撑,被选中是情绪性的,而被看见是结构性的,有野心的人需要警惕以时间计价的承诺[8]
腾讯研究院AI速递 20260512
腾讯研究院·2026-05-12 00:03