腾讯研究院AI速递 20260518

谷歌Gemini系列进展 - 谷歌Gemini 3.5代号“卡布奇诺”提前曝光，编码与推理能力达到GPT-5.5的92%，成本却便宜15至20倍[1] - 同步泄露全时AI智能体“Gemini Spark”，定位为24小时数字生活管家，可管理邮件、执行任务，甚至可能未经询问替用户下单消费[1] - DeepMind在AI编程平台Antigravity的采用率仅6%，谷歌押注分发入口与多模态系统以反哺下一代模型训练[1] OpenAI产品更新与集成 - OpenAI将Codex集成进ChatGPT移动端APP，以预览形式在iOS与安卓上滚动上线，面向包括Free和Go在内的所有付费档位用户开放[2] - 用户可通过手机连接本地电脑，实时审查输出、批准命令、切换模型、启动新任务，但需本地机器保持在线运行Codex[2] - 同步推出远程SSH、Hooks、可编程访问令牌和HIPAA合规支持，AI编码竞争焦点正从写好代码转向长任务中的人机接管[2] - OpenAI推出个人理财工具，面向美国Pro用户开放，通过Plaid连接超1.2万家金融机构，可读取余额、交易、投资及负债数据[3] - 用户可用自然语言进行对话式理财，ChatGPT结合真实数据制定计划、分析趋势，OpenAI过去半年已收购Roi与Hiro Finance组建金融团队[3] 全球AI教育与普及动态 - 马耳他政府启动“AI for All”项目，向全体公民提供免费AI课程，完成三个核心模块后赠送一年ChatGPT Plus订阅[4] - 项目由马耳他数字创新管理局负责分发，覆盖学生、家长、教师、求职者、创业者及老年人，五月起分阶段上线ai4all.gov.mt平台[4] - 该项目与OpenAI for Countries业务线合作落地，前英国财政大臣George Osborne牵头，爱沙尼亚、希腊也在推进国家级AI教育合作[4] AI助手与浏览器自动化工具 - 月之暗面推出Kimi WebBridge浏览器插件，可被Kimi Code、Claude Code、Cursor、Codex等本地AI智能体调用，让AI带着登录状态执行点击、输入与表单填写[5][6] - 内部测试场景包括自动采集应用商店素材撰写设计分析、一键接管量化平台抓取数据并迭代回测策略，覆盖大量重复网页操作[6] - 安装仅需两步，社区可分享网站专用CLI工具节省Token消耗，Kimi Claw桌面端用户无需额外配置即可直接调用[6] 腾讯与阿里在AI领域的布局 - 微信AI小程序成长计划云开发资源正式支持腾讯混元最新Hy3 preview模型，在复杂推理、指令遵循、代码与智能体能力上实现进化[7] - 开发者需在5月30日0点前完成接口升级，提供商由hunyuan-exp切换为hunyuan-v3，模型名更换为hy3-preview[7] - 升级后原赠送的1亿Token额度可在新模型上继续使用，无需重新申请，确保现有业务平滑过渡[7] - 阿里健康推出医学AI助手“氢离子”，主打循证智能问答，答案均附指南、文献、说明书等证据支撑，可定位到原文具体段落供医生核查[8] - 与英国BMJ集团达成期刊内容独家合作，获得70本医学期刊十年文献授权使用，已打通中华医学会、人民卫生出版社等国内权威数据源[8] - 构建证据理解、精准检索、模型微调、专家评审四层循证架构，邀请300多位临床专家共建评价标准，文献阅读时间从1至2小时压缩到3至5分钟[8] AI开发成本与团队协作模式 - “龙虾之父”Peter Steinberger晒出Codex后台账单，过去30天调用OpenAI API花费约130万美元（940万人民币），消耗6030亿Token、760万次请求[9] - 被OpenAI收购后团队仅3人，在云端同时运行约100个Codex开发OpenClaw，分工Review PR、扫描漏洞、修复程序、监控基准回归，实现多Agent群体协作[9] - 关闭快速模式可降低70%成本，他认为比雇用旧金山高级工程师便宜，软件开发正从“人类使用工具”转向“人类管理Agent团队”[9] AI创业与公司战略 - Anthropic发布《The Founders Playbook》，系统拆解AI原生公司从想法到IPO全过程，指出42%创业公司死于做了没人想要的东西，AI时代该比例只增不减[9][10] - 强调创始人角色从个人贡献者转向编排者，建议用结构化唱反调压力测试想法，并用CLAUDE.md沉淀项目记忆防止AI技术债以复利累积[10] - 给出三层护城河：领域知识编码进AI上下文、用户行为数据复利、工作流锁定，瓶颈不再是你能造什么而是选择造什么[10]