谷歌Gemini系列进展 - 谷歌Gemini 3.5代号“卡布奇诺”提前曝光,编码与推理能力达到GPT-5.5的92%,成本却便宜15至20倍[1] - 同步泄露全时AI智能体“Gemini Spark”,定位为24小时数字生活管家,可管理邮件、执行任务,甚至可能未经询问替用户下单消费[1] - DeepMind在AI编程平台Antigravity的采用率仅6%,谷歌押注分发入口与多模态系统以反哺下一代模型训练[1] OpenAI产品更新与集成 - OpenAI将Codex集成进ChatGPT移动端APP,以预览形式在iOS与安卓上滚动上线,面向包括Free和Go在内的所有付费档位用户开放[2] - 用户可通过手机连接本地电脑,实时审查输出、批准命令、切换模型、启动新任务,但需本地机器保持在线运行Codex[2] - 同步推出远程SSH、Hooks、可编程访问令牌和HIPAA合规支持,AI编码竞争焦点正从写好代码转向长任务中的人机接管[2] - OpenAI推出个人理财工具,面向美国Pro用户开放,通过Plaid连接超1.2万家金融机构,可读取余额、交易、投资及负债数据[3] - 用户可用自然语言进行对话式理财,ChatGPT结合真实数据制定计划、分析趋势,OpenAI过去半年已收购Roi与Hiro Finance组建金融团队[3] 全球AI教育与普及动态 - 马耳他政府启动“AI for All”项目,向全体公民提供免费AI课程,完成三个核心模块后赠送一年ChatGPT Plus订阅[4] - 项目由马耳他数字创新管理局负责分发,覆盖学生、家长、教师、求职者、创业者及老年人,五月起分阶段上线ai4all.gov.mt平台[4] - 该项目与OpenAI for Countries业务线合作落地,前英国财政大臣George Osborne牵头,爱沙尼亚、希腊也在推进国家级AI教育合作[4] AI助手与浏览器自动化工具 - 月之暗面推出Kimi WebBridge浏览器插件,可被Kimi Code、Claude Code、Cursor、Codex等本地AI智能体调用,让AI带着登录状态执行点击、输入与表单填写[5][6] - 内部测试场景包括自动采集应用商店素材撰写设计分析、一键接管量化平台抓取数据并迭代回测策略,覆盖大量重复网页操作[6] - 安装仅需两步,社区可分享网站专用CLI工具节省Token消耗,Kimi Claw桌面端用户无需额外配置即可直接调用[6] 腾讯与阿里在AI领域的布局 - 微信AI小程序成长计划云开发资源正式支持腾讯混元最新Hy3 preview模型,在复杂推理、指令遵循、代码与智能体能力上实现进化[7] - 开发者需在5月30日0点前完成接口升级,提供商由hunyuan-exp切换为hunyuan-v3,模型名更换为hy3-preview[7] - 升级后原赠送的1亿Token额度可在新模型上继续使用,无需重新申请,确保现有业务平滑过渡[7] - 阿里健康推出医学AI助手“氢离子”,主打循证智能问答,答案均附指南、文献、说明书等证据支撑,可定位到原文具体段落供医生核查[8] - 与英国BMJ集团达成期刊内容独家合作,获得70本医学期刊十年文献授权使用,已打通中华医学会、人民卫生出版社等国内权威数据源[8] - 构建证据理解、精准检索、模型微调、专家评审四层循证架构,邀请300多位临床专家共建评价标准,文献阅读时间从1至2小时压缩到3至5分钟[8] AI开发成本与团队协作模式 - “龙虾之父”Peter Steinberger晒出Codex后台账单,过去30天调用OpenAI API花费约130万美元(940万人民币),消耗6030亿Token、760万次请求[9] - 被OpenAI收购后团队仅3人,在云端同时运行约100个Codex开发OpenClaw,分工Review PR、扫描漏洞、修复程序、监控基准回归,实现多Agent群体协作[9] - 关闭快速模式可降低70%成本,他认为比雇用旧金山高级工程师便宜,软件开发正从“人类使用工具”转向“人类管理Agent团队”[9] AI创业与公司战略 - Anthropic发布《The Founders Playbook》,系统拆解AI原生公司从想法到IPO全过程,指出42%创业公司死于做了没人想要的东西,AI时代该比例只增不减[9][10] - 强调创始人角色从个人贡献者转向编排者,建议用结构化唱反调压力测试想法,并用CLAUDE.md沉淀项目记忆防止AI技术债以复利累积[10] - 给出三层护城河:领域知识编码进AI上下文、用户行为数据复利、工作流锁定,瓶颈不再是你能造什么而是选择造什么[10]
腾讯研究院AI速递 20260518