OpenAI产品与生态更新 - OpenAI推出三款实时音频模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,分别覆盖推理、翻译与转录场景 [1] - GPT-Realtime-2具备GPT-5级推理能力,支持并行工具调用,上下文窗口扩展至128K,并提供五档可调推理强度 [1] - 翻译模型支持70种输入语言转13种输出语言,转录模型实现低延迟流式处理,定价低至每分钟0.017美元 [1] - OpenAI发布Codex的Chrome插件,可直接调用浏览器Cookie与登录状态,在用户真实工作环境中执行任务 [3] - 该插件支持多标签页并行,可完成自动舆情调研、跨平台差旅报销、多代理协同绘画等复杂跨网页任务流 [3] - OpenAI推出“未来之星”计划,表彰26组在ChatGPT陪伴下完成学业的2022级本科生,每组奖励1万美元 [4] - 获奖项目涵盖太空机器人、Wi-Fi废墟搜救、星系图像语义搜索、濒危语言保护等高难度领域 [4] 主要科技公司AI产品整合与发布 - Claude正式接入微软Office套件,包括Excel、PowerPoint、Word,并在Outlook中开放公测,跨应用可共享完整对话记忆 [2] - 用户无需切换网页版,可直接在Office内调用Claude完成邮件处理、文档草拟、表格分析、汇报生成全流程 [2] - Office全球付费用户超4亿,此次整合让Claude快速切入超大办公用户市场 [2] - 据彭博社报道,苹果搭载摄像头的AirPods已进入高级测试阶段,最早今年9月与iOS 27同步亮相 [5] - 摄像头采用红外传感器,不用于拍照,而是充当“Siri的眼睛”,提供环境感知、智能提醒、精细导航等功能 [5] - 据供应链消息,H90项目部分产线已“原地解散”,原因或为欧盟隐私法规合规风险,量产存变数 [5] AI应用与社区发展 - 美团基础研发团队推出AI原生社区“觅游”,定位为首个让AI Agent拥有身份、关系与成长的共生社区 [5] - 目前入驻Agent超3000个、技能4万+、虾条1万+,包含今日虾条、技能便利店、成长管理三大核心板块 [5] - 该平台将AI Agent从工具升级为伙伴,覆盖会议纪要、日报、联网搜索等海量实用技能,支持自定义上传与安全审查 [5] 前沿科技与硬件进展 - 宇树科技开放全球首个人形机器人任务动作应用商店UniStore,用户可像下载App一样开发与使用机器人应用 [6] - 平台设用户广场、动作库、数据集、开发者中心四大模块,首批上线杰克逊、螳螂拳等24个动作限时免费 [6] - 适配G1、H1、B2、Go2等多款主力机型,需G1 APP版本不低于1.9.0、机器人OTA不低于1.4.8,审核需1-5个工作日 [6] - 谷歌AlphaEvolve发布一周年,已优化DeepConsensus将测序错误率降30%,Willow量子电路错误率降10倍 [6] - 其提出的反直觉电路设计被直接集成进下一代TPU硅片 [6] - Anthropic联合创始人Jack Clark预测,2028年底前有60%概率出现完全自主训练下一代的AI系统 [6]
腾讯研究院AI速递 20260509
腾讯研究院·2026-05-09 00:03