OpenAI GPT系列模型进展 - GPT-5.4已在内部进行A/B测试,测试版一次提示可生成超过6000行代码 [1] - GPT-5.4将配备极限推理模式,上下文窗口从40万tokens翻倍至100万tokens [1] - GPT-5.4可能实现永久记忆功能,疑似结合SSM与Transformer架构,上下文长度或超预期 [1] - OpenAI发布GPT-5.3 Instant,主打对话体验优化,联网幻觉率降低26.8%,减少不必要拒答和免责声明,写作能力和语气自然度显著提升 [3] - OpenAI发布GPT-5.3 Instant时暗示GPT-5.4即将到来,并宣布GPT-5.2 Instant将于2026年6月3日正式下线 [3] 谷歌产品与技术更新 - 谷歌发布Workspace官方CLI工具,覆盖Drive、Gmail、Calendar、Sheets、Docs等全线产品,所有输出为JSON格式 [2] - Workspace CLI工具实时读取谷歌API目录自动生成命令,支持MCP Server模式一行命令启动,内置100多个SKILL.md文件和50个常用操作配方,可直接被Claude Code等Agent调用 [2] - 该工具仓库包含专为AI编程助手编写的AGENTS.md贡献指南,支持Google Cloud Model Armor防注入攻击,当前版本v0.3.4仍在活跃开发中 [2] - 谷歌推出Gemini 3.1 Flash-Lite模型,定价为输入0.25美元/百万tokens,首token响应速度比Gemini 2.5 Flash快2.5倍,输出速度提升45%,Arena Elo评分达1432 [3] - 谷歌NotebookLM发布影院级视频概览功能,由Gemini 3担任总导演把控叙事逻辑、Nano Banana Pro负责生成创意图片、Veo 3制作流畅动画和音效,三模型协同工作 [4] - NotebookLM新版支持一个笔记本存储多个同类型产出,可为不同语言、不同岗位定制专属版本,并支持多任务处理 [4] - NotebookLM界面改版为音频、视频、思维导图、报告四大区块,功能将在未来几周陆续发布,目前已向Ultra用户推出英文版 [4] 其他AI公司模型与产品发布 - MiniMax发布Music 2.5+模型,新增纯音乐创作能力,支持古典管弦、极简主义、电子、氛围音、自然声景等多元风格,覆盖冥想助眠、广告配乐、游戏影视等场景 [4][5] - MiniMax Music 2.5+具备强大的跨风格融合能力,可将东方民族乐器与西方管弦乐自然融合,对笛子、琵琶、古筝等中国传统乐器的音色还原处于行业领先水平 [5] - 该模型单一模型即可处理从纯自然声到多轨器乐编排的完整复杂度,声场三频分明,已开放C端产品体验和API接口 [5] 机器人技术前沿 - 宇树发布春晚武BOT技术论文,提出OmniXtreme双阶段框架:流匹配预训练构建统一动作策略,执行器感知后训练弥合仿真与现实鸿沟 [6] - 真机测试完成157次独立试验覆盖24种高动态极限动作,后空翻成功率达96.36%,端到端推理延迟控制在10毫秒,全部在宇树G1机载Orin NX芯片上原生执行 [6] - OmniXtreme架构已同步开源,通过写实驱动器建模、激进域随机化和功率安全正则化,首次解决了高保真动作追踪与多动作可扩展性之间的长期权衡难题 [6] AI行业生态与趋势 - 外媒称OpenClaw在中国AI圈的发酵速度远超硅谷想象,字节、阿里、腾讯已在各自云平台上线OpenClaw服务,开发者可直接在云端运行Agent [7] - 中国创业者围绕OpenClaw爆发式创新,春节黑客马拉松涌现AI相亲平台、AI招聘网站、AI旅行日志等Agent应用 [7] - OpenClaw的影响已从软件溢出到硬件领域,广州初创公司实现通过Agent远程控制充电设备,创业者认为这是中国AI行业一次「不可逆的冲击」 [7] - Anthropic CEO表示Scaling Law没撞墙,甚至将激进加速,并用棋盘稻米寓言类比AI发展,称当前正处于第40格,前39格的所有震撼加在一起不过是后24格的零头 [8] - Anthropic端到端生产效率已翻两到三倍,模型开始搭建工具和脚手架改进自身工作流,递归式自我改进初现端倪 [8] - 面对Meta开出1亿至5亿美元挖角单个研究员的天价,Anthropic仅流失两人,7位联合创始人至今全部在职 [8] - Sam Altman表示,AI同等智能水平的成本在18个月内下降约1000倍,智能成本将持续趋近于零,GDP将因AI通缩效应变成糟糕的衡量指标 [9] - Altman认为科学进步和经济引擎将被同时自动化,代码领域的变革将以相同模式复制到金融、医疗、法律等所有行业,最被低估的机会是「零人公司」 [9] - Vinod Khosla预言2035年世界将进入极其通缩的经济体,双方共同强调能动性和好奇心是AI时代最重要的元技能 [10] AI在科研领域的应用 - 88岁图灵奖得主Don Knuth发表论文《Claude's Cycles》,记录Claude Opus 4.6在约一小时内通过31次探索,解决了他研究数周未果的三维环面图哈密顿环分解问题 [11] - Claude发明了「蛇形模式」并从失败的模拟退火结果中提取隐藏规律,找到适用于所有奇数维度的通用构造方法,Knuth据此证明共存在760种同类分解方案 [11] - 偶数情况后由GPT-5.3-codex解决,形成Claude解奇数、GPT解偶数,两个AI各解半题的局面 [11]
腾讯研究院AI速递 20260306
腾讯研究院·2026-03-06 00:31