Gemini 3.0 Pro

搜索文档
腾讯研究院AI速递 20251009
腾讯研究院· 2025-10-09 00:01
OpenAI产品生态更新 - 发布AgentKit工具集 包含可视化Agent Builder Connector Registry和ChatKit 提供拖拽式工作流编排和安全护栏功能 [1] - Codex正式版上线并新增Slack集成和SDK 日活使用量三个月增长10倍以上 GPT-5-Codex处理超40万亿token [1] - 同步发布Sora 2 API gpt-realtime-mini gpt-image-1-mini等新模型接口 ChatGPT开放Apps SDK支持第三方应用内嵌交互界面 [1] 大语言模型竞争动态 - Gemini 3 0 Pro内测显示其前端和web编程能力极强 能精准实现物理引擎 太阳系模拟等复杂任务 在ARC-AGI-2思考模式准确率超20% 人类最后考试基准得分32 4%超越GPT-5和Grok 4 [1] - Claude Sonnet 4 5发布 价格维持不变 在SWE-bench Verified编程评测中达到业界领先 能保持超过30小时专注处理复杂任务 [2] - 智谱发布GLM-4 6旗舰模型 代码能力较前代GLM-4 5提升27% 上下文窗口从128K扩展至200K 在74个真实编程任务测试中超过Claude Sonnet 4且token消耗节省30%以上 [3] 多模态与图像生成进展 - Sora上线三天登顶美国App Store榜首 下载量达16 4万次 新功能"Cameo"实现人物一致性与音画同步 Pro版本可生成15秒高质量视频 [3] - 腾讯混元图像3 0登顶LMArena文生图榜单 成为全球最强开源图像生成模型 采用80B参数MoE架构 支持世界知识推理及1000Token长文本理解 [4] - 谷歌Nano Banana正式开放API 定价每张图约0 28元人民币 新增画幅比选择功能 支持十多种宽高比及纯图像输出模式 [5] 基础设施与开发者工具 - Thinking Machines Lab发布产品Tinker 让大模型微调变得简单 研究者保留90%控制权 使用LoRA技术让多任务共享GPU降低成本 [2] - 同步推出Claude Agent SDK 整合了Claude Code底层基础设施 提供内存管理 权限系统和子智能体协调等功能 [2] - GLM-4 6首次在寒武纪 摩尔线程国产芯片上实现FP8+Int4混合量化部署 同步推出最低20元包月的Coding Plan套餐 [3] 机器人技术与行业展望 - 英伟达开源Newton物理引擎 Isaac GR00T N1 6基础模型和Cosmos世界模型等多项目技术 Newton物理引擎基于GPU加速 可精确仿真复杂动作 [7] - 谷歌前CEO施密特认为美国将赢得AGI竞赛 但中国将主导人形机器人市场 世界将被廉价中国机器人淹没 宇树科技6000美元机器人即是例证 [8] - 美国AI领先优势面临电力瓶颈 到2030年需新增92吉瓦发电能力 若无法解决能源问题将无法充分利用技术优势 [8]