Workflow
AI周报|OpenAI发布大模型GPT-5;谷歌推出可交互的世界模型Genie 3
第一财经·2025-08-10 12:13

OpenAI发布GPT-5 - OpenAI推出GPT-5,强调其幻觉率下降且减少对人类的"阿谀奉承" [1][2] - GPT-5在编程、数学、写作、健康、视觉智能等领域具备最先进性能,内置思维能力可提供专家级智能 [2] - 模型知道何时快速响应或长时间思考,免费用户需等待几天才能使用完整推理功能 [2] - 基准测试显示GPT-5得分超过o3和o4-mini,但与前代差距不大 [2] - 特斯拉CEO马斯克称Grok 4在ARC-AGI基准测试中击败GPT-5 [2] OpenAI开源策略转变 - 公司时隔六年再次开源gpt-oss-120b(1170亿参数)和gpt-oss-20b(210亿参数)两款MoE架构模型 [3] - gpt-oss-120b可在单张80GB GPU运行,gpt-oss-20b适配16GB内存消费级设备 [3] - 公司倾向于旗舰模型闭源策略,但承认强大开源模型的重要性 [3] Anthropic更新Claude模型 - Claude Opus 4.1在代理任务、现实世界编码和推理方面升级,擅长处理复杂多步骤问题 [4] - 公司转向渐进式更新策略,未来几周将推出更多迭代 [4] - 新版本在代码编写和代理能力方面有实用改进 [4] 谷歌发布Genie 3世界模型 - Genie 3支持实时交互,可模拟水、光等自然现象及生态系统 [5] - 能以24帧/秒速度生成720p动态世界,视觉记忆追溯达1分钟 [5] - 模型存在动作空间有限、多智能体交互模拟困难等局限性 [5] 小红书开源多模态模型 - dots.vlm1基于DeepSeek V3打造,配备自研12亿参数视觉编码器NaViT [7] - 在视觉评测集表现接近Gemini 2.5 Pro等领先模型 [7] - 具备图文图表理解、表情包解析、产品配料表分析等能力 [7] xAI将开源Grok 2模型 - 马斯克宣布下周开源Grok 2,该模型以复杂问题处理和逻辑推理见长 [8] - 相比第一代在多个方面实现显著提升 [8] - X平台同步为订阅用户推出图片生成新功能 [8] AI应用市场格局 - 2025上半年AI搜索引擎(MAU 6.85亿)和AI综合助手(6.12亿)构成第一梯队 [9] - AI社交互动(1.26亿)和AI专业顾问(1.11亿)组成第二梯队 [9] - 近七成原生APP月活负增长,手机厂商预装助手和中长尾玩家增长乏力 [9] - DeepSeek月活从1.93亿降至1.62亿,流失用户主要转向百度(56%)和QQ浏览器(42.1%) [9] AMD季度财报 - Q2营收76.85亿美元(同比+32%),净利润8.72亿美元 [10] - 数据中心收入32亿美元(同比+14%)未达预期 [10] - 贸易政策导致8亿美元库存及相关费用损失 [10] - 剔除影响后非GAAP毛利率为54%,AI收入预计将同比增长 [10] 谷歌AI搜索影响 - 公司否认AI搜索导致网站流量下滑,称总体点击量保持相对稳定 [11][12] - 反驳第三方报告关于流量急剧下降的结论,认为其方法存在缺陷 [12]