腾讯研究院AI速递 20250617

GPT-5训练优化器 - 研究员Keller Jordan凭借Muon优化器博客文章加入OpenAI，可能应用于GPT-5训练 [1] - Muon优化器采用牛顿-舒尔茨迭代法实现矩阵正交化，训练速度比AdamW更快 [1] - Keller批评现有优化器研究文献充斥无效方法，提倡在竞争性训练任务中验证新方法 [1] 谷歌AI架构变革 - 谷歌承认Transformer注意力机制无法实现无限上下文，需核心架构创新 [2] - Gemini将成为谷歌统一平台，连接所有服务并支持全模态能力和智能体功能 [2] - 谷歌重组AI团队整合到DeepMind，Gemini 2.5 Pro被视为重大转折点 [2] 微软AI应用案例 - 微软展示700个AI Agent和Copilot案例，覆盖金融、医疗、教育等多行业 [3] - WellsFargo使用AI将响应时间从10分钟缩至30秒，毕马威减少50%合规工作量 [3] - 米其林生产力提升10倍，SPAR节省89个工作日，84%的BCI用户效率提升10-20% [3] Midjourney视频生成技术 - Midjourney视频模型效果细腻真实但缺乏音频功能 [4] - 采取开放策略邀请用户参与评分，渲染速度提升40%，快速模式从36秒减至22秒 [5] - V7图像模型支持语音生图、草稿模式和对话模式 [5] GenSpark智能浏览器 - AI浏览器将能力融入每个网页，提供比价、选购帮助和视频总结等功能 [6] - 支持"自动驾驶模式"自动浏览网页、整理信息、制作播客 [6] - 内置700多个工具连接实现自动化工作流，目前仅推出Mac版本 [6] AI古画修复技术 - MIT工科生用AI算法将古画修复时间从9个月压缩至3.5小时 [7] - 新方法修复5612个区域并填充57314种颜色，效率提高66倍 [7] - 修复方式可化学去除不损伤原画，缺损区域越多效果越显著 [7] 小鹏自动驾驶模型 - 研发720亿参数云端大模型，验证规模法则在VLA模型持续生效 [10] - 累计处理2000多万条视频片段，算力达10 EFLOPS [10] - Token压缩方法将车端处理量压缩70% [10] AI消费范式重构 - AI将"完成任务"取代"建立关系"成为产品主线，用户月付费可达200美元 [11] - 当前AI社交产品仅嵌入生成内容，未来需重构底层连接方式 [11] - 速度成为主要竞争力，企业需保持"动态领跑" [11] AI发展路线争议 - 黄仁勋反对"AI将取代半数白领岗位"观点，批评Anthropic封闭开发模式 [12] - Anthropic回应称从未主张独家安全AI能力 [12] - 反映两种治理观：审慎伦理框架 vs 开放竞争 [12]