Workflow
腾讯研究院AI速递 20250822
腾讯研究院·2025-08-22 00:01

全新Pixel 10系列发布 - 谷歌发布Pixel 10系列四款机型,搭载Tensor G5芯片和Gemini Nano模型,强调AI深度整合成为标志性特点 [1] - 新机型配备多项AI功能:Gemini Live语音助手、Voice Translate实时语音翻译、Nano Banana照片编辑器和Camera Coach摄影导师等 [1] - Pro Res Zoom支持高达100倍智能变焦,Magic Cue智能信息提示自动从Gmail和日历中提取内容,谷歌宣告"传统智能手机时代终结" [1] DeepSeek-V3.1模型发布 - DeepSeek正式发布V3.1模型,采用混合推理架构同时支持思考与非思考模式,思考效率和Agent能力均有显著提升 [2] - 新模型在编程智能体测评SWE和搜索智能体测评上取得明显进步,并在保持性能的前提下减少20%-50%的输出token [2] - 模型全面开源,采用UE8M0 FP8 Scale参数精度,API同步升级对Anthropic API格式的支持,上下文扩展至128K [2] 字节Seed团队开源Seed-OSS系列模型 - 字节跳动Seed团队开源三款模型:Seed-OSS-36B-Base(含合成数据和不含合成数据两个版本)和Seed-OSS-36B-Instruct [3] - 模型用12万亿tokens训练,采用Apache-2.0许可证,支持512K超长上下文窗口和灵活推理预算控制 [3] - 在MMLU-Pro、MATH、AIME24等测试中表现突出,特别是Instruct版本在多个开源基准测试中创下新SOTA记录 [3] 港大和可灵团队推出Context as Memory技术 - 港大和快手可灵团队推出Context as Memory技术,在视频生成中实现长时间保持场景记忆力,效果媲美谷歌Genie 3且投稿时间更早 [4] - 该技术创新性地将历史生成的上下文作为"记忆",并设计基于相机轨迹视场的记忆检索机制,大幅提升计算效率 [4] - 研究发现视频生成模型能隐式学习3D先验,无需显式3D建模,能在几十秒时间尺度内保持原视频的静态场景记忆力 [4] 百度发布蒸汽机(MuseSteamer)视频模型2.0 - 百度发布蒸汽机(MuseSteamer)视频模型2.0,利用中文音视频一体化生成技术,解决AI视频生成中对白不自然的痛点 [5] - 新模型提供四款版本(turbo、pro、lite和有声版),能精准匹配中文口型,支持情感表达和方言,驱动静态照片说对白 [5] - 该技术将声音和画面同步构思,无需后期匹配,采用"多模态潜在空间规划器"技术,大幅降低视频制作成本和复杂度 [6] 腾讯元宝接入腾讯视频功能 - 腾讯元宝接入腾讯视频功能,用户与元宝聊天时若检索到腾讯视频片源,回答中会显示可点击的封面卡片或片名链接 [7] - 用户可通过给出片名寻找类似风格的影片、向元宝描述场景获取个性化片单推荐、用模糊记忆找回想不起名字的电影 [7] - 除了搜片和推荐功能,元宝还能与用户深入探讨影片的创作背景、剧情内涵和风格流派,点击相关作品即可直接跳转观看 [7] 波士顿动力Atlas人形机器人新进展 - 波士顿动力发布新视频展示Atlas人形机器人进化,基于最新的大型行为模型(LBMs)实现多任务、语言驱动的精准控制 [8] - 该系统由四部分组成:通过遥控操作收集具身行为数据、处理标注数据、训练统一神经网络策略模型、通过测试任务评估策略模型 [8] - Atlas机器人现可流畅完成"维修站"任务,包括复杂的移动操作、灵巧抓取、二次抓握等,能智能应对意外情况,推动通用AI机器人发展 [8] GPT-5官方解析 - OpenAI研究员称GPT-5的行为设计有意针对"逢迎问题",旨在平衡互动感与健康助手属性,且创造性写作、编程能力显著提升 [9] - 随着评测基准趋于饱和,未来模型优劣将主要看实际使用场景,团队从目标能力反推,根据真实世界需求设计内部评测 [9] - OpenAI的智能体发展战略从ChatGPT开始,向Deep Research、功能更完整的Agent进化,目标是构建异步执行任务的系统,能长期维持跨平台记忆 [9] Index Ventures投资逻辑 - Index Ventures投资总监强调创始人特质比市场规模更重要,优秀创始人能将小市场做大,如Adyen和Figma案例所示 [10] - 美国与欧洲创始人存在明显差异:美国创始人更具全球化野心和融资能力,欧洲创始人虽更务实但往往受限于市场分散和资本不足 [10] - 欧洲要想诞生全球性AI巨头必须解决三大核心问题:提升资本密度、加速市场一体化、完善人才体系以留住顶级研究者和创业者 [10]