腾讯研究院AI速递 20250923

联发科天玑9500芯片发布 - 采用第三代3nm工艺和全大核架构集成超300亿晶体管 NPU性能比上代提升111% 功耗降低56% [1] - 采用超性能+超能效双NPU架构首次引入存算一体设计和BitNet 1.58 bit量化推理框架支持端侧模型训练 [1] - 支持128K长文本处理 4K画质图像生成 vivo和OPPO等厂商旗舰新机将搭载该芯片 [1] OpenAI计算资源投入与新产品 - 已投入160亿美元租用计算资源计划在2024-2030年间投入3500亿美元租赁服务器 2030年单年预计花费1000亿美元 [2] - 与甲骨文签署5年3000亿美元算力合同额外追加1000亿美元用于备用服务器 [2] - 预告未来几周推出计算密集型新产品 Pro用户需额外付费 [2] 谷歌开源Deep Research新范式 - 突破传统Agent"规划-检索-生成"模式提出新的研究框架采用"扩散式降噪"过程 [3] - 让Agent基于草稿发现信息缺口从外部搜寻证据反复优化研究内容 [3] - 引入多版本智能自我批判和报告级降噪技术在GAIA等任务上全面优于OpenAI DeepResearch [3] DeepSeek发布V3.1终极版本 - 发布DeepSeek-V3.1的终极(Terminus)版本针对用户反馈进行改进 [4] - 缓解中英文混杂偶发异常字符等语言一致性问题优化Code Agent与Search Agent表现 [5] - 在官方App 网页端小程序与DeepSeek API模型同步上线开源版本可在Hugging Face和ModelScope平台下载 [5] 可灵AI 2.5视频模型突破 - 在运动能力和表情表演方面实现重大突破准确表现人物微表情变化与复杂情绪维持角色一致性 [6] - 完美衔接下落奔跑骑摩托等连续动作保持环境交互真实感细节理解复杂因果关系 [6] - 在动作戏上表现极佳生成高质量跑酷跨越战斗和爆炸场景已对超级创作者灰度内测 [6] 美团高效推理模型发布 - 发布高效推理模型LongCat-Flash-Thinking 在逻辑数学代码和智能体等多领域达到全球开源模型最先进水平 [7] - 首创领域并行强化学习训练方法采用异步弹性共卡系统实现三倍提速设计双路径推理框架提升智能体能力 [7] - 在推理基准测试上全面领先开源模型在AIME和LiveCodeBench等测试中与GPT-5等顶级闭源模型表现相当 [7] 百度开源视觉理解模型 - 发布视觉理解模型Qianfan-VL并全面开源提供3B 8B和70B三种规格支持OCR识别和教育垂类等场景 [8] - 基于开源模型开发在自研昆仑芯P800上完成全流程计算支持单任务5000卡规模并行计算 [8] - 具备思维链能力 OCR全场景识别和复杂版面文档理解能力在多项基准测试中表现优异 [8] 亚太区科技创新人才评选 - 公布2025年度"35岁以下科技创新35人"亚太区入选名单 35位创新者来自AI 机器人材料等领域 [10] - 夏斐閔世媛等多位入选者在人工智能领域取得突破包括具身智能非参数大语言模型等方向 [10] - 中国入选者最多截至2024年共完成11届评选中国共82人入选领先新加坡76人 [10] 图像生成模型发展趋势 - 图像模型未来会从创意工具转变为信息查询工具最大挑战是把LLM的"世界知识"融入图像模型 [11] - 现有图像模型质量"上限"已接近顶点但"下限"仍有巨大提升空间未来将专注于提高"模型可表达性" [11] - 未来交互界面将整合文本图像语音等多种模态 AI模型与传统工具将长期共存 [11]