Workflow
腾讯研究院AI速递 20250923
腾讯研究院·2025-09-23 00:01

联发科天玑9500芯片发布 - 采用第三代3nm工艺和全大核架构 集成超300亿晶体管 NPU性能比上代提升111% 功耗降低56% [1] - 采用超性能+超能效双NPU架构 首次引入存算一体设计和BitNet 1.58 bit量化推理框架 支持端侧模型训练 [1] - 支持128K长文本处理 4K画质图像生成 vivo和OPPO等厂商旗舰新机将搭载该芯片 [1] OpenAI计算资源投入与新产品 - 已投入160亿美元租用计算资源 计划在2024-2030年间投入3500亿美元租赁服务器 2030年单年预计花费1000亿美元 [2] - 与甲骨文签署5年3000亿美元算力合同 额外追加1000亿美元用于备用服务器 [2] - 预告未来几周推出计算密集型新产品 Pro用户需额外付费 [2] 谷歌开源Deep Research新范式 - 突破传统Agent"规划-检索-生成"模式 提出新的研究框架 采用"扩散式降噪"过程 [3] - 让Agent基于草稿发现信息缺口 从外部搜寻证据 反复优化研究内容 [3] - 引入多版本智能自我批判和报告级降噪技术 在GAIA等任务上全面优于OpenAI DeepResearch [3] DeepSeek发布V3.1终极版本 - 发布DeepSeek-V3.1的终极(Terminus)版本 针对用户反馈进行改进 [4] - 缓解中英文混杂 偶发异常字符等语言一致性问题 优化Code Agent与Search Agent表现 [5] - 在官方App 网页端 小程序与DeepSeek API模型同步上线 开源版本可在Hugging Face和ModelScope平台下载 [5] 可灵AI 2.5视频模型突破 - 在运动能力和表情表演方面实现重大突破 准确表现人物微表情变化与复杂情绪 维持角色一致性 [6] - 完美衔接下落 奔跑 骑摩托等连续动作 保持环境交互真实感细节 理解复杂因果关系 [6] - 在动作戏上表现极佳 生成高质量跑酷 跨越 战斗和爆炸场景 已对超级创作者灰度内测 [6] 美团高效推理模型发布 - 发布高效推理模型LongCat-Flash-Thinking 在逻辑 数学 代码和智能体等多领域达到全球开源模型最先进水平 [7] - 首创领域并行强化学习训练方法 采用异步弹性共卡系统实现三倍提速 设计双路径推理框架提升智能体能力 [7] - 在推理基准测试上全面领先开源模型 在AIME和LiveCodeBench等测试中与GPT-5等顶级闭源模型表现相当 [7] 百度开源视觉理解模型 - 发布视觉理解模型Qianfan-VL并全面开源 提供3B 8B和70B三种规格 支持OCR识别和教育垂类等场景 [8] - 基于开源模型开发 在自研昆仑芯P800上完成全流程计算 支持单任务5000卡规模并行计算 [8] - 具备思维链能力 OCR全场景识别和复杂版面文档理解能力 在多项基准测试中表现优异 [8] 亚太区科技创新人才评选 - 公布2025年度"35岁以下科技创新35人"亚太区入选名单 35位创新者来自AI 机器人 材料等领域 [10] - 夏斐 閔世媛等多位入选者在人工智能领域取得突破 包括具身智能 非参数大语言模型等方向 [10] - 中国入选者最多 截至2024年共完成11届评选 中国共82人入选 领先新加坡76人 [10] 图像生成模型发展趋势 - 图像模型未来会从创意工具转变为信息查询工具 最大挑战是把LLM的"世界知识"融入图像模型 [11] - 现有图像模型质量"上限"已接近顶点 但"下限"仍有巨大提升空间 未来将专注于提高"模型可表达性" [11] - 未来交互界面将整合文本 图像 语音等多种模态 AI模型与传统工具将长期共存 [11]