腾讯研究院AI速递 20260612
腾讯研究院·2026-06-12 00:07

腾讯混元开源HPC-Ops推理算子库 - 腾讯混元AI Infra开源了工业级推理算子库HPC-Ops,新增五大关键算子,以覆盖推理全链路优化能力 [1] - Attention动态调度在长文本场景下最高加速2.95倍,端到端QPM提升17%,Sampler算子较vLLM提速4至7.5倍 [1] - Router GEMM算子通过双BF16重构FP32高精度计算,FusedMoE算子较主流框架提速1.2至1.6倍,所有成果均已正式开源 [1] 谷歌开源DiffusionGemma文本扩散模型 - 谷歌发布了实验性开源模型DiffusionGemma,采用Apache 2.0许可,模型规模为260亿,采用MoE架构,推理时仅激活38亿参数 [1] - 该模型放弃逐token自回归方式,可一次性并行生成256个token的整块文本,在GPU上的生成速度最高提升至4倍 [1] - 模型支持双向注意力与自我修正,适合行内编辑、代码补全等本地低并发场景,但输出质量低于标准版Gemma 4 [1] 小米发布并开源MiMo Code编程助手 - 小米发布了终端AI编程助手MiMo Code V0.1.0,基于OpenCode二次开发,采用MIT协议,内置限免的MiMo-V2.5模型 [2] - 该助手独创持久记忆系统与Compose模式,可自动完成从设计、规划、编码、测试到审查的全流程,交付工业级成品 [2] - 在同模型对比下,MiMo Code在SWE-Bench Pro基准测试中达到62%的准确率,在Terminal Bench 2中达到73%的准确率,均优于Claude Code [2] Meshy发布3D创作AI Agent - 胡渊鸣创立的Meshy推出了全球首个3D创作AI Agent,可通过多轮对话完成从概念探索到模型导出的全流程 [2] - 该工具打通了生成、编辑、风格统一、打印检查与多格式导出环节,将单点生成工具升级为完整的3D资产生产工作流入口 [2] - 该技术将建模成本从约1000美元降至1美元,速度提升近千倍,目前已服务全球超千万用户,生成了超过1亿个3D模型 [2] Codex协助天体物理研究提速 - 亚利桑那大学的Chi-kwan Chan借助OpenAI Codex改进了黑洞等离子体模拟算法,以破解算力压制难题 [3] - Codex帮助推导候选算法、发现新的坐标变换与数值方法,据称某些计算速度可提升至1000倍 [3] - 研究者强调AI不替代人,所有方案仍需实现与验证,决策只在测试之后做出,以保持可重复性基础 [3] 头部企业AI支出与分层差距 - Ramp最新AI Index报告显示,采用程度前1%的企业,其人均每月AI支出达7500美元(约5万元人民币),较上月环比上涨14.1% [3] - 尽管token单价在两年内下降了98%,但智能体应用放大了使用量,导致企业AI总账单上涨约320%,年均预算从120万美元增至700万美元 [3] - 前1%企业与中位数公司的AI支出差距高达680倍,分歧不仅在于订阅数量,更体现在工作流整合、数据利用与组织熟练度上 [3] Sarah Guo论AI创业方向 - Conviction创始人Sarah Guo撰文反驳“AI绝望论”,认为凡可被基准测量(Benchmark)的工作终将被商品化,并被模型替代 [4][5] - 真正有价值的工作天生“不可读”或难以标准化,其正确性依赖于企业私有数据与封闭系统,通过许可、问责与信任建立壁垒 [4] - 应用公司的机会在于处理行业特有的“脏活”、定义行业“什么叫好”,并用私有数据训练专用模型,而非在通用任务上比拼算力 [5] Anthropic CEO呼吁政府监管前沿AI - Anthropic CEO Dario Amodei发文称,AI能力的指数级增长趋势不可逆,因此主动要求政府对头部AI企业实施强制第三方测试与监管 [6] - 提议参照美国联邦航空管理局的适航认证模式,对网络、生物、失控、研发加速四类风险进行审查,政府应对高危模型拥有部署否决权 [6] - 同步发布了前沿监管与就业补偿两份政策提案,并承诺投入2亿美元用于相关研究,投入1.5亿美元用于技能培训奖学金 [6]

腾讯研究院AI速递 20260612 - Reportify