腾讯研究院AI速递 20260612

腾讯混元开源HPC-Ops推理算子库 - 腾讯混元AI Infra开源了工业级推理算子库HPC-Ops，新增五大关键算子，以覆盖推理全链路优化能力 [1] - Attention动态调度在长文本场景下最高加速2.95倍，端到端QPM提升17%，Sampler算子较vLLM提速4至7.5倍 [1] - Router GEMM算子通过双BF16重构FP32高精度计算，FusedMoE算子较主流框架提速1.2至1.6倍，所有成果均已正式开源 [1] 谷歌开源DiffusionGemma文本扩散模型 - 谷歌发布了实验性开源模型DiffusionGemma，采用Apache 2.0许可，模型规模为260亿，采用MoE架构，推理时仅激活38亿参数 [1] - 该模型放弃逐token自回归方式，可一次性并行生成256个token的整块文本，在GPU上的生成速度最高提升至4倍 [1] - 模型支持双向注意力与自我修正，适合行内编辑、代码补全等本地低并发场景，但输出质量低于标准版Gemma 4 [1] 小米发布并开源MiMo Code编程助手 - 小米发布了终端AI编程助手MiMo Code V0.1.0，基于OpenCode二次开发，采用MIT协议，内置限免的MiMo-V2.5模型 [2] - 该助手独创持久记忆系统与Compose模式，可自动完成从设计、规划、编码、测试到审查的全流程，交付工业级成品 [2] - 在同模型对比下，MiMo Code在SWE-Bench Pro基准测试中达到62%的准确率，在Terminal Bench 2中达到73%的准确率，均优于Claude Code [2] Meshy发布3D创作AI Agent - 胡渊鸣创立的Meshy推出了全球首个3D创作AI Agent，可通过多轮对话完成从概念探索到模型导出的全流程 [2] - 该工具打通了生成、编辑、风格统一、打印检查与多格式导出环节，将单点生成工具升级为完整的3D资产生产工作流入口 [2] - 该技术将建模成本从约1000美元降至1美元，速度提升近千倍，目前已服务全球超千万用户，生成了超过1亿个3D模型 [2] Codex协助天体物理研究提速 - 亚利桑那大学的Chi-kwan Chan借助OpenAI Codex改进了黑洞等离子体模拟算法，以破解算力压制难题 [3] - Codex帮助推导候选算法、发现新的坐标变换与数值方法，据称某些计算速度可提升至1000倍 [3] - 研究者强调AI不替代人，所有方案仍需实现与验证，决策只在测试之后做出，以保持可重复性基础 [3] 头部企业AI支出与分层差距 - Ramp最新AI Index报告显示，采用程度前1%的企业，其人均每月AI支出达7500美元（约5万元人民币），较上月环比上涨14.1% [3] - 尽管token单价在两年内下降了98%，但智能体应用放大了使用量，导致企业AI总账单上涨约320%，年均预算从120万美元增至700万美元 [3] - 前1%企业与中位数公司的AI支出差距高达680倍，分歧不仅在于订阅数量，更体现在工作流整合、数据利用与组织熟练度上 [3] Sarah Guo论AI创业方向 - Conviction创始人Sarah Guo撰文反驳“AI绝望论”，认为凡可被基准测量（Benchmark）的工作终将被商品化，并被模型替代 [4][5] - 真正有价值的工作天生“不可读”或难以标准化，其正确性依赖于企业私有数据与封闭系统，通过许可、问责与信任建立壁垒 [4] - 应用公司的机会在于处理行业特有的“脏活”、定义行业“什么叫好”，并用私有数据训练专用模型，而非在通用任务上比拼算力 [5] Anthropic CEO呼吁政府监管前沿AI - Anthropic CEO Dario Amodei发文称，AI能力的指数级增长趋势不可逆，因此主动要求政府对头部AI企业实施强制第三方测试与监管 [6] - 提议参照美国联邦航空管理局的适航认证模式，对网络、生物、失控、研发加速四类风险进行审查，政府应对高危模型拥有部署否决权 [6] - 同步发布了前沿监管与就业补偿两份政策提案，并承诺投入2亿美元用于相关研究，投入1.5亿美元用于技能培训奖学金 [6]