腾讯研究院AI速递 20260623

特斯拉布局模块化AI数据中心硬件 - 特斯拉向美国专利商标局提交“Megapod”商标申请，计划销售涵盖服务器、网络设备、配电与冷却系统的模块化AI数据中心硬件，支持即插即用部署AI训练与推理 [1] - 该举措延续了“Megapack”储能和“Megablock”电力模块的“mega三部曲”思路，其切入点更可能是解决数据中心的电力、储能与冷却等基础设施痛点，而非直接参与英伟达GPU的竞争 [1] - 其中，xAI在两年内累计采购了价值约10亿美元的Megapack储能产品，表明特斯拉在AI领域的重要变现入口可能是其电池储能业务，而不仅仅是自动驾驶 [1] Sakana AI发布模型编排器 - 日本独角兽Sakana AI发布Fugu系列编排器模型，其中Fugu Ultra在工程、科学和推理基准测试上的性能接近或超越了Fable 5与Mythos Preview等顶尖模型 [1] - Fugu模型本身不直接生成答案，而是充当“总指挥”，通过任务识别、模型选择、工作流设计与反馈优化四大机制，调度GPT、Claude、Gemini等多个大模型协作完成任务 [1] - 其底层调用的模型池完全可替换，若一家供应商断供可立即切换至另一家，该公司将此模式称为“AI主权的现实蓝图”，并主张模型编排能力将成为AI发展的新前沿方向 [1] Anthropic加速模型迭代 - 据爆料，Claude Sonnet-5的域名已在合作伙伴网站出现，内部代号为“Fennec”，最快可能于下周发布，其主打编程性能、速度与性价比优于Opus和Fable模型，并支持百万级token的上下文长度 [2] - 距离其首版Mythos模型上线仅过去两个月，代号为Mythos 5.1或6的新版本疑似已在内部完成训练，这种在60天内实现跨代迭代的速度显示出其研发飞轮正在加速 [2] - 《经济学人》披露，Fable 5和Mythos 5模型曾被封锁与安全担忧有关，但封禁反而释放了算力资源，业界认为其模型迭代速度因此不降反升 [2] 阿里升级视频生成模型 - 阿里巴巴发布视频生成模型HappyHorse 1.1，在动态表现力、主体一致性、指令遵循、视觉质感与音频能力五个维度实现提升，支持生成3至15秒、分辨率为720p及1080p的视频 [2] - 实测显示，画面“油腻感”得到明显改善，运动连贯性与角色还原更加稳定，但在边缘场景、多参考主体的物理规律遵循方面仍有优化空间 [2] - 模型已上线阿里云百炼与官网，其1080p视频的生成价格下调了25%，至每秒1.2元人民币，此次升级幅度符合小版本迭代的预期 [2] 百度开源高性能OCR模型 - 百度开源了Unlimited OCR模型，总参数量为30亿，激活参数量仅为5亿，在OmniDocBench v1.5和v1.6基准测试上分别取得了93.23%和93.92%的成绩，刷新了端到端OCR的SOTA记录，并超越了参数量达2350亿的Qwen3-VL等大模型 [3] - 其核心技术R-SWA使模型在推理时始终可见完整原文、仅需回看前128个token，并将KV缓存固定为恒定队列，从而实现一次推理即可转录数十页文档而不失忆、不降速 [3] - 模型与代码已上线GitHub与HuggingFace平台，该模型的核心贡献者疑似为从DeepSeek出走的OCR领域专家魏浩然 [3] DeepSeek大力招募Agent人才 - DeepSeek公司Harness部门负责人崔添翼连续放出研究员、工程师、产品经理三个岗位的招聘信息，自称每天都在面试、四处贴广告，招聘进行了一个多月仍未招满 [3] - Harness部门负责模型之外让智能体（Agent）落地的全部工作，其中研究员偏重问题定义与能力上限探索，工程师负责架构实现，产品经理则连接研究、工程与用户 [3] - 三份职位描述串联起上下文工程、长期记忆、子智能体、多智能体等能力坐标，折射出AI发展进入下半场后，行业对复合型智能体团队的激烈争夺 [3] 美国拟议对AI巨头征税并建立主权基金 - 美国参议员桑德斯拟提出《美国AI主权财富基金法案》，主张对OpenAI、Anthropic、xAI等公司一次性征收50%的股权税，让公众直接持股 [4] - 其核心理由是AI建立在全人类集体知识之上，科技巨头未经许可、未给报酬即据为己有，因此创造的财富理应惠及全民而非少数亿万富翁 [4] - 副总统万斯称前总统特朗普对政府持股的思路持开放态度，而马斯克则主张直接向民众发放现金，关于AI财富分配方式的争论已进入主流政治议程 [4] 学界观点：AGI是炒作，AI需与经济学结合 - 机器学习奠基者Michael Jordan批评通用人工智能（AGI）只是一个“公关术语”，认为这种在亢奋与恐慌之间的两极叙事正在误导年轻研究者与产业发展方向 [4] - 他主张AI当前最大的局限恰恰来自其最擅长的“优化”能力，因为真实世界涉及多方参与者的利益与协调，未来的机器学习必须与经济学的均衡、激励机制设计相结合 [4] - 他强调不确定性不是需要被消除的缺陷，而是系统稳定的一部分，未来AI领域的核心人才需要兼具计算、推断与经济三种思维 [4]