Workflow
SmolLM
icon
搜索文档
美国开源AI最后的旗帜,也倒了
量子位· 2026-03-30 09:34
艾伦人工智能研究所(AI2)的战略转向与核心团队流失 - 艾伦人工智能研究所宣布削减对开源模型开发(包括OLMo系列)的资金投入,将战略重心转向AI应用[1] - 研究所核心团队被“打包带走”,前CEO阿里·法哈迪、前首席运营官索菲·莱布雷希特、OLMo项目联合负责人汉娜·哈吉希尔齐以及关键项目主导者兰杰·克里希纳等核心人员集体离职,加入微软穆斯塔法·苏莱曼领导的超级智能团队[2][3][9][10] - 前CEO阿里·法哈迪已于3月26日卸任,结束了超过两年半的任期[11] 战略转向背后的资金与资助方因素 - 非营利组织难以以慈善资金与科技巨头竞争:训练GPT-4级别模型的成本估计在1-2亿美元量级,当前前沿模型训练成本已攀升至数亿美元,而AI2的年度运营预算与之相比存在数量级差距[27][28][29][32] - 主要资助方科学与技术基金会(FFST,由保罗·艾伦遗产设立,规模达31亿美元)的资助策略发生显著变化[33] - 2024年新任FFST CEO琳达·斯图尔特博士更倾向于资助具有明确科学应用和可量化社会影响的项目,而非前沿模型研究[34][36][37] - FFST对AI2的资助模式将从提供年度总资助转向基于项目提案的资助模式,这种成果导向的模式对周期长、成本高的开源基础模型开发不利[37][38] - 有知情人士透露,FFST未来的资助预计将更倾向于人工智能的实际应用,而非构建开源基础模型[38] OLMo项目的开源标杆意义及其终结 - AI2的OLMo系列极致践行“完全开源”理念,不仅开源模型权重,而且公开从数据处理、预训练、微调到评测的全流程,并采用Apache 2.0许可证[42][43] - 2025年11月发布的OLMo 3系列包括Base、Instruct、Think和RL Zero四个变体,覆盖70亿和320亿参数规模,其中OLMo 3-Think 320亿被宣传为“该规模首个完全开源推理模型”[43][44] - AI2发布了完整的“模型流程”,包括训练日志、中间检查点、完整代码和配置,以及升级版的OlmoTrace工具,其透明度高于Llama(只开源权重)和Mistral(部分数据闭源)[45][46] - OLMo与Llama 4、Mistral Large 3并称为“三大开源支柱”,其战略调整被视为美国开源AI领域旗帜性标杆的倒下[46][47][50] 美国开源AI生态的演变与中国的崛起 - 美国现存的开源力量存在局限:Meta的LLaMA训练数据不公开且许可有限制;谷歌的Gemma不提供完整训练数据或流程;Hugging Face的SmolLM由社区驱动但缺乏大规模训练资源;英伟达的Nemotron系列主要服务其硬件生态[54][55][56][57] - 中国开源模型在性能上已超越美国领先的开源模型,并进一步拉大差距[58] - 在OpenRouter上,过去三周中国大模型的调用量已经连续超过美国[60] - MIT与Hugging Face的联合报告显示,过去一年中国开源模型全球下载量占比达到17.1%,首次反超美国[63] - 许多美国初创企业开始依赖中国开源模型进行构建,例如Cursor的新模型Composer 2被曝套壳Kimi K2.5,Deep Cogito的Cogito v2.1被曝基模是DeepSeek[64] - 行业观点认为,开源AI已完全进入“中国时间”,未来大模型的“安卓版”可能只能在中国出现[65][66] 相关项目与人员背景 - 汉娜·哈吉希尔齐是开源多模态人工智能基础设施加速科学发展项目(OMAI)的联合首席研究员,该项目为期5年,耗资1.52亿美元,由英伟达和美国国家科学基金会联合资助,年均资助约3000万美元[17][18][31] - 阿里·法哈迪曾联合创立AI2的衍生公司Xnor.ai,该公司于2020年被苹果以约2亿美元的价格收购[14] - 微软穆斯塔法·苏莱曼的超级智能团队自去年11月起组建,已从谷歌、Meta、OpenAI、Anthropic等巨头以及AI2和华盛顿大学聘请了大量人才[21] - AI2临时CEO皮特·克拉克表示研究所仍致力于其使命以及与NSF和Nvidia的合作关系,包括OMAI计划[52]