Workflow
OLMo系列
icon
搜索文档
美国开源AI最后的旗帜,也倒了
量子位· 2026-03-30 09:34
艾伦人工智能研究所(AI2)的战略转向与核心团队流失 - 艾伦人工智能研究所宣布削减对开源模型开发(包括OLMo系列)的资金投入,将战略重心转向AI应用[1] - 研究所核心团队被“打包带走”,前CEO阿里·法哈迪、前首席运营官索菲·莱布雷希特、OLMo项目联合负责人汉娜·哈吉希尔齐以及关键项目主导者兰杰·克里希纳等核心人员集体离职,加入微软穆斯塔法·苏莱曼领导的超级智能团队[2][3][9][10] - 前CEO阿里·法哈迪已于3月26日卸任,结束了超过两年半的任期[11] 战略转向背后的资金与资助方因素 - 非营利组织难以以慈善资金与科技巨头竞争:训练GPT-4级别模型的成本估计在1-2亿美元量级,当前前沿模型训练成本已攀升至数亿美元,而AI2的年度运营预算与之相比存在数量级差距[27][28][29][32] - 主要资助方科学与技术基金会(FFST,由保罗·艾伦遗产设立,规模达31亿美元)的资助策略发生显著变化[33] - 2024年新任FFST CEO琳达·斯图尔特博士更倾向于资助具有明确科学应用和可量化社会影响的项目,而非前沿模型研究[34][36][37] - FFST对AI2的资助模式将从提供年度总资助转向基于项目提案的资助模式,这种成果导向的模式对周期长、成本高的开源基础模型开发不利[37][38] - 有知情人士透露,FFST未来的资助预计将更倾向于人工智能的实际应用,而非构建开源基础模型[38] OLMo项目的开源标杆意义及其终结 - AI2的OLMo系列极致践行“完全开源”理念,不仅开源模型权重,而且公开从数据处理、预训练、微调到评测的全流程,并采用Apache 2.0许可证[42][43] - 2025年11月发布的OLMo 3系列包括Base、Instruct、Think和RL Zero四个变体,覆盖70亿和320亿参数规模,其中OLMo 3-Think 320亿被宣传为“该规模首个完全开源推理模型”[43][44] - AI2发布了完整的“模型流程”,包括训练日志、中间检查点、完整代码和配置,以及升级版的OlmoTrace工具,其透明度高于Llama(只开源权重)和Mistral(部分数据闭源)[45][46] - OLMo与Llama 4、Mistral Large 3并称为“三大开源支柱”,其战略调整被视为美国开源AI领域旗帜性标杆的倒下[46][47][50] 美国开源AI生态的演变与中国的崛起 - 美国现存的开源力量存在局限:Meta的LLaMA训练数据不公开且许可有限制;谷歌的Gemma不提供完整训练数据或流程;Hugging Face的SmolLM由社区驱动但缺乏大规模训练资源;英伟达的Nemotron系列主要服务其硬件生态[54][55][56][57] - 中国开源模型在性能上已超越美国领先的开源模型,并进一步拉大差距[58] - 在OpenRouter上,过去三周中国大模型的调用量已经连续超过美国[60] - MIT与Hugging Face的联合报告显示,过去一年中国开源模型全球下载量占比达到17.1%,首次反超美国[63] - 许多美国初创企业开始依赖中国开源模型进行构建,例如Cursor的新模型Composer 2被曝套壳Kimi K2.5,Deep Cogito的Cogito v2.1被曝基模是DeepSeek[64] - 行业观点认为,开源AI已完全进入“中国时间”,未来大模型的“安卓版”可能只能在中国出现[65][66] 相关项目与人员背景 - 汉娜·哈吉希尔齐是开源多模态人工智能基础设施加速科学发展项目(OMAI)的联合首席研究员,该项目为期5年,耗资1.52亿美元,由英伟达和美国国家科学基金会联合资助,年均资助约3000万美元[17][18][31] - 阿里·法哈迪曾联合创立AI2的衍生公司Xnor.ai,该公司于2020年被苹果以约2亿美元的价格收购[14] - 微软穆斯塔法·苏莱曼的超级智能团队自去年11月起组建,已从谷歌、Meta、OpenAI、Anthropic等巨头以及AI2和华盛顿大学聘请了大量人才[21] - AI2临时CEO皮特·克拉克表示研究所仍致力于其使命以及与NSF和Nvidia的合作关系,包括OMAI计划[52]
麦肯锡 & Mozilla:2025 人工智能时代下的开源技术研究报告
欧米伽未来研究所2025· 2025-04-24 19:53
开源AI的应用现状 - 开源AI技术在企业AI技术栈的七个关键领域实现显著渗透,超过半数受访者在数据、模型和工具三个核心领域利用开源技术[4] - 在模型层面,Meta的Llama系列、Google的Gemma系列、阿里巴巴的Qwen 2.5-Max等开源或部分开源模型性能快速提升,正在追赶甚至超越部分专有模型[5] - 开源技术应用存在结构性差异,模型修改和托管/推理计算领域采用率相对较低,可能与企业更倾向使用内部开发工具包有关[6] - 科技、媒体和电信(TMT)行业开源AI使用率高达70%,印度(77%)和英国(75%)的受访者报告的开源AI模型使用率最高[7] 开源AI的价值驱动因素 - 60%受访者认为开源AI实施成本低于专有方案,46%认为维护成本更低,51%认为相关软件工具成本更低[8] - 绝大多数受访者对使用的开源AI模型表示满意,高性能和易于使用是驱动满意度的首要因素[8] - 81%开发者表示拥有开源工具经验在其领域受到高度重视,66%认为使用开源工具对工作满意度至关重要[9][10] - 48%受访者认为专有工具能更快带来价值,仅33%认为开源工具在这方面表现更好[9] 开源AI的未来发展趋势 - 75%受访者预计其组织将在未来几年增加对开源AI技术的使用[11] - 2024年开源AI领域里程碑事件包括Meta的Llama 3基准测试表现优异,DeepSeek-V3推理速度媲美顶级专有系统[11] - 超过70%受访者在AI技术栈各层面对采用开源或专有技术持开放态度,未来可能形成混合式AI解决方案[11] - 企业正在采取建立"护栏"、第三方评估、加强文档管理和监控等措施应对开源AI风险[14][15] 开源AI的行业影响 - 开源AI正在成为企业构建AI能力、驱动创新、寻求竞争优势的核心组成部分[3] - 开源模式通过降低创新门槛促进技术普及与迭代,打破了传统商业软件的封闭模式[1] - 理解并战略性地运用开源AI已成为企业在智能化时代生存和发展的必修课[3] - 企业需要将开源AI视为整体AI战略不可或缺的一部分,采取务实灵活的混合策略[17]