Open-source models
搜索文档
Microsoft hires former Ai2 CEO Ali Farhadi and key researchers for Suleyman's AI team
GeekWire· 2026-03-24 06:32
微软AI人才招聘 - 微软聘请了来自艾伦人工智能研究所和华盛顿大学的一组顶尖AI研究人员,包括前Ai2首席执行官Ali Farhadi [2] - 加入微软的成员包括Ali Farhadi、Hanna Hajishirzi、Ranjay Krishna以及前Ai2首席运营官Sophie Lebrecht,他们将在加入Mustafa Suleyman团队的同时保留在华大的教职 [3][10] - Mustafa Suleyman是微软AI的CEO,他近期将工作重心从监督面向用户的Copilot产品转向领导微软的“超级智能”团队 [4] 微软AI战略布局 - 此次招聘是微软为减少对OpenAI前沿AI模型依赖、并与亚马逊、谷歌等公司竞争所做的努力的一部分 [4] - Suleyman的“超级智能”团队成立于去年11月,是微软推动开发自身基础模型更广泛行动的一部分 [4] - 微软已从谷歌DeepMind、Meta、OpenAI和Anthropic聘请了研究人员,此次加入的Ai2和华大团队将为微软带来开源模型开发和训练效率方面的深厚专业知识 [5] - 微软的“超级智能”团队拥有数十亿美元的计算投资作为后盾,为研究人员提供了进行大规模研究的资源和使命 [16] 新加入成员的专业背景 - Ali Farhadi是计算机视觉专家,共同创立了Ai2的衍生公司Xnor.ai,该公司于2020年被苹果以约2亿美元收购,之后他重返Ai2担任CEO [8] - Hanna Hajishirzi是OLMo开源语言模型项目的联合负责人,也是一项由美国国家科学基金会和英伟达支持的1.52亿美元、为期五年倡议的共同首席研究员,该倡议旨在为科学研究构建开放AI模型 [6] - Ranjay Krishna领导了Ai2的Molmo多模态模型等项目的开发 [7] - Sophie Lebrecht曾将Ai2的运营和开源工作规模化,她还共同创立了AI公司Neon Labs,并拥有布朗大学认知神经科学博士学位 [10] - Suleyman称赞Farhadi领导Ai2在一年内发布了超过100个模型,并称Hajishirzi是“世界上被引用最多的自然语言处理研究者之一” [10] 对艾伦人工智能研究所的影响 - 这批人员的离职对Ai2是一个显著的集体损失,Ai2由已故微软联合创始人Paul Allen于2014年创立 [6] - Ai2临时CEO Peter Clark承认了这些离职,但表示研究所仍致力于其使命以及与NSF和英伟达的合作关系,包括OMAI倡议 [9] - Ai2董事会主席Bill Hilf表示,Farhadi希望在最前沿的AI领域进行研究,而营利性公司正在花费数十亿美元训练最先进的模型,非营利组织的慈善资金是否应用于尝试跟上步伐是董事会必须权衡的问题 [11][12] Ai2资金环境的变化 - Ai2最初由Allen的Vulcan Inc.资助,后来由其遗产资助,其主要支持者现在是“科学与技术基金”,这是一个根据Allen指示创建、于8月公开启动的31亿美元基金会 [14] - 该基金会由CEO Dr. Lynda Stuart领导,她更青睐AI的应用,而非成本高昂的前沿模型开发工作 [15] - Ai2已从固定的年度预算转向基于提案的资金申请流程,未来的支持预计将更倾向于AI的现实应用,而非构建开源基础模型 [15] - 这种资金重点的转变是导致这波离职潮的原因之一 [13][15]
企业级LLM:性能为王,开源采用趋于平缓 | Jinqiu Select
锦秋集· 2025-08-03 12:31
核心观点 - 企业级LLM API支出在过去六个月内从35亿美元增长至84亿美元,实现翻倍增长,闭源模型正在建立性能护城河 [1] - Anthropic以32%的市场份额超越OpenAI成为企业级AI市场新领导者 [2] - 代码生成已成为AI的第一个杀手级应用,Claude在代码生成领域占据42%的市场份额,远超OpenAI的21% [2] - 强化学习与验证器(RLVR)成为扩展智能的新路径,模型训练重心从"数据量"转向"后训练"的质量和效率 [2] - 2025年被称为"智能体之年",大模型通过工具集成和多轮交互解决复杂问题 [2] 基础模型市场格局 - 企业级LLM API支出从2024年11月的35亿美元跃升至2025年中的84亿美元 [4] - Anthropic占据32%市场份额,OpenAI降至25%,谷歌占20%,Meta的Llama占9%,DeepSeek仅占1% [9] - Claude Sonnet 3.5和3.7的发布推动Anthropic登顶,Claude 4、Opus 4和Claude Code巩固其领先地位 [12] 开源模型现状 - 开源模型采用率从19%降至13%,性能仍落后闭源模型9到12个月 [14] - Meta的Llama仍是开源领导者,但Llama 4表现平平 [14] - 部署复杂性和对中国公司API的顾虑阻碍开源模型在企业市场的扩张 [14] - 66%开发者选择在现有提供商内升级模型,仅11%会切换供应商 [20] 市场动态 - 开发者优先选择性能最好的模型而非更便宜的替代品,模型价格下降10倍也不会影响选择 [25] - 74%初创企业和49%大型企业的计算支出转向推理,高于去年的48%和29% [27] - Claude 4发布后一个月内占据Anthropic用户群的45%,Sonnet 3.5份额从83%降至16% [23] 技术趋势 - 代码生成领域已形成19亿美元的生态系统,AI集成开发环境和应用程序构建器成为新类别 [13] - 互联网数据规模成为瓶颈,强化学习与验证器(RLVR)在后训练阶段发挥关键作用 [13] - 模型训练为"代理"使其能够逐步思考、通过问题推理并使用外部工具 [13]