Codestral

搜索文档
两岁的Llama,最初的14位作者已跑了11个!Mistral成最大赢家
机器之心· 2025-05-27 11:23
Meta人才流失现状 - Meta开源Llama模型团队的14位核心作者中已有11位离职,仅剩3人留任(研究科学家Hugo Touvron、工程师Xavier Martinet、技术负责人Faisal Azhar)[1] - 离职人员平均任职时间超过5年,部分成员参与Llama 1/2/3全周期研发后离开[11] - 人才流失集中在2023年1月至2024年间,涉及模型架构、代码生成、基础设施等关键领域[11][16][27] 离职人员去向分布 - **Mistral AI**吸纳最多人才: - 联合创始人兼CTO Timothée Lacroix(Meta工作8年2个月)[30][31] - 首席科学家Guillaume Lample(Meta工作6年5个月)[66][68] - AI科学家Baptiste Rozière(主导Code Llama开发)[16][18] - 研究工程师Marie-Anne Lachaux(参与Llama 1/2研发)[35][36] - **其他头部机构**: - Cohere基础模型训练负责人Aurélien Rodriguez(开发Command-A模型)[21][23] - Anthropic技术成员Eric Hambro(专注LLM工具微调研究)[26][27] - Google DeepMind杰出科学家Armand Joulin(总引用量超9万)[44][48][51] 对Meta的影响 - 开源领域优势削弱:开发者转向DeepSeek、Qwen等竞品,Llama 4市场反响平淡[4] - 技术研发滞后:缺乏专用推理模型,落后于谷歌/OpenAI的多步思考功能[11] - 管理层动荡:FAIR团队负责人Joelle Pineau卸任,继任者Robert Fergus曾跳槽谷歌[6][9] 核心人员学术贡献 - 离职团队学术影响力显著: - 11人中有7人Google Scholar总引用量超1.8万,最高达9万[28][33][48][55][63][68] - Llama系列论文引用量突出:Llama 1被引16,164次,Llama 2被引15,412次[42] - 衍生成果包括Code Llama(被引2,153次)、Mixtral of Experts(被引1,787次)[19][34]
深度|关于OpenAI竞对的一切,Mistral AI估值60亿美元
Z Potentials· 2025-03-08 15:32
Mistral AI概述 - 法国AI初创企业,被视为法国最有前途的科技公司之一,估值达60亿美元[1] - 成立于2023年,目标是"让前沿AI触手可及",倡导AI开放性[3] - 旗下产品包括聊天助手Le Chat及多个基础模型,定位为"全球最环保、领先的独立AI实验室"[2] 核心产品与技术 - **Le Chat**:替代ChatGPT的聊天助手,移动端发布两周内下载量突破100万,曾登顶法国iOS免费榜[5] - **模型矩阵**: - Mistral Large 2(大型语言模型)[6] - Pixtral Large(多模态模型)[7] - Codestral(代码生成模型)[8] - Les Ministraux系列(边缘设备优化)[9] - Mistral Saba(阿拉伯语专用)[10] - Mistral OCR(PDF转文本API,2025年3月推出)[11] 创始团队与背景 - 三位创始人均来自美国科技巨头:CEO Arthur Mensch(Google DeepMind前员工)、CTO Timothée Lacroix和首席科学家Guillaume Lample(Meta前员工)[12] - 联合创始顾问包括健康保险初创公司Alan的创始人及法国前数字部长[12] 商业模式与收入 - **盈利方式**: - Le Chat Pro订阅(14.99美元/月,2025年2月推出)[16] - B2B API按使用量收费及模型授权[16] - 战略合作伙伴收入分成[16] - 当前整体收入处于八位数(千万美元级)[17] 合作伙伴关系 - 微软:Azure平台分发模型+1500万欧元投资(2024年)[18] - 法新社(AFP):接入1983年以来的文本档案(2025年1月)[19] - 其他合作方:法国军队、德国Helsing、IBM、Orange、Stellantis等[20] 融资历程 - 总融资额:约10亿欧元(10.4亿美元,含债务融资)[21] - **关键轮次**: - 种子轮:1.12亿美元(2023年6月,估值2.6亿美元)[21] - A轮:3.85亿欧元(4.15亿美元,估值20亿美元)[22] - A轮延伸:微软1630万美元可转换投资(2024年2月)[23] - 混合融资:6亿欧元(6.4亿美元,估值60亿美元,2024年6月)[23] 未来规划 - 明确拒绝出售,计划通过IPO退出[24] - 需提升收入以支撑60亿美元估值[24]