Workflow
Mistral Small
icon
搜索文档
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
猿大侠· 2025-08-15 12:11
公司争议事件 - 网友爆料Mistral离职员工群发邮件揭露公司多项黑幕,其中最劲爆的是Mistral最新模型疑似直接蒸馏自DeepSeek,却对外包装成强化学习成功案例并歪曲基准测试结果[2][3] - 早在6月就有博主通过"语言指纹"分析发现Mistral-small-3.2和DeepSeek-v3高度相似,而2月时网友还调侃DeepSeek是"中国的Mistral",半年后剧情反转[7][9][11] - 推特博主Sam Peach通过分析模型输出中过度使用的词汇模式(Slop),采用层次聚类方法生成相似性图,证实Mistral-small-3.2和DeepSeek-v3输出模式高度相似[13][14][16][17][18] 公司背景与市场地位 - Mistral被誉为欧洲版OpenAI,是全球开源明星玩家之一,模型性能一直备受好评[4][5] - 公司成立于2023年,base法国巴黎,由前Google DeepMind的Arthur Mensch和前Meta的Guillaume Lample与Timothée Lacroix联合创立[24] - 2024年6月完成由General Catalyst领投的6亿欧元(6.45亿美元)融资,估值达58亿欧元(62亿美元),排名全球第四(美国湾区外排名第一)[25] 业务与技术 - Mistral保持开源路线,今年开源模型包括轻量级模型Mistral Small和主打编程的Mistral Code等,在多语言处理和推理能力方面具备竞争力[27] - 推出自家聊天机器人LeChat,对标ChatGPT,内置深度研究模式、原生多语言推理和高级图像编辑等功能[28] - 就在争议爆发前一天,公司还发布了新模型Mistral Medium V3.1[29] 市场动态 - 2024年8月被曝估值达到100亿美元,且正在筹集新一轮10亿美元融资[25] - 在大模型市场中凭借开源、小快灵的特点占据独特地位[27]
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
量子位· 2025-08-14 15:34
核心观点 - Mistral最新模型被曝疑似直接蒸馏自DeepSeek-v3 而非独立训练 且对外包装成强化学习成功案例并歪曲基准测试结果 [3][11][13][19][21] - 该事件由离职员工群发邮件爆料 引发行业震动 因Mistral在开源AI领域具有重要地位 [2][4][5][24] - 此前已有技术分析显示Mistral-small-3.2与DeepSeek-v3存在异常相似性 通过语言指纹和层次聚类方法验证 [7][12][15][16][17] 事件背景 - Mistral被誉为欧洲版OpenAI 成立于2023年 由前Google DeepMind和Meta员工创立 主打开源小模型路线 [24][27] - 公司2024年6月完成6亿欧元融资 估值62亿美元 8月估值升至100亿美元 正筹集新一轮10亿美元融资 [25] - 产品包括Mistral Small轻量模型、Mistral Code编程模型及对标ChatGPT的LeChat聊天机器人 [27][28] 技术争议 - 博主Sam Peach通过分析模型输出中的高频词汇模式(Slop) 发现Mistral-small-3.2与DeepSeek-v3存在统计学层面的高度相似性 [12][15][16] - 层次聚类结果显示两模型在相似性图中位置异常接近 独立训练难以产生此结果 指向蒸馏技术可能性 [13][17] - 行业共识认为蒸馏模型应明确标注 Mistral未披露该信息涉嫌误导公众 [21][22] 市场影响 - 事件曝光时Mistral刚发布新模型Mistral Medium V3.1 官方暂未回应争议 [29] - 此前DeepSeek曾被调侃为"中国Mistral" 半年后剧情反转凸显技术竞争动态 [9][10] - 公司多语言处理和推理能力受认可 在非美国市场估值排名第一 [25][27]
深度|英伟达黄仁勋对话欧洲最大AI独角兽Mistral CEO: 开源是技术民主化的基石;AI将对每个国家的GDP产生双位数影响
Z Potentials· 2025-04-11 12:20
主权AI的战略价值与国家主导权 - AI被视为通用技术,能应用于服务业、农业、国防等所有国家关键领域,具备广泛经济和社会影响力 [3][4] - 集中式AI模型存在局限性,需基于特定文化、语言和需求进行定制化改造,例如瑞典需专注瑞典语和文化,沙特需关注本地生态 [5][6] - 开源是技术民主化基石,加速技术进步并保障主权视角下的开放性,企业和国家需自主部署模型 [3][27] AI与历史通用技术的异同 - AI与电力类似,将对各国GDP产生双位数影响,缺乏本土AI能力将导致经济利益外流和经济依赖性 [6][7] - AI的可塑性是其独特属性,需通过基础设施、人才和软件塑造数字劳动力,且内容生成技术承载社会文化和价值观 [7][8] - 数字智能成为国家新基础设施层,需决定外包或自主掌控,如同管理电信、医疗和教育 [8][9] 定制化AI的实现路径 - 采用"通用模型+垂直专业化"分层架构,例如Mistral Small通用模型经阿拉伯语调优后性能超越更大规模模型 [18][19] - 语言是定制化首要切入点,后续需结合法律、医疗等垂直领域知识,通用模型提供商难以完成此类深度定制 [19][20] - IT部门将转型为数字员工HR部门,负责模型微调、护栏设置和持续优化,形成自我强化飞轮 [10][22] 开源协作的生态价值 - 开源激活细分领域创新,如矿业、能源等利基市场,透明度和协作机制提升技术安全性 [28][29][31] - 开源模型通过全球开发者红队测试增强安全性,优于封闭系统的单点信任机制 [31][32] - 技术封锁不可行,开源如同编程语言属于横向基础技术,协作是保持竞争力的关键 [30][31] 企业架构与竞争策略 - 公司需设计灵活架构以适应快速变化,避免官僚主义,例如NVIDIA采用计算堆栈式组织形态 [33][34] - 科研与产品需双频协同,Mistral通过高频项目迭代与低频科研探索结合实现突破 [35][38] - 独特价值主张是关键,例如NVIDIA以开发者优先战略和加速计算定位赢得云服务商合作 [40][42] 未来计算趋势与社会影响 - 异步化工作负载和个性化交互将重塑基础设施需求,Agentic系统需学习人类交互模式 [44][46] - 物理学AI将突破科学认知边界,推动制造业和工业变革,各国需警惕核心产业颠覆风险 [47][48] - AI是技术鸿沟缩小器,普及教育和本土人才储备对国家AI战略至关重要 [23][26][45]