MiniMax模型
搜索文档
挺搞笑,MiniMax模型就是不认识「马嘉祺」
机器之心· 2026-03-17 11:58
MiniMax模型特定词汇生成异常事件分析 - 网友发现并测试证实,MiniMax的模型在多个接口和平台均无法正确生成“马嘉祺”这一名字,表现为稳定复现的异常现象[1][3][5] - 模型能够正确搜索并输出马嘉祺的履历信息,但在生成名字环节出现错误,有时会输出两个不同名字,表明其信息检索与名字生成环节存在脱节[6][9][10] - 有观点调侃,此现象可作为识别匿名模型是否源自MiniMax的潜在特征[4] 异常现象的技术归因分析 - 一种推测认为,异常可能与训练数据的清洗和分布有关,对于马嘉祺这类讨论度极高的公众人物,其互联网内容存在大量重复和模板化,在数据去重、过滤或重加权过程中,相关词汇可能被“误伤”,导致模型生成不稳定[13] - 从生成机制看,大模型并非先完全确认人物再输出名字,而是在理解问题、调取知识和组织语言过程中同步生成,因此特定名字在生成阶段若受额外扰动,就会出现信息正确但名字错误的现象[13] - 一篇相关论文指出,某些看似知识或推理层的异常,可能源于更底层的分词器机制缺陷,例如非唯一映射问题[14] 分词器机制缺陷的深层影响 - 论文《Say Anything but This: When Tokenizer Betrays Reasoning in LLMs》揭示,现代子词分词器常存在“一对多编码、多对一解码”的情况,导致多个不同分词序列可能解码为同一文本字符串[15] - 论文通过设计简单的词语替换任务进行测试,在超过11000次实验中,许多模型出现了“幽灵编辑”现象:模型输出的分词ID已改变,但解码后的文本却与原始词完全相同[16] - 研究进一步表明,此类由分词器非唯一映射引发的错误具有普遍性,并不会随着模型参数规模的扩大而自然消失,且可能将部分“推理能力不行”的问题错误归因于模型,实则是底层机制干扰了输出[18][20]
To B的智谱和To C的MiniMax,大模型生意都很难做
经济观察报· 2025-12-24 21:48
文章核心观点 - 中国两家AI大模型独角兽公司智谱与MiniMax在2025年底相继递交港股招股书 首次全面披露经营数据 展现了B端与C端两条截然不同的商业化路径 但均面临收入规模小、巨额亏损及持续烧钱的严峻挑战 上市被视为融资和股东退出的关键一步 [1][2] 商业化路径对比 - **智谱 (B端市场)** - 深耕国内B端市场 客户主要为大型政企 通过为企业部署大模型获得收入 [1][2] - 近3年企业部署业务收入占比从95%降至85% 仍占大头 [8] - 整体毛利率保持在50%左右 但大客户依赖度高 前五大客户收入贡献接近50% [10] - **MiniMax (C端市场)** - 选择C端突围 超70%收入来自海外 依靠用户充值付费获得收入 [1][2][5] - 2025年前9个月 AI原生产品平均月活用户(MAU)达2760万 付费用户达177万 [8] - 整体毛利率从2023年的-24.7%提升至2025年前9个月的23.3% 但核心C端业务毛利率仅为4.7% [10] 财务与经营状况 - **收入规模有限** - 智谱:2022年至2025年上半年累计收入6.85亿元 2025年上半年收入1.9亿元 [4][6] - MiniMax:2022年至2025年9月累计收入0.86亿美元(约6亿元) 2025年前9个月收入5343.7万美元(约3.76亿元) [5][6] - 收入规模远低于互联网大厂 如百度2025年第三季度单季AI业务收入达100亿元 [6] - **巨额亏损与高额投入** - 智谱:3年半累计亏损超过62亿元 同期累计研发投入44亿元 [4][6] - MiniMax:同期累计亏损约13.20亿美元(约93亿元) 累计研发投入5亿美元(约35亿元) [5][6] - 投入主要用于算力服务费及研发人员薪酬 [6] - **高昂的算力成本** - 2025年上半年 智谱算力支出11亿元 MiniMax算力支出1.4亿美元(约9.87亿元) [7] - 行业特点为用户越多、使用量越大 算力支出越高 对收入不高的公司构成回本难题 [7] - **现金流与烧钱速度** - 截至2025年9月30日 MiniMax现金结余为10.4亿美元(约73.34亿元) [12] - 截至2025年6月 智谱现金及现金等价物为25亿元 [12] - 智谱2024年经营活动净现金消耗22.45亿元(月均约1.87亿元) 2025年上半年烧钱速度加快至月均约2.21亿元 [12] - MiniMax预计每月现金消耗为2790万美元 [12] 市场竞争与挑战 - **面临互联网大厂的激烈竞争** - 智谱企业客户1.2万家 而阿里云有超过200万企业用户通过其调用和部署大模型 [8] - 2025年11月 智谱日均Tokens消耗量为4.2万亿 同期字节跳动豆包大模型日均Tokens调用量为50万亿 [8] - MiniMax的月活用户(2760万)与豆包(1.72亿)、阿里千问(3000万)相比仍有差距 [8][9] - **行业环境变化** - 智谱在2022年大模型生意“非常好做” 一个模型能卖千万元 但2023年“千模大战”兴起后高价模型难售 [7] - **法律与版权风险** - 生成式AI行业法律风险高发 MiniMax招股书用55页提示风险 智谱用26页 [13] - MiniMax坦承面临较高倒闭风险 并披露与迪士尼、环球影业、Netflix等存在未了结的版权侵权诉讼 可能面临最高7500万美元索赔 [13] 上市动机与行业展望 - **争抢“AI大模型第一股”** - 抢先上市可使资本操作更灵活 既为融资 也为外部股东提供退出通道 [12] - 行业有前车之鉴 如AI视觉“四小龙”中旷视因IPO进程曲折而错过时机 [12] - **商业模式可持续性待验证** - 两家公司均有自研大模型 需要继续大规模烧钱 [12] - 其各自选择的商业化路径能否持续是时间问题 但当前是“讲好资本故事的必要之举” [14]