MiniMax M1
搜索文档
谁来挑战OpenAI?
虎嗅APP· 2025-11-14 20:04
软银的资本运作 - 软银清仓英伟达,套现58亿美元,远超市场预期的27亿美元[2] - 交易发生在英伟达市值冲上5万亿美元高点后仅一周半[2] - 软银宣布将加注OpenAI,并称英伟达是其“最大的银行”,即AI野心的现金来源[2] - 软银的操作被视为在科技周期中“换座位”,从英伟达转向OpenAI,是在价值链中重新选择更靠前的位置站队[10][11] 美国AI的高估值困局 - 美国AI面临技术冲得快、收入涨得快,但利润兑现极慢,资本预期却已提前飙至未来5-10年的困境[8] - AI人才成本高昂,强一点的research scientist年包轻松150万美元起步,顶级梯队可达250-300万美元,明星公司年薪部分高达千万美金[8] - 大模型公司几十名核心成员,光工资一年就要烧掉上亿美元[8] - 算力成本极高,GPT-4训练成本估算在7000万–1.4亿美元,GPT-5只会更高[9] - Anthropic 2025年预计收入接近90亿美元,但算力和工程成本增长更快,必须不断加杠杆维持领先[9] - 英伟达股价上涨速度远超利润兑现,市值5万亿美元后,训练和推理端需求增速任何松动都可能带来冲击[9] 中国AI的务实路线与成本优势 - 中国头部云厂商23-25年AI资本开支总和比美国同行低82%,投资回报率远超美国[12] - 中国AI走“低成本高性能”务实路线,策略不是堆更大模型,而是把同样规模模型训练得更好、推得更快、成本更低[16] - DeepSeek是分水岭,其成功是工程化提效、算子优化等底层投入结果,证明竞争可以是“谁更聪明地用算力”[17] - MiniMax M2模型能力略逊于GPT-5仅10%,但训练成本远低于OpenAI[18] - MiniMax M1模型强化学习阶段花费约54万美元,用512块H800训练三周,体现极高效率[18] - 中国AI商业化速度更快,方法论是先选定明确产品场景,迅速推向市场,用用户反馈驱动迭代[20] 中美AI商业模式与路径对比 - MiniMax与OpenAI均构建“订阅收入+ API调用”双轮驱动商业模式,MiniMax今年ARR已达1亿美元规模[24] - OpenAI路线是“长线OS化”,构建覆盖文本、语音、视频等的巨大体系,节奏沉重[26] - MiniMax路线是围绕语音、音乐、视频等多模态模型构建可快速落地的能力矩阵,目标是立即商业化[27] - 在同等智能水平上,中国模型价格普遍低于美国模型,形成商业化上的“降维打击”[28] - 中国AI公司整体估值远低于海外,独角兽最高仅几十亿美金,而OpenAI、Anthropic动辄上百亿美元[15] 中国AI主要玩家格局 - MiniMax在技术、产品、商业化方面“三线全过关”,是挑战OpenAI的最有力竞争者[23] - 阿里Qwen依托阿里云算力与企业服务能力,在政企、金融、制造等场景深度落地[34] - Kimi在长文本能力上保持优势,提供高质量泛内容体验和资料整理能力[34] - 智谱在模型技术路线及ToB部署上保持扎实节奏,企业合作广度行业领先[34] - 国内头部玩家已形成差异化格局,分别满足产业链不同侧面需求[34][35]
外媒再议中国 AI:开源破局硅谷,成全球开发者新选择
环球网资讯· 2025-11-14 14:44
全球AI格局变化 - 中国AI大模型凭借开源优势在硅谷更受欢迎,例如Airbnb首席执行官表示非常依赖阿里巴巴旗下的Qwen产品线,因其好、速度快且成本低[1] - 全球知名AI基准测试机构Artificial Analysis数据显示,中国初创公司MiniMax的开源推理模型MiniMax M2在全球开源AI综合性能评估中荣登榜首[1] - 在AI模型全球前十排名中,包括DeepSeek和阿里巴巴旗下Qwen在内的八款中国公司开发的模型跻身榜单,仅有两款来自OpenAI的模型进入[2] 中国AI模型性能与成本优势 - MiniMax M2模型采用专家混合模型技术,显著提升计算效率和响应速度,其速度超越谷歌旗下Claude Sonnet 4.5近一倍,而价格仅为其8%[1] - MiniMax平台提供对旗舰模型MiniMax M1和M2的即时访问,核心亮点在于业界领先的百万级Token上下文窗口,可无缝处理海量文档和复杂数据集[3] - 中国AI模型凭借卓越的性能和经济的成本保持领先地位,对美国AI行业现状构成巨大挑战[4] 开源策略与行业影响 - 中国公司公开分享其AI产品,允许任何人下载和使用,此策略旨在广泛传播中国AI模型并主导AI生态系统[2] - 人工智能领域影响力巨大的纽约大学教授颜乐存表示,如今大多数开源AI都是中国制造的,并警告美国科技公司的封闭式开发模式可能面临长远风险[2] - MiniMax平台提供符合主流AI接口的API集成方案,开发团队只需极少代码改动即可将模型集成到现有工作流程中,这种对开发者友好的设计理念降低了使用门槛[3] 市场认知与评价 - 人工智能专家格雷格•斯莱博格教授认为中国的人工智能发展被低估,中国在AI领域申请的专利数量已位于世界首位[4] - MiniMax被视为一个颠覆性平台,它将最前沿的语言模型直接带给开发者和普通用户,无需注册、付费或面对技术障碍[3]
MiniMax深夜致歉,开源大模型M2登顶引发全球热潮
第一财经· 2025-10-30 15:47
模型发布与市场反响 - MiniMax发布全新模型MiniMax M2并依据MIT协议全面开源其完整权重 [1] - M2模型发布后访问量远超预期,平台一度因访问过载导致服务成功率降至约90%,经扩容后恢复至约99%的稳定水平 [4] - M2已登上OpenRouter全球调用量第5位及国内模型第1位,并位列Hugging Face Trending榜单第2位 [5] 模型性能与技术特点 - M2在权威测评榜单Artificial Analysis中取得全球第五、开源第一的成绩,其智能水平接近GPT-5(high)与Claude Sonnet 4.5等顶级模型 [7] - M2总参数约2300亿,单次激活约100亿参数,采用全注意力+MoE架构,专注于代码生成、工具调用等可执行型Agent任务 [15] - 在模型性能、推理速度与成本的综合平衡上表现突出,在'性能、速度、成本'的不可能三角中找到了平衡点 [10] 核心能力表现 - 在代理能力方面,M2能够出色地规划并执行复杂的工具链,协同调用Shell、浏览器、Python代码执行器等工具,并具备自我纠错与恢复能力 [10] - 在编程能力方面,M2具备强大的端到端开发能力,包括多代码文件处理、执行"编码-运行-调试"的完整循环 [10] - 在深度搜索能力方面,M2在Xbench-DeepSearch基准上全球前二、仅次于GPT5,在金融搜索基准FinSearchComp-global上全球前二、仅次于Grok4 [11] 产品定位与迭代路径 - 相较于前代模型M1(总参数约4560亿,激活约459亿参数)专注于长文本和复杂推理,M2完全面向Agent时代的执行任务 [12][13][14][15] - M2在设计路线上放弃了M1的混合注意力机制,选择了全注意力+MoE路线,以更好地应对Agent场景中多步骤、长链条的复杂推理 [14][15] - 公司当前将M1和M2视为平衡不同场景的两类模型:M1强调"能想很久、能读很长",M2强调"能执行、且便宜" [15] 商业模式与产品生态 - 公司维持全球范围的限时免费开放策略,为开发者提供高性能的Coding与Agent能力 [5] - M2模型的输入侧费用为每百万Token约0.30美元,输出侧为每百万Token约1.20美元,约为Claude 4.5 Sonnet价格的8% [15] - 公司自研的Agent产品已全面切换到M2模型驱动,并推出专业模式(擅长全栈开发/deep research/PPT制作)和高效模式(擅长chat问答/轻量级搜索/轻量级代码)两种模式 [16]
【WAIC2025】MiniMax创始人闫俊杰:AI公司不是重新复制一个互联网公司
经济观察网· 2025-07-26 13:16
行业趋势与AI发展 - AI公司定位为以"能力构建"为核心的基础设施企业,关键价值在于提供持续增强的生产力[2] - AI应用从任务辅助转向任务主导,渗透至非结构化复杂环境如古文字解析、飞行模拟与天文数据处理[3] - AI生态从"单点模型竞争"转向"系统协同与多元路径"共存,呈现多中心、价值观多元的发展格局[6] AI技术进展与效率提升 - AI在辅助编程与研究工具构建中成效显著,部分生产流程从耗时数月降至一日内完成、成本数百元[3] - MiniMax团队中70%代码与90%数据分析任务由AI完成,采用专家引导式标注提升专业水准[3] - 模型训练采用"环境驱动+能力涌现"路径,通过奖励反馈模拟环境优化学习效率[4] - AI推理效率显著提高,训练成本趋稳,未来研发优势取决于高效实验设计与团队能力[5] 公司动态与产品发布 - MiniMax将发布首款全栈通用智能体产品"MiniMax Agent",支持长程复杂任务规划与多线程执行[6] - MiniMax Agent技术架构采用分层协作框架,内部测试显示可输出分析报告、代码文件、网页应用等多种成果[7] - 公司自研多模态通用大模型包括MiniMax M1、Hailuo-02等,服务1.57亿个人用户及超5万家企业[7] - 大会期间展示MiniMax Chat、海螺AI、MiniMax Audio等多款AI原生产品及智能硬件设备[8] AI普惠化与产业演进 - AI向普惠化发展,模型体积增长受限但训练与推理成本降低,推动社会场景广泛部署[6] - AGI实现需产业与用户共同演进,核心能力与接口应在共建机制下开放发展[6]
全球媒体聚焦|美媒:中国AI“弯道超车” 美国领先优势“告急”
搜狐财经· 2025-07-03 18:09
中国人工智能企业挑战美国主导地位 - 中国人工智能企业正在削弱美国在全球人工智能领域的主导地位,挑战美国的领先优势 [1] 全球市场采用情况 - 在欧洲、中东、非洲和亚洲,包括跨国银行、公立大学在内的用户越来越多地选择中国企业的大型语言模型作为ChatGPT等美国产品的替代方案 [3] - ChatGPT仍是全球最主流的人工智能消费者聊天机器人,全球下载量为9.1亿次,而DeepSeek为1.25亿次 [3] - 中国公司通过提供几乎同等性能但价格低得多的产品,正在不断赢得客户 [3] 技术竞争力与优势 - 中国在人工智能领域的两个关键组成部分——数据和人力资本方面占据优势,这些正帮助其迎头赶上 [3] - 与美国人工智能公司优先追求重大技术突破不同,中国人工智能产业更注重使用人工智能打造实际应用,这一侧重点或有助于迅速赢得市场 [4] - 一些中国人工智能头部公司通过开源旗下大模型获得更多优势,开源鼓励了全球的开发者和企业采用中国模型 [4][5] 价格竞争力与市场吸引力 - 在塞浦路斯人工智能平台Latenode的全球用户中,每五人中有一人选择DeepSeek模型,因其"质量相当,价格却便宜了17倍" [5] - 中国模型对于智利和巴西等资金和计算能力不那么充裕的地方的客户格外具有吸引力 [5] 全球AI模型排名 - Google Gemini 2.5 Pro (美国) 排名第一,得分为1,477 [4] - OpenAI ChatGPT 4o (美国) 排名第二,得分为1,428 [4] - DeepSeek R1-0528 (中国) 与美国xAI Grok 3 Preview并列第三,得分为1,424 [4] - 阿里巴巴Qwen 3 (中国) 并列第九,得分为1,388 [4] - 腾讯HunYuan (中国) 和MiniMax M1 (中国) 并列第十一,得分分别为1,376和1,373 [4]
MiniMax 进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 22:00
大模型行业趋势 - 大模型技术以常规技术乘十的速度进化,颠覆互联网时代的生态护城河、资金壁垒和规模效应,使创业公司也能站上世界舞台中心 [1] - 行业生存法则已转变为"创新至上",传统互联网玩法彻底失效,淘汰周期缩短至季度为单位 [2][3] - 百模大战后,Open AI、Anthropic、MiniMax、DeepSeek等创业公司占据SOTA榜单大半,巨头优势被灵活创新机制瓦解 [10] MiniMax技术突破 视频模型Hailuo 02 - 参数量较前代增长3倍,分辨率达原生1080P,支持10秒高清内容生成,涵盖复杂物理交互与专业级运镜 [6] - 在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅其1/9 [7] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [9] 大模型M1 - 4560亿参数,原生支持100万token输入(DeepSeek R1的8倍)和8万token输出(超Gemini 2.5 Pro) [11] - 采用混合注意力机制(1/8自注意力+7/8线性注意力),实现长上下文窗口技术突破 [16] - CISPO算法使强化训练仅需3周+512块H800 GPU(成本53万美元),推理算力为DeepSeek R1的25% [17][19] 商业化与生态构建 Agent应用创新 - Hailuo Video Agent支持超百种视频模板,实现创意构思到成片的全链路生产,连续6个月全球视频生成AI榜首 [21][23] - 通用Agent可完成长程复杂任务(如网页搭建、PPT制作),内部使用率达50%,具备跨模态理解与生成能力 [24] - 基座模型与Agent形成技术闭环,性能优化与成本控制优势显著 [25] 公司发展路径 - 2022年初成立并提前布局MoE模型,2024年推出国内首个MoE大模型 [26] - 开源Lightning Attention技术,突破Transformer架构限制 [26] - 创新驱动战略使M1半年内登顶开源模型全球第二,通用Agent解决跨模态长距离任务难题 [27][28]
MiniMax进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 21:54
大模型行业特征 - 大模型技术发展速度极快,3年时间从默默无闻到改变世界,具备工业革命特质 [2] - 行业竞争激烈,头部玩家快速更迭,百亿资本投入可能迅速沉寂 [2] - 传统互联网的护城河、资金壁垒、规模效应失效,创业公司有机会站上世界舞台 [2] - 行业生存法则为创新至上,淘汰周期以季度为单位 [3][4] MiniMax的技术突破 - Hailuo 02模型参数较Hailuo 01增长3倍,视频分辨率提升至原生1080P,支持10秒高清内容生成 [9] - Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅1/9 [10][11] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [12] - M1模型支持100万token输入长度,是DeepSeek R1的8倍,输出token达8万个打破Gemini 2.5 Pro记录 [16] - M1在工具使用场景(TAU-bench)中领跑所有开源权重模型,30多轮长链路任务稳定性极高 [18] 创新架构与训练方法 - 早期探索MoE架构和混合注意力机制,1/8用自注意力,7/8用自创Lightning Attention [20] - CISPO算法替代传统PPO/GRPO,仅用3周时间、512块H800 GPU完成强化学习训练,成本53万美元 [21][23] - 生成10万token时推理算力仅需DeepSeek R1的25%,数学和编程任务效率更高 [23] Agent应用创新 - Hailuo Video Agent支持超百种视频模板,涵盖艺术片、广告片等体裁,打通完整视频生产链路 [28] - MiniMax Agent具备长期任务规划能力,内部使用60天,50%员工用于PPT制作、网页搭建等 [31] - Agent能生成复杂跳转逻辑网页,支持多模态理解与生成,完成动画、广告片等任务 [31] 公司发展历程 - 2022年初成立,早于ChatGPT引爆全球的时间 [33] - 2023年将80%算力投入MoE开发,2024年初推出国内首个MoE大模型 [34] - 2024年1月开源Lightning Attention技术,6月M1模型拿下开源模型全球第二 [34] - 持续探索更高智能水平,创新驱动发展 [35][36]
MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。
数字生命卡兹克· 2025-06-17 08:23
MiniMax M1模型发布 - 公司发布首个开源推理模型MiniMax M1,采用456B参数MoE架构,实际激活45.9B参数,支持100万字(1M)上下文长度[10] - 模型在MRCR(4-needle)测试中表现突出,准确率62.8%,与Gemini 2.5 Pro性能接近[3][6][8] - 采用Lightning Attention线性注意力机制,64K token生成时FLOPs消耗仅为DeepSeek R1的一半,100K token时仅消耗25%[9][10] 技术性能亮点 - 开源两个版本:40K和80K Extended Thinking上限版本,80K版本为40K的增强版[12] - 在TAU-bench(任务目标理解测试)表现达到开源模型领先水平[3] - 支持复杂文档处理,可准确提取并翻译技术报告中的图表、公式和表格内容[15][17][20] 应用场景展示 - 成功处理34篇刘慈欣小说合集,完成每篇的故事总结和推荐语[34][37] - 在文字冒险游戏场景中展现出优秀的上下文记忆能力[31] - 能够准确识别并提取微信群聊中特定用户的全部聊天记录[28] 行业影响 - 该模型将开源领域的上下文处理能力提升到新高度[8] - 公司预告将持续一周发布新产品,可能涉及视频、音乐等领域[42][44][46] - 此次发布标志着AI六小虎之一的MiniMax重新活跃于行业前沿[1]