Workflow
MiniMax M1
icon
搜索文档
【WAIC2025】MiniMax创始人闫俊杰:AI公司不是重新复制一个互联网公司
经济观察网· 2025-07-26 13:16
行业趋势与AI发展 - AI公司定位为以"能力构建"为核心的基础设施企业,关键价值在于提供持续增强的生产力[2] - AI应用从任务辅助转向任务主导,渗透至非结构化复杂环境如古文字解析、飞行模拟与天文数据处理[3] - AI生态从"单点模型竞争"转向"系统协同与多元路径"共存,呈现多中心、价值观多元的发展格局[6] AI技术进展与效率提升 - AI在辅助编程与研究工具构建中成效显著,部分生产流程从耗时数月降至一日内完成、成本数百元[3] - MiniMax团队中70%代码与90%数据分析任务由AI完成,采用专家引导式标注提升专业水准[3] - 模型训练采用"环境驱动+能力涌现"路径,通过奖励反馈模拟环境优化学习效率[4] - AI推理效率显著提高,训练成本趋稳,未来研发优势取决于高效实验设计与团队能力[5] 公司动态与产品发布 - MiniMax将发布首款全栈通用智能体产品"MiniMax Agent",支持长程复杂任务规划与多线程执行[6] - MiniMax Agent技术架构采用分层协作框架,内部测试显示可输出分析报告、代码文件、网页应用等多种成果[7] - 公司自研多模态通用大模型包括MiniMax M1、Hailuo-02等,服务1.57亿个人用户及超5万家企业[7] - 大会期间展示MiniMax Chat、海螺AI、MiniMax Audio等多款AI原生产品及智能硬件设备[8] AI普惠化与产业演进 - AI向普惠化发展,模型体积增长受限但训练与推理成本降低,推动社会场景广泛部署[6] - AGI实现需产业与用户共同演进,核心能力与接口应在共建机制下开放发展[6]
全球媒体聚焦|美媒:中国AI“弯道超车” 美国领先优势“告急”
搜狐财经· 2025-07-03 18:09
中国人工智能企业挑战美国主导地位 - 中国人工智能企业正在削弱美国在全球人工智能领域的主导地位,挑战美国的领先优势 [1] 全球市场采用情况 - 在欧洲、中东、非洲和亚洲,包括跨国银行、公立大学在内的用户越来越多地选择中国企业的大型语言模型作为ChatGPT等美国产品的替代方案 [3] - ChatGPT仍是全球最主流的人工智能消费者聊天机器人,全球下载量为9.1亿次,而DeepSeek为1.25亿次 [3] - 中国公司通过提供几乎同等性能但价格低得多的产品,正在不断赢得客户 [3] 技术竞争力与优势 - 中国在人工智能领域的两个关键组成部分——数据和人力资本方面占据优势,这些正帮助其迎头赶上 [3] - 与美国人工智能公司优先追求重大技术突破不同,中国人工智能产业更注重使用人工智能打造实际应用,这一侧重点或有助于迅速赢得市场 [4] - 一些中国人工智能头部公司通过开源旗下大模型获得更多优势,开源鼓励了全球的开发者和企业采用中国模型 [4][5] 价格竞争力与市场吸引力 - 在塞浦路斯人工智能平台Latenode的全球用户中,每五人中有一人选择DeepSeek模型,因其"质量相当,价格却便宜了17倍" [5] - 中国模型对于智利和巴西等资金和计算能力不那么充裕的地方的客户格外具有吸引力 [5] 全球AI模型排名 - Google Gemini 2.5 Pro (美国) 排名第一,得分为1,477 [4] - OpenAI ChatGPT 4o (美国) 排名第二,得分为1,428 [4] - DeepSeek R1-0528 (中国) 与美国xAI Grok 3 Preview并列第三,得分为1,424 [4] - 阿里巴巴Qwen 3 (中国) 并列第九,得分为1,388 [4] - 腾讯HunYuan (中国) 和MiniMax M1 (中国) 并列第十一,得分分别为1,376和1,373 [4]
MiniMax 进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 22:00
大模型行业趋势 - 大模型技术以常规技术乘十的速度进化,颠覆互联网时代的生态护城河、资金壁垒和规模效应,使创业公司也能站上世界舞台中心 [1] - 行业生存法则已转变为"创新至上",传统互联网玩法彻底失效,淘汰周期缩短至季度为单位 [2][3] - 百模大战后,Open AI、Anthropic、MiniMax、DeepSeek等创业公司占据SOTA榜单大半,巨头优势被灵活创新机制瓦解 [10] MiniMax技术突破 视频模型Hailuo 02 - 参数量较前代增长3倍,分辨率达原生1080P,支持10秒高清内容生成,涵盖复杂物理交互与专业级运镜 [6] - 在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅其1/9 [7] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [9] 大模型M1 - 4560亿参数,原生支持100万token输入(DeepSeek R1的8倍)和8万token输出(超Gemini 2.5 Pro) [11] - 采用混合注意力机制(1/8自注意力+7/8线性注意力),实现长上下文窗口技术突破 [16] - CISPO算法使强化训练仅需3周+512块H800 GPU(成本53万美元),推理算力为DeepSeek R1的25% [17][19] 商业化与生态构建 Agent应用创新 - Hailuo Video Agent支持超百种视频模板,实现创意构思到成片的全链路生产,连续6个月全球视频生成AI榜首 [21][23] - 通用Agent可完成长程复杂任务(如网页搭建、PPT制作),内部使用率达50%,具备跨模态理解与生成能力 [24] - 基座模型与Agent形成技术闭环,性能优化与成本控制优势显著 [25] 公司发展路径 - 2022年初成立并提前布局MoE模型,2024年推出国内首个MoE大模型 [26] - 开源Lightning Attention技术,突破Transformer架构限制 [26] - 创新驱动战略使M1半年内登顶开源模型全球第二,通用Agent解决跨模态长距离任务难题 [27][28]
MiniMax进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 21:54
大模型行业特征 - 大模型技术发展速度极快,3年时间从默默无闻到改变世界,具备工业革命特质 [2] - 行业竞争激烈,头部玩家快速更迭,百亿资本投入可能迅速沉寂 [2] - 传统互联网的护城河、资金壁垒、规模效应失效,创业公司有机会站上世界舞台 [2] - 行业生存法则为创新至上,淘汰周期以季度为单位 [3][4] MiniMax的技术突破 - Hailuo 02模型参数较Hailuo 01增长3倍,视频分辨率提升至原生1080P,支持10秒高清内容生成 [9] - Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅1/9 [10][11] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [12] - M1模型支持100万token输入长度,是DeepSeek R1的8倍,输出token达8万个打破Gemini 2.5 Pro记录 [16] - M1在工具使用场景(TAU-bench)中领跑所有开源权重模型,30多轮长链路任务稳定性极高 [18] 创新架构与训练方法 - 早期探索MoE架构和混合注意力机制,1/8用自注意力,7/8用自创Lightning Attention [20] - CISPO算法替代传统PPO/GRPO,仅用3周时间、512块H800 GPU完成强化学习训练,成本53万美元 [21][23] - 生成10万token时推理算力仅需DeepSeek R1的25%,数学和编程任务效率更高 [23] Agent应用创新 - Hailuo Video Agent支持超百种视频模板,涵盖艺术片、广告片等体裁,打通完整视频生产链路 [28] - MiniMax Agent具备长期任务规划能力,内部使用60天,50%员工用于PPT制作、网页搭建等 [31] - Agent能生成复杂跳转逻辑网页,支持多模态理解与生成,完成动画、广告片等任务 [31] 公司发展历程 - 2022年初成立,早于ChatGPT引爆全球的时间 [33] - 2023年将80%算力投入MoE开发,2024年初推出国内首个MoE大模型 [34] - 2024年1月开源Lightning Attention技术,6月M1模型拿下开源模型全球第二 [34] - 持续探索更高智能水平,创新驱动发展 [35][36]
MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。
数字生命卡兹克· 2025-06-17 08:23
MiniMax M1模型发布 - 公司发布首个开源推理模型MiniMax M1,采用456B参数MoE架构,实际激活45.9B参数,支持100万字(1M)上下文长度[10] - 模型在MRCR(4-needle)测试中表现突出,准确率62.8%,与Gemini 2.5 Pro性能接近[3][6][8] - 采用Lightning Attention线性注意力机制,64K token生成时FLOPs消耗仅为DeepSeek R1的一半,100K token时仅消耗25%[9][10] 技术性能亮点 - 开源两个版本:40K和80K Extended Thinking上限版本,80K版本为40K的增强版[12] - 在TAU-bench(任务目标理解测试)表现达到开源模型领先水平[3] - 支持复杂文档处理,可准确提取并翻译技术报告中的图表、公式和表格内容[15][17][20] 应用场景展示 - 成功处理34篇刘慈欣小说合集,完成每篇的故事总结和推荐语[34][37] - 在文字冒险游戏场景中展现出优秀的上下文记忆能力[31] - 能够准确识别并提取微信群聊中特定用户的全部聊天记录[28] 行业影响 - 该模型将开源领域的上下文处理能力提升到新高度[8] - 公司预告将持续一周发布新产品,可能涉及视频、音乐等领域[42][44][46] - 此次发布标志着AI六小虎之一的MiniMax重新活跃于行业前沿[1]