Workflow
海螺2.0版本
icon
搜索文档
MiniMax AI超级智能体发布!编程/多模态能力突出,MCP工具无缝集成,无需邀请码即可试用
量子位· 2025-06-19 10:56
MiniMax Agent发布 - 推出AI超级智能体MiniMax Agent 具备专家级多步骤规划 任务分解和端到端执行能力 设计定位为"可靠队友"[1][2] - 支持生成15分钟速读概述 可快速完成特定任务如影视速通[3][4] - 内部试用两个月 已成为50%以上员工的日常工具[5] - 全量开放无需邀请码 新用户获1000积分 提供19元月套餐(15任务)和69元专业版(60任务)[6][17] MiniMax Agent核心功能 - 提供编程能力 3分钟可构建交互式网页如"在线卢浮宫" 支持音频介绍等多媒体元素[9][11] - 具备多模态理解生成能力 支持音频/视频输入和图片/音频/PPT/动画输出[13] - 无缝集成MCP工具 通过@调用 MCP Market已上线多种工具[14][16] MiniMaxWeek技术发布 - 第一天开源MiniMax-M1模型 全球首个开源大规模混合架构推理模型 支持100万token输入(DeepSeek R1的8倍) 8万token输出(超Gemini 2.5 Pro的6.4万) 生成10万token时算力仅需DeepSeek R1的25%[20] - 第二天发布海螺2.0版本 处理极端物理情况 原生支持1080P 指令遵循和生成质量达一流水平 成本效率破纪录[21] - 第三天发布MiniMax Agent 完成技术发布三连击[22] 行业活动预告 - 6月25日将举办AI眼镜主题线下沙龙 参与方包括影目科技 李未可科技 小米 百度智能云等 探讨第一代AI眼镜市场反馈 爆款挑战及Killer应用[22]
MiniMax秀了波AI视频杂技:越看越惊艳,指令遵循太强了
量子位· 2025-06-18 08:54
海螺AI 2.0视频生成能力 - 最新发布的MiniMax海螺2.0版本能生成复杂精致的视频效果,包括处理极端物理场景并原生支持1080P分辨率[1] - 展示案例显示模型可精准执行高难度动作指令,如"人物快速流畅地投掷刀具"和"空中杂技表演跟随镜头"[2][3][5][6] - 在超现实场景(如狮子跳火圈)中保持符合物理规律的光影变换,并能捕捉火星飞舞等细节[11][13][14] 技术性能与行业地位 - 海螺2.0在AI视频竞技场图生视频排行榜位列第二,ELO评分1314,超过Google Veo 3 Preview(1240)和Runway Gen 4(1119)[23][24] - 模型在指令遵循、生成质量和成本效率方面达到一流水平,网页端和APP端均已支持该版本[8][17][19] 底层架构创新 - 公司推出全球首个开源大规模混合架构推理模型MiniMax-M1,支持100万token输入(DeepSeek R1的8倍)和8万token输出(超越Gemini 2.5 Pro)[25] - 独创闪电注意力机制使8万token深度推理仅需DeepSeek R1约30%算力,10万token推理算力消耗仅为竞品的25%[26][27] - 强化学习算法CISPO比字节DAPO等算法收敛速度快1倍,整个强化学习阶段仅消耗512块H800三周时间,成本53.47万美元[27] 研发战略方向 - 公司在视频生成和长上下文推理领域连续突破,显示其基础模型创新能力持续强化[28][29] - 技术报告显示架构创新带来显著算力效率优势,支撑其在训练和推理环节的成本竞争力[26][27]