Workflow
Hailuo 02
icon
搜索文档
大模型降温?AI小虎讲新故事:抢做能用好用的Agent
南方都市报· 2025-08-01 22:28
Manus新功能发布 - Manus发布新功能Wide Research 目前仅对Pro用户开放 未来将向Basic和Plus用户开放 [1] - Manus近期经历裁员风波 与阿里在中国的合作搁置 [1] - Peak季逸超上次为产品录制视频是在今年3月Manus引发Agent热潮时 [1] WAIC展会动态 - 今年WAIC吸引800余家企业参展 40余款大模型亮相 2024年参展模型数量达近百款 [2] - "AI大模型六小虎"中的百川智能与零一万物缺席今年展会 [2] - 阶跃星辰发布新一代基础大模型Step 3 与吉利合作推出AI智能座舱银河M9 实现端到端语音大模型量产上车 [3] - 阶跃星辰已覆盖国内超一半头部国产手机厂商 深度合作打造手机Agent体验 [3] 大模型厂商新动向 - 月之暗面发布并开源万亿参数Kimi K2大模型 强调通用Agent任务能力 [5] - 智谱发布GLM-4.5和GLM-4.5-Air模型 在12个基准测试中显示其国内排名第一 [5] - Minimax发布行业最高难度运动场景视频生成模型Hailuo 02和MiniMax Agent等产品 [5] - 商汤科技林达华表示Agent依赖大模型的推理、反思、规划、决策能力 是技术落地重要载体 [5][6] Agent应用趋势 - Agent从通用走向垂类场景 行业更关注能否创造实际价值 [7] - 腾讯展示12个垂直智能体应用 覆盖企业服务、生活服务与办公效率场景 [8] - 腾讯共富AI智能体针对微信生态"土特产"小店与农文旅营销场景 [8] - 金山办公WPS AI 3.0搭载Agent能力 专攻办公场景 可实现PPT一键生成和自主排版 [8] 企业级Agent部署 - 极光集团推出Multi-Agent平台 内置多种AI Agent角色 90%业务布局海外 [10] - 极光采取端到端项目制交付方式 强调私有化部署重要性 [10] - 恒生活数科依托"恒纪元"大模型打造六大金融智能应用矩阵 加速金融服务转型升级 [11] - Agent在C端商业化可能性被探讨 翻译等场景可能成为突破口 [11]
AI四小强重新上桌了?
虎嗅· 2025-07-26 20:11
AI四小强技术布局与竞争态势 - AI四小强(MiniMax、DeepSeek、阿里巴巴、百度)被黄仁勋评价为开发"世界级产品",近期通过Deep Research技术重新进入行业焦点 [1] - 7月阶跃星辰推出阶跃AI Deep Research测试版,MiniMax在6月连续发布推理模型M1、视频生成模型及Agent,月之暗面跟进Kimi Research,智谱3月已发布融合Deep Research的AutoGLM沉思版 [2] - 四家公司均押注Deep Research和AI Agent技术,以垂直领域深度应用应对大厂竞争,并需向投资人证明其在下半场的竞争力 [3][4] Deep Research技术路径分化 - 月之暗面Kimi-Researcher采用"傻瓜式操作"路径,用户仅需指令即可生成报告(10-20分钟),提供可视化卡片/表格等ChatGPT未覆盖的功能 [12][14] - 智谱和MiniMax选择高互动型Workflow模式,用户需设计复杂提示词并实时反馈,任务耗时1-2小时但可控性更强 [13][14] - 两种路径均反映当前大模型能力不足,四小强通过升级模型补足短板:MiniMax M1支持1兆上下文,月之暗面K2参数量达万亿,阶跃星辰Step 3推理效率达DeepSeek R1的300% [15] 行业竞争与商业化压力 - 腾讯、阿里、字节等大厂通过元宝、夸克、豆包等产品挤压四小强市场空间,Kimi因停投流导致搜索排名下滑但仍坚持技术优先策略 [17][18] - 四小强放弃用户规模追逐,转向技术迭代:智谱启动上市辅导,MiniMax拟融资3亿美元(估值40-50亿美元),月之暗面K2获国际认可,MiniMax视频模型Hailuo 02评测全球第二 [23][22] - Agent商业化案例显现价值:某客户通过Agent将销售培训周期从30天缩至2天,新人绩效达中等偏上水平,但需解决高token消耗(单报告22万token)及任务执行成本(2-3美元/次)问题 [28][30] 技术卡位与市场挑战 - 四小强需通过出圈案例证明技术优越性,对比Manus(融资7500万美元)和Lovert(获马斯克点赞)的国际影响力仍有差距 [25][26] - Agent市场增长现疲态:Manus月访问量从2376万次降至1730万次,Genspark从888万次跌至769次,反映产品市场匹配度待提升 [31] - 行业进入"厘时代"算力价格战,但Agent的高成本与长耗时(OpenAI目标用户需愿等待30分钟)仍是普及障碍 [30][31]
继小米雷军之后,黄仁勋被曝“密会”MiniMax 闫俊杰深度交流
搜狐财经· 2025-07-18 17:59
公司动态 - 英伟达CEO黄仁勋与MiniMax创始人闫俊杰进行了近两小时的深入交流 [1] - MiniMax创始人闫俊杰曾任商汤科技副总裁 于2021年底创立MiniMax [1] - MiniMax近期基本完成近3亿美元新一轮融资 折合21.56亿元人民币 [3] - 本轮融资后公司估值超40亿美元 折合287.43亿元人民币 [3] - 融资出资方包括上市公司、交叉基金和上海国资平台 [3] 产品与技术 - MiniMax发布全球首个开源大规模混合架构推理模型M1 性能超DeepSeek-R1 [3] - MiniMax发布视频生成工具Hailuo 02 打破全球视频模型效果成本纪录 [3] 行业评价 - 黄仁勋评价中国开发者正在推动AI快速创新 有100万名开发者投身该领域 [3] - 黄仁勋特别提到MiniMax等公司开发的产品都是世界级 推动全球AI发展 [3]
新股消息丨MiniMax将完成近3亿美元新融资 传筹备赴港上市
智通财经网· 2025-07-16 10:34
融资动态 - MiniMax近期基本完成近3亿美元新一轮融资 本轮融资后公司估值超40亿美元 [1] - 本轮融资出资方包括上市公司 交叉基金和大型国资平台上海国资 [1] - 融资在半年前开启 目前已基本确定 公司正在筹备赴港上市 最快或于年内落地 [1] - 公司已聘请投行顾问 具体上市方案仍在内部讨论中 [1] - 此前完成由阿里巴巴出资6亿美元的B轮融资 以及腾讯资本出资超2.5亿美元的A轮融资 [1] - 早期出资方包括云启资本 高瓴创投 IDG 明势资本 米哈游等 此前未有国资背景资方参投 [1] - 本轮融资结束后 国内估值达到300亿元的大模型公司仅有MiniMax和智谱 [1] 技术进展 - 近期推出开源推理模型MiniMax-M1 采用Apache 2.0许可协议 实现代码开放 [2] - 官方称MiniMax-M1性能优于DeepSeek最新版且算力消耗更低 [2] - 多模态领域视频生成模型Hailuo 02支持原生1080P高清视频输出 [2] - Hailuo 02在复杂场景中展现强大时空一致性和物理逻辑性 如体操运动员翻转 马戏演员喷火等 [2] - 在国际权威测评榜单Artificial Analysis视频竞技场中拿下第二名 领先Google的Veo 3和快手的可灵(Kling)等对手 [2]
“AI六小虎”开抢IPO,MiniMax要超智谱?
36氪· 2025-07-15 16:05
公司融资与估值 - MiniMax完成近3亿美元新一轮融资 投后估值超过40亿美元(约300亿元人民币) 目前国内达到这一估值的大模型公司仅有MiniMax和智谱[1][3] - 2024年公司获得6亿美元A轮融资后估值达25亿美元(约179亿元人民币) 投资方包括红杉中国、阿里巴巴、腾讯、IDG资本、米哈游等顶级机构[4] - 公司正在筹备赴港上市 彭博社于2024年6月报道相关消息[4] 产品与技术布局 - 构建"模型-多模态-应用"一体化技术路线 发布覆盖基座模型(开源MiniMax-M1系列)、视频生成(Hailuo 02)、语音模型(Speech 02)、智能体(Hailuo Video Agent)的全栈产品[3] - 视频生成技术突破:Hailuo 02支持1080P画质输出与高保真物理模拟 Hailuo Video Agent实现自然语言驱动的专业级视频生成[3][6] - 语音模型创新:Speech 02推出Voice Design功能 用户可通过自然语言描述精准控制音色多个维度[3] 商业化进展 - 海外情感应用Talkie前8个月下载量突破千万次 位列美国AI应用下载榜第4 2023年创造7000万美元营收(含用户付费与广告)[4] - 视频生成产品海螺AI通过蓝色胖猫IP爆火 被用户评价为"最优秀AI视频生成模型" 部分作品接近真实拍摄水准[5][6] - Agent产品商业化探索:Hailuo Video Agent支持文字/图片输入生成专业视频 通用Agent可处理长程复杂任务(如代码编写、PPT生成)[13][14] 行业竞争格局 - "AI六小虎"排位赛加速 差异化成为关键:DeepSeek通过展示思考过程实现体验突破 MiniMax以视频Agent回应市场对实用性的质疑[1][10] - 同质化竞争加剧:对话/视频/图片生成赛道免费成常态 价格战提前打响 订阅制商业模式依赖产品差异化[9][10] - 2025年被视为Agent商业化元年 办公、垂直类应用先行(如Glean企业搜索ARR翻倍 DayDream链接2000+品牌)[11] 战略发展方向 - 从技术研发向商业闭环快速跨越 平衡"速度-质量-盈利"三角难题[1][11] - 押注Agent赛道 布局"超级APP"机会:推动AI从Chat到Act的演进 整合工具类软件功能[13][16] - 技术演进路径:遵循OpenAI AGI五级路线图 当前产品处于第一(对话工具)至第二阶段(知识型助手) 向第三阶段(行动型助手)突破[13]
大模型“上海队”进入丰产阶段(神州看点) 生成的“猫跳水”视频一周获三亿播放量
人民日报· 2025-07-03 08:10
公司技术突破 - 公司推出全球首个开源大规模混合架构推理模型MiniMax-M1 在权威评测中位列全球开源模型第二 [1] - 模型支持100万token上下文输入 可处理整本英文版《三体》 性能媲美谷歌Gemini2.5Pro [2] - 视频生成模型Hailuo 02生成的"猫跳水"视频在海外社交平台获3亿播放量 [1] - Hailuo 02在复杂动作表现上优于谷歌Veo3 开创"动物奥运会"AI视频新品类 [3][4] 研发与成本优势 - M1强化学习阶段仅花费53.5万美元 远低于行业千万美元级投入 [2] - 采用"稀疏激活"MoE架构 节省计算开销 与行业主流稠密架构形成差异化 [8] - 组建导演、编剧、美术复合团队打磨Hailuo 02 要求达到电影质感和5%影视应用比例 [5] 产品落地与市场表现 - 视频生成应用Hailuo AI已服务200个国家和地区 累计生成3.7亿个视频 [6] - 公司坚持技术驱动路线 认为好模型是产品落地的核心驱动力 [6] - 作为国内少数坚持基座模型研发的创业公司 在行业收缩期保持研发投入 [7] 行业地位与政策环境 - 公司入选大模型"上海队" 与商汤、书生·浦语等共同构成区域AI产业生态 [9] - 上海提出2025年建成世界级AI产业生态 规划建设多个大模型创新孵化器 [9] - 公司早在2022年底ChatGPT爆火前就已布局AGI 展现前瞻性技术路线选择 [1]
MiniMax 进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 22:00
大模型行业趋势 - 大模型技术以常规技术乘十的速度进化,颠覆互联网时代的生态护城河、资金壁垒和规模效应,使创业公司也能站上世界舞台中心 [1] - 行业生存法则已转变为"创新至上",传统互联网玩法彻底失效,淘汰周期缩短至季度为单位 [2][3] - 百模大战后,Open AI、Anthropic、MiniMax、DeepSeek等创业公司占据SOTA榜单大半,巨头优势被灵活创新机制瓦解 [10] MiniMax技术突破 视频模型Hailuo 02 - 参数量较前代增长3倍,分辨率达原生1080P,支持10秒高清内容生成,涵盖复杂物理交互与专业级运镜 [6] - 在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅其1/9 [7] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [9] 大模型M1 - 4560亿参数,原生支持100万token输入(DeepSeek R1的8倍)和8万token输出(超Gemini 2.5 Pro) [11] - 采用混合注意力机制(1/8自注意力+7/8线性注意力),实现长上下文窗口技术突破 [16] - CISPO算法使强化训练仅需3周+512块H800 GPU(成本53万美元),推理算力为DeepSeek R1的25% [17][19] 商业化与生态构建 Agent应用创新 - Hailuo Video Agent支持超百种视频模板,实现创意构思到成片的全链路生产,连续6个月全球视频生成AI榜首 [21][23] - 通用Agent可完成长程复杂任务(如网页搭建、PPT制作),内部使用率达50%,具备跨模态理解与生成能力 [24] - 基座模型与Agent形成技术闭环,性能优化与成本控制优势显著 [25] 公司发展路径 - 2022年初成立并提前布局MoE模型,2024年推出国内首个MoE大模型 [26] - 开源Lightning Attention技术,突破Transformer架构限制 [26] - 创新驱动战略使M1半年内登顶开源模型全球第二,通用Agent解决跨模态长距离任务难题 [27][28]
MiniMax进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 21:54
大模型行业特征 - 大模型技术发展速度极快,3年时间从默默无闻到改变世界,具备工业革命特质 [2] - 行业竞争激烈,头部玩家快速更迭,百亿资本投入可能迅速沉寂 [2] - 传统互联网的护城河、资金壁垒、规模效应失效,创业公司有机会站上世界舞台 [2] - 行业生存法则为创新至上,淘汰周期以季度为单位 [3][4] MiniMax的技术突破 - Hailuo 02模型参数较Hailuo 01增长3倍,视频分辨率提升至原生1080P,支持10秒高清内容生成 [9] - Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅1/9 [10][11] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [12] - M1模型支持100万token输入长度,是DeepSeek R1的8倍,输出token达8万个打破Gemini 2.5 Pro记录 [16] - M1在工具使用场景(TAU-bench)中领跑所有开源权重模型,30多轮长链路任务稳定性极高 [18] 创新架构与训练方法 - 早期探索MoE架构和混合注意力机制,1/8用自注意力,7/8用自创Lightning Attention [20] - CISPO算法替代传统PPO/GRPO,仅用3周时间、512块H800 GPU完成强化学习训练,成本53万美元 [21][23] - 生成10万token时推理算力仅需DeepSeek R1的25%,数学和编程任务效率更高 [23] Agent应用创新 - Hailuo Video Agent支持超百种视频模板,涵盖艺术片、广告片等体裁,打通完整视频生产链路 [28] - MiniMax Agent具备长期任务规划能力,内部使用60天,50%员工用于PPT制作、网页搭建等 [31] - Agent能生成复杂跳转逻辑网页,支持多模态理解与生成,完成动画、广告片等任务 [31] 公司发展历程 - 2022年初成立,早于ChatGPT引爆全球的时间 [33] - 2023年将80%算力投入MoE开发,2024年初推出国内首个MoE大模型 [34] - 2024年1月开源Lightning Attention技术,6月M1模型拿下开源模型全球第二 [34] - 持续探索更高智能水平,创新驱动发展 [35][36]
坚守与变阵:IPO曙光下的大模型“六小虎”
上海证券报· 2025-07-01 03:10
行业现状 - 中国AI大模型初创企业"六小虎"(智谱、月之暗面、百川智能、MiniMax、阶跃星辰和零一万物)面临融资退潮、巨头挤压与战略分化等多重考验 [2] - 证监会宣布在上交所科创板设置科创成长层,允许尚未盈利的高研发投入AI企业申请IPO [2] - "六小虎"在商业路径上分化为"转型派"和"坚守派" [2] - "六小虎"市场关注度持续下降,不复昔日"AI明星"之姿 [4] 公司动态 坚守派 - 智谱2025年为开源年,已开源CogView4和GLM模型系列,并签署上市辅导协议 [4] - MiniMax发布混合架构推理模型M1、视频生成模型Hailuo 02和通用智能体产品MiniMax Agent,拟计划港股上市 [5] - 月之暗面暂缓投放但未停止基座模型预训练 [5] - 阶跃星辰坚持基础模型研发 [5] 转型派 - 百川智能"All in"医疗,聚焦百小应、AI儿科、AI全科、精准医疗四个方向 [6] - 零一万物不再投入万亿参数基模,转向中规模高性价比模型,推出企业级DeepSeek部署定制解决方案 [6] 行业挑战 - 基座大模型商业模式存在先天缺陷 [8] - 预训练成本极高,研发人员占比60%-70% [9] - 估值高企使融资难度陡增,融资资金消耗快 [10] - C端市场被大厂和DeepSeek占据,MAU前五均为大厂产品 [12] - B端面临成本与技术领先性劣势 [13] 潜在出路 - 短期内IPO是有效解决方案 [14] - 长期需找到可行商业化路径,机会在B端垂直领域 [15] - 垂类应用场景需形成服务闭环产品体验 [15] - 收缩预训练规模,投入小模型或智能体可节省60%-70%成本 [16] - 选择开放的垂直行业利基市场,需具备行业洞察、产品能力和成本效率 [17][18]
计算机行业重大事项点评:MiniMax:推理模型、Agent与多模态
华创证券· 2025-06-26 19:04
报告行业投资评级 - 推荐 [4] 报告的核心观点 - 6月17日MiniMax连续五天推出AI新品,涉及推理模型、视频生成模型、Agent、语音设计等产品,展示了其在多领域的技术实力和追赶国际巨头的能力,随着全球模型厂商能力提升,我国AI Agent商业化落地有望在2025H2提速,实现客户转化率与付费率双提升,建议关注海内外AI企业级服务及场景落地机会 [2][8][31] 根据相关目录分别进行总结 MiniMax:推理模型、Agent与多模态 - 6月17日MiniMax连续5天发布多款AI新品,覆盖推理、视频生成、智能体等领域 [11] MiniMax - M1:混合架构赋能性能升级 - 6月17日MiniMax发布并开源新一代推理模型MiniMax - M1,融合混合门控专家架构与Lightning Attention双技术框架,在性能与推理效率上显著突破,在长上下文理解等场景表现卓越,接近国际顶尖闭源模型能力并优化计算资源消耗 [12] - MiniMax - M1提出创新强化学习算法CISPO,训练效率高于DAPO和GRPO算法,该模型采用分层计价模式收费 [17] Hailuo 02:NCR模态助力性能成本双赢 - 6月18日MiniMax推出全新AI视频生成模型Hailuo 02,能根据文本或图像生成高清视频,支持1080p分辨率输出,单段视频最长10秒 [18] - Hailuo 02在国际AI视频生成模型评测中凭借NCR框架跻身前列,全球排名第二,且付费价格低廉,性价比高 [21] MiniMax Agent:多模态集成重塑智能体性价比 - 产品发布周期第三天,MiniMax推出通用型AI智能体MiniMax Agent,基于多模态大语言模型构建,集成多种能力,支持多智能体协同工作,已在公司内部完成近两个月测试,遵循人类智能标准研发,具备编程辅助等功能并支持MCP协议扩展架构 [26] - 通用Agent采用积分制收费,优惠期设基础会员和Pro会员,基础会员月费19美元,Pro会员月费69美元 [26] Voice Design:个性化定制的交互语音模块 - 产品发布周期间,MiniMax对语音大模型Speech - 02进行重要版本升级,优化语音合成设计功能并集成Voice Design模块,升级后语音合成质量显著提升 [28] - Voice Design可精确调控音色多方面,用户输入音色文本描述,模型能生成相应音色编码 [30] 投资建议 - 多模态模型发展快,我国AI Agent商业化落地有望在2025H2提速,建议关注A股AI应用方向,国内侧关注办公、营销等企业级服务及金融、教育等行业场景相关企业,海外侧关注办公、金融等多领域相关企业 [8][31][32]