Hailuo Video Agent

搜索文档
MiniMax Agent发布30天,这次真的碾压了OpenAI?
虎嗅· 2025-07-25 17:06
AI Agent行业动态 - 2025年被定位为"Agent元年",AI Agent技术正朝着将创意直接转化为可运行产品的全技术栈方向发展[1] - AI独角兽MiniMax完成新一轮融资,估值突破40亿美元,成立仅三年便获得资本持续青睐[2] - MiniMax近期开源了超长上下文推理模型MiniMax-M1、AI视频模型Hailuo 02等多款产品,在技术社区引发广泛关注[3] MiniMax Agent产品升级 - 产品上线30天后即完成关键迭代,新增全栈开发能力,支持前后端一体化开发[6][8] - 最新版本具备更强的"反思"能力,会在项目部署后持续优化功能,主动进行端到端测试[18][20] - 输出成果包含前端代码、后端架构、数据库配置、边缘函数和支付集成的完整技术栈[21] 全栈开发能力案例 - 播客社区案例: - 实现从文稿自动生成AI音频、Stripe支付(5美元/次下载)、Supabase后端管理的全流程[9][10][12] - 自动创建数据库表结构(comments/favorites等)、存储Bucket(音频/封面)、初始数据插入[15][16] - 生成包含用户管理(注册/登录)、内容审核、订单追踪(显示20美元总收入)的完整后台系统[26][30][31] - 其他创新应用: - 算命MCP服务:通过自然语言指令即可创建调用大模型API的占卜服务,支持前端古风界面定制[60][61][68] - 融资新闻站:利用Cron job实现每分钟自动抓取Serper API的AI初创公司融资动态[70][71][76] - PPT生成:基于文档自动创建"彩虹小熊"主题演示文稿,保持多页面视觉一致性[79][80][81] 行业趋势洞察 - 技术门槛降低:全栈Agent使单人开发者能快速实现包含支付、用户系统的生产级应用[87][89] - 效率提升:产品验证周期从数月缩短至分钟级,创意实现效率呈指数级增长[90] - 竞争焦点转向: - 差异化能力成为关键,同质化风险加剧[91] - 端到端测试、风格一致性、主动优化等进阶能力构成产品竞争力[93][96] - 市场格局:OpenAI等巨头入局加速Agent技术整合,行业进入生态竞争阶段[97][99]
「Manus+景鲲」领衔主演,华人AI Agent全球狂欢
36氪· 2025-07-24 18:07
行业动态 - 2025年全球科技圈聚焦华人AI Agent,Genspark和Manus成为代表性产品[1][3][4] - Agent行业在2025年迎来"文艺复兴",技术跃升推动产品形态成熟,用户规模和收入显著增长[6][7] - Claude 3.7 Sonnet模型和MCP协议发布,为Agent生态发展提供关键技术支撑[9] - 垂直领域Agent开始崛起,LiblibAI、米哈游等公司在多模态、游戏等细分市场布局[29][31] 公司表现 - MainFunc旗下Genspark实现45天3600万美元ARR,10周上线8个产品的爆发式增长[1] - Monica团队开发的Manus发布当月MAU达2300万,获Benchmark领投7500万美元融资,投后估值超5亿美元[4] - 阿里夸克AI月访问量超8400万,高考志愿报告Agent累计生成1000万份报告[8] - 360纳米AI超级搜索智能体月访问量达1.57亿,美图RoboNeo登顶国内App Store分类榜[8] 产品特征 - 新一代Agent具备自主规划任务、调用外部工具的能力,突破传统聊天机器人局限[6] - Manus定义了显示思维链对话框+任务执行可视化面板的产品范式,被多家公司模仿[10][12] - 通用Agent面临PMF验证问题,Manus和Genspark月访问量分别从2376万/888万下滑至1730万/769万[13] - 垂直领域Agent在图像设计、视频编辑、编程等场景取得突破性进展[31] 市场趋势 - Agent实现高营收速度惊人,Genspark仅用9天达到1000万美元ARR,远超Cursor的21个月[17] - 初创公司在通用Agent领域表现激进,大厂受制于组织惯性和政策限制进展缓慢[18][22] - 地缘政治影响显现,Manus裁撤中国团队转向新加坡市场,面临海外融资压力[14][15] - 行业共识认为未来通用Agent将由模型厂商主导,创业公司需转向垂直领域发展[28][29] 技术发展 - 第三方模型性能提升和低代码工具降低开发门槛,推动Agent产品快速迭代[6][23] - Monica团队4次重构智能体框架,优化运行速度和可扩展性[25] - 产品开发周期大幅缩短,Manus和Lovart分别仅用3个月和2个月完成开发[24][25]
“AI六小虎”凶猛竞逐,智谱率先叩响IPO大门
搜狐财经· 2025-07-17 20:23
公司上市动态 - 智谱AI成为中国"AI六小虎"中首家启动A股IPO进程的企业,已向北京证监局提交上市辅导备案,辅导机构为中金公司 [2] - 公司正考虑将IPO地点由内地改为香港,可能募资约3亿美元(约23.4亿港元),同时也在准备港股和A股上市,A股上市概率较高 [3] - 智谱AI已于2025年3月28日完成股份制改造,辅导期预计在2025年10月结束,有望在2026年正式登陆资本市场 [6] 公司背景与股权结构 - 公司成立于2019年6月11日,注册资本为3.622.4375万元,注册地址位于北京市海淀区 [5] - 公司无控股股东,实际控制人为唐杰与刘德兵,二人合计控制公司36.9647%的表决权 [5] - 技术源于清华大学KEG实验室,创始团队此前在清华大学计算机系工作 [6] 融资与估值 - 2024年9月,公司投前估值为200亿元,近期获得浦东创投集团和张江集团联合战投10亿元,最新估值已超400亿元 [6] - MiniMax完成近3亿美元新一轮融资,投后估值超过40亿美元(约300亿元人民币) [10][11] 技术与商业化 - 公司致力于打造新一代认知智能大模型,目标为实现通用人工智能(AGI) [6][7] - 2024年1月被美国列入出口管制"实体清单",但表示该决定不会对业务产生实质影响 [7] - 公司在商业化变现方面显露劣势,产品化进展缓慢,缺乏成熟的销售和售前体系 [8][10] - MiniMax在商业化方面表现突出,推出全栈产品并在海外市场取得显著成绩 [11] 行业竞争格局 - "AI六小虎"包括智谱AI、MiniMax、百川智能、月之暗面、阶跃星辰和零一万物,智谱AI起步最早 [3] - 行业正经历从"烧钱竞速"到"价值创造"的分化,技术创新、商业落地与资本市场的互动更加紧密 [12] - MiniMax通过差异化产品策略在竞争中占据优势,如推出Hailuo Video Agent [11][12]
“AI六小虎”开抢IPO,MiniMax要超智谱?
36氪· 2025-07-15 16:05
公司融资与估值 - MiniMax完成近3亿美元新一轮融资 投后估值超过40亿美元(约300亿元人民币) 目前国内达到这一估值的大模型公司仅有MiniMax和智谱[1][3] - 2024年公司获得6亿美元A轮融资后估值达25亿美元(约179亿元人民币) 投资方包括红杉中国、阿里巴巴、腾讯、IDG资本、米哈游等顶级机构[4] - 公司正在筹备赴港上市 彭博社于2024年6月报道相关消息[4] 产品与技术布局 - 构建"模型-多模态-应用"一体化技术路线 发布覆盖基座模型(开源MiniMax-M1系列)、视频生成(Hailuo 02)、语音模型(Speech 02)、智能体(Hailuo Video Agent)的全栈产品[3] - 视频生成技术突破:Hailuo 02支持1080P画质输出与高保真物理模拟 Hailuo Video Agent实现自然语言驱动的专业级视频生成[3][6] - 语音模型创新:Speech 02推出Voice Design功能 用户可通过自然语言描述精准控制音色多个维度[3] 商业化进展 - 海外情感应用Talkie前8个月下载量突破千万次 位列美国AI应用下载榜第4 2023年创造7000万美元营收(含用户付费与广告)[4] - 视频生成产品海螺AI通过蓝色胖猫IP爆火 被用户评价为"最优秀AI视频生成模型" 部分作品接近真实拍摄水准[5][6] - Agent产品商业化探索:Hailuo Video Agent支持文字/图片输入生成专业视频 通用Agent可处理长程复杂任务(如代码编写、PPT生成)[13][14] 行业竞争格局 - "AI六小虎"排位赛加速 差异化成为关键:DeepSeek通过展示思考过程实现体验突破 MiniMax以视频Agent回应市场对实用性的质疑[1][10] - 同质化竞争加剧:对话/视频/图片生成赛道免费成常态 价格战提前打响 订阅制商业模式依赖产品差异化[9][10] - 2025年被视为Agent商业化元年 办公、垂直类应用先行(如Glean企业搜索ARR翻倍 DayDream链接2000+品牌)[11] 战略发展方向 - 从技术研发向商业闭环快速跨越 平衡"速度-质量-盈利"三角难题[1][11] - 押注Agent赛道 布局"超级APP"机会:推动AI从Chat到Act的演进 整合工具类软件功能[13][16] - 技术演进路径:遵循OpenAI AGI五级路线图 当前产品处于第一(对话工具)至第二阶段(知识型助手) 向第三阶段(行动型助手)突破[13]
上海AI公司开源模型登上全球第二
快讯· 2025-07-03 07:19
公司动态 - 上海国产AI独角兽MiniMax于6月17日在官网和开源平台GitHub上发布全球首个开源大规模混合架构推理模型MiniMax-M1 [1] - MiniMax-M1在权威评测榜单中位列全球开源模型第二 仅次于5月28日发布的DeepSeek-R1-0528 [1] - MiniMax-M1在长文本处理 工具调用等方面形成碾压级优势 [1] - M1发布后4个工作日内 公司连续发布视频生成模型Hailuo02 通用智能体MiniMax Agent 视频创作智能体Hailuo Video Agent 以及音色设计工具Voice Design 保持日更节奏 [1] 行业地位 - MiniMax-M1是全球首个开源大规模混合架构推理模型 具有行业开创性 [1] - 该模型发布即进入全球开源模型第二的位置 显示公司在AI领域的快速突破能力 [1] - 公司在短时间内密集发布多款AI产品 展现强劲的技术研发和产品化能力 [1]
MiniMax 进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 22:00
大模型行业趋势 - 大模型技术以常规技术乘十的速度进化,颠覆互联网时代的生态护城河、资金壁垒和规模效应,使创业公司也能站上世界舞台中心 [1] - 行业生存法则已转变为"创新至上",传统互联网玩法彻底失效,淘汰周期缩短至季度为单位 [2][3] - 百模大战后,Open AI、Anthropic、MiniMax、DeepSeek等创业公司占据SOTA榜单大半,巨头优势被灵活创新机制瓦解 [10] MiniMax技术突破 视频模型Hailuo 02 - 参数量较前代增长3倍,分辨率达原生1080P,支持10秒高清内容生成,涵盖复杂物理交互与专业级运镜 [6] - 在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅其1/9 [7] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [9] 大模型M1 - 4560亿参数,原生支持100万token输入(DeepSeek R1的8倍)和8万token输出(超Gemini 2.5 Pro) [11] - 采用混合注意力机制(1/8自注意力+7/8线性注意力),实现长上下文窗口技术突破 [16] - CISPO算法使强化训练仅需3周+512块H800 GPU(成本53万美元),推理算力为DeepSeek R1的25% [17][19] 商业化与生态构建 Agent应用创新 - Hailuo Video Agent支持超百种视频模板,实现创意构思到成片的全链路生产,连续6个月全球视频生成AI榜首 [21][23] - 通用Agent可完成长程复杂任务(如网页搭建、PPT制作),内部使用率达50%,具备跨模态理解与生成能力 [24] - 基座模型与Agent形成技术闭环,性能优化与成本控制优势显著 [25] 公司发展路径 - 2022年初成立并提前布局MoE模型,2024年推出国内首个MoE大模型 [26] - 开源Lightning Attention技术,突破Transformer架构限制 [26] - 创新驱动战略使M1半年内登顶开源模型全球第二,通用Agent解决跨模态长距离任务难题 [27][28]
MiniMax进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 21:54
大模型行业特征 - 大模型技术发展速度极快,3年时间从默默无闻到改变世界,具备工业革命特质 [2] - 行业竞争激烈,头部玩家快速更迭,百亿资本投入可能迅速沉寂 [2] - 传统互联网的护城河、资金壁垒、规模效应失效,创业公司有机会站上世界舞台 [2] - 行业生存法则为创新至上,淘汰周期以季度为单位 [3][4] MiniMax的技术突破 - Hailuo 02模型参数较Hailuo 01增长3倍,视频分辨率提升至原生1080P,支持10秒高清内容生成 [9] - Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅1/9 [10][11] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [12] - M1模型支持100万token输入长度,是DeepSeek R1的8倍,输出token达8万个打破Gemini 2.5 Pro记录 [16] - M1在工具使用场景(TAU-bench)中领跑所有开源权重模型,30多轮长链路任务稳定性极高 [18] 创新架构与训练方法 - 早期探索MoE架构和混合注意力机制,1/8用自注意力,7/8用自创Lightning Attention [20] - CISPO算法替代传统PPO/GRPO,仅用3周时间、512块H800 GPU完成强化学习训练,成本53万美元 [21][23] - 生成10万token时推理算力仅需DeepSeek R1的25%,数学和编程任务效率更高 [23] Agent应用创新 - Hailuo Video Agent支持超百种视频模板,涵盖艺术片、广告片等体裁,打通完整视频生产链路 [28] - MiniMax Agent具备长期任务规划能力,内部使用60天,50%员工用于PPT制作、网页搭建等 [31] - Agent能生成复杂跳转逻辑网页,支持多模态理解与生成,完成动画、广告片等任务 [31] 公司发展历程 - 2022年初成立,早于ChatGPT引爆全球的时间 [33] - 2023年将80%算力投入MoE开发,2024年初推出国内首个MoE大模型 [34] - 2024年1月开源Lightning Attention技术,6月M1模型拿下开源模型全球第二 [34] - 持续探索更高智能水平,创新驱动发展 [35][36]
芯片板块全天活跃!天弘中证芯片产业ETF发起联接(A:012552;C:012553)场外一键布局芯片产业发展机遇
搜狐财经· 2025-06-30 14:46
芯片板块市场表现 - 2025年6月30日芯片板块全天活跃,思特威上涨6.01%,芯原股份上涨5.42%,安集科技上涨4.66%,翱捷科技、寒武纪等个股跟涨 [1] - 天弘中证芯片产业ETF发起联接(A:012552;C:012553)与芯片ETF天弘(159310)紧密挂钩,跟踪中证芯片产业指数,聚焦A股芯片全产业链 [1] - 中证芯片产业指数前十大成份股权重合计占比达54.62%,包括中芯国际(9.27%)、北方华创(7.47%)、海光信息(6.93%)、寒武纪(6.56%)、豪威集团(5.84%)等 [1][2] 行业动态 - 寒武纪将回购价格上限由不超过297.77元/股调整为不超过818.87元/股,截至6月27日收盘价为585.50元/股 [4] - SEMI报告显示全球半导体制造行业预计2024-2028年产能将以7%的复合年增长率增长,达到每月1110万片晶圆 [4] - 国金证券指出光刻机是自主可控最核心环节,中国大陆是最大半导体设备市场,国内晶圆厂将继续扩产 [4] 大模型与AI应用 - 6月国内大模型厂商MiniMax发布MiniMax-M1、Hailuo02等大模型及应用,月之暗面开源编程大模型Kimi-Dev-72B [5] - OpenAI CEO透露GPT-5将于今夏发布,看好重磅模型发布带来的AI应用产业链投资机会 [5]
宇树科技估值飙升至100亿+;狂揽12亿美元,全球AI应用2024大爆发;Z世代孤独经济遭AI萌宠血洗| 混沌 AI 一周焦点
混沌学园· 2025-06-25 18:12
本周核心趋势 - AI编程工具将"需求→代码"链路压缩至一句话指令,传统编程工具和低代码平台价值被削弱 [2] - 具身智能产业化加速,制造巨头通过提升"机器服务密度"重构生产业务线人力资源结构 [2] - 多模态进入成本血拼阶段,开源方案重构创作生态 [2] - AI算法陪伴服务受Z世代追捧,表现出强烈付费意愿 [2] 交互革命 - 腾讯元宝支持10+语言编程,0配置实时运行 [3] - DeepSite V2支持React/Three.js秒级建站 [3] - 豆包编程实现700+行代码级网页生成,审美与功能双突破 [3] - 三款产品均采用对话式开发界面,大幅降低技术门槛 [4] 具身智能 - 银河通用获超10亿元融资,创具身智能赛道年度纪录 [6] - 其人形机器人Galbot已落地奔驰/极氪工厂实现物料分拣 [6] - 本轮资金将深化与宁德时代电池+自动化产线协同 [6] 产品矩阵 - Minimax发布全球首个开源大规模混合架构推理模型MiniMax-M1 [7] - 新一代视频生成模型Hailuo 02打破效果与成本纪录 [7] - 通用智能体MiniMax Agent能完成复杂任务规划与执行 [7] AI应用收入 - 2024年全球AI应用收入达12亿美元,同比增长179% [9] - ChatGPT占据40%市场份额 [9] - 亚洲市场垂类应用集体爆发,Pixverse月活破6000万 [10] 模型开源 - 昆仑万维开源Skywork-SWE-32B,代码修复能力登顶 [11] - 模型在SWE-bench基准以38% pass@1准确率刷新开源记录 [11] 商业事件 - 宇树科技完成C轮融资,估值突破100亿人民币 [12] - 公司四足机器狗全球市占率超60%,且连续5年盈利 [12] 模型能力 - Midjourney推出AI视频模型V1,每秒视频成本≈1张图像 [13] - 支持最高20秒电影级动态画面生成 [13] - Google Gemini 2.5全家桶三款模型升级,官网访问量暴涨162% [14] 产品形态 - 珞博智能完成数千万天使轮融资,首款AI养成潮玩"芙崽"融合多模态交互与仿生记忆系统 [15] - 产品直击Z世代情感痛点,开辟"硬件+社交裂变"新赛道 [15]
AI模型、端侧齐发力,关注中报及内容新品带来的弹性
开源证券· 2025-06-22 22:42
报告行业投资评级 - 看好(维持) [2] 报告的核心观点 - 近期 Minimax、豆包大模型多模态、推理能力及 Agent 继续升级,加上 Rokid、华为鸿蒙在端侧 AI 持续发力,或推动内容创作、泛娱乐、教育、电商等领域 AI 应用加速渗透及商业化提速,拉动推理算力需求,建议坚定布局 AI [4] - 聚焦中报业绩线,结合内容新品带来的弹性,继续布局 IP 新消费,包括游戏、短剧、电影、潮玩等板块 [5] 根据相关目录分别进行总结 行业数据综述 - 《三角洲行动》获内地 iOS 免费榜第一,《王者荣耀》获内地 iOS 畅销榜第一;《无畏契约:源能行动》为安卓和 iOS 预约榜第一;电影《酱园弄·悬案》获得周票房冠军 [9][12] - 展示了重点公司游戏产品 iOS 游戏畅销榜排名、各类型影视综艺数据以及抖音卡牌爆款榜前 10 名情况 [11] AI 进化驱动行业变革,AIGC 创新场景持续扩展 AIGC - 《遥远行星:建造师》是“AI 原生游戏”概念开创性实践,由 AI 驱动世界运行逻辑,构建虚拟生态 [35] - 豆包·视频生成模型 Seedance1.0 pro 性能卓越、性价比高,重新定义 AI 视频生成领域 [36] - 京东加码进军酒旅行业,推出“京东酒店 PLUS 会员计划”,最高可享三年 0 佣金 [37] - Rokid 与支付宝携手推出“看一下支付”智能眼镜支付方案,带来全新支付变革 [37] - MiniMax 发布 MiniMax - M1 系列模型,推动 AI 模型产业向高性能、高性价比、真开源方向转型 [38] - Gemini 系列模型更新,推出 Gemini 2.5 Flash - Lite 版本,适用于大规模、高效处理的 AI 场景 [39] - 华为 HDC 大会宣布推出 HarmonyOS 6,小艺助手将具备视频通话能力,AI 更深入渗透系统 [40] 游戏 - 首款旗舰渡劫修仙手游《诛仙 2》定档 8 月 7 日,iOS 预约同步开启 [40] - 2025 年 5 月微信小游戏畅销榜头部市场格局总体稳定,厂商竞争与新品迭代激烈 [41] - 2025 年 5 月中国游戏市场规模为 280.51 亿元,同比增长 9.86%,环比增长 2.56% [42] 影视/IP - 2025 年暑期档电影市场迎来 60 + 中外佳作,涵盖多种题材,展现行业多元与成熟 [42] 公告总结 - 顺网科技发布 2024 年年度权益分派实施公告,以 6.74 亿股为基数,每 10 股派发现金红利 0.90 元 [43][44] - 兰生股份发布 2024 年年度权益分派实施公告,以 7.24 亿股为基数,每 10 股派发现金红利 2.20 元 [45] - 内蒙新华宣布旗下两家全资子公司进行吸收合并,旨在优化管理架构,提高运营效率 [46] 板块行情综述 - A 股传媒板块 2025 年第 25 周下跌 - 1.81%,表现弱于上证综指、沪深 300、深证成指、创业板指;游戏板块表现最好(+ 1.42%),体育板块表现最差(- 8.01%) [47] - 展示了 A 股、美股、港股传媒互联网相关个股的周涨跌幅情况 [47][48][53][55]