海螺AI

搜索文档
字节、讯飞、MiniMax,为什么都在上新“声音复刻”?
AI研究所· 2025-07-04 17:28
声音复刻技术竞速 - 字节跳动旗下豆包AI播客功能全量上线,可将8万字英文PDF在数秒内生成男女对谈播客,语气词、停顿节奏与真人无异 [1][2] - 科大讯飞2024年4月推出声音复刻功能升级,仅需10秒音频素材即可复刻角色声音,情绪表达与原角色难分伯仲 [1] - MiniMax海螺AI在2024年底已实现30秒语音素材克隆唐国强、林黛玉等人物声音,情感还原度高 [1][7] 技术细节与优势 - 豆包AI播客能将8万词英文起诉书在1-2分钟内转化为带封面图的完整播客,自动添加语气词、附和与停顿 [4] - 科大讯飞构建"三阶段层次化语音建模框架",通过星火底座大模型精确捕捉发音规律,实现"超拟人"效果 [4] - 海螺AI对中文语音情绪与音色把控精细,如林黛玉声音克隆中精准捕捉哀怨感,相比海外产品更贴合中文语境 [8] 行业应用与场景 - 讯飞超拟人合成技术已应用于智能座舱、教育等场景,如蔚来汽车智能助手NOMI情感表达与交互自然度大幅提升 [6] - 微软AzureAISpeech推出"神经语音"技术,谷歌WaveNet以波形级生成提升语音真实感 [9] - 中文场景下形成技术梯队:字节在语义理解领先,讯飞在专业场景精度占优,MiniMax以轻量化克隆和情感表达突围 [9] AI播客市场前景 - 2024年中文播客听众将达1.34亿,76.2%用户每天收听超半小时 [11] - 播客变现模式包括广告、付费订阅与IP衍生开发,头部节目单期广告报价达2-15万元,付费节目销售额可达数百万 [12][13] - 2024年中国播客广告市场收入约33亿人民币,规模仍有限但潜力巨大 [14]
“AI六小虎”到了下一个赛点
36氪· 2025-07-04 17:24
作为"AI六小虎"之一的MiniMax(稀宇科技),近期刚刚结束了"技术发布周"。 自6月17日以来,MiniMax发布了一系列核心技术与产品更新,涵盖基座模型、视频生成模型、多模态智能体等多个方向,系统展现其"模型--多模态--应 用"一体化技术路线。 就在MiniMax"疯狂上新"的同时,市场上传出了其拟赴港IPO的消息,这也让MiniMax成了智谱AI之后第二家"AI六小虎"中传出冲刺上市的公司;不过, 目前公司对此没有相关回应。 图源:微博截图 即使身处时下最火的赛道、顶着明星履历,MiniMax或者其他"AI六小虎"的企业也都面临着同样的困境——产品同质化、商业化不成熟,以及盈利困境。 01.冲刺IPO的"六小虎" "AI 六小虎"(谱、月之暗面、百川智能、MiniMax、阶跃星辰、零一万物)是过去两年国内大模型时代的一个标志,指的是当年最早完成 10 亿 + 美元融 资,且均拥有自研千亿参数级大模型,在国际基准测试中与 GPT-4、Llama 等对标的大模型创业公司。 为了避免依赖单一产品的风险,2024年9月,MiniMax发布了视频生成模型"海螺视频I2V-01",并上线了海螺AI。 AIGC ...
MiniMax逆着商汤过河
搜狐财经· 2025-07-04 09:21
文 | 新立场Pro 25年刚过半,"AI六小虎"的称呼仿佛成为了一个过气梗,DeepSeek横空出世,改写了AI创业的造神势头——原本也许可以在新一年高歌猛进的六大玩 家,上半年有人削减投流,有人裁撤业务,有人重心转向,有人更加急切地寻求上市。 2月消息称月之暗面Kimi暂停烧钱投流;3月消息称百川智能裁撤主要负责金融行业To B业务的B端组;4月智谱向中国证监会北京证监局提交上市辅导备 案;5月零一万物转向彻底拥抱To B;6月初消息称阶跃星辰减少C端应用投入并将重心转向Agent;就在前段时间,消息称MiniMax计划最早在今年港股上 市,并且已为此次IPO聘请了财务顾问。 DeepSeek鲶鱼效应加速下,六小虎当然知道市场留给自己的耐心更加不多了,寻求上市则是赚取更多市场耐心的方式之一。 不止闫俊杰,根据公开资料,MiniMax另一位创始人周彧聪也来自商汤。所以起初,在市场对AI六小虎的模式和演变路径都还不清楚的时候,MiniMax被 视为"商汤系"、"商汤2.0",这当然不意味着公司业务层面在效仿商汤的模式,仅仅指向管理层的人员履历。 以近年对外发言较多的闫俊杰的基本履历来看,其此前其在商汤科技负责 ...
AI视频大战升级:Sora“神话”被打破?国产模型加速商业化落地
华夏时报· 2025-06-28 20:01
从东方美学到赛博朋克,从黏土动画到三维写实,《新世界加载中》在不同画风的切换中,开启了全新 的AIGC微短剧叙事。《新世界加载中》是由快手可灵AI与星芒短剧联合出品、由异类Outliers团队制作 的全球首部AI单元故事集,已经在6月26日上线。 多模态大模型带动诸多行业重塑生产环节,由于短剧篇幅较短、市场规模处于快速增长期,且AI生成 能有效降低科幻等题材的特效成本,其成为AIGC最先落地的影视内容。在《新世界加载中》总导演、 异类Outliers创始人陈翔宇看来,AIGC相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性 释放。 2024年开始,一个个视频大模型接踵登场,并在此后不断升级优化,试图抢占竞争高地。而随着AI行 业回归理性,越来越多的企业意识到大模型的商业化落地颇为重要。"可灵AI是一个商业化的产品,确 实有一些商业化目标,但从市场化来看,我们商业化的这些数字更多还是去印证市场和用户需求的可能 性,此刻我们单纯说数字没有什么意义,因为行业还在比较早期阶段,更希望和创作者一起共同探索和 摸索。"可灵AI产品及运营负责人李杨在6月25日接受《华夏时报》记者在内的媒体记者采访时表示。 据记者了 ...
计算机行业重大事项点评:MiniMax:推理模型、Agent与多模态
华创证券· 2025-06-26 19:04
报告行业投资评级 - 推荐 [4] 报告的核心观点 - 6月17日MiniMax连续五天推出AI新品,涉及推理模型、视频生成模型、Agent、语音设计等产品,展示了其在多领域的技术实力和追赶国际巨头的能力,随着全球模型厂商能力提升,我国AI Agent商业化落地有望在2025H2提速,实现客户转化率与付费率双提升,建议关注海内外AI企业级服务及场景落地机会 [2][8][31] 根据相关目录分别进行总结 MiniMax:推理模型、Agent与多模态 - 6月17日MiniMax连续5天发布多款AI新品,覆盖推理、视频生成、智能体等领域 [11] MiniMax - M1:混合架构赋能性能升级 - 6月17日MiniMax发布并开源新一代推理模型MiniMax - M1,融合混合门控专家架构与Lightning Attention双技术框架,在性能与推理效率上显著突破,在长上下文理解等场景表现卓越,接近国际顶尖闭源模型能力并优化计算资源消耗 [12] - MiniMax - M1提出创新强化学习算法CISPO,训练效率高于DAPO和GRPO算法,该模型采用分层计价模式收费 [17] Hailuo 02:NCR模态助力性能成本双赢 - 6月18日MiniMax推出全新AI视频生成模型Hailuo 02,能根据文本或图像生成高清视频,支持1080p分辨率输出,单段视频最长10秒 [18] - Hailuo 02在国际AI视频生成模型评测中凭借NCR框架跻身前列,全球排名第二,且付费价格低廉,性价比高 [21] MiniMax Agent:多模态集成重塑智能体性价比 - 产品发布周期第三天,MiniMax推出通用型AI智能体MiniMax Agent,基于多模态大语言模型构建,集成多种能力,支持多智能体协同工作,已在公司内部完成近两个月测试,遵循人类智能标准研发,具备编程辅助等功能并支持MCP协议扩展架构 [26] - 通用Agent采用积分制收费,优惠期设基础会员和Pro会员,基础会员月费19美元,Pro会员月费69美元 [26] Voice Design:个性化定制的交互语音模块 - 产品发布周期间,MiniMax对语音大模型Speech - 02进行重要版本升级,优化语音合成设计功能并集成Voice Design模块,升级后语音合成质量显著提升 [28] - Voice Design可精确调控音色多方面,用户输入音色文本描述,模型能生成相应音色编码 [30] 投资建议 - 多模态模型发展快,我国AI Agent商业化落地有望在2025H2提速,建议关注A股AI应用方向,国内侧关注办公、营销等企业级服务及金融、教育等行业场景相关企业,海外侧关注办公、金融等多领域相关企业 [8][31][32]
“过气”的Sora,凭什么想做AI版的抖音?
新财富· 2025-06-24 16:10
Sora的战略转型与AI社交趋势 - OpenAI通过Sora开辟视频大模型赛道,但初期因产品延期导致竞争格局反转,国产AI视频模型如快手可灵1.0和MiniMax海螺AI迅速抢占市场[1][2][3][4] - Sora从视频生成工具转型为AI社交平台,新增图像生成模块GPT-Image-1,上线一周吸引1.3亿用户,日均生成1亿张图像,带动付费用户增长[15][16][17][18] - 新版Sora强化社交功能:提高图片作品占比、增加推荐/点赞/复制等交互组件、支持提示词复用和内容公开分享,接近完整图像社区形态[21][22][23][24] AI社交平台的行业逻辑 - 头部AI公司如马斯克xAI、月之暗面Kimi、OpenAI均布局社交领域,核心动机包括获取用户反馈提升模型能力及构建流量入口[7][8][10][11][12][40] - 社交平台通过UGC内容形成数据飞轮,Meta、Google、抖音已验证流量变现模式,OpenAI创始人Sam Altman认为10亿用户平台价值超越顶尖模型[43][44] - OpenAI 2024年营收40亿美元但亏损50亿美元,依赖ChatGPT订阅服务(2000万付费用户,年化营收50亿美元),需拓展高级会员提升收入[45][48][49][52] 图像/视频的社交属性与竞争格局 - GPT-Image-1通过高度风格化图像(如吉卜力画风)突破文生图审美瓶颈,满足个性化表达需求,实现跨文化传播[27][29][30][32] - 移动互联网时代Instagram、Snapchat等成功案例证明图像/视频是社交核心载体,当前短视频人均单日使用时长达138.4分钟,远超聊天应用[33][34][36][37][62] - AI社交面临传统社交巨头的阻击(如抖音整合豆包、微信接入元宝),新入局者需依赖AI技术突破存量竞争壁垒[56][60][61][64][65]
「AI新世代」从推理模型到智能体!MiniMax复刻OpenAI“闪电战”,投资人的耐心还剩多少
华夏时报· 2025-06-21 17:38
产品发布动态 - MiniMax在6月17日至20日密集推出四款新产品:开源推理模型MiniMax-M1(支持100万上下文输入,是DeepSeek R1的8倍)、视频生成模型Hailuo 02、通用智能体MiniMax Agent及视频创作Agent Hailuo Video Agent [2][4] - 此次"闪电战"式产品发布效仿OpenAI的营销策略,旨在构建更稳健的商业生态,但新品市场接受度与变现能力尚未验证 [2] - 公司现阶段核心目标是打造下一个爆款产品,当前唯一爆品为海外虚拟伴侣应用Talkie(2023年7月月活达1100万,美国用户占比超50%)[3][5] 商业化进展 - 海螺AI推出分级会员制引发争议,最高档至臻版年费达10788元(月均899元),公司回应称Hailuo 02模型定价显著低于Runway等竞品 [6][7] - 公司未公开营收数据,但近期动作显示商业化紧迫性提升,包括会员体系调整(高级版升级为至臻版,每月赠送12000贝壳信用点)[6][7] - 内部考虑启动上市计划,目前处于初步筹备阶段,而"AI六小虎"中仅智谱已提交上市辅导备案 [7] 行业竞争格局 - 2025年大模型领域投资趋紧,"AI六小虎"除智谱外均未获新融资,MiniMax最新融资仍为2023年3月阿里领投的B轮 [5][6] - DeepSeek崛起改变市场格局,MiniMax试图通过视频模型领域突破确立核心定位,与竞争对手差异化竞争 [5][8] - 行业整体转向应用层开发,"六小虎"多数放弃或缩减基座大模型研发,聚焦垂直领域应用落地 [8] 战略方向 - 公司采取C端与B端并重策略,产品覆盖虚拟伴侣(Talkie/星野)、视频生成(海螺AI)及企业级推理模型等多赛道 [3][4] - 专家建议强化出海优势,利用中国供应链与工程师红利,目标成为全球化AI应用巨头 [8] - 2024年Talkie下架事件(原因未披露)促使公司加速产品多元化布局以降低单一产品风险 [5]
一个上海AI独角兽爆发了
投资界· 2025-06-20 16:04
MiniMax上演逆袭。 作者 I 刘博 报道 I 投资界PEdaily 全球AI圈又沸腾起来了。 6月17号,Mi n iMa x "发布周"拉开序幕,又是开源又是发布新模型, 一系列动作令业内 惊呼。 新模型Mi niMa x-M1,是"世界上第一个开源的大规模混合架构的推理模型",被 视为"性价比新王"。值得一提的是,这只是一道"开胃菜"。 Mi n iMa x,这个名字创投圈并不陌生。身后掌舵者是一位8 9年的博士——闫俊杰,他早 年任职于AI四小龙之一的商汤科技,后来在2 022年投身到AGI创业之中。早在Ch a tGPT 爆红前,Mi n iMa x就已经成为国产大模型的代表性企业。 1 9 8 9年,闫俊杰出生在河南的一座小县城。他从中国科学院自动化研究所博士毕业后, 继续在清华大学计算机系从事博士后研究。他的学术成就令人印象深刻——在深度学习和 计算机视觉领域,发表过顶级会议和期刊论文1 0 0余篇, Go ogl e Sc h o l a r引用超过10 0 0 0 次。 博士期间,闫俊杰加入商汤科技,从实习生一路做起,曾任商汤集团副总裁、研究院副院 长 和 智 慧 城 市 事 业 群 C ...
开源还要IPO?MiniMax不想被遗忘在这个夏天
36氪· 2025-06-20 12:44
行业竞争格局 - 六小虎(MiniMax、智谱、月之暗面、百川智能、零一万物、阶跃星辰)正通过发布新模型与DeepSeek展开技术竞速 [1] - 月之暗面开源编程大模型Kimi-Dev-72B,在SWE-bench测试中超越671B参数的DeepSeek R1 [1] - MiniMax发布混合架构推理模型M1,支持100万上下文输入,为业内最高水平 [3] MiniMax技术突破与产品布局 - M1模型在17个主流测评集表现优异,填补公司近三个月基座模型空白 [3] - 视频生成模型Hailuo 02和通用Agent产品MiniMax Agent同步发布,形成多产品矩阵 [1][3] - 海螺AI连续6个月位居全球视频生成产品榜首,海外访问量达1635万(国内6倍) [6][7] 商业化与收入结构 - 公司收入原依赖Talkie广告和订阅,现通过海螺AI和MiniMax Agent订阅制拓展多元化收入 [12] - 产品战略调整为"MiniMax"主攻文本生成,"海螺AI"聚焦多模态内容生成 [7] - 海外市场成为重点,新模型与产品均同步海外发布 [12] 行业IPO动态 - 智谱成为六小虎中首家提交上市辅导备案的企业 [3][9] - MiniMax计划港股IPO但年内难启动,六小虎中仅智谱年营收超1亿港元(约9159.9万元) [9][11] - 港股流动性下滑,创业板日均成交额仅1.3亿港元,主板要求未商业化企业证明现金流能力 [10] 产品差异化策略 - 海螺AI以动画创作为核心差异化,在二次元群体中形成口碑 [5] - 视频生成赛道通过审美多元化突破大厂包围,如字节Seeweed、快手可灵AI等竞品 [5][6] - Talkie下架事件后用户增速放缓,公司加速布局Agent等新应用以降低单一产品风险 [4][7]
MiniMax秀了波AI杂技视频,视频生成赛道又卷起来了
第一财经· 2025-06-18 16:47
行业动态 - AI视频生成赛道近期竞争加剧,多家公司发布新模型,包括快手可灵2.0、字节跳动即梦3.0 Pro、谷歌Veo3和MiniMax海螺02 [1] - 行业整体技术水平提升,海螺02在复杂人类动作、光影和物理模仿方面表现优异 [6] - 视频生成模型竞技场Artificial Analysis Video Arena最新排名:字节Seedance 1.0 pro第一,海螺02第二,谷歌Veo3第三 [6][7] - 行业仍处于技术迭代初期,最终市场格局尚未确定 [16] 公司表现 - MiniMax海螺02在性价比方面领先,1000元可生成1.7万条1080p视频,高于字节即梦1.4万条和谷歌Veo3 2000条 [14] - 海螺AI自去年8月发布以来已帮助创作者生成超过3.7亿个视频 [14] - 快手可灵AI全球用户达2200万,累计生成1.68亿视频和3.44亿图片,月活增长25倍 [14] - 快手可灵AI季度营收超1.5亿元,中金给予60亿美元估值,全球市场占有率30.7% [14][15] 技术进展 - 海螺02在物理运动效果和细节呈现(如泪珠)方面获得用户好评 [8] - AI视频生成仍存在"抽卡"问题,需要多次尝试才能获得理想画面 [6] - 影视行业对AI生成复杂动作场景(如剑斗)仍持观望态度 [10] - 多模态内容生成被视为大模型厂商的必要能力 [15] 商业化前景 - 快手可灵AI的营收表现显示AI视频领域商业化前景可期 [14] - 行业正从专业创作者向更广泛用户群体渗透 [15] - 性价比和生成效率(减少"抽卡"次数)是竞争关键因素 [14]