MiniMax海螺AI - 财报，业绩电话会，研报，新闻

MiniMax海螺AI

搜索文档

北京日报客户端· 2025-08-23 09:12

行业技术突破 - AI视频生成技术实现规模化应用，仅需一张图或一句话即可生成电影级质感视频，大幅降低制作门槛 [1] - 百度"蒸汽机"音视频一体化模型实现行业首次多人有声音视频一体化生成，突破传统"默片"限制 [5] - 视频生成长度普遍为5-10秒，但百度内部已在下一代技术架构取得突破性进展，将解决视频长度与成本倍数增长问题 [11] 成本效率变革 - 科幻短片《归途》制作成本仅330.6元人民币，相比传统实拍成本降低超万倍（传统成本需数百万元） [3][5] - 该短片含40多个镜头，通过AI生成超120个片段素材，包括18个10秒有声片段和102个5秒片段，耗时仅一周完成 [3] - AI技术消除传统影视制作的演员、场地、设备租赁及后期特效等高成本环节 [3] 市场竞争格局 - 国内企业包括百度"蒸汽机"、字节即梦、快手可灵AI、智谱清影、生数科技Vidu、MiniMax海螺AI等密集布局AI视频生成赛道 [7] - 国际市场竞争者包括OpenAI Sora、Google Veo、Runway Gen系列及Stability AI的Stable Video Diffusion模型 [7] - 生数科技Vidu模型上线8个月实现年化经常性收入2000万美元（约1.4亿元人民币） [7] - 快手可灵AI收入从一季度1.5亿元增长至二季度2.5亿元，环比大幅提升 [7] 生态价值与用户增长 - 百度将AI视频生成视为生态活跃度核心支点，移动搜索结果页AI生成内容占比从4月35%提升至7月64% [8] - AIGC行业用户使用时长同比飙升393.9%，成为移动互联网新增长引擎 [8] - 爆款漫剧《明日周一》采用"10人团队+45天+50集+AI生成"模式，抖音上线5天播放量突破500万 [7] 应用场景与用户群体 - 当前AI视频生成需专业创作者反复调试提示词（prompt），消费群体以专业创作者为主 [11] - 技术需突破一键生成能力，实现从专业创作者向大众用户群体的跨越 [11]

百度集团(US:BIDU)

AI视频生成

Artificial Intelligence

Artificial Intelligence

字节、讯飞、MiniMax，为什么都在上新“声音复刻”？

AI研究所· 2025-07-04 17:28

声音复刻技术竞速 - 字节跳动旗下豆包AI播客功能全量上线，可将8万字英文PDF在数秒内生成男女对谈播客，语气词、停顿节奏与真人无异 [1][2] - 科大讯飞2024年4月推出声音复刻功能升级，仅需10秒音频素材即可复刻角色声音，情绪表达与原角色难分伯仲 [1] - MiniMax海螺AI在2024年底已实现30秒语音素材克隆唐国强、林黛玉等人物声音，情感还原度高 [1][7] 技术细节与优势 - 豆包AI播客能将8万词英文起诉书在1-2分钟内转化为带封面图的完整播客，自动添加语气词、附和与停顿 [4] - 科大讯飞构建"三阶段层次化语音建模框架"，通过星火底座大模型精确捕捉发音规律，实现"超拟人"效果 [4] - 海螺AI对中文语音情绪与音色把控精细，如林黛玉声音克隆中精准捕捉哀怨感，相比海外产品更贴合中文语境 [8] 行业应用与场景 - 讯飞超拟人合成技术已应用于智能座舱、教育等场景，如蔚来汽车智能助手NOMI情感表达与交互自然度大幅提升 [6] - 微软AzureAISpeech推出"神经语音"技术，谷歌WaveNet以波形级生成提升语音真实感 [9] - 中文场景下形成技术梯队：字节在语义理解领先，讯飞在专业场景精度占优，MiniMax以轻量化克隆和情感表达突围 [9] AI播客市场前景 - 2024年中文播客听众将达1.34亿，76.2%用户每天收听超半小时 [11] - 播客变现模式包括广告、付费订阅与IP衍生开发，头部节目单期广告报价达2-15万元，付费节目销售额可达数百万 [12][13] - 2024年中国播客广告市场收入约33亿人民币，规模仍有限但潜力巨大 [14]

声音复刻

AI播客

耳朵经济

Artificial Intelligence

Artificial Intelligence

MiniMax海螺AI

豆包AI播客

“过气”的Sora，凭什么想做AI版的抖音？

新财富· 2025-06-24 16:10

Sora的战略转型与AI社交趋势 - OpenAI通过Sora开辟视频大模型赛道，但初期因产品延期导致竞争格局反转，国产AI视频模型如快手可灵1.0和MiniMax海螺AI迅速抢占市场[1][2][3][4] - Sora从视频生成工具转型为AI社交平台，新增图像生成模块GPT-Image-1，上线一周吸引1.3亿用户，日均生成1亿张图像，带动付费用户增长[15][16][17][18] - 新版Sora强化社交功能：提高图片作品占比、增加推荐/点赞/复制等交互组件、支持提示词复用和内容公开分享，接近完整图像社区形态[21][22][23][24] AI社交平台的行业逻辑 - 头部AI公司如马斯克xAI、月之暗面Kimi、OpenAI均布局社交领域，核心动机包括获取用户反馈提升模型能力及构建流量入口[7][8][10][11][12][40] - 社交平台通过UGC内容形成数据飞轮，Meta、Google、抖音已验证流量变现模式，OpenAI创始人Sam Altman认为10亿用户平台价值超越顶尖模型[43][44] - OpenAI 2024年营收40亿美元但亏损50亿美元，依赖ChatGPT订阅服务（2000万付费用户，年化营收50亿美元），需拓展高级会员提升收入[45][48][49][52] 图像/视频的社交属性与竞争格局 - GPT-Image-1通过高度风格化图像（如吉卜力画风）突破文生图审美瓶颈，满足个性化表达需求，实现跨文化传播[27][29][30][32] - 移动互联网时代Instagram、Snapchat等成功案例证明图像/视频是社交核心载体，当前短视频人均单日使用时长达138.4分钟，远超聊天应用[33][34][36][37][62] - AI社交面临传统社交巨头的阻击（如抖音整合豆包、微信接入元宝），新入局者需依赖AI技术突破存量竞争壁垒[56][60][61][64][65]

Artificial Intelligence

Artificial Intelligence

Sora