MiniMax Music 1.5 - 财报，业绩电话会，研报，新闻

MiniMax Music 1.5

搜索文档

搜狐财经· 2025-09-17 11:09

游戏板块市场表现 - 游戏ETF（159869）早盘上涨近1% 资金单日净流入2.98亿元[1] - 巨人网络领涨超4% 冰川网络涨近1.5% 华立科技、宝通科技、神州泰岳跟涨[1] 手游发行商收入表现 - 8月全球收入前三名为腾讯、点点互动和网易[1] - 巨人网络月度收入环比增长72% 因《超自然行动组》进入全球收入前十[1] - 雷霆游戏《杖剑传说》8月收入环比大幅增长74% 位列海外收入第18名[1] 海外市场与产品表现 - 点点互动两款产品蝉联月度出海手游收入前两名三款新产品进入榜单[1] AI技术应用进展 - 字节跳动发布即梦图片4.0 傅利叶开启陪伴机器人GR-3预售[1] - 爱诗科技完成6000万美元B轮融资 MiniMax Music 1.5上线[1] - 快手推出AI超级员工Kwali 阿里发布Qwen3-Next-80BA3B双模型[1] - 腾讯开源Youtu-GraphRAG框架[1] 行业投资价值 - 游戏板块具备AI、内容、商业化模式变革等多重催化因素[2] - 游戏ETF（159869）跟踪中证动漫游戏指数反映A股动漫游戏产业整体表现[2]

海通国际证券· 2025-09-15 16:07

行业投资评级 - 报告未明确提供整体行业投资评级 [1][6][20] 核心观点 - 日本政府大力支持半导体产业向美光提供最高5360亿日元(约36.4亿美元)补贴用于下一代DRAM研发与量产 [1][2] - 苹果A20处理器将采用"三级分"策略台积电2纳米制程获近半初期产能供应链同步受益 [3][4][5] - Google采用"硬件即服务"模式推广TPU 以游击策略切入NVIDIA主导的算力租赁市场 [8][9][10] - xAI重组训练体系裁撤500名数据标记员转向扩大专业AI导师团队 [7][34][35] - AI模型能力持续突破 MiniMax Music 1.5支持4分钟音乐生成 Meta MobileLLM-R1小模型效率显著提升 [14][58][59] 半导体制造与投资 - 美光计划至2029年度投入1.5万亿日元使广岛工厂具备月产4万片先进DRAM能力预计2028年6-8月开始出货 [2][22] - 日本政府要求美光量产後至少持续生产10年包含此次补助总额达7745亿日元 [3][24] - 日本经产省还对台积电熊本厂和铠侠四日市工厂提供补贴确保先进半导体量产能力 [3][25] - 芯片分级策略将带动差异化代工与封装订单台积电竞争对手面临量产与良率差距扩大风险 [5][30] 人工智能与算力生态 - Google Ironwood TPU单芯片算力达2.3 Petaflops 与NVIDIA B300的2.5 PFLOPS相当完整Pod可整合9216颗芯片 [11][44] - OpenAI面临巨大成本压力预计2029年前烧掉1150亿美元仅2030年就需花费1000亿美元租赁服务器 [12][48] - xAI数据标记团队从超过1500人缩减至约1000人未来专注STEM、编程、金融、医学等领域专家 [7][36][37] - 美团AI Agent"小美"基于5600亿参数Longcat模型实现全自动点餐操作但尚无法处理复杂需求 [14][51][52] 技术创新与产品突破 - 苹果A20系列将对应折叠iPhone、iPhone Air和Pro系列采用2+4核心CPU架构和不同GPU配置 [4][27] - MiniMax Music 1.5支持16种风格×11种情绪×10场景自定义可生成民族乐器音色和段落分明作品 [14][49][50] - 小红书FireRedTTS-2支持多语言实时音频生成 B站IndexTTS2实现0.02%时长误差率精准口型同步 [15][53][57] - Meta MobileLLM-R1系列仅用2T token训练 950M模型性能媲美36T token训练的Qwen3 0.6B [16][58][59] - AI Gauss三周完成陶哲轩团队18个月未解数学难题生成25000行Lean代码含上千定理定义 [16][61][62]

腾讯研究院· 2025-09-15 00:01

OpenAI与微软合作及发展前景 - OpenAI与微软发布非约束性合作备忘录涉及云服务托管知识产权归属和AGI控制权等核心问题但最终合作条约仍未确定[1] - OpenAI预计成立估值超1000亿美元的公益公司(PBC) 非营利机构将持有股权并保持控制权成为全球资源最充足的慈善组织之一[1] - OpenAI面临巨大成本压力预计2029年前烧掉1150亿美元仅2030年就需花费1000亿美元租赁服务器未来几年几乎没有容错空间[1] AI影视内容创作突破 - 前谷歌X团队创立全球首家AI原生影视工作室Utopai 两部电影项目已带来1.1亿美元收入锁定戛纳电影节[2] - Utopai突破AI视频生成三大难题：一致性可控性和叙事延续性实现毫秒级精准对口型模型内置物理规律的3D数据训练[2] - 公司定位为内容+AI而非纯工具供应商已获好莱坞顶级资源支持为电影《科尔特斯》邀请奥斯卡提名编剧八集科幻剧《太空计划》成功预售欧洲市场[2] 音乐生成技术进展 - MiniMax发布新一代音乐生成模型Music 1.5 支持长达4分钟的完整歌曲创作具备强控制力人声自然饱满编曲层次丰富和歌曲结构清晰四大突破[3] - 模型支持"16种风格×11种情绪×10个场景"自定义音乐特征能生成不同声线唱腔并支持中国民族乐器生成真正实现Intro/Verse/Chorus段落分明[3] - 基于MiniMax多模态自研能力积累同步面向全球开发者提供API 适用于专业音乐创作影视游戏配乐虚拟偶像单曲和企业品牌专属音频内容多种场景[3] 本地生活AI应用发展 - 美团首个AI Agent产品"小美"开启公测通过自然语言指令点咖啡找餐厅规划早餐菜单大幅简化点餐流程[4] - 小美基于美团自研Longcat模型(5600亿总参数) 能根据用户口味偏好和地理位置实现从选品到支付的全自动操作并记忆用户习惯[4] - 与Agent热潮相呼应但目前仍有局限性：无法处理复杂模糊需求无法进行语音回复未来将在个性化和主动服务能力上进一步优化[4] 语音合成技术创新 - 小红书智创音频技术团队发布新一代对话合成模型FireRedTTS-2 解决现有方案灵活性差发音错误多说话人切换不稳定和韵律不自然等问题[5] - 模型在数百万小时语音数据上训练支持逐句生成与多说话人音色切换能够通过一句语音样本模仿音色和说话习惯流式解码可实时输出音频[6] - 在主客观评测中均达行业领先水平开箱即用支持中文英语日语等多语言是AI播客等对话合成应用的工业级解决方案已开源代码与模型权重[6] 开源语音合成技术突破 - 哔哩哔哩开源新一代零样本语音合成模型IndexTTS2 实现毫秒级精准时长控制让AI配音能严丝合缝对上口型[7] - 模型采用"通用且兼容自回归架构的语音时长控制方法" 达到0.02%的时长误差率同时通过两阶段训练策略实现情感和说话人身份的"解耦"[7] - 系统由T2S(文本到语义) S2M(语义到梅尔频谱)及BigVGANv2声码器三大核心模块组成支持用大白话控制情绪在跨语言产业应用上具有重大意义[7] 小型高效模型发展 - Meta AI发布MobileLLM-R1系列小参数高效模型包括140M/360M/950M三种规模专为数学编程和科学问题优化[8] - 最大的950M模型仅使用约2T高质量token预训练(总训练量不足5T) 性能却与使用36T token训练的Qwen3 0.6B相当或更佳[8] - 在MATH基准上比Olmo 1.24B高五倍比SmolLM2 1.7B高两倍 Token效率和性价比极高完全开源模型中创造新标杆[8] AI数学研究突破 - 名为"Gauss"的AI Agent仅用三周时间完成了陶哲轩团队18个月未能完成的数学挑战——在Lean中形式化强素数定理(PNT)[9] - 该Agent由Math公司开发生成约25000行Lean代码包含上千个定理和定义[9] - Gauss能协助顶级数学家进行形式验证突破了复分析核心难题团队计划在未来12个月让形式化代码总量提升100到1000倍[9] AI产业格局演变 - OpenAI推出GPT-5 首次真正让人感觉与博士级专家对话内置"思考"能力统一模型取代复杂选择界面显著减少幻觉[10] - 发布前其他玩家也纷纷推出战略性新品：Anthropic推出Claude Opus 4.1瞄准高风险企业场景 Google推出Gemini 2.5 Deep Think和Genie 3分别强化推理和模拟能力[10] - 新AI版图已重新排布：OpenAI同时占据开放与封闭AI生态主导地位 Anthropic专注企业级精准稳定 Google专注基础研究长期布局 Agentic AI 先进推理和端侧能力已成顶尖模型核心特性[11] 科研AI战略布局 - DeepMind科学团队只瞄准三类问题：具有变革性公认5-10年内无人能解但DeepMind有信心快速攻克的"不可能任务"[12] - 团队从专用模型到通用智能的进化：将AlphaProof等专用数学模型的能力成功转移到Gemini通用模型使DeepThink实现IMO金牌水平[12] - 未来目标是打造"科学API" 让全球科学家共享AI能力从AlphaFold数据库到AI Co-scientist 降低科研门槛使普通人也能做出诺贝尔奖级贡献[12]

MiniMax 发布新一代音乐生成大模型 “一人即乐队”成为现实

新华财经· 2025-09-13 12:28

公司产品发布 - 公司正式发布新一代音乐生成模型Music 1.5 在音乐生成时长、控制精度、编曲表现等多个维度实现显著提升生成时长升至4分钟 [1] - 模型支持简单模式下通过关键词或自然语言描述生成高完成度歌曲高级模式下可对风格、情绪、场景等音乐特征及歌曲段落歌词编排进行控制 [1] - 通过对人声唱腔发音技巧深度建模可生成不同声线、唱腔的音色突破解决了AI生成音乐中人声机械化、缺乏情感表达的问题 [2] - 模型优化乐器层次编曲能力支持中国小众及民族乐器的生成 [2] - 技术突破基于公司在文本、语音、视觉等多模态领域的自研能力积累利用文本模型能力增强对文本描述的理解力和控制力 [2] - 产品不仅面向C端用户还同步面向全球开发者提供API接口延续"全球最高性价比"定价策略 [3] 行业应用前景 - AI音乐生成技术在专业音乐创作领域可为音乐人提供AI辅助灵感激发 [2] - 在影视、游戏、短视频等内容产业可快速定制背景音乐 [2] - 在虚拟偶像和数字娱乐领域可量身打造单曲与MV [2] - 在企业营销层面可为品牌生成专属音频内容 [2]

AI音乐生成技术

Artificial Intelligence

MiniMax Music 1.5

海螺视频大模型

AI音乐生成技术

Artificial Intelligence

MiniMax Music 1.5

海螺视频大模型