MiniMax Music 1.5

搜索文档
2025年9月15日全球科技新闻汇总
海通国际证券· 2025-09-15 16:07
行业投资评级 - 报告未明确提供整体行业投资评级 [1][6][20] 核心观点 - 日本政府大力支持半导体产业 向美光提供最高5360亿日元(约36.4亿美元)补贴 用于下一代DRAM研发与量产 [1][2] - 苹果A20处理器将采用"三级分"策略 台积电2纳米制程获近半初期产能 供应链同步受益 [3][4][5] - Google采用"硬件即服务"模式推广TPU 以游击策略切入NVIDIA主导的算力租赁市场 [8][9][10] - xAI重组训练体系 裁撤500名数据标记员 转向扩大专业AI导师团队 [7][34][35] - AI模型能力持续突破 MiniMax Music 1.5支持4分钟音乐生成 Meta MobileLLM-R1小模型效率显著提升 [14][58][59] 半导体制造与投资 - 美光计划至2029年度投入1.5万亿日元 使广岛工厂具备月产4万片先进DRAM能力 预计2028年6-8月开始出货 [2][22] - 日本政府要求美光量产後至少持续生产10年 包含此次补助总额达7745亿日元 [3][24] - 日本经产省还对台积电熊本厂和铠侠四日市工厂提供补贴 确保先进半导体量产能力 [3][25] - 芯片分级策略将带动差异化代工与封装订单 台积电竞争对手面临量产与良率差距扩大风险 [5][30] 人工智能与算力生态 - Google Ironwood TPU单芯片算力达2.3 Petaflops 与NVIDIA B300的2.5 PFLOPS相当 完整Pod可整合9216颗芯片 [11][44] - OpenAI面临巨大成本压力 预计2029年前烧掉1150亿美元 仅2030年就需花费1000亿美元租赁服务器 [12][48] - xAI数据标记团队从超过1500人缩减至约1000人 未来专注STEM、编程、金融、医学等领域专家 [7][36][37] - 美团AI Agent"小美"基于5600亿参数Longcat模型 实现全自动点餐操作但尚无法处理复杂需求 [14][51][52] 技术创新与产品突破 - 苹果A20系列将对应折叠iPhone、iPhone Air和Pro系列 采用2+4核心CPU架构和不同GPU配置 [4][27] - MiniMax Music 1.5支持16种风格×11种情绪×10场景自定义 可生成民族乐器音色和段落分明作品 [14][49][50] - 小红书FireRedTTS-2支持多语言实时音频生成 B站IndexTTS2实现0.02%时长误差率精准口型同步 [15][53][57] - Meta MobileLLM-R1系列仅用2T token训练 950M模型性能媲美36T token训练的Qwen3 0.6B [16][58][59] - AI Gauss三周完成陶哲轩团队18个月未解数学难题 生成25000行Lean代码含上千定理定义 [16][61][62]
腾讯研究院AI速递 20250915
腾讯研究院· 2025-09-15 00:01
生成式AI 一、 OpenAI与微软发布了非约束性的合作备忘录,重组待定 1. OpenAI与微软发布非约束性合作备忘录,涉及云服务托管、知识产权归属和AGI控制权等核心问题,但最终合作条 约仍未拍板; 2. OpenAI预计成立估值超1000亿美元的公益公司(PBC),非营利机构将持有股权并保持控制权,成为全球资源最充 足的慈善组织之一; 1. 全球首家AI原生影视工作室Utopai由前谷歌X团队创立,两部电影项目已带来1.1亿美元收入,锁定戛纳电影节; 2. Utopai突破AI视频生成三大难题:一致性、可控性和叙事延续性,实现毫秒级精准对口型,模型内置物理规律的 3D数据训练; 3. 公司定位为内容+AI而非纯工具供应商,已获好莱坞顶级资源支持,为电影《科尔特斯》邀请奥斯卡提名编剧,八 集科幻剧《太空计划》成功预售欧洲市场。 https://mp.weixin.qq.com/s/Zf3YdM4t8f-tprImv_rDTg 三、 MiniMax Music 1.5上线,4分钟时长、回归"好听"本质 1. MiniMax发布新一代音乐生成模型Music 1.5,支持长达4分钟的完整歌曲创作,具备强控制力、 ...
MiniMax 发布新一代音乐生成大模型 “一人即乐队”成为现实
新华财经· 2025-09-13 12:28
另外,模型通过对人声唱腔发音技巧进行深度建模,可以生成不同声线、唱腔的音色。突破解决了此前 AI生成音乐中人声机械化、缺乏情感表达的问题。同时,模型进一步优化乐器层次的编曲能力,支持 中国小众及民族乐器的生成。 MiniMax研发团队表示,Music 1.5的技术突破基于MiniMax在文本、语音、视觉等多模态领域的自研能 力积累。通过利用文本模型的能力,Music 1.5对文本描述有更强的理解力和控制力,不仅可对歌曲风 格、情感色彩和适用场景进行整体控制,也可对人声特征进行细粒度控制,生成不同声线特质的人声音 色。 从市场前景来看,AI音乐生成技术正处于快速发展期。在专业音乐创作领域,AI音乐生成技术可以为 音乐人提供AI辅助灵感激发;在影视、游戏、短视频等内容产业,可以快速定制背景音乐;在虚拟偶 像和数字娱乐领域,可以量身打造单曲与MV;在企业营销层面,可以为品牌生成专属音频内容。 值得注意的是,MiniMax Music 1.5不仅面向C端用户,还同步面向全球开发者提供API接口。MiniMax 表示,将延续"全球最高性价比"的定价策略,让更多开发者能够轻松接入AI音乐生成能力,构建自己的 应用、工具或 ...