MiniMax Music 1.5
搜索文档
游戏ETF(159869)单日获资金净流入达2.98亿元,备受资金青睐
搜狐财经· 2025-09-17 11:09
游戏板块市场表现 - 游戏ETF(159869)早盘上涨近1% 资金单日净流入2.98亿元[1] - 巨人网络领涨超4% 冰川网络涨近1.5% 华立科技、宝通科技、神州泰岳跟涨[1] 手游发行商收入表现 - 8月全球收入前三名为腾讯、点点互动和网易[1] - 巨人网络月度收入环比增长72% 因《超自然行动组》进入全球收入前十[1] - 雷霆游戏《杖剑传说》8月收入环比大幅增长74% 位列海外收入第18名[1] 海外市场与产品表现 - 点点互动两款产品蝉联月度出海手游收入前两名 三款新产品进入榜单[1] AI技术应用进展 - 字节跳动发布即梦图片4.0 傅利叶开启陪伴机器人GR-3预售[1] - 爱诗科技完成6000万美元B轮融资 MiniMax Music 1.5上线[1] - 快手推出AI超级员工Kwali 阿里发布Qwen3-Next-80BA3B双模型[1] - 腾讯开源Youtu-GraphRAG框架[1] 行业投资价值 - 游戏板块具备AI、内容、商业化模式变革等多重催化因素[2] - 游戏ETF(159869)跟踪中证动漫游戏指数 反映A股动漫游戏产业整体表现[2]
2025年9月15日全球科技新闻汇总
海通国际证券· 2025-09-15 16:07
行业投资评级 - 报告未明确提供整体行业投资评级 [1][6][20] 核心观点 - 日本政府大力支持半导体产业 向美光提供最高5360亿日元(约36.4亿美元)补贴 用于下一代DRAM研发与量产 [1][2] - 苹果A20处理器将采用"三级分"策略 台积电2纳米制程获近半初期产能 供应链同步受益 [3][4][5] - Google采用"硬件即服务"模式推广TPU 以游击策略切入NVIDIA主导的算力租赁市场 [8][9][10] - xAI重组训练体系 裁撤500名数据标记员 转向扩大专业AI导师团队 [7][34][35] - AI模型能力持续突破 MiniMax Music 1.5支持4分钟音乐生成 Meta MobileLLM-R1小模型效率显著提升 [14][58][59] 半导体制造与投资 - 美光计划至2029年度投入1.5万亿日元 使广岛工厂具备月产4万片先进DRAM能力 预计2028年6-8月开始出货 [2][22] - 日本政府要求美光量产後至少持续生产10年 包含此次补助总额达7745亿日元 [3][24] - 日本经产省还对台积电熊本厂和铠侠四日市工厂提供补贴 确保先进半导体量产能力 [3][25] - 芯片分级策略将带动差异化代工与封装订单 台积电竞争对手面临量产与良率差距扩大风险 [5][30] 人工智能与算力生态 - Google Ironwood TPU单芯片算力达2.3 Petaflops 与NVIDIA B300的2.5 PFLOPS相当 完整Pod可整合9216颗芯片 [11][44] - OpenAI面临巨大成本压力 预计2029年前烧掉1150亿美元 仅2030年就需花费1000亿美元租赁服务器 [12][48] - xAI数据标记团队从超过1500人缩减至约1000人 未来专注STEM、编程、金融、医学等领域专家 [7][36][37] - 美团AI Agent"小美"基于5600亿参数Longcat模型 实现全自动点餐操作但尚无法处理复杂需求 [14][51][52] 技术创新与产品突破 - 苹果A20系列将对应折叠iPhone、iPhone Air和Pro系列 采用2+4核心CPU架构和不同GPU配置 [4][27] - MiniMax Music 1.5支持16种风格×11种情绪×10场景自定义 可生成民族乐器音色和段落分明作品 [14][49][50] - 小红书FireRedTTS-2支持多语言实时音频生成 B站IndexTTS2实现0.02%时长误差率精准口型同步 [15][53][57] - Meta MobileLLM-R1系列仅用2T token训练 950M模型性能媲美36T token训练的Qwen3 0.6B [16][58][59] - AI Gauss三周完成陶哲轩团队18个月未解数学难题 生成25000行Lean代码含上千定理定义 [16][61][62]
腾讯研究院AI速递 20250915
腾讯研究院· 2025-09-15 00:01
OpenAI与微软合作及发展前景 - OpenAI与微软发布非约束性合作备忘录 涉及云服务托管 知识产权归属和AGI控制权等核心问题 但最终合作条约仍未确定[1] - OpenAI预计成立估值超1000亿美元的公益公司(PBC) 非营利机构将持有股权并保持控制权 成为全球资源最充足的慈善组织之一[1] - OpenAI面临巨大成本压力 预计2029年前烧掉1150亿美元 仅2030年就需花费1000亿美元租赁服务器 未来几年几乎没有容错空间[1] AI影视内容创作突破 - 前谷歌X团队创立全球首家AI原生影视工作室Utopai 两部电影项目已带来1.1亿美元收入 锁定戛纳电影节[2] - Utopai突破AI视频生成三大难题:一致性 可控性和叙事延续性 实现毫秒级精准对口型 模型内置物理规律的3D数据训练[2] - 公司定位为内容+AI而非纯工具供应商 已获好莱坞顶级资源支持 为电影《科尔特斯》邀请奥斯卡提名编剧 八集科幻剧《太空计划》成功预售欧洲市场[2] 音乐生成技术进展 - MiniMax发布新一代音乐生成模型Music 1.5 支持长达4分钟的完整歌曲创作 具备强控制力 人声自然饱满 编曲层次丰富和歌曲结构清晰四大突破[3] - 模型支持"16种风格×11种情绪×10个场景"自定义音乐特征 能生成不同声线唱腔 并支持中国民族乐器生成 真正实现Intro/Verse/Chorus段落分明[3] - 基于MiniMax多模态自研能力积累 同步面向全球开发者提供API 适用于专业音乐创作 影视游戏配乐 虚拟偶像单曲和企业品牌专属音频内容多种场景[3] 本地生活AI应用发展 - 美团首个AI Agent产品"小美"开启公测 通过自然语言指令点咖啡 找餐厅 规划早餐菜单 大幅简化点餐流程[4] - 小美基于美团自研Longcat模型(5600亿总参数) 能根据用户口味偏好和地理位置实现从选品到支付的全自动操作 并记忆用户习惯[4] - 与Agent热潮相呼应 但目前仍有局限性:无法处理复杂模糊需求 无法进行语音回复 未来将在个性化和主动服务能力上进一步优化[4] 语音合成技术创新 - 小红书智创音频技术团队发布新一代对话合成模型FireRedTTS-2 解决现有方案灵活性差 发音错误多 说话人切换不稳定和韵律不自然等问题[5] - 模型在数百万小时语音数据上训练 支持逐句生成与多说话人音色切换 能够通过一句语音样本模仿音色和说话习惯 流式解码可实时输出音频[6] - 在主客观评测中均达行业领先水平 开箱即用支持中文 英语 日语等多语言 是AI播客等对话合成应用的工业级解决方案 已开源代码与模型权重[6] 开源语音合成技术突破 - 哔哩哔哩开源新一代零样本语音合成模型IndexTTS2 实现毫秒级精准时长控制 让AI配音能严丝合缝对上口型[7] - 模型采用"通用且兼容自回归架构的语音时长控制方法" 达到0.02%的时长误差率 同时通过两阶段训练策略实现情感和说话人身份的"解耦"[7] - 系统由T2S(文本到语义) S2M(语义到梅尔频谱)及BigVGANv2声码器三大核心模块组成 支持用大白话控制情绪 在跨语言产业应用上具有重大意义[7] 小型高效模型发展 - Meta AI发布MobileLLM-R1系列小参数高效模型 包括140M/360M/950M三种规模 专为数学 编程和科学问题优化[8] - 最大的950M模型仅使用约2T高质量token预训练(总训练量不足5T) 性能却与使用36T token训练的Qwen3 0.6B相当或更佳[8] - 在MATH基准上比Olmo 1.24B高五倍 比SmolLM2 1.7B高两倍 Token效率和性价比极高 完全开源模型中创造新标杆[8] AI数学研究突破 - 名为"Gauss"的AI Agent仅用三周时间完成了陶哲轩团队18个月未能完成的数学挑战——在Lean中形式化强素数定理(PNT)[9] - 该Agent由Math公司开发 生成约25000行Lean代码包含上千个定理和定义[9] - Gauss能协助顶级数学家进行形式验证 突破了复分析核心难题 团队计划在未来12个月让形式化代码总量提升100到1000倍[9] AI产业格局演变 - OpenAI推出GPT-5 首次真正让人感觉与博士级专家对话 内置"思考"能力 统一模型取代复杂选择界面 显著减少幻觉[10] - 发布前其他玩家也纷纷推出战略性新品:Anthropic推出Claude Opus 4.1瞄准高风险企业场景 Google推出Gemini 2.5 Deep Think和Genie 3分别强化推理和模拟能力[10] - 新AI版图已重新排布:OpenAI同时占据开放与封闭AI生态主导地位 Anthropic专注企业级精准稳定 Google专注基础研究长期布局 Agentic AI 先进推理和端侧能力已成顶尖模型核心特性[11] 科研AI战略布局 - DeepMind科学团队只瞄准三类问题:具有变革性 公认5-10年内无人能解 但DeepMind有信心快速攻克的"不可能任务"[12] - 团队从专用模型到通用智能的进化:将AlphaProof等专用数学模型的能力成功转移到Gemini通用模型 使DeepThink实现IMO金牌水平[12] - 未来目标是打造"科学API" 让全球科学家共享AI能力 从AlphaFold数据库到AI Co-scientist 降低科研门槛 使普通人也能做出诺贝尔奖级贡献[12]
MiniMax 发布新一代音乐生成大模型 “一人即乐队”成为现实
新华财经· 2025-09-13 12:28
公司产品发布 - 公司正式发布新一代音乐生成模型Music 1.5 在音乐生成时长、控制精度、编曲表现等多个维度实现显著提升 生成时长升至4分钟 [1] - 模型支持简单模式下通过关键词或自然语言描述生成高完成度歌曲 高级模式下可对风格、情绪、场景等音乐特征及歌曲段落歌词编排进行控制 [1] - 通过对人声唱腔发音技巧深度建模 可生成不同声线、唱腔的音色 突破解决了AI生成音乐中人声机械化、缺乏情感表达的问题 [2] - 模型优化乐器层次编曲能力 支持中国小众及民族乐器的生成 [2] - 技术突破基于公司在文本、语音、视觉等多模态领域的自研能力积累 利用文本模型能力增强对文本描述的理解力和控制力 [2] - 产品不仅面向C端用户 还同步面向全球开发者提供API接口 延续"全球最高性价比"定价策略 [3] 行业应用前景 - AI音乐生成技术在专业音乐创作领域可为音乐人提供AI辅助灵感激发 [2] - 在影视、游戏、短视频等内容产业可快速定制背景音乐 [2] - 在虚拟偶像和数字娱乐领域可量身打造单曲与MV [2] - 在企业营销层面可为品牌生成专属音频内容 [2]