Mureka V7.5 - 财报，业绩电话会，研报，新闻

Mureka V7.5

搜索文档

中证网· 2025-10-30 12:39

财务业绩 - 公司前三季度实现营业收入58.0亿元，同比增长52% [1] - 公司实现海外业务收入54亿元，同比增长58%，海外收入占比达93%，同比提升3.6个百分点 [1] - 公司整体毛利率达69.9% [1] - 2025年第三季度实现归母净利润1.9亿元，环比扭亏为盈 [1] AGI与AIGC业务进展 - 公司AGI与AIGC业务稳步推进，在核心技术、应用生态及商业化探索方面均取得阶段性成果 [1] - 公司持续开源系列模型，2025年8月12日开源3D世界生成模型Matrix-3D，可从单图像生成可漫游的高质量三维场景 [1] - 同日发布Matrix-Game 2.0，为业内首个在通用场景下实现实时长序列交互生成的开源方案 [1] 基础研究与智能体 - 公司在AGI基础研究领域取得多重学术突破，相关论文被机器学习顶会NeurIPS 2025选为Spotlight论文 [2] - 公司联合南洋理工大学推出分层多智能体框架AgentOrchestra [2] - 公司推出新一代AI智能体Skywork Deep Research Agent V2，首次引入多模态深度调研Agent [2] AI视频与音乐 - 公司发布SkyReels-A3模型，基于DiT视频扩散模型等架构，能够实现任意时长的全模态音频驱动数字人创作 [3] - 公司发布新版SkyReels平台并展开内部测试，推动高质量视频生成从专业制作走向大众应用 [3] - 在AI音乐方面，Mureka V7采用优化的MusiCoT技术，使音乐性与人声真实度大幅提高 [3] - Mureka V7.5在中文音乐生成方面实现突破，使AI演唱更贴近真人效果，并同步推出两项语音合成成果 [3] AI游戏与社交 - 公司AI游戏业务稳步推进，持续深化AI在游戏内容生成与智能交互领域的应用探索 [4] - AI社交产品Linky持续优化产品功能与用户体验，提升文字对话、剧情互动及人设一致性表现 [4] 短剧业务 - 公司凭借优质运营巩固出海短剧第一梯队地位，2025年8月DramaWave跃居海外短剧平台收入榜第三位 [4] - DramaWave单月下载量突破400万次，上线动漫频道成为全球一线短剧平台中首个引入动漫内容者 [4] - 动漫频道已上线多部作品，支持18种语言，人均观看时长超过30分钟，实现破圈增长 [4] 海外信息分发与元宇宙 - Opera在人工智能与元宇宙领域进展顺利，收入保持稳健增长 [5] - Opera推出面向AI时代的Agent浏览器Opera Neon，设计理念为让浏览器从被动工具转变为主动智能协作者 [5] - Opera Neon核心功能包括Tasks、Neon Do和Neon Make，其智能代理在浏览器本地直接执行任务，提升安全性与响应速度 [5] 未来展望与战略 - 公司将紧抓AI时代机遇，以技术突破为引擎，以场景落地为方向，持续加大在AGI、多模态、智能体等核心领域的研发创新 [6] - 公司将进一步发挥其独特的全球化平台优势，推动AI技术与信息分发、社交娱乐、内容创作等业务的深度融合 [6] - 公司将以技术创新为锚点、以生态构建为支撑，不断巩固行业领先地位，致力于实现长期稳健增长 [6]

AI动态汇总：智元推出机器人世界模型平台genieenvesioner，智谱上线GLM-4.5a视觉推理模型

中邮证券· 2025-08-25 19:47

根据提供的研报内容，这是一份关于AI行业动态的周报，主要汇总了多家科技公司在人工智能领域的最新技术发布和产品动态。经过全面审阅，**该报告未涉及任何量化模型或量化因子的构建、测试与分析内容**。报告的核心是AI技术进展的行业资讯，而非金融工程领域的量化投资研究。因此，**本次任务无法提取并总结任何量化模型或量化因子的相关信息**。报告内容聚焦于AI模型的技术架构、性能对比和应用场景，与量化投资中的因子挖掘、模型回测等主题无关。

通义Wan2.2 - I2V - Flash

通义Wan2.2 - I2V - Flash

Mureka V7.5

腾讯研究院AI速递 20250818

腾讯研究院· 2025-08-18 00:01

谷歌开源Gemma 3 270M - 谷歌发布轻量级模型Gemma 3 270M，参数规模2.7亿（嵌入参数1.7亿，Transformer模块1亿），下载体积仅241MB [1] - 模型在Pixel 9 Pro手机上25次对话仅耗电0.75%，INT4量化后适配资源受限设备 [1] - IFEval基准测试表现超越Qwen 2.5同级模型，下载量突破两亿次，支持任务微调 [1] Meta开源DINOv3视觉模型 - DINOv3采用自监督学习，在密集预测任务中超越弱监督模型，参数规模达70亿，训练数据17亿张图像 [2] - 创新技术包括Gram Anchoring策略和旋转位置编码(RoPE)，提供ViT-B/ViT-L等系列模型 [2] - 商业许可开源，已应用于卫星图像分析和环境监测领域 [2] 腾讯混元3D世界模型Lite版 - 显存需求降至17GB以下，消费级显卡可运行，显存占用减少35% [3] - 动态FP8量化和SageAttention技术使推理速度提升3倍，精度损失小于1% [3] - 支持单文本/图片输入生成可漫游3D世界，可导出Mesh文件接入游戏引擎 [3] 昆仑万维音乐模型Mureka V7.5 - 一周内发布六款模型覆盖视频生成、AI音乐等热点领域 [4] - Mureka V7.5优化ASR技术提升中文歌曲音色与咬字，超越国外顶尖音乐模型 [4] - 同期推出MoE-TTS框架，通过自然语言控制语音特征，开源条件下超越闭源产品 [4] GPT-5编程提示技巧 - 指令需避免冲突与含糊，过分强硬措辞可能适得其反 [5] - 复杂任务用高推理力度，类XML语法可结构化规则 [6] - 零到一任务需先规划评判标准，控制Agent工具预算与查找节奏 [6] 人形机器人运动会 - 首日赛事包括1500米长跑（宇树机器人夺冠）、5V5足球等，蓝队1号球员完成3次进球 [7] - 现场解说聚焦AI技术，出现机器人集体摔倒等"鬼畜"场面 [7] DeepMind Genie 3世界模型 - 结合Veo 2和Genie 2，每秒生成24帧720p画面，支持单文本创建互动世界 [8] - 具备1分钟视觉记忆能力，物理规律表现随数据规模提升 [8] - 被视为AGI重要路径，可解决机器人训练数据瓶颈 [8] OpenAI战略动向 - 计划斥资数万亿建设数据中心，暗示未来AI可能担任CEO [9] - 与Jony Ive合作开发AI硬件，承认人类创作内容价值将上升 [9] - 认为当前AI泡沫类似互联网泡沫，但技术革命影响占比将达10%-20% [9] AGI发展观点 - AGI定义细化多维能力集合，评测基准需转向应用价值评估 [10] - 模型已在IMO/ICPC等竞赛展现推理能力，编程教育需结合AI辅助 [10][11] Agent市场展望 - AI市场将分基础模型、工具链、应用型Agent三赛道，后者机会最大 [12] - Agent将重构生产力曲线，未来按业务成果定价，长尾型公司大量涌现 [12]

一周六连发！昆仑万维将多模态AI卷到了新高度

量子位· 2025-08-17 17:00

技术发布概览 - 一周内连续发布六款多模态AI模型，覆盖视频生成、世界模型、统一多模态、智能体及AI音乐创作等核心场景 [2][3] - 绝大部分模型已开源，包括音频驱动视频生成模型SkyReels-A3、交互世界模型Matrix-Game 2.0、3D场景生成模型Matrix-3D等 [3][19][25] - 技术周前公司入选"中国AI开源16强"，与腾讯、阿里等并列 [5] 核心模型与技术突破视频生成领域 - **SkyReels-A3**：支持音频驱动人像视频生成，预设8种运镜参数，可生成60秒单分镜视频，唇形同步指标Sync-C达8.66，超越OmniHuman（8.15）和Hydra（7.70） [8][10][12][14] - 技术原理：基于DiT视频扩散模型+插帧延展+强化学习动作优化，支持文本提示词输入画面变化及商品交互 [14][15] 世界模型领域 - **Matrix-Game 2.0**：国内首个对标谷歌Genie 3的开源模型，支持25 FPS实时生成分钟级交互视频，数据管线基于Unreal Engine和GTA 5构建1350小时高质量交互视频 [19][20][22][24] - **Matrix-3D**：单图像生成全景视频并还原三维空间，对标李飞飞World Labs，适用于游戏引擎、元宇宙等领域 [25][27] 统一多模态领域 - **Skywork UniPic 2.0**：2B参数模型在图像生成/编辑任务中超越7B的BAGEL和12B的Flux-Kontext，联合训练后模型UniPic2-Metaquery刷新多项SOTA [29][31][33] - 训练策略：采用渐进式双任务强化策略优化SD3.5-Medium架构，降低硬件门槛 [30][31] 智能体领域 - **Skywork Deep Research Agent v2**：多模态深度调研智能体整合图片检索与生成，自动插入图文混合文档；浏览器智能体支持社媒多模态分析（如小红书、Instagram） [37][38][44] - 技术手段：端到端强化学习（GRPO算法）、并行推理机制、多智能体协同框架 [48][49][50][51] AI音乐与语音 - **Mureka V7.5**：中文音乐生成模型在音色、情感表现上超越Suno v4.5，优化ASR技术提升人声真实度 [53][54][57] - **MoE-TTS**：基于MoE的语音合成框架，通过自然语言描述精准控制声音特征，域外描述贴合度领先闭源产品 [60][61] 战略与行业布局 - **战略定力**：2023年确立"All in AGI与AIGC"战略，2024年研发费用15.4亿元（同比+59.5%），研发团队占比73.41% [66][67][73] - **垂直领域聚焦**：CEO方汉强调垂直Agent与高频应用场景的价值，如数字人直播（国内市场规模近十万亿）、游戏引擎、具身智能等 [70][76] - **开源生态**：通过开源建立技术话语权，推动"技术-社区-应用"正向循环，强化行业地位 [78]

Artificial Intelligence

Artificial Intelligence

MoE - TTS