Workflow
人工智能龙头“开花结果”:昆仑万维发布多款前沿模型,厚积薄发迎商业收获期

技术与商业同步跃升 - 公司正处于AI技术与商业同步发展的关键窗口期 在全球AI产业竞争加速背景下 [1] - 通过SkyWork AI技术发布周集中推出六款覆盖多模态AI核心场景的前沿模型 展示高强度研发投入转化为市场竞争力的成果 [1] - 2024年全年研发费用达15.4亿元 同比增长59.5% 重点投入AI算力芯片、大模型及应用等环节 [1][13] Mureka V7.5模型突破 - 模型构建了深度融合文化语境与语言特性的音乐音频理解模块 系统性训练覆盖中文音乐多样性 包括传统民歌、戏曲到当代民谣 [3] - 在音色与演奏技法上实现质的飞跃 通过优化ASR技术提升人声清晰度、结构感和情感真实度 显著降低机械感 [4] - 已形成成熟商业模式 包括C端流媒体平台Melodio和B端创作平台Mureka API 2025年3月年化流水超1200万美元 [3] MoE-TTS框架创新 - 首创基于MOE的角色描述语音合成框架 融合预训练大语言模型文本能力与语音专家模块 实现"知识零损失"的泛化理解能力 [4] - 在双测试集评测中 风格表现力贴合度和整体贴合度等声学控制维度领先 尤其擅长处理比喻、类比等复杂修辞 [6] - 应用潜力覆盖虚拟助手、数字人、有声创作等领域 推动行业从封闭标签式控制迈向自然语言自由控制 [6] 全栈AI技术突破 - SkyReels-A3模型实现音频驱动人像视频生成 基于DiT视频扩散模型+插帧模型+强化学习动作优化技术 [7] - Matrix-Game 2.0世界模型实现25FPS实时长序列交互生成 生成时长扩展至分钟级 为A股唯一对标谷歌Genie的模型 [7][9] - Matrix-3D模型从单图像生成可漫游三维空间 对标WorldLabs效果 短期革新游戏开发、影视制作流程 长期布局元宇宙基础设施 [9] 多模态与智能体技术 - Skywork UniPic 2.0构建理解、生图、编辑一体化能力 已全面开源模型权重与训练代码 降低开发者门槛 [9] - Skywork Deep Research Agent v2整合多模态检索、理解和生成 突破长距离信息收集与异步并行架构 输出视觉友好的深度报告 [10] - 技术迭代源于实际产品需求 具备高应用价值 为产业端提供高效、开放、可落地的AI工具集 [12] 研发战略与商业化闭环 - 公司采用"厚积薄发"策略 2025年一季度研发费用同比增长23.4%至4.3亿元 持续加码AI算力芯片与大模型研发 [13] - 技术突破快速转化为商业化应用 形成研发-落地-收益反哺的正向循环 2024年全球月活用户近4亿 海外收入占比91% [14] - AI社交业务单月最高收入突破100万美元 成为海外增长最快的中国AI应用 构建面向万亿级生态的双轮驱动模式 [14]