Workflow
Mureka O1
icon
搜索文档
Agent真的卷疯了,AI办公Agent也来了。
数字生命卡兹克· 2025-05-22 00:53
产品定位与功能 - 昆仑万维推出垂直办公场景的AI智能体Skywork Super Agents 专为文档 PPT 表格等办公场景优化[2][3][5] - 产品分为海外版和国内版 海外版网址为https://skywork.ai 国内版网址为https://www.tiangong.cn[5] - 提供文档 PPT 表格 网页 播客五种模式 其中文档 PPT 表格被定位为"专家级场景"[5][6] 核心功能亮点 - PPT模式支持细分场景选择 包括旅游观光 历史文化 科技技术等垂直领域[7][8] - 表格模式可自动处理数据 生成可视化图表 并分sheet展示分析结果[61] - 文档模式细分12种子场景 包括商业报告 简历 营销广告等专业类型[7] - 播客模式支持通过Prompt生成音频内容 通用模式可创作音乐等多样化内容[72][74] 交互设计创新 - 采用选择式交互替代传统对话式 降低用户输入成本[15][17] - 关键节点设置用户确认机制 包括任务清单确认和大纲确认环节[18][19] - 支持在线编辑生成内容 实现"最后一公里"的办公闭环[27] 技术实现特点 - 使用代码生成PPT 保持风格统一性[21][23] - 整合知识库功能 支持上传参考文件进行内容生成[30][31] - 基于音乐模型Mureka实现音乐创作功能[77] 商业化策略 - 采用积分制收费模式 任务复杂度决定积分消耗量[78] - 国内版定价仅为海外版1/3 采取差异化定价策略[84] - 每日赠送1200积分降低使用门槛[79] 开源生态布局 - 开源DeepResearch Agent框架 提供开发者社区支持[86][90] - 开放MCP接口 允许调用文档 PPT 表格生成能力[91] - GitHub开源地址为https://github.com/SkyworkAI/DeepResearchAgent[90]
昆仑万维:AI应用持续落地 商业化进程加速
中国证券报· 2025-05-19 05:26
公司AI战略布局 - 公司提出"All in AGI与AIGC"战略,大幅增加研发投入,2024年研发费用达15.4亿元,同比增长59.5% [1][2] - 已完成"算力基础设施—大模型算法—AI应用"全产业链布局,控股AI算力芯片企业艾捷科芯,员工近200名 [3] - 计划5月中旬发布全球首款生产力场景通用Agent平台产品,将推出开源深度研究智能体框架 [1][5] 产品与技术进展 - 已发布天工大模型4.0、音乐推理大模型Mureka O1、短剧大模型SkyReels等多款AI产品 [1][4] - SkyReels-V1/V2等模型选择开源,视频模型开源后平台订阅量每天增长10倍 [4] - Mureka平台2025年3月全球访问量达333万次,环比增长86.5% [4] 商业化进展 - Mureka月流水收入约100万美元,短剧平台DramaWave月流水收入约1000万美元 [4] - AI社交业务2024年单月收入峰值突破100万美元 [4] - 短剧业务已形成订阅、内购及广告等多种收入来源 [5] 市场前景与规划 - 预计2027年AI大模型业务将实现盈利,2023-2024年为初始投资阶段,2025-2026年为应用落地期 [2] - 全球数字音乐工作站工具市场规模有望从40亿美元扩大至100亿美元,公司目标占据10%份额 [6] - 将专注于音乐生成和短剧生成等C端场景,降低创作门槛与成本 [3][6] 财务表现 - 2024年公司实现营收56.62亿元,同比增长15.2% [1] - 2024年净利润亏损15.95亿元,主要因研发投入增加 [1][2]
国内最早的AI大模型公司已经开始亏损了
凤凰网财经· 2025-05-05 19:14
公司财务表现 - 2024年营收56.62亿元,同比增长15.2%,但净利润亏损15.95亿元,同比下跌226.8%,为上市十年首度亏损 [1] - 亏损主因包括研发费用增至15.4亿元(同比增59.5%)及金融资产价格波动导致投资损失8.2亿元 [4] - 公司长期储备至少10亿美元资金支持AGI和AIGC业务发展,并计划持续加大研发投入 [4] AI技术布局与成果 - 2025年密集发布多款大模型:1月推出天工大模型4.0,2月发布3D生成模型Matrix-Zero和短剧视频模型SkyReels-V1,3月开源工业界多模态模型Skywork R1V及音乐模型Mureka O1,4月升级Skywork-R1V 2.0 [3] - Mureka O1模型性能超越Suno,被称"音乐圈DeepSeek" [2] - 多模态推理模型Skywork-R1V 2.0因高考题目测试表现获"能考上985的AI"评价 [1] - 2023年4月发布千亿级大语言模型"天工",为国内首批入局"百模大战"企业 [3] 战略转型与行业定位 - 游戏业务营收占比从90%以上降至2024年的9.6%,全面转向AI赛道 [6] - 采用"红海找蓝海"策略,聚焦细分领域如AI短剧、音乐、3D生成,海外收入占比达88% [9] - 2022年ChatGPT热潮后加速AI布局,覆盖搜索、社交、游戏等全场景应用 [8][9] 行业竞争与挑战 - 国际科技巨头2025年AI投资计划:亚马逊1000亿美元、微软800亿美元、谷歌750亿美元、Meta 600-650亿美元 [11] - 国内阿里宣布未来三年AI投入超3800亿元,昆仑万维研发规模相对较小(2024年15.4亿元) [11] - AI Agent成为新竞争焦点,公司2024年推出通用计算机控制框架Cradle,但行业仍处生态建设早期 [14] 资本市场与人才动态 - 2023年5月股价从ChatGPT爆火前的14.13元最高飙升至70.61元 [10] - 机构投资者持股家数从414家降至不足百家,部分因技术高管颜水成卸任研究院院长 [18] - 当前估值逻辑更看重技术突破而非短期商业化,OpenAI 2024年收入仅37亿美元 [11][12]
专访昆仑万维方汉:AI不能画饼,“能挣钱这件事很重要”
新浪财经· 2025-04-30 18:23
公司战略与定位 - 昆仑万维选择AI作为第二增长曲线,重点布局音乐与视频AIGC赛道,避开与大厂在文本大模型的直接竞争[1][4][8] - 公司采用"小而美"策略深耕垂直领域,通过掌握细分行业数据和行为习惯构建护城河,目标是实现从"小而美"到"大而美"的泛化[6][25][26] - 商业模式分为两部分:探索通用人工智能(AGI)的长期价值与聚焦音乐/短剧AIGC的商业化落地[14][15] 产品与技术进展 - 音乐生成模型Mureka迭代至V6版本,其中O1模型加入MusiCoT技术,性能超越全球竞品Suno,生成时间从1分钟延长至2分钟但质量显著提升[4][9][11][12] - 视频生成平台SkyReels聚焦短剧垂直场景,支持40种表情与300种动作,模型下载量达3万次(Hugging Face),Github星数超千[5][17] - 技术路线强调SOTA(State-of-the-Art)表现,认为这是最佳营销方式与人才吸引手段[2][22] 商业化表现 - 2024年公司总收入56.6亿元(+15.2%),AI业务年化收入1.4亿美元,音乐ARR达1200万美元(月流水100万美元)[5] - AI音乐创作成本从传统10-100万元/首降至几十元/首,预计工具市场规模可达百亿美元,公司目标占据10-20亿美元份额[29][31][32] - 短剧市场年规模100亿元,视频生成商业化进度晚于音乐1-2年[38] 行业竞争与人才策略 - 通过差异化数据积累构建壁垒:音乐领域自建CoT训练数据,视频领域标注独家表演数据[13][18][19] - 人才招募采用主动上门沟通模式,核心团队包括Mureka和SkyReels主创,吸引力来自技术SOTA地位、决策链短及薪酬优势[1][22][23] - 认为模型厂商在Agent领域更具话语权,套壳应用易被底层技术迭代颠覆[39][40][42] 市场判断与未来展望 - AI行业进入生产力应用阶段,产品模式趋于接地气,模型能力已达可用水平[38][44] - 音乐与图像生成已具备商用条件,视频生成仍需突破[29][36] - 公司长期使命是实现AGI,短期聚焦音乐/短剧AIGC的商业化落地[44][45]
昆仑万维:一季度营收大幅增长46% AI算力芯片取得突破性进展
证券时报网· 2025-04-29 10:00
财务表现 - 2025年一季度公司实现营业收入17.6亿元,同比增长46% [1] - 研发费用4.3亿元,同比增长23% [1] - AI音乐年化流水收入ARR达1200万美金(月流水100万美金),短剧平台Dramawave年化流水ARR达1.2亿美金(月流水1000万美金) [1] - 海外业务收入16.7亿元,同比增长56%,占营收比重提升至94% [1] - Opera收入同比增长41% [4] AI技术突破 - 多模态推理模型Skywork R1V达到开源SOTA水平 [2] - 视频生成领域SkyReels-V1模型与SkyReels-A1算法位居全球领先,后者实现技术突破性SOTA [2] - AI音乐领域Mureka V6与全球首款融合CoT技术的Mureka O1形成组合优势,Mureka O1登顶行业SOTA [2] AI算力芯片进展 - 控股AI算力芯片企业北京艾捷科芯,完成"算力基础设施—大模型算法—AI应用"全产业链布局 [3] - 攻克多项核心技术难关,整体研发进度过半,向量产迈进 [3] - 艾捷科芯员工数量接近200名,覆盖芯片设计、算法研发、系统集成等专业领域 [3] AI产品规划 - 计划2025年5月中旬在海外发布全球首款生产力场景通用Agent平台Skywork.ai [3] - Skywork.ai包含五大专家级AI Agent,覆盖专业文档、数据表格、演示文稿、播客及网页内容优化 [3] - 支持跨模态内容创作,可高效生成MV、宣传片、有声读物、互动绘本等多媒体内容 [3] 业务战略 - 全球化战略成效显著,国际化布局持续深化 [1] - 未来将持续推进AI算力芯片研发及AI应用矩阵落地 [4]
AI正在批量生产神曲
投资界· 2025-04-12 15:27
AI音乐市场现状 - AI音乐创作门槛大幅降低,业余创作者可通过输入关键词快速生成歌曲,如海文用AI生成17首demo [5] - 音乐平台出现大量AI生成内容,部分用户日更30首AI歌曲"碰运气" [5] - 《七天爱人》成为现象级作品,两周内卖出五位数的版权费,登上微博热搜和音乐平台飙升榜 [5][7] - 多家平台推出AI音乐专属通道和活动,昆仑万维发布全球首款音乐推理大模型Mureka O1 [7] AI音乐技术特点 - AI音乐核心在于"模仿"与"拼接",通过分析海量作品拆解拼凑成符合市场趋势的"新作品" [9] - 算法保证了下限但锁死了上限,作品质量在基准线上下徘徊,缺乏创新和情感逻辑 [9][11] - 人声演唱机械感明显,编曲和弦套路化,如《七天爱人》随机选取意象缺乏创作目的 [9] 市场反应与争议 - 《七天爱人》的爆火被质疑为营销驱动,短视频平台播放量达3000万但音乐平台热度不足十分之一 [12] - 行业出现两极分化:部分音乐人强烈抵制,认为AI制造"听觉垃圾";也有尝试"人机共创"的支持者 [7] - 法律风险凸显,AI创作是否享有著作权存在争议,美国已立法明确AI生成内容不获版权保护 [17] 商业化困境 - 实际变现困难,实验显示100名创作者中仅4人收入超1元,多数作品播放量勉强破万且零收益 [17] - 平台审核趋严,要求提供创作证明并可能封禁批量投稿账号 [18] - 版权费用与播放量直接挂钩,但推广成本可能比制作成本高出十倍 [17] 行业影响 - AI已渗透低成本广告和游戏配乐领域,预计将影响行业50%从业者收入 [20] - 编曲接单价可能减少20%-30%,中小音乐人收入缩水成为趋势 [20] - 全球音乐市场积压超2亿首曲目,AI加剧了内容过剩问题 [12] 审美与创作危机 - 市场热捧平庸之作反映畸形生态,《七天爱人》压制低于基准线的作品成为"神曲" [12] - 审美滑坡现象严重,DJ版经典歌曲和广场舞神曲已将音乐解构为碎片 [20] - AI消解创作过程中的灵感迸发,导致"去过程化"的思维惰性和审美空洞化 [20]
敲敲键盘就能量产“神曲”,周杰伦看了也沉默
虎嗅· 2025-04-07 22:14
AI音乐市场现状 - 业余音乐人海文通过AI工具在1个月内生成17首demo 但播放量仅破万且零收益 仍坚信AI音乐代表未来[1] - 音乐平台涌现大量"野生音乐人" 用户日更30首AI歌曲"碰运气" 关键词搜索显示上百首AI歌曲存在[2] - 现象级AI歌曲《七天爱人》由程序员耗时2小时创作 登微博热搜及网易云飙升榜 两周版权收入达五位数[3] 行业参与度 - 汽水音乐等平台开放AI音乐专属通道 昆仑万维发布全球首款音乐推理大模型Mureka O1[6] - 音乐平台积压超2亿首曲目 按每天听200首计算需1141年才能听完 平庸作品占比持续增加[14] 技术局限性 - AI音乐本质是模仿与拼接 通过分析海量作品拆解重组 保证基础听感但缺乏创新[10] - 《七天爱人》被指为"音乐工业垃圾" 选取意象无情感逻辑 编曲套路化 人声机械感明显[9][12] - 算法确保质量基准线但限制上限 作品在开盲盒式创作中徘徊于中等水平[11][14] 市场泡沫 - 《七天爱人》爆火被质疑为营销驱动 短视频平台3000万播放量 vs 音乐平台不足十分之一热度[15] - 实验显示100名创作者仅4人收入超1元 某200万播放歌曲实际收益仅46元 反映变现困难[20] - 爆红月余后无后继者突围 续作《八天爱人》未复刻成功 显示行业或处于伪需求阶段[18] 商业模式挑战 - 主流平台不与AI生成歌曲签约 小平台存在法律风险 美国已立法否认AI作品著作权[22] - 网易云等平台加强审核 要求上传演奏视频及DAW工程文件 批量投稿面临封号风险[23] - 编曲市场价格受冲击 198元年卡可无限生成伴奏 预计接单价下降20%-30%[26] 行业影响 - AI渗透低成本TVC广告和游戏配乐领域 威胁初级从业者50%收入来源[25] - 审美体系面临坍塌风险 算法推荐机制反向训练AI模型 加剧市场"三分钟音乐"泛滥[30] - 人类创作的情感沉淀不可替代 如《山丘》蕴含的人生况味超越技术拼接[31]
直线涨停!刚刚,三大巨头,重磅来袭!
券商中国· 2025-03-28 15:08
文化传媒板块异动 - 百纳千成20CM涨停,上海电影涨停,果麦文化涨超10%,读客文化、中广天择、华策影视、华谊兄弟、横店影视、光线传媒、金逸影视等跟涨 [1] - 板块异动主因与中午突发信息有关,包括阿里通义千问推出QVQ-Max视觉推理模型和昆仑万维发布Mureka O1与V6模型 [3][4] AI技术重大更新 - OpenAI对GPT-4o和Sora进行重大更新,提供全新文生图模型,支持自定义操作、连续发问、风格转换、图像PPT等功能 [2] - 阿里通义千问推出QVQ-Max视觉推理模型,具备强大多模态处理能力,能理解图片和视频内容并进行分析、推理、设计插图、生成短视频剧本等 [2][3] - 昆仑万维发布Mureka O1音乐推理大模型,性能超越Suno,登顶SOTA,Mureka V6支持10种语言AI音乐创作,引入自研ICL技术提升声场和人声质感 [2][4] ChatGPT图像生成功能 - ChatGPT图像生成功能"Images in ChatGPT"正式推出,允许用户通过自然语言指令生成和编辑图像,支持多轮迭代优化,标志ChatGPT从单一语言模型跨越到全模态智能体 [5][6] - 功能上线后迅速走红导致GPU资源严重过载,公司创始人表示GPU正在"冒烟",凸显生成式AI爆发力与算力需求矛盾 [5] AI应用趋势与机会 - AI正扩展到医疗、金融、制造、零售等传统行业,生成式AI在内容创作、客户服务、教育等领域越来越普及 [7] - AI与物联网结合,智能设备通过AI处理实时数据实现高效决策和自动化 [7] - 华鑫证券表示AI时代将带来内容生产到消费终端全链条革新,文化传媒互联网新消费板块有望持续受益,关注AI玩具、AI眼镜、AI具身智能与传媒应用场景相结合的标的 [8]
昆仑万维发布全球首个音乐推理模型Mureka O1,董事长兼CEO方汉详解AI音乐商业化路径
21世纪经济报道· 2025-03-27 09:04
产品发布与技术升级 - 昆仑万维发布全球首款音乐推理大模型MurekaO1与全新基座模型MurekaV6,后者支持10种语言的AI音乐创作并引入自研ICL技术提升声场和人声质感 [1][2] - MurekaO1是全球首个引入思维链(CoT)的音乐模型,通过推理优化显著提升音乐品质、创作效率及灵活性,性能超过Suno并登顶SOTA [3][6] - 创新技术MusiCoT利用CoT预生成整体音乐结构,提升结构连贯性与乐器编排精准度,基于CLAP模型实现高扩展性且无需人工标注 [4][7] 商业模式与用户定位 - 用户群体覆盖C端音乐爱好者(降低创作门槛)和B端影视/游戏从业者(降本增效),C端采用免费+付费增值模式,B端通过SaaS/PaaS服务收费 [6] - 已合作大客户包括中国联通、中国移动及海外造车企业,AI作品曾进入印尼流行音乐排行榜前100 [8] - 全球数字音乐市场规模约40亿美元,公司预计技术介入后市场将扩容至百亿美元级别 [8] 竞争策略与技术壁垒 - 差异化聚焦B端需求与全球化布局(支持多语言),垂直赛道深耕多年,区别于大厂平台化定位 [9] - 数据积累为核心优势,自2021年立项研发,国内全量音乐数据储备领先,算法迭代借鉴文本大模型经验 [10] - 未来技术方向包括音频领域整体解决方案(结合视频大模型)和语言交互式音乐调整 [11] 战略规划与行业展望 - 双轨战略:短期在AIGC赛道盈利,长期投入文本大模型等基础能力,同步构建创作者生态和用户社群护城河 [12] - 预计3-5年AI音乐进入消费排行榜,5-10年产业重构,公司定位制作工具不介入分发,版权归属付费用户 [8][12] - 持续推动开源生态建设,通过社区反哺模型质量并树立行业声望 [13]
超越 Suno,全球首个 CoT 音乐模型Mureka O1 来了!
AI科技大本营· 2025-03-26 18:20
AI音乐生成行业发展 - 2023年全球数字音频工作站市场规模达30亿美元 预计2026年70%企业将采用AI辅助创作[1] - AI音乐生成技术显著降低创作门槛 支持多语言歌曲生成和音色克隆功能[7][11] - 行业呈现"人人可创作"趋势 平台提供音轨分离下载功能便于二次创作[6] Mureka产品技术突破 - 2024年3月发布V6和O1两款大模型 V6采用ICL技术提升声场与人声质感 O1为首个应用CoT技术的音乐模型[19][21] - MusiCoT技术通过预生成音乐结构 使旋律连贯性提升35% 歌词契合度提高40%[32][34] - 在评测中O1整体听感得分6.93 超越Suno V4的6.85 乐器多样性达7.10分[22][23] 商业化应用生态 - 开放音乐生成与语音合成两类API 支持私有数据微调模型 覆盖游戏配乐等场景[36][38] - 已服务全球100+国家用户 提供品牌音乐定制等B端解决方案[21][40] - 模型微调功能严格保障数据隐私 不用于基座模型训练[38] 公司战略布局 - 昆仑万维2023年确立"All in AGI与AIGC"战略 2024年更新使命为"实现通用人工智能"[40] - 创始人提出未来30年是"自我表达爆发期" AI将把创作门槛降低1000倍[40] - 技术路线聚焦音乐生成领域创新 包括MusiCoT等前沿技术应用[32][40]