万相2.6
搜索文档
可灵AI海外“屠榜”、国内强敌环伺背后:月收入飙至1.4亿元
每日经济新闻· 2026-01-15 21:41
文章核心观点 - 快手旗下可灵AI商业化进程显著加速,月收入从2025年第一季度的1.5亿元人民币跃升至2025年12月的1.4亿元人民币,年化收入运行率已达2.4亿美元(约16.8亿元人民币)[1] - 可灵AI通过持续的技术迭代与功能创新(如“Motion Control”功能)驱动用户增长与海外市场下载量飙升,同时面临来自阿里云、字节跳动等大厂在视频生成赛道的激烈竞争[1][4][5][6] - 公司未来战略将聚焦于深化面向专业创作者的服务,并探索通过产品化、降低使用门槛以及与社交互动结合的方式,向消费端市场拓展以实现“破圈”[4][6][7] 商业化进展与财务表现 - 可灵AI在2025年12月实现月收入突破2000万美元(约1.4亿元人民币),对应年化收入运行率达2.4亿美元(约16.8亿元人民币)[1] - 其商业化持续提速,月收入1.4亿元已接近2025年第一季度的总收入1.5亿元[2] - 收入增长主要受P端付费订阅会员驱动,该群体贡献了将近70%的收入[4] - 为支持业务增长,公司持续追加算力投入,预计2025年集团整体资本性支出将较2024年实现中高双位数的同比增长[2] 技术迭代与产品功能 - 可灵AI产品保持高速迭代,2025年12月以来先后发布全球首个大一统多模态视频模型“可灵O1”及具备音画同出能力的“可灵2.6模型”[4] - 2026年元旦假期,其“Motion Control”功能在海外突然爆火,用户可通过上传静态图片并绘制轨迹生成动态视频,带动下载量在多个国家应用榜单中跻身前十或登顶[1][6] - 该功能体现了行业“化繁为简”、降低使用门槛的趋势,有助于产品向更广泛用户群体渗透[7] 市场竞争格局 - 国内视频生成赛道竞争加剧,阿里云于2025年12月16日发布支持角色扮演、音画同步等功能的万相2.6系列模型,字节跳动旗下火山引擎也同期推出了Seedance 1.5 Pro音视频创作模型[1][4][5] - 各大厂争夺的焦点是P端用户,即自媒体视频创作者、广告营销从业者及影视、短剧制作等专业用户群体[4] - 行业竞争已进入火力全开的状态,各家均瞄准专业影视制作和图像创作场景进行升级[5] 用户结构与未来战略 - 可灵AI当前核心用户为P端专业创作者,但未来计划将技术能力进一步产品化,与社交互动结合,以加速消费端应用的商业化[6] - 公司认为,面向消费端时,产品化、商业化是实现增长的必经之路,整体方向定位于“社交互动”[6] - 分析师建议,公司未来发展需进一步打磨底层大模型以保持技术创新领先,并持续迭代功能化服务以降低使用门槛、保持创意领先[7] 行业趋势与分析师观点 - 人工智能目前仍被视为“未成年产业”,行业整体收入可能远低于研发与运行投入,大部分商业化场景处于试水阶段[3] - 然而,可灵AI单月收入过亿元已充分证明其受欢迎程度,且人工智能相关业务的收入规模增长被视作颇具想象空间[3] - 国内互联网科技公司擅长将高门槛技术“一键傻瓜化”,这一路径预计将在视频生成赛道继续演绎,实现“降维打击”[7]
海外“屠榜”、国内强敌环伺:可灵AI月收入飙至1.4亿元,但视频生成大战才刚打响
搜狐财经· 2026-01-15 08:57
可灵AI业务表现与商业化进展 - 可灵AI在2025年12月实现月收入突破2000万美元(约1.4亿元人民币),对应年化收入运行率达2.4亿美元(约16.8亿元人民币)[1] - 其商业化进程显著提速,从2025年一季度总收入1.5亿元,发展到2025年12月单月收入即达1.4亿元[4] - 可灵AI在其正式上线第10个月(2025年3月)ARR突破1亿美元,至2025年12月ARR已增至2.4亿美元[1] - 2025年12月推出的“Motion Control(动作控制)”新功能在海外市场爆火,带动可灵AI下载量在多个国家应用榜单登顶或进入前十[1][9][10] 公司战略与资本投入 - 快手正在不断追加算力投入以支持可灵AI增长,包括扩充推理侧算力以满足用户需求,以及提升训练算力以保持技术竞争力[4] - 公司预计2025年集团整体资本性支出将较去年实现中高双位数的同比增长,未来1-2年资本开支将重点聚焦算力升级与技术深化[5] - 公司创始人兼首席执行官程一笑表示,未来会将可灵AI的技术能力进一步产品化,与社交互动结合,加速消费端应用的商业化[9] 收入结构与用户定位 - 可灵AI的收入结构中,面向自媒体视频创作者和广告营销从业者等专业用户的P端付费订阅会员贡献了将近70%的收入[6] - 公司同时瞄准影视、短剧制作领域,通过导演共创计划、首部AIGC单元剧等吸引影视专业创作者[6] - 公司未来的增长方向包括扩大普通用户规模,在产品侧“破圈”,并将整体发展方向定在“社交互动”[9] 行业竞争格局 - 国内视频生成赛道竞争加剧,阿里云于2025年12月16日发布万相2.6系列模型,火山引擎也同期推出Seedance 1.5 Pro音视频创作模型,均瞄准同一赛道[3][6][7] - 阿里云万相2.6是国内首个支持角色扮演功能的视频模型,同时支持音画同步、多镜头生成及声音驱动等功能[6] - 火山引擎Seedance 1.5 Pro具备影视级叙事张力,能精准捕捉运动细节并细腻呈现人物情绪,在音画同步技术上取得突破[7] 产品迭代与技术发展 - 2025年12月以来,可灵AI先后发布全球首个大一统多模态视频模型“可灵O1”以及具备音画同出能力的“可灵2.6模型”,产品保持高速迭代[6] - “Motion Control(动作控制)”功能允许用户上传静态图片并绘制简单轨迹以生成流畅动态视频,显著降低了使用门槛[10] - 行业分析师指出,国内互联网科技领域擅长“化繁为简”,通过“一键傻瓜化”降低高门槛,视频生成赛道亦会按此路径发展[10]
阿里巴巴-W(09988):3QFY26前瞻:关注云出海表现,电商受宏观影响表现疲软
国信证券· 2026-01-13 17:27
报告投资评级 - 投资评级:优于大市(维持) [1][4][23] 报告核心观点 - 预计阿里巴巴3QFY26整体营收同比微增2%至2858亿元,但经调整EBITA同比大幅下降39%至335亿元,利润率承压,主要受闪购业务投入及AI算力支出增加影响 [3][5] - 云智能集团是核心增长引擎,预计收入同比加速增长35%,海外市场表现尤其亮眼,AI模型能力获得国际认可 [3][10] - 中国电商集团受宏观消费疲软及激烈竞争影响,预计GMV仅同比增长3%,即时零售业务亏损严重,公司以市占率优先,未来将继续加大投入 [3][19][21] - 报告基于疲软消费环境及高于预期的AI相关支出,小幅下调了公司未来财年的收入及利润预测 [4][23] 按业务板块总结 整体财务预测 - 预计3QFY26总收入为2858亿元,同比增长2%,环比增长15% [3][5][7] - 预计3QFY26经调整EBITA为335亿元,同比下降39%,经调整EBITA利润率为11.7%,同比下降7.8个百分点 [3][5][7] - 预计3QFY26 Non-GAAP归母净利润为273亿元,同比下降47% [7] 云智能集团 - 预计3QFY26收入同比增长35%,继续保持加速增长态势 [3][5][10] - 核心AI模型Qwen于11月底取代Llama成为新加坡国家AI项目技术底座,领先的模型能力有望助力海外市场份额持续提升,预计海外收入增速高于国内 [3][10] - 本季度AI取得多项进展:Qwen模型进行小版本升级并上线长记忆能力;发布国内首个支持角色扮演功能的视频模型“万相2.6” [11] - AI应用“千问APP”于11月17日上线,接入高德等阿里系生态,上线30天月活突破4000万 [3][11] 中国电商集团 - **电商业务**:预计3QFY26 GMV同比增长3%,客户管理收入(CMR)增速预计与GMV接近,同样为3%,增长受社会零售大盘疲软拖累 [3][19] - **即时零售(闪购)业务**:预计3QFY26亏损约200-250亿元,公司保持市占率优先目标,未来几个季度会加大投入 [3][21] - 测算3QFY26日均单量约7000-7500万单,对应单均亏损约3-3.5元,公司正通过减少补贴、提升履约效率、提高客单价(AOV)推进减亏,预计12月AOV接近35元 [3][21] 其他业务 - **国际数字商业集团(AIDC)**:预计收入增速继续放缓,亏损收窄幅度与上季度接近,但受海外黑五大促等活动影响,预计将产生亏损 [3][22] - **所有其他业务**:预计3QFY26亏损较上季度进一步扩大至超过70亿元,主要因模型训练、千问APP上线带来的算力投入增加,以及高德扫街榜发布的投入 [3][22] 盈利预测与估值调整 - 将FY2026-FY2028收入预测调整至10307/11494/12751亿元,调整幅度分别为-1.5%/-2.8%/-1.4%,主要考虑疲软的消费环境 [4][23] - 将FY2026-FY2028经调整净利润预测调整至1016/1354/1655亿元,调整幅度分别为-9.1%/-6.6%/-3.7%,主因电商业务收入利润弱于预期及AI相关支出高于预期 [4][23] - 目前公司对应FY2027年预测市盈率(PE)为20倍 [4][23]
千问APP联手B站,打造全新跨年晚会AI互动体验
格隆汇APP· 2025-12-29 11:35
哔哩哔哩跨年晚会合作与影响力 - 2025年哔哩哔哩跨年晚会由千问APP独家总冠名,将AI创作能力融入晚会节目与互动环节 [1] - 晚会定位为年轻群体重要的跨年仪式,2024年预约观众数突破千万人次,直播峰值达到3.46亿 [1] 千问APP的AI技术应用与营销活动 - 千问APP将基于阿里视频生成模型万相2.6的角色扮演功能,推出“用AI为新年干杯”活动,用户可与家人、朋友、宠物甚至历史名人生成个性化干杯视频 [1] - 活动期间用户制作干杯视频可领取现金红包,最高金额达888元,并通过收集瓜分卡参与瓜分千万现金奖池,幸运用户有机会获得纯金打造的千问纪念金钞 [1]
阿里巴巴-W(09988.HK):模型能力持续迭代 钉钉发布工作智能操作系统AGENT OS
格隆汇· 2025-12-28 04:05
阿里巴巴多模态AI模型能力迭代 - 公司发布新一代视频生成模型“万相2.6”,单次视频时长达到国内最高的15秒,并新增角色扮演和分镜控制功能,可一键完成多人合拍及多镜头切换,满足专业影视级需求 [1] - 公司推出全新图像生成模型“Qwen-Image-Layered”,采用自研创新架构,可将图片拆解为多个可独立操作的图层,支持缩放、移动和重新着色等高保真编辑 [1] - 公司在多模态模型领域已覆盖文生图、图像编辑、文生视频、图生视频、动作生成、角色扮演及通用视频编辑等多种视觉创作能力,有望广泛应用于AI漫剧、广告设计和短视频创作等领域 [2] 钉钉AI生态与操作系统布局 - 钉钉召开AI钉钉1.1新品发布会暨生态大会,发布包括Agent OS、ONE、DingTalk Real等在内的20多个AI产品 [1] - 发布硬件Agent设备“DingTalk Real”,可在权限可控范围内打通内网系统与数据访问,支持调用外网服务,并具备实时数据获取能力以支撑Agent判断与执行 [2] - 发布系统级平台“Agent OS”,旨在统一AI Agent的构建、部署与交互标准,同时发布“悟空”可通过对话自动执行复杂操作流程,调用钉钉内建AI能力并支持多模型融合与任务自主规划 [2] - 推出垂直场景Agent如AI印、AI招聘、AI差旅等,旨在打印、招聘等细分领域帮助企业提升效率 [2] - 钉钉正在构建软硬一体化的Agent运行环境,有望将自身打造为AI时代工作场景的操作系统,为企业用户提供全新的AI工作方式 [2] 公司财务预测与AI业务布局 - 预计公司FY2026-FY2028实现营收1.03万亿元、1.12万亿元、1.24万亿元,实现经调整归母净利润1160亿元、1480亿元、1793亿元,对应PE分别为21.7倍、17.0倍、14.0倍 [3] - 公司AI大模型多模态能力持续提升,to B云业务维持较高收入增速,to C应用千问快速起量,实现了硬件、模型、云业务、应用的AI全面布局 [3]
AI日报丨有道AI答疑笔销售额破亿;查诺斯警告AI投资面临泡沫风险
美股研究社· 2025-12-17 22:47
AI行业动态与商业化进展 - 网易有道旗下AI原生硬件“有道AI答疑笔”上市不足一年销售额突破一亿元,被视为国内AI硬件迈过概念验证、进入可持续商业化阶段的关键信号 [5] - 阿里千问APP同步上线最新视频生成模型万相2.6,并向所有用户免费开放,该模型是国内首个支持角色扮演功能的视频模型,具备音画同步、多镜头生成及声音驱动等功能,基于此上线的“AI小剧场”玩法首次实现“角色合拍”能力 [6] - 著名投资人吉姆·查诺斯警告AI投资面临泡沫风险,其正加倍押注做空数据中心,认为数据中心业务模式资本回报率低、资本密集度高,AI投资的价值将来源于AI应用本身而非数据中心,并指出数据中心购买的GPU可能因快速折旧在五年内过时 [7][8] - 包括OpenAI、Meta和微软在内的科技巨头正敦促美国国会通过《加速许可效率以增强数字竞争力法案》,以简化人工智能与芯片项目的联邦许可审批流程,加快基础设施建设及半导体生产项目进度 [9] - OpenAI据悉正在与亚马逊洽谈引入至少100亿美元的投资,并计划使用亚马逊的自研AI芯片Trainium,该芯片与英伟达的AI加速器竞争 [14][15] 科技巨头公司动态 - 苹果计划扩充iPhone产品线,目标是在2027年秋季将机型增至至少7款,计划包括于2026年秋季推出首款可折叠iPhone,以及于2027年秋季发布一款20周年纪念版iPhone,核心目标是覆盖更广泛的消费者预算区间 [11] - 英国竞争与市场管理局正在调查谷歌是否在广告技术领域通过其行为滥用市场支配地位,涉嫌反竞争行为 [12] - 特斯拉计划投资近10亿欧元,目标是从2027年起在其柏林-勃兰登堡工厂每年生产高达8千兆瓦时的完整电池,以实现电池与车辆在同一地点生产,加强欧洲供应链复原力和竞争力 [13]
用手机就能当导演,硬刚Sora2的万相2.6接入千问APP
新浪财经· 2025-12-17 19:36
产品发布与功能创新 - 12月16日,阿里千问APP上线最新视频生成模型万相2.6,并向所有用户免费开放[2] - 基于万相2.6,千问APP上线“AI小剧场”功能,在国内首次实现“角色合拍”玩法,用户可与朋友或名人同框出演AI短片[2] - 万相2.6是全球功能最全的视频生成模型,支持音画同步、多镜头生成及声音驱动等功能,也是国内首个支持角色扮演功能的视频模型[4] - “AI小剧场”玩法基于角色扮演功能,目前全球仅OpenAI的Sora2大模型有类似功能[4] - 万相2.6的某些功能如音频驱动生视频,Sora2尚未实现[5] 技术实力与行业地位 - 千问APP接入影视级视觉大模型,使AI不仅是专业工具,也能释放普通人的想象力[5] - 公司拥有全栈自研的强大技术底座,今年9月在国内率先发布音画同步的视频生成模型万相2.5[5] - 在权威大模型评测集LMArena上,万相图生视频位居国内第一[5] - 在语言模型领域,阿里千问已具备比肩GPT的实力,英伟达开源的多个模型基座来自千问[6] - 爱彼迎Airbnb CEO表示公司大量依赖阿里千问,认为其比OpenAI更好更便宜[6] - 在大模型赛道,公司已成为实力全面硬刚OpenAI的中国科技公司[6] - 公司已在全球开源300多款模型,在全球主要模型社区的下载量突破7亿,衍生模型突破18万个[6] - 阿里千问超越美国Meta的Llama,成为全球第一的开源模型家族[6] 应用表现与用户增长 - 千问APP公测一个月,迭代速度惊人,共计更新18个版本,在创作、学习、办公三大场景能力持续增强[5] - 用户数量增长破纪录,公测一周下载量即破千万[5] - 公测23天,月活跃用户数(含APP、Web、PC端)突破3000万,成为全球增长最快的AI应用[5]
硬刚Sora2,万相2.6轻松定制角色、控制分镜,普通人也能当导演
机器之心· 2025-12-17 13:28
行业年度回顾与趋势 - 2025年视频生成领域发展突飞猛进,视频内容创作范式正在发生改变 [1] - 行业在B端和C端商业化落地速度惊人:B端大量AI短剧、漫剧上线,制作成本大幅降低;C端社交平台出现爆款特效,大量博主开始常态化使用AI制作剧情短片 [1] - 顶尖模型生成的画面在光影质感与物理规律上已臻化境,但用户体验门槛依然存在,如高不可攀的内测资格或不菲的订阅费用 [1] 公司产品发布与定位 - 阿里于12月16日正式发布新一代万相2.6系列模型,涵盖文生视频、图生视频、参考生视频、图像生成和文生图共5款模型,是目前全球功能覆盖最全面的视频生成模型家族之一 [2][3] - 万相2.6是**国内首个**具备声画一致性角色定制能力的模型,能通过角色参考固定IP形象,并参考输入视频中的音色,实现从画面到声音的完美复刻 [3] - 该版本进一步提升了画质、音效和指令遵循能力,单次视频生成时长实现了**国内最高的15秒**(参考生视频为10秒) [3] - 模型已同步上线阿里云百炼和万相官网,企业用户可直接调用API,千问APP也将于近期上线 [3] 核心技术能力突破 - 万相2.6具备“参考生视频”能力,成为**全球唯二、国内首个**拥有此能力的模型,允许将任意人或物设定为主角,在多镜头切换中保持核心主体、场景和环境氛围的统一 [7] - 模型在结构上集成了多项创新技术,可对输入参考视频进行多模态联合建模与学习,提取主体的时序情绪、姿态、视觉特征及音色、语速等声学特征,实现从视觉到听觉的全感官一致性迁移 [9] - 模型具备“分镜控制”功能,通过高层语义理解将简单提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,确保内容、节奏和氛围的高一致性 [3][9] 产品功能实测与效果 - 实测中,万相2.6能精准提取参考素材中主体的形象特征、声音声线及惯用神态,并可通过提示词将其置入全新剧情 [11] - 在多角色声画同步测试中,模型对科技人物(如奥特曼、哈萨比斯、黄仁勋)的眉眼微表情、肢体语言及习惯性动作还原度极高,英文版能完美复刻其原本的声线与语调 [13][14] - 在细节把控测试中,模型能生成电影级高保真度的特写镜头,完美呈现如眼镜片因热气起雾、皮肤细微纹理和毛孔“呼吸感”等复杂细节,打破了AI生成人物常见的“塑料感” [17][18] - 在长叙事能力测试中,模型展现出了类似专业导演的运镜意识,能通过推拉摇移和景深变化掌控叙事节奏,并高度还原设定的视觉风格与人物情绪 [24] 图像生成能力升级 - 万相2.6在静态图像生成领域完成了版本迭代,在“高美学”与“强可控”上同时迈进 [26][27] - 在文生图方面,新模型实现了对艺术风格的“灵魂捕捉”,对肌理、色彩、笔触等细节刻画更为到位,并能进行平滑自然的风格融合 [27] - 针对人物写实照片,2.6版本综合优化了构图与光影,削弱了“AI塑料感”,人物神态更自然,肤质真实感大幅提升 [29] - 新版本改善了在图片中生成中英文文本的能力,并新增了“图文混排输出”和“多图融合生成”等功能,能依据逻辑创作具有叙事性的绘本或复杂商品组合场景 [31] - 模型提供了商用级的一致性保持能力,以及更精确的镜头远近视角和光影效果控制选项 [33] 应用场景与市场影响 - 万相2.6面向广告设计、短剧制作等专业场景展现出惊人潜力,通过连续提示词能生成完整叙事的短片 [16] - 万相模型家族已支持文生图、图像编辑、文生视频等10多种视觉创作能力,已广泛应用于AI漫剧、广告设计和短视频创作等领域 [35] - 万相2.6的发布标志着AI视频生成告别“抽卡”时代,迈向了精准可控的电影级创作新阶段,将昂贵的影视工业特权折叠进了手机和云端 [36]
中国版Sora2来了!阿里千问接入万相2.6
经济观察报· 2025-12-17 12:46
公司产品与技术发布 - 阿里千问APP于12月16日同步上线并免费开放了最新的视频生成模型万相2.6 [3] - 万相2.6是全球功能最全的视频生成模型,同时支持音画同步、多镜头生成、声音驱动及角色扮演功能 [1] - 基于万相2.6的核心能力,千问APP上线了“AI小剧场”功能,在国内首次实现“角色合拍”玩法,用户可与他人同框出演AI短片 [1][3] - 该角色扮演功能目前仅美国OpenAI公司的Sora2大模型有类似能力 [1] - 万相2.6的音频驱动生视频功能,是Sora2尚未实现的 [4] 产品表现与用户增长 - 千问APP公测一个月,迭代速度惊人,共计更新18个版本 [4] - 公测一周下载量即突破千万 [4] - 公测23天,月活跃用户数(含APP、Web、PC端)突破3000万,成为全球增长最快的AI应用 [4] 技术实力与行业地位 - 千问APP的快速迭代基于阿里全栈自研的强大技术底座 [4] - 今年9月,阿里在国内率先发布音画同步的视频生成模型万相2.5,其在权威评测集LMArena的图生视频项目中位居国内第一 [4] - 在语言模型领域,阿里千问已具备比肩GPT的实力 [4] - 英伟达开源的多个模型,其基座都来自于千问 [4] - 爱彼迎Airbnb CEO表示公司大量依赖阿里千问,并认为与OpenAI相比,千问更好更便宜 [4] - 在大模型赛道,阿里已成为实力全面硬刚OpenAI的中国科技公司 [4] 开源生态与全球影响 - 阿里已在全球开源300多款模型 [5] - 阿里模型在全球主要模型社区的下载量突破7亿 [5] - 基于阿里开源模型衍生的模型数量突破18万个 [5] - 阿里千问超越美国Meta的Llama,成为全球第一的开源模型家族 [5]
千问App接入视频生成模型万相2.6
每日经济新闻· 2025-12-17 11:30
公司动态 - 阿里巴巴旗下千问App于12月16日同步上线最新视频生成模型万相2.6,并向所有用户免费开放 [1] - 基于万相2.6模型的核心能力,千问App上线了“AI小剧场”功能,在国内首次实现“角色合拍”玩法,用户可与朋友或名人同框出演AI短片 [1] - 截至12月17日,千问App公测满一个月,在此期间该App迅速迭代,共计更新了18个版本 [1] 行业技术 - 千问App新上线的“AI小剧场”玩法是基于其视频生成模型万相2.6的角色扮演新功能 [1] - 目前,仅美国大模型公司OpenAI旗下的Sora2大模型具备类似的功能 [1]