可灵数字人2.0 - 财报，业绩电话会，研报，新闻

可灵数字人2.0

搜索文档

格隆汇· 2026-01-05 10:13

公司股价表现与市场反应 - 公司股价大幅上涨近13%，最高触及74.85港元，创下超过两个月以来的新高 [1] 产品与技术发展 - 公司近期上线了多个AI产品功能迭代，包括视频O1模型、图片O1模型、音画同出的“可灵2.6”视频功能，以及可灵数字人2.0 [1] - 最新版的可灵O1模型被认为能显著提升用户生成视频的灵活性与效率 [1] - 公司持续强化可灵技术以维持其在相关领域的领先地位 [1] 机构观点与财务预测 - 花旗维持对公司“买入”评级，并给出88港元的目标价 [1] - 高盛同样维持“买入”评级，目标价为83港元 [1] - 高盛预测公司的可灵AI业务2025年收入将超过1.4亿美元，2026年收入预计将增长至2.3亿至2.4亿美元之间 [1]

华福证券· 2025-12-31 14:53

行业投资评级 - 传媒行业评级为“强于大市”（维持）[6] 核心观点 - 可灵AI通过“全能灵感周”进行多个产品功能迭代，其功能迭代带来了商业化空间的进一步提升[2][4] - 建议关注快手及其它“文生视频”应用[5] 行业动态跟踪：可灵“全能灵感周”功能迭代 - 第一天上线“视频O1模型”，仅需简单对话即可使用图片、视频等各种素材，同时提高了视频稳定性，主题建构能在复杂场景中保持一致[3] - 第二天上线“图片O1模型”，可以实现元素高度统一，响应专业级创作需求[3] - 第三天上线音画同出视频“可灵2.6”，实现单次生成完整音视频[3] - 第四天上线“可灵数字人2.0”，表演力全面进化，情绪传达更生动细节，支持单次上限至5分钟[3] - 第五天上线“可灵O1主体库和对比模板”，支持多个主体和多素材随心搭配，通过智能AI补图可以创建专属形象[3] 商业化空间分析 - 以可灵2.6模型为例，生成5秒视频，快手1.6模型“标准模式”收费20个灵感值，“高品质模式”收费35个灵感值，而可灵2.6模型仅支持高品质模型，收费50个灵感值[4] - 可灵2.6模型价格相比快手1.6模型高品质模式收费（50个灵感值 vs 35个灵感值）有所提升，进一步打开了商业化空间[4]

用AI规模化生产好内容，可灵AI携手全球创作者叩响临界点大门

21世纪经济报道· 2025-12-22 19:51

文章核心观点 - 生成式AI技术，特别是视频生成技术，正在重塑内容生产力，通过技术、艺术与影视的跨界探索，叩开日常生活和艺术创作的大门 [1] - 以可灵AI为代表的中国科技巨头正加速布局AI视频生成前沿技术，并通过构建生态协作来重新定义AI视频创作的可能性边界 [1] - AI技术不仅为影视、广告等内容产业带来降本增效的革新机遇，更通过降低创作门槛，推动“AI平权”，让每个人都能成为创作者 [3][6] AI视频生成的技术进展与产品迭代 - 可灵AI在12月连续发布多项更新，包括可灵O1新模型、音画同出模型可灵2.6、可灵数字人2.0、可灵O1主体库&对比模版等 [1] - 可灵O1模型是全球首个统一的多模态视频及图片创作工具，标志着AI生成技术从单一模态指令迈向综合理解的关键一步 [4] - 自发布以来一年多，可灵AI已完成超30次迭代升级，新模型解决了视频一致性与可控性难题，可灵2.6模型实现了“音画同出”能力，改变了传统AI视频生成流程 [4][8] - 截至今年7月，可灵AI全球用户规模突破4500万，累计生成超过2亿个视频和4亿张图片 [5] AI对内容产业的赋能与降本增效 - AI大模型已深度嵌入影视、动画、电商等产业流程，颠覆传统内容创作模式，帮助打破文化表达边界 [3] - 以国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》为例，利用可灵AI辅助后，全剧99%的镜头由AI生成，制作周期从半年多缩减至2个月，帮助制作方提升投入产出比约10倍 [3] - AI技术帮助储存大量数据，并用生成技术辅助制作流程，例如在特效制作中快速生成中间效果，提高协作效率 [3] - 可灵AI目前覆盖的企业用户数超过2万家，涵盖影视制作、广告、创意设计、自媒体、游戏、电商等诸多领域 [9] 生态构建与创作者赋能 - 可灵AI在全球范围内构建平台、创作者与技术的协同生态，旨在降低创意表达门槛，搭建让优质创作被看见、被认可的生态系统 [6][7] - 公司通过技术迭代、创作者扶持计划与全球赛事赋能创作者，例如“灵感成真”之旅全球创意短片征集计划在1个月内吸引超60个国家和地区的创作者参与，提交作品超2000件 [7] - 今年发布的NextGen新影像创投计划，通过千万资金、全球宣发、IP打造和算力保障助力新世代创作者 “可灵AI NEXTGEN全球新影像创作大赛”收到来自122个国家和地区的超4600部投稿作品 [7] - 公司珍视与各界伙伴合作的机会，共同推动“用AI规模化生产好内容”临界点的加速到来 [2][4] AI时代下的艺术创作与人类角色 - 专家认为AI是强大的工具，但人类艺术家拥有不可替代的感知力、感性表达能力与创造力，艺术的核心是人类创造力 [4] - 在AI时代，应形成人机既协作又对抗的共生关系，艺术品可以被AI模仿，但艺术不能 [4] - AI打破了内容生产者与消费者的边界，让创作成为每个人的权利，而不再是小部分群体的专利，释放“AI平权”信号 [6] - 技术的进步让普通用户也能充分发挥协同效应，拓宽创意边界，未来在创作生态构建下，观众也可能变成共创者，创作者将更加多元化 [5][8]

用AI规模化生产好内容，可灵AI携手全球创作者叩响临界点大门

21世纪经济报道· 2025-12-22 19:47

文章核心观点 - 生成式AI技术，特别是视频生成技术，正进入规模化应用前夜，深刻重塑内容创作、影视工业及艺术表达的生产逻辑与产业生态 [1] - 以可灵AI为代表的中国科技公司正通过持续的技术迭代和生态协作，推动AI视频创作走向高效化、低门槛化，旨在实现“用AI规模化生产好内容”的愿景 [1][2][10] AIGC赋能艺术与影视革新 - AI技术正深度嵌入影视、动画、电商等产业流程，颠覆传统创作模式，帮助打破文化表达边界 [6] - 具体案例显示，AI能大幅降本增效：国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》99%的镜头由AI生成，制作周期从半年多缩减至2个月，投入产出比提升约10倍 [7] - AI不仅优化工业流程，还激发创新玩法，使普通用户、艺术家能借助智能化工具实现个性化叙事与互动化传播 [7] - 行业专家指出，AI是强大工具，但人类艺术家的创造力、感知力与作品诠释能力不可被替代，未来将是人机协同共生的关系 [8] 可灵AI的技术进展与产品迭代 - 可灵AI在12月连续发布多项更新，包括可灵O1新模型、音画同出模型可灵2.6、可灵数字人2.0、可灵O1主体库&对比模板等 [1][18] - 可灵O1模型是全球首个统一的多模态视频及图片创作工具，标志着AI生成技术从单一模态指令迈向综合理解的关键一步 [10] - 该模型旨在解决创作者面临的一致性与画面可控性难题，而可灵2.6模型的“音画同出”能力改变了传统“先画面、后配音”的工作流程 [18][19] - 自发布以来的一年多，可灵AI已完成超30次迭代升级，并与广告营销、影视动画、游戏等行业应用深度融合 [10] 用户规模、创作数据与行业应用 - 截至今年7月，可灵AI全球用户规模突破4500万，累计生成超过2亿个视频和4亿张图片 [12] - 目前覆盖的企业用户数超过2万家，涵盖影视制作、广告、创意设计、自媒体、游戏、电商等诸多领域 [19] - 庞大的用户基数和AI技术解放了内容生产力，推动了社交平台上创意内容的涌现 [14] 构建创作者生态与推动创作平权 - 公司通过技术迭代、创作者扶持计划与全球赛事，降低创意表达门槛，搭建让优质创作被看见的生态系统 [15] - 今年发布的“灵感成真”之旅全球创意短片征集计划，在1个月内吸引超过60个国家和地区的创作者参与，提交作品超过2000件 [15] - 同期发布的NextGen新影像创投计划，通过千万资金、全球宣发等资源支持创作者 “可灵AI NEXTGEN全球新影像创作大赛”收到来自122个国家和地区超过4600部投稿作品 [16] - 专家认为，AI打破了内容生产者与消费者的边界，让创作成为每个人的权利，而非小部分群体的专利 [14][15]

Artificial Intelligence

AIGC

Artificial Intelligence

可灵O1

可灵2.6

可灵数字人2.0

Artificial Intelligence

AIGC

Artificial Intelligence

量子位· 2025-12-10 12:26

公司近期产品发布概览 - 12月初，公司在5天内密集发布了5次产品更新，包括全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型以及可灵数字人2.0等功能 [1][2] - 这一系列更新显著提升了生成式AI领域的竞争激烈程度 [2] 可灵O1模型的核心创新 - 可灵O1基于创新的多模态视觉语言交互理念，将所有生成和编辑任务融合于一个全能引擎，为用户提供从灵感到成品的一站式闭环创作流程 [3] - 视频O1模型打破了传统单一视频生成任务的边界，将参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改变换、风格重绘、镜头延展等多种任务融合于同一引擎，解决了主体一致性和视频画面可控性等难题 [6] - 图像O1模型实现了从基础图像生成到高阶细节编辑的全链路无缝衔接，用户可通过纯文本生成图像，也可上传最多10张参考图进行融合再创作 [7] - 有行业人士将可灵O1评价为“视频界的Nano Banana” [4] 可灵2.6模型的“音画同出”能力 - 可灵2.6模型上线了里程碑式的“音画同出”能力，改变了传统AI视频生成“先无声画面、后人工配音”的工作流程 [10] - 该模型能在单次生成中，输出包含自然语言、动作音效以及环境氛围音的完整视频，极大提升了创作效率 [11] - 目前支持生成最长10秒的视频，语音部分支持中文和英文，更多语言及固定声线功能正在研发中 [12] - 该模型在音画协同、音频质量和语义理解上表现亮眼，能够支持说话、对话、旁白、唱歌、Rap、环境音效、混合音效等多种声音的单独或混合生成 [12][27] 技术性能与市场应用 - 根据公司内部测评，在“图片参考”任务上，可灵AI对Google Veo 3.1的整体效果胜负比为247%；在“指令变换”任务上，与Runway Aleph对比的整体效果胜负比达到230% [18] - 公司目前覆盖的企业用户数超过2万家，涵盖影视制作、广告、创意设计、自媒体、游戏、电商等诸多领域 [26] - 数字人2.0功能允许用户上传角色图，添加配音并描述角色表现，即可生成表现力生动的自定义数字人视频，视频内容最长可达5分钟 [27] 行业影响与发展愿景 - 自2024年6月正式推出以来，公司的每一次迭代都引发了业界的广泛关注和讨论，从早期案例到获得特斯拉创始人马斯克点赞，公司已成为视觉生成技术走向成熟过程中的关键角色 [20] - 公司高级管理层表示，其初心是让每个人都能用AI讲出好的故事，并希望这一天更快到来 [28] - 通过年末的系列更新，公司正朝着这一愿景加速迈进 [29]

生成式AI

Multimodal Visual Language (MVL)

Artificial Intelligence

Multimodal Visual Language (MVL)

Artificial Intelligence

腾讯研究院· 2025-12-05 00:16

OpenAI模型与产品动态 - OpenAI在DesignArena测试四个代号为“企鹅家族”的新模型，推理预算分别为Emperor（512）、Rockhopper（64）、Macaroni（16）和Mumble（0）[1] - 内部代码流出显示OpenAI正开发“记忆搜索”功能，用户可通过提问快速检索存储的记忆信息[1] - 有付费用户称对话中收到ChatGPT广告推送，引发取消订阅潮，外界猜测OpenAI可能提前发布GPT-5.2以应对谷歌Gemini竞争[1] - OpenAI公开在GPT-5-Thinking上进行的“忏悔训练”研究，让模型在回答后生成“忏悔报告”汇报是否偷工减料或违反指令[5] - 在11/12个测试场景中，模型至少有一半概率会在忏悔中承认错误，平均“假阴性”概率仅4.36%，专门训练后忏悔准确性从45%提升至89%[6] - 奖励信号完全隔离，模型在忏悔中承认作弊不影响主任务得分，该技术被定位为监控诊断工具，计划与思维链监控等安全技术配合使用[6] 国内AI产品与模型发布 - 可灵数字人2.0正式全量上线，带来表现力、手部及口型精准控制、支持最长5分钟视频三大突破性改变[2] - 模型精通体态动作、手势、表情、镜头语言，口型效果真实自然，手部细节大幅提升，在多维度客观评测中效果胜负比综合得分远超同类产品[2] - 单次生成视频时长支持5分钟，覆盖深度科普、歌曲演绎等长内容场景[2] - 火山引擎正式发布豆包图像创作模型Doubao-Seedream-4.5并开启公测，在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代[3] - 模型重点强化多图组合生成能力，优化海报排版与Logo设计功能，支持高精度图文混排，确保多源素材融合时的自然感与一致性[3] - 模型全面支持广告营销、电商运营、影视制作、数字娱乐及教育等核心场景应用，已上线火山方舟并面向企业开放API使用[3] - 杭州瞳行科技公司发布国内首款AI助盲眼镜，基于Qwen-VL、OCR等系列模型打造，具有出行避障、找物读物、语音助手和一键求助亲友等功能[7] - 在出行场景可实现300ms超低延时，配备121度超广角双摄像头，眼镜由主体、手机、遥控指环、盲杖四部分组成[7] - 大模型出现使算力成本降至过去十分之一，通过基模复用加微调优化快速实现所需功能[7] 行业竞争与人才流动 - Meta官宣苹果人机交互设计副总裁艾伦·戴伊加入并成立全新设计工作室，戴伊将担任Meta首席设计官，直接向现实实验室CTO汇报[4] - 戴伊在苹果工作19年，曾负责Apple Watch、Vision Pro头显和iOS 26液态玻璃视觉系统设计，其副手比利·索伦蒂诺也同时加入Meta[4] - 今年Meta已从苹果挖走基础模型团队经理庞若鸣等多位人才，苹果设计团队自2019年乔尼·艾维离职后持续出现人才流失[4] AI应用产品表现与洞察 - a16z合伙人Olivia Moore分享数据显示Sora APP用户留存率从day1的10%降至day7的2%、day30的1%、day60的0%[9] - Sora APP虽5天下载破百万且出道即拿下App Store免费榜第一，但目前排名已降至第22，无法留存用户主要因推荐算法糟糕、功能设计不佳、缺乏原生分享链接等[9] - OpenAI首席研究官Mark Chen表示OpenAI本质仍是纯AI研究公司，短视频产品运营对其是不小挑战，Sora更多被当作创意工具而非社交产品使用[9] - AI语音输入产品Wispr Flow在5个月内ARR翻10倍，估值超7亿美元，用户一年后留存率高达70%，收入自6月以来环比增长近40%[10] - 创始人强调核心区别在于解决“听写”而非“转录”问题，“零编辑率”已达89%，用户从看到生成信息到按发送平均仅半秒[10] - 语音消除思考时认知负荷，让用户专注创作，统计显示平均72%文本输入通过Wispr Flow完成，键盘使用率降至5%以下[11] 前沿硬件产品发布 - 影石旗下品牌影翎正式发售首款无人机产品A1，限时补贴后起售价6799元，仅249g重量全球绝大部分地区无需培训即可畅飞[8] - 标准版套装包含支持8K全景画质拍摄的无人机、内置双1英寸Micro-OLED显示屏的飞行眼镜、“指哪飞哪”的体感遥控器[8] - 采用全景技术实现观看视角与飞行方向完全分离，用户拥有360度无限自由空中视角，“先拍摄后取景”大幅降低飞行和拍摄门槛[8]

豆包图像创作模型Doubao - Seedream - 4.5

豆包图像创作模型Doubao - Seedream - 4.5

AI助盲眼镜