视频大模型
搜索文档
继Seedance2.0后,又一中国视频大模型站到台前
观察者网· 2026-02-28 09:57
公司产品发布与技术定位 - 昆仑万维集团旗下Skywork AI于2月27日正式发布多模态视频基础模型SkyReels V4,该模型被描述为“全球首个同时支持多模态输入、联合音视频生成、统一生成/修复/编辑任务”的视频基础模型 [1] - 根据第三方评测机构Artificial Analysis的数据,SkyReels V4在“文生视频(带音频)的所有历史模型”排行榜中位列第四名,已超过绝大多数明星产品 [1] - 模型以双流多模态扩散 Transformer(MMDiT)为核心架构,实现了1080p分辨率、32 FPS帧率、15秒时长的音视频同步生成 [4] 产品性能与功能 - 模型支持基于参考图片和参考运动的主体替换/动作迁移、修改属性(如服装颜色、物体形状)、更换背景,添删物体、修改局部纹理与属性等功能 [4] - 在文本及音频生成方面,SkyReels V4支持包括中英日韩德法语等多个语种的文本合成,其中中文语音合成表现突出,多个指标达到行业领先水平 [4] - 官方演示的15秒生成视频,镜头切换恰当,音画同步,整体效果已与目前短剧水平相当 [2] 核心技术突破 - 针对音画不同步痛点,采用双流MMDiT架构,使视频和音频从任务开始就协同工作,共享同一个文本理解模型,并通过双向跨注意力机制提高角色嘴型、动作和声音的匹配度 [7] - 针对生成高清长视频算力消耗大、速度慢、成本高的问题,采用“低分辨率全序列 + 高分辨率关键帧”联合生成策略,先快速生成低分辨率完整视频和高分辨率关键帧,再通过专用模块重构高质量视频,从而降低用户制作高质量视频的门槛和成本 [9] - 针对多工具切换剪辑的痛点,将生成、编辑、处理整合在统一框架里,提出通道拼接与时序拼接相结合的统一范式,减少用户对多工具的依赖,提升效率 [9] 行业竞争格局与挑战 - 在Artificial Analysis的文生视频(带音频)排行榜中,SkyReels V4以ELO评分1,090位列第四,紧随谷歌Veo 3.1 Preview(1,181分)、KlingAI Kling 3.0 1080p (Pro)(1,094分)和谷歌Veo 3.1 Fast Preview(1,091分)之后 [2] - 大模型竞争已不仅限于技术,数据来源的合法性与合规成本成为新的壁垒,字节跳动Seedance2.0此前因版权问题遭美国电影协会及好莱坞制片厂联合维权,导致产品性能出现“降智”现象和产出稳定性下降 [10] - 行业普遍面临创作平权与版权保护的矛盾激化问题,普通用户无意间使用包含IP的素材进行生成,可能导致侵权行为变得普遍且难以追责 [10] - 对于中国AI企业而言,想要顺利进入并立足国际市场,所需要的远不止是算力和算法的领先 [11]
视频大模型概念强势收官
第一财经· 2026-02-13 20:16
市场表现与板块动态 - 蛇年最后一个交易日,影视传媒、半导体设备板块大涨,Seedance视频大模型指数板块逆势收涨,掌阅科技、光线传媒涨停,深科技涨停,北方华创、江波龙等多股跟涨 [4] - 港股AI公司MiniMax及智谱双双大涨,市值均突破2000亿港元 [4] - ETF市场掀起AI主题投资热潮,影视ETF、动漫游戏ETF、传媒类ETF同步走强,多只产品年内涨幅超20% [6] - 算力板块方面,曙光数创涨停,首都在线维持涨幅,传媒板块在收官日呈现分化格局 [6] 行业核心观点与趋势 - 字节、阿里、智谱及DeepSeek在春节前密集发布旗舰模型,AI行业上演“春节档” [3] - AI视频生成正在从盲盒式娱乐向精准工业化生产跨越,国内大厂视频产品路径分化,例如字节走“效率基建”,快手走“专业叙事” [4] - 随着视频生成技术提升成片率与稳定性,更看好下游内容IP方、内容版权、AI应用工具等细分方向以及对云服务与算力的拉动 [4] - 中国互联网与人工智能行业正迎来史上最密集的旗舰模型发布浪潮,行业竞争是比拼谁能更快将“技术溢出”转化为“消费级爆款”的竞速赛 [7] - AI应用正从“对话式工具”向更高频的“产品内嵌AI”阶段加速渗透 [7] - 2026年AI投资的主线是商业化推进,主要集中在用户订阅和企业级应用中,广告、交易抽成、增值服务是重要的盈利渠道 [10] 主要公司及产品动态 - 字节跳动正式宣布Seedance 2.0接入豆包App、电脑端及网页版,模型实现四大核心突破:支持多模态混合输入,运动场景生成可用率达业界领先,具备导演级运镜控制与高仿真音效同步生成能力,单条15秒1080P视频生成成本降至4.5-9元,制作周期从7天压缩至3天 [6] - 据国盛证券测算,保守假设下Seedance2.0可降低5%的视频生成成本,中性假设下成本降幅高达37% [6] - 智谱AI上线开源旗舰模型GLM-5,聚焦智能体工程与编程能力强化 [7] - MiniMax正式上线新一代文本模型MiniMax M2.5,并于2月12日在MiniMax Agent上线,13日全球开源支持本地化部署 [7] - DeepSeek完成版本更新,将上下文窗口扩展至100万Token,长文本处理能力大幅提升 [7] 技术进展与商业化现状 - Seedance 2.0目前暂不支持上传真人图片作为主体参考,且在细节稳定性、多人口型匹配、文字还原精度等方面仍有优化空间 [9] - 随着推理单位成本持续下降,在多步推理、工具调用中消耗更多Token将变得更具经济性 [7] - AI技术正处于加速迭代和商业化落地的黎明期,产业天花板较高 [9] 机构观点与市场观察 - AI板块目前存在投资超前、预期过高的问题,部分概念股估值已透支未来一年以上的业绩 [9] - 应选择卡位好、技术强、预期合理的标的进行投资,避免盲目追高短期涨幅过大的概念股,重点关注算力基础设施、版权合规、内容生产落地等确定性较高的环节 [9] - 经过前期较大幅度上涨,AI板块整体估值已不再处于低位区间,部分热门概念股的估值甚至包含了对未来多年高速成长的乐观预期 [9] - 高估值意味着对业绩兑现的要求更为苛刻,也更容易受到市场情绪、流动性及宏观因素变化的冲击,板块波动性会显著加大 [9] - 回顾2025年,AI火热带来算力投资机遇,PCB和CPO板块涨势积累,机构预计2026年AI主线分化将更加明显 [10]
视频大模型概念强势收官,马年AI主线该怎么投
第一财经· 2026-02-13 18:11
文章核心观点 - AI视频大模型技术突破与成本下降引爆资本市场行情,推动影视传媒、半导体设备及算力等板块走强,但部分机构提示板块估值已高,需理性布局并关注商业化落地确定性[1][2][4][5] 行业动态与市场表现 - 马年春节前,字节、阿里、智谱及DeepSeek密集发布旗舰AI模型,行业提前上演“春节档”[1] - 蛇年最后一个交易日,Seedance视频大模型指数板块逆势收涨,掌阅科技、光线传媒涨停[1] - 受益于AI浪潮,存储芯片、半导体设备等板块走强,深科技涨停,北方华创、江波龙等多股跟涨[1] - 港股AI公司MiniMax及智谱双双大涨,市值均突破2000亿港元[1] - 传媒板块反复走强但呈现分化格局,算力板块中曙光数创涨停,首都在线维持涨幅[2] - ETF市场掀起AI主题投资热潮,影视ETF、动漫游戏ETF、传媒类ETF多只产品年内涨幅超20%[2] - 摩根大通指出,中国互联网与人工智能行业正迎来史上最密集的旗舰模型发布浪潮,行业竞争转向将技术转化为消费级爆款[3] 技术进展与成本效益 - 字节跳动Seedance 2.0模型实现四大核心突破:支持多模态混合输入、运动场景生成可用率业界领先、具备导演级运镜控制与高仿真音效同步、单条15秒1080P视频生成成本降至4.5-9元,制作周期从7天压缩至3天[2] - 据国盛证券测算,保守假设下Seedance2.0可降低5%的视频生成成本,中性假设下成本降幅高达37%[2] - 智谱AI上线开源旗舰模型GLM-5,聚焦智能体工程与编程能力强化[3] - MiniMax正式上线新一代文本模型MiniMax M2.5,并于2月13日全球开源支持本地化部署[3] - DeepSeek完成版本更新,将上下文窗口扩展至100万Token,长文本处理能力大幅提升[3] - 华创证券分析,AI视频生成正在从盲盒式娱乐向精准工业化生产跨越,国内大厂视频产品路径开始分化[1] 商业化前景与投资方向 - 随着推理单位成本持续下降,在多步推理、工具调用中消耗更多Token将更具经济性,推动国内AI应用从“对话式工具”向“产品内嵌AI”阶段加速渗透[3] - 华创证券更看好下游内容IP方、内容版权、AI应用工具等细分方向以及对云服务与算力的拉动[1] - 天弘中证中美互联网基金经理胡超预计2026年AI投资的主线是商业化推进,目前主要集中在用户订阅和企业级应用,未来广告、交易抽成、增值服务是重要盈利渠道[6] - 机构建议重点关注算力基础设施、版权合规、内容生产落地等确定性较高的环节[4] - 回顾2025年,AI火热带来PCB和CPO板块涨势,机构预计2026年AI主线分化将更加明显[5] 行业挑战与估值观察 - Seedance 2.0目前仍存在限制,暂不支持上传真人图片作为主体参考,且在细节稳定性、多人口型匹配、文字还原精度等方面仍有优化空间[5] - 部分基金经理指出AI板块存在投资超前、预期过高的问题,部分概念股估值已透支未来一年以上的业绩[4] - 经过前期较大幅度上涨,AI板块整体估值已不再处于低位区间,部分热门概念股的估值包含了对未来多年高速成长的乐观预期[5] - 高估值意味着对业绩兑现的要求更为苛刻,也更容易受到市场情绪、流动性及宏观因素变化的冲击,板块波动性会显著加大[5]
熵基科技:约1.11亿股限售股2月24日解禁
每日经济新闻· 2026-02-11 18:50
公司限售股解禁计划 - 熵基科技计划于2026年2月24日解禁约1.11亿股限售股份 [1] - 此次解禁的股份将上市流通 [1] - 解禁股份数量占公司总股本的比例为47.17% [1] 行业相关技术动态 - 中国视频大模型技术取得进展,被描述为“地表最强” [1] - 该模型具备电影级视频生成能力,例如可生成“男子街头逃亡、剑客山间打斗”等场景 [1] - 技术可实现通过几十个提示字生成15秒视频,并可进行商业交付 [1] - 相关技术进步带动影视行业股票出现上涨 [1]
慧博云通:2月11日召开董事会会议
每日经济新闻· 2026-02-11 17:27
公司公告 - 慧博云通于2026年2月11日晚间发布公告 [1] - 公司第四届第十四次董事会会议于2026年2月11日以通讯会议方式召开 [1] - 会议审议了《关于出售参股公司股权暨关联交易的议案》等文件 [1] 行业动态 - 电影级中国视频大模型被称“地表最强” [1] - 该模型可通过几十个提示字生成15秒视频并可商业交付 [1] - 相关技术进展带动影视股大涨 [1]
衢州东峰:2月11日召开董事会会议
每日经济新闻· 2026-02-11 16:36
公司公告 - 衢州东峰于2026年2月11日晚间发布公告 [1] - 公司第六届第十一次董事会会议于2026年2月11日以通讯表决方式召开 [1] - 会议审议了《关于以集中竞价交易方式回购股份预案的议案》等文件 [1] 行业动态 - 电影级中国视频大模型被称“地表最强” [1] - 该模型可通过几十个提示字生成15秒视频并可商业交付 [1] - 相关技术进展引发影视股大涨 [1]
谈“AI抖音”尚早,Sora 2们会先改变影视行业
虎嗅· 2025-10-04 09:01
Sora 2模型技术突破 - 新视频模型实现更精准的现实世界呈现和更强的可控性,能创造复杂音频并轻松将现实世界元素插入AI生成视频[1] - Sora 2生成内容更具真实感,可连续生成复杂镜头,展示AI理解真实世界并进行模拟的可能性[17] - 模型在人物一致性和细节效果上取得明显进步,从尝鲜向具备实际效果的生产工具过渡[16] AI视频行业竞争格局 - 2024年Sora和可灵开启AI视频赛道竞争,国内出现20多款视频大模型产品,阿里、腾讯、字节参与其中[12] - 海外市场Google、Meta等巨头及Runway、Luma AI、Midjourney等创业公司加入战局[12] - 2025年可灵2.1、Google Veo 3、字节Seedance 1.0 pro等模型在生成效果上各有优势,生数科技Vidu Q2模型强调复杂表情生成能力[16] 商业化落地进展 - 快手可灵AI月度付费流水持续突破1亿元人民币,新上线可灵2.5 Turbo价格降低30%以吸引创作者[19] - 视频大模型商业化更多集中在B端和P端,Sora App面向C端用户目前免费但限制生成10秒360P视频[20] - 2024年9月Vidu完成数亿人民币A轮融资,爱诗科技获阿里巴巴领投6000万美元B轮融资[21] 创作效率提升 - AI"炼丹"效率提升,降低试错成本,从去年Sora发布后40分钟生成结果到如今生成更自然画面[24][26][27] - 参考生视频功能上线满足创作者对一致性和可控性需求,Vidu Q1支持上传七个主题一键直出视频[31][32] - 生成5秒视频从原来只有0.5秒可用到现在可直接生成复杂镜头构成的桥段[29] 影视行业工作流变革 - AI应用减少原画师工作量,空镜画面基本由AI生成,部分短剧比原计划少画三分之一原画[40] - AI跳过传统制作环节,分镜上色后直接生成视频,优化传统拍摄模式中耗时十天的造型设计方案[41][42] - 可灵灵动画布功能支持一站式AI视频全链路创作,Luma AI Ray3被应用在Adobe Firefly中服务好莱坞制片厂[37][38] 低门槛创作工具发展 - Agent能力推动创作思路变化,爱诗科技推出模板化Agent帮助用户撰写提示词,FilmAction用户月活增长相当于过去一年[45][51] - AIpai和FilmAction等产品支持选用不同大模型完成脚本、分镜到视频、配乐全流程,降低普通人创作门槛[47][49] - 专业团队在保证质量前提下人均一天能制作一到两集短剧,但真正AI创作流程比传统影视创作有时更慢[52] 行业未来发展趋势 - AI工具将同时适用于C端、P端和B端用户,带来工具层面普惠,但因需求不同产生不同结果[56] - 技术平权后决胜关键将是内容质量,拥有IP和合规化数字形象变得重要[56] - 一键成片如实现将带来新内容生产体系和行业权力架构,而非人人都有摄像机的作品大爆炸[57]
谈「AI抖音」尚早,Sora 2们会先改变影视行业
创业邦· 2025-10-03 18:33
Sora 2模型的技术突破与行业影响 - Sora 2视频模型实现了对现实世界更精准的呈现,具备更强的可控性,能创造复杂音频,并轻松将现实世界的人和物插入AI生成视频中,完成高难度客串[5] - 模型能力的提升可能加快To B方向的落地,推动整个视频大模型行业的技术更新[6] - Sora 2的发布是2025年的重要节点,展示了AI理解真实世界并在生成视频中进行模拟的可能性,其生成的内容更有真实感,且能连续生成复杂镜头[12] AI视频生成工具的现状与本质 - 当前的Sora App本质是一个工具而非平台,与Higgsfield同类,都是在利用AI提供更高级的滤镜,激发出人们跟风和模仿的冲动[5] - 一旦进行商业化,Sora App的付费用户很可能集中在P端,将生成的内容面向全平台分发,更具工具属性[14] - OpenAI计划在Sora界面中提供故事版功能,让用户能够逐个镜头地生成和调整内容[29] AI对影视行业的变革与商业化进展 - AI给影视行业带来的变化被类比为从胶片到数字的革新,AI短剧《巨蛇怪谈》的创作团队仅3人,上线后获得累计超500万次播放[6] - 影视行业出现了更多追求商业化变现的AI短剧作品,例如珀乐互动联合Vidu创作的AI漫剧《明日周一》在全平台上线后收获了超过1亿观看[15] - 快手公布的数据显示,自今年4月推出2.0模型以来,可灵AI的月度付费流水持续突破1亿元人民币[14] 视频大模型的技术迭代与市场竞争 - 2024年Sora的横空出世开启了AI视频赛道竞争,截至2024年底国内已出现20多款视频大模型产品,阿里、腾讯、字节都参与其中[11] - 2025年视频大模型能力加速进化,人物一致性、细节效果明显进步,从尝鲜向具备实际效果的生产工具过渡[12] - 9月,Vidu和爱诗科技两家国内视频大模型厂商获得融资,Vidu完成由博华资本领投的数亿人民币A轮融资,爱诗科技拿到阿里巴巴领投的6000万美元B轮融资[14] AI视频生成效率的提升与关键因素 - AI“炼丹”效率提升有助于降低试错成本,《明日周一》制作过程中“炼丹”效率在1:1.3~1:1.5,团队期待第二季提升到1:1.1或1:1.2[17] - 视频大模型的基础能力影响生成效果,决定了“炼丹”效率的下限,如今AI生成吃面条或切橙子的视频效果已比之前更加自然[20] - 视频大模型工具生成的一致性和稳定性决定了“炼丹”效率的上限,参考生视频与首尾帧等工具提升了生成可控性[24] 影视行业工作流的创新与优化 - 可灵发布的灵动画布功能支持创作者在画布上添加不同创作节点,一站式实现AI视频的全链路创作和团队协作[27] - AI应用优化了传统影视创作链路,《明日周一》中原画工作量比原计划少画了三分之一,并跳过了部分中间环节[29] - AI技术融入影视行业不仅带来工具和流程变革,更是一种创作思路的牵引,影响视听行业的表达方式[30] 低门槛创作工具与Agent能力的发展 - 爱诗科技、AIpai和好耶科技等团队推出具备Agent能力的产品,旨在降低视频创作门槛,实现一站式生成[33] - FilmAction的Agent能力上线一个月内,用户月活增长相当于过去一年,显示低门槛创作工具的市场需求[36] - 真正AI创作流程有时比传统影视创作流程更慢,因为需要面对不确定性很高的模型算法并建立新的制作体系[39] 行业未来发展趋势与挑战 - AI在影视行业存在两条进化路径:创作者不断加深对AI技术的理解,以及技术继续走向成熟让AI生成内容更丰富[39] - 当技术平权之后,决胜的将是内容质量,拥有IP和合规化数字形象变得格外重要[40] - 一键成片如果实现,将给影视行业带来新的内容生产体系和行业权力架构,但创作冲动的普及仍面临挑战[42]
可灵AI升级模型降价30%,视频大模型会卷入价格战吗?
钛媒体APP· 2025-09-23 22:32
可灵AI模型更新与定价策略 - 可灵AI推出视频生成可灵2.5 Turbo模型 新增文生视频和图生视频功能 [2] - 新模型相比2.1同档位降价近30% 突出性价比优势 [2] - 可灵AI罕见采用降价策略 此前三个版本未重点提及价格调整 [2] 视频大模型行业竞争格局 - 百度率先发起国内视频大模型价格战 蒸汽机2.0版本刊例价降至同类产品70% [2] - 百度声称其技术可将好莱坞百万级特效成本降至百元级别 [2] - 行业定价策略分化 垂直模型公司走高端专业路线 互联网大厂侧重生态赋能 [8] 视频大模型成本与盈利特征 - 视频生成大模型硬件采购和运营成本居大模型领域第一梯队 [3] - 高分辨率视频推理成本极高 多模态生成token消耗远高于文本 [3] - 可灵AI在推理算力层面实现毛利率转正 追加投入对集团利润影响可控 [3] 国内视频大模型定价体系 - 可灵AI会员分四档:黄金66元/月 铂金266元/月 钻石666元/月 黑金1314元/月 [4] - 即梦AI定价三档:基础79元/月 标准239元/月 高级649元/月 [6] - 海螺AI最高端会员月费达1399元 为国内视频大模型最高定价 [3] 互联网大厂战略定位与营收表现 - 可灵AI和即梦AI核心目标非直接盈利 通过低门槛策略反哺短视频平台生态 [8] - 百度采用激进定价旨在快速抢占企业级市场份额 [8] - 可灵AI单季度营收超2.5亿元人民币 是主流大模型中唯一公开披露营收的 [9] 技术进展与应用场景拓展 - 可灵2.5 Turbo在文本响应、动态效果、风格保持等维度大幅提升 [9] - 模型提升视频生成可控性、稳定性和一致性 适用于影视、游戏、广告等专业场景 [9] - 可灵AI亮相釜山国际电影节 与Google、Midjourney共同探讨影视领域应用前景 [9]
国产视频大模型:赋能千行百业,开启AI时代视频创作新篇章!
搜狐财经· 2025-09-07 02:46
大模型技术定位 - 大模型是基于海量数据与强大算力构建的超级神经网络 成为人工智能技术的基础设施[3] - 通过深度学习算法从数据中提取规律 形成具备复杂任务处理能力的智能系统[3] - 衍生出语言处理 科学计算 视频生成等细分方向 其中视频大模型因对时空维度的精准建模能力成为内容产业智能化转型的关键工具[3] 技术突破 - 快手可灵视频生成模型通过算法重构内容生产流程 创作者仅需输入文本描述即可生成符合物理规律的动态画面[3] - 自主研发的流匹配算法与高效模型架构使生成内容在角色运动轨迹 画面时空连贯性等方面达到行业领先水平[3] - 在模拟物体坠落场景时能精准计算重力加速度与空气阻力对运动轨迹的影响 生成接近真实拍摄的效果[3] 商业化应用 - AI视频生成技术已渗透至广告制作 电商营销 短剧生产等多个领域[4] - 采用可灵辅助制作的AIGC短剧制作周期较传统方式缩短67%[4] - 2025年第二季度商业收入突破2.5亿元 其中专业内容创作者贡献占比近七成[4] 市场竞争力 - 在海外创意平台Freepik的模型评测中 用户选择可灵生成视频的数量超过其他所有竞品总和[4] - 中国团队在场景理解与用户体验优化方面展现技术优势[4] 技术挑战与治理 - 视频生成模型面临物理规律模拟偏差 长视频内容一致性等挑战[4] - 需防范深度伪造技术带来的版权纠纷与虚假信息传播风险[4] - 建立覆盖数据采集 模型训练 内容生成全链条的治理机制 通过技术手段与人工审核相结合确保内容符合伦理规范[4] 研发基础与发展前景 - 国内视频大模型研发团队构建包含3000万组时空数据对的训练集 覆盖人物动作 环境交互 光影变化等200余种场景类型[4] - 数据积累优势与算法创新能力推动中国从技术追赶者向规则制定者转变[4] - 随着5G网络普及与算力成本下降 视频大模型有望在三年内实现从专业创作到全民应用的跨越[4]