Workflow
即梦
icon
搜索文档
AI 视频生成的战场如何从「模型秀场」转向「工作流」?
机器之心· 2026-04-04 11:03
文章核心观点 - AI视频生成行业的竞争重心已从单纯的模型性能比拼,转向将视频生成能力整合进现有工作流和业务流程 赛道正从“模型秀场”阶段进入“工作流整合”阶段 [1][4] 01 独立视频产品还能代表 AI 视频竞争的整体方向吗? - **竞争重心转移**:AI视频生成能力不再是最终目标,而是厂商与用户希望纳入实际场景、持续释放价值的基础能力 竞争重心开始倾斜 [4] - **发展阶段演变**: - **2025年之前**:竞争主要围绕模型生成能力展开,市场关注文生视频、图生视频、生成时长、一致性和镜头控制等指标 代表性产品包括Runway Gen-2、Pika、Luma Dream Machine、OpenAI Sora、Google Veo、可灵、PixVerse、Vidu、海螺视频、即梦等 [4] - **2025年起**:行业开始更关注视频能力能否接入现有工具和流程 例如Adobe将视频生成纳入Firefly一体化创作应用,Google将Veo放入Vertex AI等产品体系 [4][5] - **进入2026年**:厂商关注点聚焦于模型能力能否承接既有素材并嵌入具体流程 OpenAI宣布Videos API及sora-2、sora-2-pro等模型将于2026年9月24日移除,Sora web/app将于2026年4月26日停止服务 体现了其视频产品入口与接口体系的调整 [5] - **竞争形态变化**:伴随产品迭代,独立App和单次生成效果不再是唯一观察重点 视频生成能力开始更多进入既有工具和流程,形成围绕“产品入口”和“组织方式”的竞争 [5] - **结论**:独立视频产品已不足以作为判断一家公司AI视频布局的唯一依据 视频能力接入了哪些平台、服务于哪些业务流程等因素,正在成为观察厂商竞争力的重要维度 [7] 02 AI 视频生成赛道的竞争正在关注哪些入口? - **入口类型**: - **独立产品**:主要指单独面向用户或开发者的视频入口,如Sora web/app、Videos API [6] - **平台能力**:主要指视频能力被嵌入既有系统之中,如编辑平台、广告营销工具和创作平台 [6] - **行业趋势**:AI视频正在更多进入既有平台和业务流程,不再主要以独立产品形态推进 Adobe、Google、CapCut、阿里等公司的近期动作表明,视频能力开始被纳入原有产品体系,成为既有入口的一部分 [8] - **厂商入口布局对照**: - **字节**:通过即梦AI、CapCut、Seedance 2.0等入口,服务于内容生产与编辑业务链路 [9] - **快手**:通过可灵,服务于内容生产业务链路 [9] - **Adobe**:通过Firefly、Premiere Pro、Adobe Express等入口,服务于创意制作与后期编辑业务链路 [9] - **Canva**:通过Magic Media、Magic Video、Magic Studio等入口,服务于轻量内容生产与营销设计业务链路 [9] - **Google**:通过Demand Gen、Vertex AI等入口,服务于广告与营销业务链路 [9] - **Meta**:通过Ads Manager、Advantage+ creative等入口,服务于广告创意与投放业务链路 [9] - **腾讯**:通过妙思、MKTAPI3.0等入口,服务于广告与营销业务链路 [9] - **Amazon Ads**:通过Creative Studio、Video Generator、Amazon DSP等入口,服务于广告与零售营销业务链路 [9] - **阿里**:通过万相营造、相关AIGC套件等入口,服务于商家经营与电商转化业务链路 [9] - **Runway**:通过Runway、Gen-4 / Gen-4.5、API等入口,服务于创意生产业务链路 [9] - **Luma**:通过Dream Machine、Ray等入口,服务于创意生产业务链路 [9] - **OpenAI**:通过Sora web/app、Sora API、Videos API等入口,服务于通用模型服务业务链路 [9] 03 AI 视频进入真实业务后竞争标准会如何改变? - **新竞争焦点**:当AI视频进入真实业务后,行业竞争标准发生改变 生产效能、品牌控制与授权合规开始成为新的竞争焦点 [3] - **路径分化**:OpenAI与平台型公司的路径分化意味着行业不同参与者选择了不同的整合与商业化策略 [3]
Seedance2.0开放公测
第一财经· 2026-04-03 18:29
Seedance 2.0 公测规则与限制 - 公测仅面向完成企业认证的主体,个人用户暂不纳入申请范围[5] - 默认并发数锁定在10且不支持上调,真人肖像验证与自定义虚拟人像功能暂不开放,仅可使用平台公共虚拟人像库[5] - 企业若想解锁完整能力,需要签署保底合作协议并支付10%预付款[5] 公测背景与解决的问题 - 此次面向企业端开放公测被视为已解决此前导致API延期上线的内容安全、海外版权风险及算力承压等问题[6] - 针对此前用户吐槽的排队时间过长问题,企业现在可直接从火山引擎批量购买模型调动能力,以提升生产效率[6] - 公测开放的核心前提是已构建较领先的版权保护体系,对提示词、生成素材、最终视频成品全链路进行深度优化,并依托豆包VLM视觉理解能力搭建版权IP保护机制[7] 行业影响与市场动态 - 迈入生产级的视频大模型正推动AI短剧、AI漫改等行业进入爆发期[7] - 据DataEye研究院统计,2025年全国漫剧市场规模估计达168亿元,预计2026年将增长至244亿元,增长动因首先是AI驱动供给端产能暴增[7] - 豆包大模型日均Token消耗量从去年底的63万亿涨至120万亿,核心原因包括Seedance 2等模型的推出使视频创作相关Token消耗大幅增长[8] 企业策略与商业化路径 - 快手CEO称有信心在2024年实现可灵收入超过100%的同比增长,并推出会员模型优惠计划[8] - 创业公司群体正密集推动融资动作为AI视频商业化储备弹药[8] - 行业观点认为,创业公司应找到适合的垂直赛道深耕商业化,而非一味投入通用模型能力建设[8] - 商业化无需等待智能水平达到特定阈值,只要在一定能力范围内找到合适入口服务目标人群即可推进,不同赛道对模型能力要求差异显著[9]
刚刚,小云雀的短剧Agent上线了,背后是字节自己的Seedance 2.0。
数字生命卡兹克· 2026-03-19 11:31
核心观点 - 字节跳动旗下产品“小云雀”推出了一款基于Seedance 2.0模型的AI短剧创作Agent,该工具通过自动化剧本生成、角色场景设计、分镜脚本到视频合成的全流程,将AI短剧/漫剧的制作效率提升至“生产力级别”,标志着AI影视工业化在短剧领域取得实质性进展 [2][37][38] 产品功能与性能 - **全流程自动化**:用户仅需提供一个剧本或故事设定,Agent即可自动完成从剧本拆解、角色与场景生成、分镜脚本到最终视频合成的全部工序,无需人工进行参考贴图、提示词编写和剪辑 [2] - **底层模型强大**:产品以“世界第一的AI视频模型”Seedance 2.0为技术基底,具备强大的导演思维和分镜能力 [2][37] - **高效率**:使用该Agent制作一集短剧仅需不到一小时,半天时间即可完成四集高质量短剧,相比手动使用Seedance 2.0模型(一集需两三天)效率实现飞跃式提升 [5][8][9] - **多风格支持**:工具不限制创作风格,能够生成包括真人武侠风、19世纪欧洲风格、国漫3D风格乃至创意改编(如猫猫版迅哥)在内的多种类型视频 [10][11][14][15][17] 用户体验与操作流程 - **两种输入模式**:支持用户直接输入完整剧本,或通过口述故事梗概由AI自动生成剧本 [21] - **标准化创作流程**:操作遵循“点子-剧本-人物-分镜-分场生成”的顺序,交互顺畅,易于掌握 [36] - **可控性与可修改性**:在生成过程中,用户可检查并重新生成单个角色、场景或分场视频,对结果拥有较高的控制权 [29][34] - **快速合成**:所有分场视频生成完毕后,点击“合成全集”按钮,仅需等待两三分钟即可得到一集完整的短剧 [33] 剧本创作方法论 - **人机协同**:高质量剧本创作依赖于“人类的审美标准+AI的执行力”,即由人类提供审美指导和关键输入,AI负责高效执行 [47] - **参考学习法**:通过向AI(如Claude模型)提供优秀剧本作为参考,让其总结创作规律,再根据特定要求(如小说改编)进行剧本写作 [48][49] - **处理长篇内容**:对于长达近两千章的网络小说改编,建议先由人类提炼核心“事件列表”以明确故事主线,再交由AI根据列表、剧本格式和原文进行改编,避免生成无关的“水情节” [51][53][55] - **质量定位**:当前方法生成的AI剧本质量尚无法与资深编剧的作品相比,但这代表了AI影视工业化进程中的一个重要实践阶段 [58] 行业意义与未来展望 - **生产力变革**:该工具实现了“人类只出脑子,让AI来干码字、出分镜、剪辑”的创作模式,极大解放了创作者在前期制作中的生产力 [57] - **技术迭代预期**:预计未来将从Seedance 2.0升级至3.0,Agent能力也将变得更加强大和高效 [58] - **人类创作的不可替代性**:尽管技术高效,但源于真实生活体验的情感、恐惧、愤怒与审美构成了人类艺术创作的核心文脉,这是AI无法替代的部分 [60][61] - **新时代的机遇**:工具降低了视频创作门槛,为创作者在AI视频新时代找到自身定位提供了可能 [61]
AI内容供需旺盛,英伟达发力本地AI创作
21世纪经济报道· 2026-03-13 12:32
公司战略与产品发布 - 公司在GDC上的重点是推动更多用户使用AI制作内容,进一步降低开发门槛,而非游戏显卡 [1] - 公司宣布为AI绘图工具ComfyUI推出更简化的“应用视图”,主要面向不熟悉节点工作流的设计师,用户只需输入提示词、调整参数并点击即可生成AI内容 [1] - 公司引入RTX Video超分辨率技术,并称其显存占用极低,速度比其他主流本地分辨率提升工具快30倍,能极速将视频提升至4K [1][2] - 公司为LTX-2.3、FLUX.2 Klein等模型提供NVFP4和FP8变体支持,以完善本地AI视频生成流程 [1] - 公司试图将原本偏极客化的生成式AI工作流,推向更广泛的初学者和设计师群体 [1] 性能优化与技术进展 - 自去年9月以来,ComfyUI在RTX GPU上的体验性能已提升40% [1] - 在GeForce RTX 50系列GPU上,使用NVFP4数据格式时性能最高可提升2.5倍,并减少60%的显存占用 [1] - 在GeForce RTX 50系列GPU上,使用FP8数据格式的性能最高可提升1.7倍,并减少40%显存占用 [1] - 公司介绍,此前制作4K视频时,创作者通常会先生成低分辨率预览以保证效率,目前处理10秒4K视频通常耗时数分钟 [2] 行业背景与市场动态 - AI生成内容大幅增长,2024年初OpenAI的Sora让“AI生成视频”从概念走入现实,随后字节跳动和快手迅速跟进,推出即梦和可灵 [2] - 2025年,“AI生成视频”迅速爆发,进入规模化增长阶段,至今已经占据内容平台一席之地 [2] - 以AI漫剧为例,这是一种利用生成式AI技术将网络短篇故事IP通过多模态大模型直接转化为动态影像的新型内容形态 [3] - 市场预测显示,2026年中国漫剧市场规模有望突破240亿元,用户规模超过3亿 [3] - 在AI工具链赋能下,传统数月制作周期被压缩至数周甚至更短,成本降幅超过60% [3] - 多家头部平台相继布局AI漫剧业务,推动行业形成独立内容赛道 [3] 公司战略协同与行业影响 - AI生成内容供需旺盛,公司正试图通过软件、模型和工具链协同,降低本地AI创作工具的使用门槛 [3] - 公司将旗下GPU和AI生产流程绑定,以迎合AI生产浪潮 [3] - 目前AI短剧的主流制作已形成一套成熟流程,而这套复杂工作流的背后,几乎全都依赖于公司GPU算力驱动 [3]
这个春节后,中国AI进入千问豆包“双王时代”
格隆汇· 2026-02-17 00:47
2026年春节AI大战总体概览 - 2026年春节成为中国AI产业从技术实验室走向全民生活的关键分水岭,各大科技公司展开百花齐放的春节争夺战 [1] - 阿里与字节跳动凭借差异化战略和现象级表现,在竞争中突围而出,站上塔尖 [1] - 春节AI大战的核心已从“吸引用户”转向“培养习惯”,从“功能展示”升级为“场景落地”,推动了AI技术的全民普及 [5] - 行业意义远超商业竞争,市场看到了中国AI产业两大核心发展方向:以阿里为代表的“消费端落地”和以字节为代表的“生产端革新” [6] - 随着千问DAU强势逼平豆包,中国AI产业正式进入“双王时代”,由阿里和字节双雄引领、多元发展 [6] 阿里巴巴(千问)表现与战略 - **模型技术突破**:除夕开源千问Qwen3.5-Plus,性能媲美Gemini 3 Pro,登顶全球最强开源模型 [1][8] - **模型技术细节**:千问3.5-Plus总参数3970亿,激活仅170亿,性能超越万亿参数的千问3-Max,部署显存占用降低60%,最大推理吞吐量提升至19倍 [9] - **模型性价比**:API价格每百万Token低至0.8元,仅为Gemini3Pro的1/18 [8][10] - **开源影响力**:千问全球下载量突破10亿次,衍生模型超20万个,单月下载量是第2到8名总和 [10] - **应用数据爆发**:春节活动期间,全国超过1.3亿人第一次体验AI购物,AI完成下单超1.3亿笔,用户累计说出50亿次“千问帮我” [1][5] - **用户增长迅猛**:公测不足3个月,DAU达到7352万,逼近豆包的7871万,相当于用3个月走完了豆包3年的增长之路 [8] - **场景落地深化**:千问通过接入阿里生态(淘宝、支付宝、飞猪等),实现“对话即履约”,用户一句话即可完成从方案生成到服务履约的全流程 [11] - **春节活动表现**:AI购买电影票订单环比增长372倍,三四线城市AI订单量暴涨782倍,近一半AI订单来自县城,近400万60岁以上用户体验AI购物 [11] - **生态接入速度**:自2025年11月公测以来,仅用2个月便接入400多项办事能力 [12] - **技术生态协同**:阿里拥有“自研AI芯片(平头哥)+世界级云平台(阿里云)+世界级大模型(通义实验室)”的“通云哥”黄金三角,实现全栈垂直整合 [14] - **战略布局深远**:AI布局早于行业爆发,2017年成立达摩院,2018年启动大模型研发,具备长期战略定力 [14] - **生态独特优势**:阿里拥有覆盖电商、本地生活、支付、物流的国民级实体服务生态,补齐了AI从意图到执行的最后一块拼图 [15] 字节跳动(豆包)表现与战略 - 字节跳动旗下豆包以内容生产为核心,凭借Seedance 2.0、即梦、剪映等产品矩阵降低内容创作门槛 [5] - 豆包日均模型调用量达63万亿Tokens,服务超百万家企业和开发者 [5] - 除夕登上总台春晚送出超10万份科技好礼,将AI创意生产的理念传递给全国观众 [5] - 构建了“模型+流量”的生产端革新模式,让AI成为赋能创作者的“创意代理” [18] 行业影响与未来展望 - 阿里与字节的差异化布局覆盖了用户生活与创作需求,完成了一次普及式的全民AI观念教育 [6] - 千问引爆AI购物后,谷歌快速跟进,在Gemini中加入购物功能,标志着中国AI的应用创新开始反向引领全球 [18] - 阿里“通云哥”全栈能力、开源普及策略及“技术服务于人”的理念,为全球AI产业提供了中国方案 [18] - 未来双雄争霸将推动AI在消费端和生产端的持续突破,促使中国AI产业形成多元发展格局 [19] - 技术创新与实体经济深度融合,模型能力与生态落地双向赋能,将让中国AI产业在全球竞争中占据核心地位 [19]
导演贾樟柯发布Seedance2.0制作的短片 本人“出演” 罗永浩转发:接下来 做一部电影只需要导演一个人了
新浪财经· 2026-02-16 16:47
行业动态 - 国产AI视频生成工具Seedance 2.0于2月12日正式上线,全面接入豆包和即梦产品,并上线火山方舟体验中心[1] - Seedance 2.0自开启内测后,其生成的相关视频在网络端刷屏传播,显示出较高的市场关注度和用户参与度[1] 技术应用与市场反应 - 知名导演贾樟柯使用国产AI工具Seedance 2.0生成了一支名为《贾科长Dance》的短片,亲自“出演”并引发广泛关注[1] - 贾樟柯在个人微博账号发文评价“Seedance 2.0确实厉害,我准备用它做个短片”,随后罗永浩转发该内容并表示“接下来,做一部电影只需要导演一个人了”[1] 行业观点 - 导演贾樟柯就AI与电影的关系发表看法,认为电影自诞生之初就一直在与新技术共处,技术本身(如摄影机)曾令人不安但最终成为日常,关键在于人如何使用技术[1] - 贾樟柯表示不担心技术是否会“取代”电影,并指出其AI短片的深层意义在于引发观众对创作本质的思考[1]
全球用户涌入中国AI视频生成模型 AI“技术平权”加速: 1人剧组时代或将来临
新浪财经· 2026-02-16 09:30
公司动态 - 字节跳动正式上线新一代视频生成模型Seedance2.0,并接入旗下生成式AI创作平台即梦以及豆包App [1] - 该模型发布后凭借逼真的画面效果与简易的创作方式迅速走红 [1] - 用户只需要输入简单的文字、图片或者视频素材,就能生成几秒甚至十几秒的视频 [1] 市场反响与用户反馈 - 在海外社交平台上,美国企业家埃隆·马斯克转发演示并评论称,这一模型"进展太快" [1] - 每天都有很多用户来体验,甚至有很多外国朋友自带翻译软件来学习怎么用 [1] - 一些外国用户在实测后惊叹,该模型能够彻底改变电影制作 [1] - 全球用户涌入中国AI视频生成模型进行体验 [1] 技术能力与特点 - Seedance2.0在训练阶段就用了大量东方美学的素材 [1] - 该模型在镜头语言的控制、复杂的交互呈现上也有非常强的能力 [1] - 与之前的模型相比,Seedance 2.0在连续分镜生成、语音还原、表情演绎、动作控制以及镜头调度等方面都有明显提升 [1] - 过去的AI影视仍需要进行剪辑和配音等后期环节,如今不少流程都可以一次性完成 [1] 行业影响与趋势 - AI视频生成技术的升级正在加速"技术平权" [1] - 业内分析认为,AI视频生成模型的升级将进一步推动AI漫剧、短剧以及互动影视等细分领域加速发展 [1] - 漫剧市场规模有望实现快速增长 [1] - 一人公司、一人剧组慢慢会成为一个潮流 [1] - AI视频生成模型可能使一天做出一个90分钟电影成为可能 [1] 应用案例 - AIGC内容创业者宋东桓已在测试Seedance 2.0,并将它应用于电商短视频制作 [1]
新春走基层 ·见喜|当爸妈用AI送出春节祝福
新浪财经· 2026-02-16 07:23
AI在中文传统文化研究与传播领域的应用现状 - AI工具已深度融入文史工作者的日常工作与生活 父母辈用户已能熟练使用DeepSeek、豆包、元宝、即梦、OpenAI等多种AI软件生成新年祝福等文本内容[3] - AI显著提升了文史研究的工作效率 能够将几万字的资料在几秒钟内整理出头绪[5] - AI生成内容存在引用与版权问题 在吴越国文化宣传中 出现了大段AI生成内容照搬研究者个人专著成果的情况 例如水月观音座像、钱王手植柏等具体内容[5] AI对传统文化内容生产与传播的影响 - AI被视为优秀的编辑工具 其基于严谨历史与逻辑的生成能力 有助于避免研究者因过于专业或受地方视角局限而影响判断[5] - AI正在重塑中文传统文化的传播方式 研究者过去通过博客讲述地方传说故事吸引读者 如今对AI时代传统文化的新传播形态抱有信心[10] - 科技与传统文化生活呈现双向奔赴的融合趋势[10]
抖音副总裁:Seedance2.0暂不支持真人人脸参考
新浪财经· 2026-02-15 18:37
公司产品动态 - 抖音集团副总裁通过微博宣布,其AI视频生成模型“Seedance 2.0”已上线,并邀请用户在“豆包”和“即梦”平台进行体验 [1] - 用户生成数字分身需要进行真人认证,且平台目前不支持使用真人人脸或特定IP形象(如迪士尼、熊出没)作为参考 [1] - 公司团队当前投入最多的任务之一是持续维护和加强反侵权策略,并鼓励用户对发现问题进行反馈 [1] 产品功能与限制 - 视频生成功能允许用户通过描述动作和运镜来创作内容 [5] - 在实际测试中,当用户请求生成涉及“美国队长大战奥特曼”或“熊出没拜年”等特定主题的5秒视频时,平台会因版权限制而拒绝生成对应内容 [6][12] - 在图片生成测试中,当用户请求生成“詹姆斯扣篮”的图片时,同样因版权限制而无法创作 [8] - 上述测试表明,公司AI生成工具对涉及知名IP或可能涉及版权问题的内容有严格的过滤机制 [6][8][12]
抖音副总裁谈Seedance2.0
财联社· 2026-02-15 17:14
Seedance2.0 AI视频生成模型的应用与进展 - 抖音集团旗下AI视频生成模型Seedance2.0将于2026年央视春晚进行深度应用,这将是全球首个公开项目[1] Seedance2.0的产品体验与功能限制 - 模型已在豆包、即梦等平台上线,可供用户体验[1] - 用户需完成真人认证方可使用数字分身生成功能[1] - 平台目前不支持基于真人人脸参考或迪士尼、熊出没等IP形象生成内容[1] 公司的运营与治理重点 - 团队当前投入最多的任务是持续维护和加强反侵权策略[1] - 公司建立了用户反馈渠道,承诺对发现的问题会及时跟进处理[1]