V3.1
搜索文档
从创作者视角分享AI视频能力
2026-03-04 22:17
行业与公司分析:AI视频生成行业电话会议纪要 一、 行业概况与核心趋势 * **行业定位**:AI视频生成行业,主要应用于短剧、商业广告、普通短视频制作 [1] * **发展阶段**:2026年被视作AI视频爆发元年,行业处于加速期,尚未看到增速边际放缓的迹象 [1][33] * **核心驱动**:模型能力从“创作者迁就模型”转向“模型迁就创作者”,显著降低使用门槛,释放非专业用户生产力 [1][34][35] * **技术平权效应**:技术门槛降低导致参与者增多,加剧行业竞争,压低市场价格 [29][31] * **海内外对比**:海内外模型能力差异不大,国内模型在体验层面(以即梦2.0为代表)甚至略有领先 [37] 二、 市场渗透与商业应用 * **渗透率水平**:AI在短剧制作中渗透率最高,达**60%-70%**;广告行业次之,约**30%-40%**;普通短视频领域渗透率约**30%到40%** [1][28][39] * **商业场景**: * **短剧**:AI短剧热度高,吸引大量传统影视从业者进入 [28] * **商业广告**:行业对AI接受度相对较低,仍存在“必须实拍”的认知惯性 [28] * **普通短视频**:覆盖范围广(虚拟数字人、信息流广告等),AI提升空间大,尚未出现绝对头部企业 [39][40] * **盈利能力**:在影视精品化路线下,通过承接广告、宣传片、定制项目等订单,可以实现盈利 [26] * **商业模式**:对外报价较高,例如接近TVC级别的广告项目报价为**300–800元/秒** [27] 三、 主要AI模型竞争格局与性能对比 * **图像生成模型**:使用频率最高、质量稳定的主要是**nano banana pro**、**即梦**、**Midjourney** [3] * **视频生成模型**:常用模型包括**奇梦**、**可灵**、**海螺**、**微度**、**V3**、**Sora 2**等 [3] * **模型性能对比**: * **即梦2.0 (CDA2.0)**:性价比最高(约**4元/5秒**),易用性最强,“全能参考”能力实现质变,支持主体一致性与运镜领先 [1][5][17] * **可灵**:在商业级稳定性(逐帧不形变)上领先,画质表现好,在商业广告场景综合表现定义为100分,其他模型约为其**70%到80%** [1][9][10] * **V3.1等海外模型**:生成效果较强,但因高溢价(价格贵**50%**)导致渗透受限 [1][6][7] * **Sora 2**:价格低,但稳定性不足,多用于“视频预跑”作为参考工具,不直接用于最终成片 [8] * **海螺**:在人物动作表演力(如打斗)方面更强,但自带风格可能影响画面一致性,价格约**6元多/5秒** [17][25] * **关键能力进展**: * **音画同步**:可灵2.6(2025年12月底上线)、微度Q3(2026年1月中下旬)、即梦2.0相继上线该功能,极大提升效率 [1][4][20] * **“全能参考”**:即梦2.0在参考能力上突出,对输入条件保留更完整,丢失程度更低 [5] * **易用性**:即梦2.0提示词响应能力显著增强,上手难度明显下降,是其破圈关键 [34][35][36] 四、 应用场景与模型选择策略 * **商业广告**: * 对画质、细节稳定性要求极高,需逐帧审查(如每**0.5秒**截取一帧) [10] * 图像生成首选**Banana**生图至**4K+**;视频生成首选**可灵**,核心考虑其高帧数与画质 [3] * **短剧**: * 对人物表现力、音画同步要求高 [4] * 人物对话等关键环节首选**可灵2.6**或**微度Q3**,因其能节省人效并提升成片率 [4] * 非关键片段使用**微度**、**奇梦**、**拍我**等模型 [4] * **普通短视频**: * 更关注画面丰富度、镜头语言与性价比 [3] * 图像生成常用**奇梦**;视频生成组合使用**奇梦**、**微度**、**拍我**、**海螺** [4] 五、 生产流程、成本与效率 * **核心工作流**: * 长视频通过拼接大量**5秒**片段实现,依赖“图生视频”及“首尾帧控制”保障连续性 [19] * 跨模型片段衔接通过AI智能补帧、色彩校正、**Runway**进行4K提升、**Topaz**超分等后期处理实现 [21] * **效率提升**: * 音画同步功能将人力投入压缩至原来的**1/4**,整体效率提升约**70%** [1][20] * 短剧场景因音画同步功能,人力成本压缩**75%**,整体效率提升约**70%** [1] * **成本结构**: * **算力成本**:短剧制作中,预估一分钟算力成本约**1,000元** [29] * **报价变化**:短剧制作报价较2025年已“腰斩”至**5,000-10,000元/分钟** [29] * **成本波动**:客户反复修改是成本波动主因,频繁返工会显著增加算力消耗 [30] * **成功率**:团队视频成功率约**50%**,较早期大幅提升,关键在熟悉模型特性与提示词技巧 [23] 六、 当前技术瓶颈与挑战 * **视频时长**:长视频(**>10秒**)可用性低,一次性生成1-2分钟会出现“鬼畜”,**10秒以内最稳定** [2][19][22] * **输出画质**:当前模型输出画质上限不足,多为**720P**,难以满足商业广告**1080P**以上高清要求,需依赖后期超分 [2][16][22] * **一致性控制**:直接上传真人素材生成视频,可用率低,缺乏画面延续性,仍需回归“图生视频”工作流进行稳定控制 [16] * **“AI感/油腻感”**:部分模型生成的画面带有“油腻感”,影响审美,这与训练素材来源及图像生成质量有关 [12][13][15] * **平台限制**:部分平台(如C站2.0)对人物素材(尤其是接近明星形象)上传有限制,影响人物一致性能力落地 [16] 七、 行业生态与团队发展 * **代表团队**: * 精品内容方向:**严川导演工作室**、“**兴安岭鬼市**”团队 [32] * 产业化量产模式:**“酱油酱油”公司**(团队**1,000多人**)、“**雪宝工作室**”(代表作“后宫萌宝团”) [32] * **核心壁垒**: * **内容能力**:导演、审美、编剧、IP策划等创作端综合素质 [33] * **产业化能力**:低成本、高效率、成熟流程的规模化生产能力 [33] * **团队规模与策略**:典型团队约**20人**,计划扩张但控制在**50人**以内,更多采用与外包团队合作的方式 [39] * **平台政策**:部分平台(如红果、抖音)对优质AI创作者有流量扶持或框架合作倾向,2026年起对AI视频的流量限制有所放开 [41] 八、 其他重要观察 * **价格下行主因**:主要源于参与者增多导致的商业竞争加剧,以及“白嫖”路径对市场的冲击,而非单纯算力成本下降 [31] * **审美评估维度**:核心指标是“AI感/油腻感”,其次是光影、构图等拍摄参数的可控性,不同模型因训练素材差异呈现不同质感 [12][13] * **Token与成本趋势**:随着即梦2.0等模型可用性提升,生成同样时长视频的Token占用量倾向于下降,整体成本有下降趋势 [38]
DeepSeek更新后被吐槽变冷变傻:比20年前的青春伤感文学还让人尴尬!业内人士:这一版本类似于极速版,牺牲质量换速度
每日经济新闻· 2026-02-13 00:42
公司产品更新与性能 - 公司于2月11日对其旗舰模型进行了灰度测试,支持最高1M(百万)Token的上下文长度,相比去年8月发布的V3.1版本支持的128K有大幅提升 [1] - 实测显示,模型可一次性处理超长文本,例如能识别并处理超过24万个token的《简爱》小说文档 [1] - 此次更新版本被部分业内人士解读为“极速版”,推测其可能牺牲了部分质量以换取速度,目的是为2026年2月中旬将发布的V4版本进行最终压力测试 [6] 用户反馈与产品体验变化 - 更新后,部分用户反馈模型交互风格发生显著变化,例如不再称呼用户设定的昵称而统一称为“用户”,且深度思考模式下的角色化心理描写减少 [4] - 有用户认为模型回复变得“冷淡”、“说教”(被形容为“爹味”),或批评其输出内容风格类似“青春伤感文学”,显得尴尬 [4] - 另有用户持正面评价,认为更新后的模型变得更客观、理性,且更关注提问者的心理状态,使其交互“更像人了” [5] 技术架构与研发进展 - 公司在今年初发表的两篇论文中公开了两项创新架构:mHC(流形约束超连接)用于优化深层Transformer信息流动,提升训练稳定性和扩展性;Engram(条件记忆模块)将静态知识与动态计算解耦,旨在显著降低长上下文推理成本 [7] - V系列模型定位为追求极致综合性能的基础模型,从2024年12月的V3到2025年12月的V3.2,公司进行了快速迭代,并推出了专注于高难度数学和学术问题的特殊版本V3.2-Speciale [6] - 据科技媒体爆料,公司计划在2026年2月中旬农历新年期间推出新一代旗舰模型DeepSeek V4,预计将具备更强的代码编写能力 [6]
寒武纪股价暴涨,是期待过大吗?
36氪· 2025-09-03 11:34
中国AI半导体行业动态 - 中国产AI正迈向软件和硬件融合阶段 将大幅减少对美国英伟达和AMD等国外产品的依赖 [2] - 中国新兴AI企业DeepSeek发布新型大语言模型V3.1 其UE8M0 FP8技术针对下一代国产芯片设计 [2] - 上证科创板50成份指数8月22日上涨8.6% 创2022年2月以来新高 [2] 寒武纪市场表现与定位 - 寒武纪股价涨至7月末约2倍水平 [3] - 高盛集团8月24日将寒武纪目标股价从1223元上调至1835元 [3] - 公司总市值超过约6000亿元 在科创板超越中芯国际跃居首位 [3] - 寒武纪预计2025年度营业收入达50-70亿元 为上一年度的4.3-6倍 [3] 技术突破与产业合作 - 中国信通院确认8家企业通过DeepSeek AI模型适配测试 寒武纪与华为等企业进入名单 [2] - DeepSeek的R2开发延迟与英伟达H20供应不稳定相关 [3] - 英伟达CUDA平台仍是中国AI开发主流 成为国产半导体进入市场的主要障碍 [3] 外部环境影响因素 - 特朗普政府要求英伟达向美国政府上缴在中国销售收入的15% [3] - 英伟达面向中国的AI半导体H20相关产品据报道将停产 [3] - 阿里巴巴集团开发自有AI半导体 但对寒武纪股价未产生重大影响 [3] 行业政策背景 - 寒武纪是中国半导体自给率提高政策的关键企业之一 [2][4] - 市场期待明显超前 公司表示股价偏离当前基本面 投资者可能面临巨大风险 [3]
寒武纪股价暴涨,是期待过大吗?
日经中文网· 2025-09-03 10:54
中国AI芯片与软件融合发展 - DeepSeek发布新大语言模型V3 1 其UE8M0 FP8技术针对下一代国产芯片设计 标志中国AI进入软硬件融合阶段[4] - 中国产AI发展将大幅减少对英伟达和AMD等国外产品的依赖 上证科创板50成份指数单日上涨8 6% 创2022年2月以来新高[4] - 寒武纪作为中国半导体自给率关键企业 与华为等8家企业通过DeepSeek AI模型适配测试[4] 寒武纪市场表现与预期 - 高盛将寒武纪目标股价从1223元上调至1835元 公司股价较7月末上涨约100%[5] - 公司预计2025年度营业收入达50-70亿元 为2024年度的4 3-6倍 总市值将超6000亿元 或跃居科创板首位[6] - 寒武纪提示当前股价偏离基本面 投资者面临巨大风险[5] 地缘政治与供应链影响 - 美国建立英伟达向政府上缴在华销售收入15%的机制 并传面向中国的AI芯片H20将停产[5] - H20供应不稳定导致DeepSeek的R2开发延迟 R2训练使用英伟达芯片 推理使用华为芯片[5] - 英伟达CUDA平台仍是中国AI开发主流 但阿里巴巴自研AI芯片显示国产替代趋势加强[6] 行业竞争格局 - 寒武纪被视为"中国版英伟达" 但阿里巴巴自研AI芯片未对其股价产生显著波动[6] - 中国信通院认证8家企业通过DeepSeek模型适配 包括寒武纪和华为[4] - 市场对国产AI非美发展路径期待加强 但预期明显超前于实际进展[2][6]
V3.1适配了国产FP8 精度芯片
小熊跑的快· 2025-08-22 09:12
技术突破 - DeepSeek R1成功源于采用FP8数据格式的细粒度混合精度框架 大部分计算密集型操作在FP8精度下进行 少数关键操作保持原始数据格式 [1] - 国产芯片适配FP8后 效率损失从37%显著改善 降本优势惠及国产卡 [1] 行业趋势 - 国内下一代多家芯片厂商支持原生FP8 大模型基于FP8精度进行工程优化降本 [2] - 国产软硬件协同进步 推动低成本解决方案走向全球市场 [2][3] 竞争格局 - 英伟达GPU此前因CUDA优化及FP16适配占据优势 国产卡需升级至FP16导致效率损失37% [1] - 英伟达计划下放精度至FP4 国内厂商则聚焦FP8原生支持 形成差异化技术路径 [2]