Workflow
Seedance
icon
搜索文档
Google launches Nano Banana 2, updating its viral AI image generator
CNBC· 2026-02-27 00:56
公司动态:Google发布Nano Banana 2 - Google于周四推出了其广受欢迎的人工智能图像生成器Nano Banana的更新版本Nano Banana 2 [2] - 新模型Nano Banana 2在知识、速度、指令遵循和文本渲染方面均有提升,能够从Gemini提取实时信息以实现更准确的渲染 [1] - Nano Banana 2将专注于“快速生成、精确的指令遵循和集成的图像搜索基础”,而Nano Banana Pro将继续用于“需要最高事实准确性的高保真任务” [2] - Nano Banana 2将取代其前代产品,并整合到Gemini的Fast、Thinking和Pro模型中 [2] - 公司在8月推出了第一代Nano Banana并迅速走红,随后在11月基于Gemini 3 Pro推出了Nano Banana Pro [1] 行业趋势:AI生成内容市场蓬勃发展 - AI图像和视频生成器在消费者中人气飙升,用户仅需几个文本提示即可创建日益先进和详细的图形与视频 [3] - OpenAI在2024年推出了视频生成工具Sora,其首席执行官曾表示高使用量“熔断”了其AI处理器 [3] - Adobe也通过其照片和视频生成器Firefly,致力于在其创意工具套件中进一步集成AI [3] 行业挑战:版权与知识产权争议 - 创意公司对生成式AI工具泛滥可能导致的版权侵权问题表示担忧 [4] - 字节跳动因其AI视频制作工具Seedance涉及的知识产权侵权问题,面临来自迪士尼和派拉蒙等主要好莱坞制片公司的强烈反对 [4]
发春节红包的大厂被约谈;百度O计划曝光,文心助手MAU增4倍;影石CEO回应年会送出5套房|AI周报
AI前线· 2026-02-15 13:32
行业监管动态 - 市场监管总局于2月13日约谈阿里巴巴、抖音、百度、腾讯、京东、美团、淘宝闪购等平台企业,要求其严格遵守相关法律法规,杜绝各种形式的“内卷式”竞争,以维护公平竞争市场环境 [3] 百度AI业务进展 - 百度核心技术团队正通宵冲刺绝密“O计划”,旨在完成百度App底层架构的全面AI化升级 [4] - 百度发布春节AI核心数据,其App内的文心助手月活用户同比猛增4倍,AI生图、生视频功能使用量分别暴涨50倍和40倍,AI打电话功能增长近5倍 [6] 影石Insta360公司动态 - 影石Insta360在2026年度年会上送出5套价值百万元以上的大湾区商品房及6辆汽车(包括保时捷、理想L7 Pro、新款BMW 3系、特斯拉Model Y等),中奖率高达80%,获奖者均为90后员工,平均年龄不到32岁 [7] - 公司创始人刘靖康表示,2025年是公司史上营收规模最高的一年,其中第四季度创下近10个季度以来的营收增速新高,且2025年一年的研发投入超过之前三年的总和 [8] 大模型更新与用户反馈 - DeepSeek对其旗舰模型进行灰度测试,将上下文窗口从128K Tokens大幅提升至1M Tokens,但更新后被用户广泛吐槽模型变得“冷淡”且语气“说教”,部分用户呼吁官方调整或选择回退旧版本 [9] - 有业内人士指出,此版本可能是为2月中旬发布的V4版本所做的“极速测试版”(牺牲质量换速度),而下一代旗舰模型预计将是万亿参数级别,因训练规模大幅跃升导致发布进程延后 [10] 科技巨头资本运作 - 谷歌母公司Alphabet于本周在全球美元、英镑和瑞士法郎债券市场合计融资315.1亿美元,其中美元债券发行200亿美元,吸引了超过1000亿美元的认购需求,并在英镑市场发行了100年期“世纪债券” [11] AI版权纠纷 - 华特迪士尼公司向字节跳动发送停止侵权通知函,指控其AI视频生成模型Seedance 2.0在未获授权的情况下,利用迪士尼旗下《星球大战》、漫威等受版权保护的作品进行训练和开发 [12][13] - 此前,迪士尼曾与OpenAI达成全面协议,成为其Sora平台的首个主要内容授权合作伙伴,并进行了10亿美元的股权投资 [14] 大模型能力测试 - 一个简单的“洗车店距离我家50米,应该开车去还是走过去”的问题难倒了包括ChatGPT、DeepSeek、Gemini 3在内的多个AI大模型,各模型给出了不同甚至矛盾的推理,目前部分模型已紧急修复此问题 [15] 大模型定价策略 - 智谱发布新一代旗舰模型GLM-5,并宣布对其海外版Coding plan订阅价格进行结构性调整,价格提高30%-60%,API调用价格提升67%-100%,此为国产大模型近期首次大幅提价 [16][17] 互联网平台业务拓展 - 抖音正式推出官方团购独立App“抖省省”,覆盖甜点饮品、快餐小吃等多个本地生活品类,新用户首周每天可领至多12元优惠券,并与抖音主App账号及订单信息同步 [18] 前沿科技构想与创业 - 马斯克在xAI全员会议上提出在月球建设工厂生产AI卫星的构想,旨在为AI提供远超竞争对手的算力资源,此前他已宣布将xAI与SpaceX合并以推进太空AI数据中心计划 [19] - 斯坦福华裔研究生亨利·翁开发出AI相亲软件Date Drop,该软件通过66道选择题匹配用户,在斯坦福大学已吸引超5000名学生每周参与,并已扩展至哥伦比亚、普林斯顿等十所高校,刚完成210万美元风险融资 [19][20] 机器人行业动态 - 众擎机器人宣布启动全球首个人形机器人自由格斗联赛URKL,赛事冠军将获得一条重10公斤、价值约1000万元人民币的纯金金腰带,旨在通过实战竞技推动机器人核心技术提升 [21] 大模型与AI产品发布 - OpenAI与Cerebras合作发布GPT-5.3-Codex-Spark模型,主打实时编程,推理速度超1000 tokens/s,旨在与谷歌、Anthropic等在AI编程助手市场竞争 [22][23] - 字节跳动图像生成模型Seedream 5.0正式上线,在剪映、CapCut等应用可用,并限时免费体验,新模型在提示词理解、图像细节和编辑功能上有所增强 [24] - 腾讯混元基于2Bit端侧量化方案推出HY-1.8B-2Bit模型,等效参数量仅0.3B,内存占用仅600MB,在端侧设备上生成速度比原始精度模型提升2-3倍 [25] - 阿里巴巴发布图像生成及编辑模型Qwen-Image-2.0,在AI Arena文生图评测中获1029分,支持1K token文本输入和2K分辨率,拥有强大的中文汉字渲染能力 [26][27] - 阿里巴巴达摩院开源具身智能大脑基础模型RynnBrain,首次让机器人拥有时空记忆和空间推理能力,在16项具身开源评测中刷新纪录 [28] 开发工具与基础设施 - 摩尔线程开源TileLang-MUSA项目,实现对TileLang编程语言的完整支持,使用其开发大语言模型关键算子时,相较手写MUSA C++代码可减少约90%代码量,在矩阵运算场景下性能可达手工优化版本的95% [29][30] AI智能体与生态集成 - 美团发布原生“深度研究”Agent LongCat,基于三层智能体闭环架构,旨在缓解AI解决真实物理世界问题时的幻觉痛点 [30] - 网易有道推出桌面级全场景个人助理Agent“LobsterAI”,支持移动端与PC端连接,已在官网开放内测 [33] - GitHub宣布OpenAI的GPT-5.3-Codex模型已正式在GitHub Copilot中开始推送,新模型在复杂工作流的推理和执行能力上有明显提升 [33] - 谷歌正在其搜索引擎和Gemini聊天机器人的AI答案中测试“Direct Offers”功能,允许用户直接购买Etsy和Wayfair等零售商的商品 [33]
影视ETF(516620)收涨超9%,盘中10cm涨停,AI赋能及春节档催化影视板块表现
每日经济新闻· 2026-02-14 23:59
影视板块近期行情表现 - 2026年2月10日,影视ETF(516620)收涨超9%,盘中触及10%涨停,行情由AI赋能及春节档预期共同催化 [1] - 板块此前已连续多日录得资金净申购,市场热度提前升温 [1] - 2026年春节假期延长至9天,有效放映天数创历史新高,为行情提供了直接催化剂 [1] - 已有《飞驰人生3》等多部重磅影片定档,形成“超长假期+优质供给”的双重驱动 [1] 行业基本面与长期驱动因素 - 2025年全年国内电影票房达518.32亿元,同比增长约22%,已恢复至历史高位的八成以上,显示供需两端扎实复苏 [1] - 2026年开年票房迅速突破20亿元大关,显示出线下娱乐消费的强劲韧性 [1] - 行业长期处于“政策拐点+供需回暖+技术变革”的三重共振期 [1] - AI技术(如Sora、Seedance等视频生成模型)正加速渗透至剧本创作、特效制作等全环节,有望大幅降低制作成本并通过“产能革命”提升头部公司盈利弹性 [1] 相关投资标的与估值 - 影视ETF(516620)紧密跟踪中证影视指数,覆盖视频、直播、游戏、电影等符合新技术和新消费趋势的上市公司 [2] - 指数成分股包括光线传媒、万达电影等传统院线龙头,以及芒果超媒等新媒体巨头,能全面反映影视内容制作及传播行业的整体表现 [2] - 当前影视板块估值仍处于相对合理的历史区间 [2] - 叠加春节档票房预期兑现及AI应用落地的长逻辑,板块被认为具备较好的配置性价比 [2]
AI视频行业深度报告:技术跃迁驱动内容革命,把握产业变革新机遇
中邮证券· 2026-02-14 18:32
报告行业投资评级 - 传媒行业评级:强大于市(维持)[2] 报告核心观点 - 技术跃迁驱动内容革命,AI视频生成正从GAN走向DiT架构,是通往AGI的重要路径,其突破将对AIGC产业应用前景起到重要作用[3] - 短视频生成质量已接近专业水准,但长视频生成在物理合理性与时长上仍存瓶颈,业界关注的世界模型可能成为解决上述瓶颈、带来新技术变革的关键路径[3] - 全球AI视频生成市场正加速扩张,商业化在C端(订阅模式)与B端(API模式)双路并进,随着模型能力与工具链完善,2026年有望成为AI影视级项目商业化的关键元年[3] - AI视频是传媒行业的核心应用场景,广告、影视、游戏等领域均有望受益,并已涌现出具备自研算法、海量内容、AI营销及游戏资产生产能力的核心受益上市公司[4] 根据目录的总结 1. 视频生成的前世今生:从GAN走向DiT,通往AGI的重要路径 - **视频生成决定AIGC技术上限**:视频融合文本、图像、音频等多模态信息并引入时间维度,需处理空间、时间、因果与交互等高维结构,其复杂性要求模型具备对真实世界的综合理解与推演能力,是当前行业技术短板[7] - **技术路径演进形成共识**:AI视频生成技术自2010年代中后期起步,经历了GAN、Transformer、Diffusion Model等多个架构尝试。2024年OpenAI发布的Sora验证了DiT(Diffusion+Transformer)架构的可行性与效果,推动主流厂商全面向DiT路径演进,产业进入高速发展期[3][9] - **DiT架构成为主导路线**:DiT融合了扩散模型的生成稳定性与Transformer的长程依赖建模能力,遵循Scaling Law,使生成能力可随参数规模、数据体量与训练算力提升而持续增强。Sora发布后,字节、Google、腾讯等主流厂商模型均已向DiT架构收敛[25][29][30] 2. 技术进展:短视频生成已近专业水准,长视频或迎重要变革节点 - **美学质量接近专业水准**:当前主流模型已支持1080p及以上分辨率(部分达4K),帧率多为24-30fps。以Sora 2为例,其在高真实性、多风格表达、复杂人物主体及多镜头连续叙事方面表现成熟,短片段生成能力已基本满足影视与商业内容制作需求[34][36] - **多模态向“音画一体”演进**:AI视频音效生成分为一体化生成和后期分离生成两类路径。Google Veo 3是首个实现商业化落地的音视同步生成模型,在发布后两个月内累计生成视频超过7,000万条。在其示范效应下,主流厂商发布节奏密集,技术路径趋于收敛[41][46][47] - **物理能力与生成长时是主要瓶颈**:提升物理能力主要有“隐式物理学习”(迭代快但稳定性有限)和“显式物理约束”(物理正确性高但成本与自由度受限)两种路径[50][57]。目前主流视频模型的单次原生生成时长普遍在5-20秒,长视频生成受模型上下文记忆力有限及误差累积两大技术限制[61][62] - **世界模型或为长视频带来新变量**:世界模型旨在构建可长期维持状态并遵循物理规律的虚拟世界,正对应视频生成在长时一致性与物理可信度上的短板。2025年后,产业研究重心向“生成派”倾斜,如Google的Genie 3已能实时生成维持数分钟画面一致性的动态世界。世界模型在关键性能上迭代更快,可能成为视频生成的另一条主流演进路径[3][72][82][90] 3. 商业化进展:C+B端双路并进,影视级项目有望迎来商业元年 - **市场规模与增长**:全球AI视频生成市场正加速扩张,预计2026年市场规模将达2.96亿美元,同比增长35.16%[3] - **C端以订阅模式为主**:用户量是现阶段主要评判标准,Sora体量断档领先。行业正探索新商业模式,如OpenAI推出社交化视频创作平台Sora app,未来有望向广告、电商等路径拓展[3] - **B端以API模式为主**:核心在电商展示、广告等领域应用已基本成熟,“质量+效率+成本”是核心评价维度,可灵、海螺、Vidu等部分国产模型已实现行业领先。目前API模式主要应用于素材级生成[3] - **影视级项目商业化起步**:部分海外厂商已开始试水影视级AI解决方案并实现商业验证。例如,Utopai通过《Cortés》《Project Space》等项目累计实现收入约1.1亿美元。随着模型能力演进与工具链完善,2026年有望成为AI影视制作商业化的关键起点[3] 4. 传媒:AI视频核心应用场景,广告、影视、游戏均有望受益 - **广告:视频素材占比高,AI渗透潜力大**:2025年上半年全网移动广告中,视频类素材投放占比已超过65%,其中竖屏视频占比高达54.8%,契合现阶段视频生成模型能力边界。目前AI在广告内容生成中,视频创作渗透率(19%)明显低于内容草拟(70%)和文案创作(59%),具备后发增长潜力。AI视频工具有望使营销服务商转型为全链路合作伙伴[4] - **影视:AI漫剧与短剧率先实现商业闭环**:AI漫剧与视频生成契合度最高,已率先实现商业闭环。拟真人短剧方面,2025年1月抖音TOP5000短剧中仅4部为全AI生成,10月、11月分别增长至69部与217部,内容接受度快速提升。长剧与电影层面,CG特效等高价值环节有望成为首批替代场景,中小型影视团队或更可能率先受益[4] - **游戏:技术同源,应用持续深化**:视频生成与3D生成的底层技术路径一致。当前3D生成在游戏建模领域已初步实现静态资产的自动化生产,例如腾讯内部数十款游戏(如《元梦之星》)已接入混元3D能力。后续世界模型等新技术落地有望进一步带动动态资产生成与应用,视频生成与交互融合亦可能催生具备实时互动能力的新游戏品类[4] 5. 核心受益上市公司 - **具备自研算法与模型能力的技术型公司**:昆仑万维[4] - **拥有海量内容资产与版权资源的影视内容提供商**:中文在线、捷成股份、华策影视[4] - **积极布局AI营销、具备内容分发的整合型平台公司**:易点天下[4] - **推动AI生成能力嵌入游戏资产生产流程的大型游戏公司**:完美世界、巨人网络[4]
视频大模型概念强势收官,马年AI主线该怎么投
第一财经· 2026-02-13 18:11
文章核心观点 - AI视频大模型技术突破与成本下降引爆资本市场行情,推动影视传媒、半导体设备及算力等板块走强,但部分机构提示板块估值已高,需理性布局并关注商业化落地确定性[1][2][4][5] 行业动态与市场表现 - 马年春节前,字节、阿里、智谱及DeepSeek密集发布旗舰AI模型,行业提前上演“春节档”[1] - 蛇年最后一个交易日,Seedance视频大模型指数板块逆势收涨,掌阅科技、光线传媒涨停[1] - 受益于AI浪潮,存储芯片、半导体设备等板块走强,深科技涨停,北方华创、江波龙等多股跟涨[1] - 港股AI公司MiniMax及智谱双双大涨,市值均突破2000亿港元[1] - 传媒板块反复走强但呈现分化格局,算力板块中曙光数创涨停,首都在线维持涨幅[2] - ETF市场掀起AI主题投资热潮,影视ETF、动漫游戏ETF、传媒类ETF多只产品年内涨幅超20%[2] - 摩根大通指出,中国互联网与人工智能行业正迎来史上最密集的旗舰模型发布浪潮,行业竞争转向将技术转化为消费级爆款[3] 技术进展与成本效益 - 字节跳动Seedance 2.0模型实现四大核心突破:支持多模态混合输入、运动场景生成可用率业界领先、具备导演级运镜控制与高仿真音效同步、单条15秒1080P视频生成成本降至4.5-9元,制作周期从7天压缩至3天[2] - 据国盛证券测算,保守假设下Seedance2.0可降低5%的视频生成成本,中性假设下成本降幅高达37%[2] - 智谱AI上线开源旗舰模型GLM-5,聚焦智能体工程与编程能力强化[3] - MiniMax正式上线新一代文本模型MiniMax M2.5,并于2月13日全球开源支持本地化部署[3] - DeepSeek完成版本更新,将上下文窗口扩展至100万Token,长文本处理能力大幅提升[3] - 华创证券分析,AI视频生成正在从盲盒式娱乐向精准工业化生产跨越,国内大厂视频产品路径开始分化[1] 商业化前景与投资方向 - 随着推理单位成本持续下降,在多步推理、工具调用中消耗更多Token将更具经济性,推动国内AI应用从“对话式工具”向“产品内嵌AI”阶段加速渗透[3] - 华创证券更看好下游内容IP方、内容版权、AI应用工具等细分方向以及对云服务与算力的拉动[1] - 天弘中证中美互联网基金经理胡超预计2026年AI投资的主线是商业化推进,目前主要集中在用户订阅和企业级应用,未来广告、交易抽成、增值服务是重要盈利渠道[6] - 机构建议重点关注算力基础设施、版权合规、内容生产落地等确定性较高的环节[4] - 回顾2025年,AI火热带来PCB和CPO板块涨势,机构预计2026年AI主线分化将更加明显[5] 行业挑战与估值观察 - Seedance 2.0目前仍存在限制,暂不支持上传真人图片作为主体参考,且在细节稳定性、多人口型匹配、文字还原精度等方面仍有优化空间[5] - 部分基金经理指出AI板块存在投资超前、预期过高的问题,部分概念股估值已透支未来一年以上的业绩[4] - 经过前期较大幅度上涨,AI板块整体估值已不再处于低位区间,部分热门概念股的估值包含了对未来多年高速成长的乐观预期[5] - 高估值意味着对业绩兑现的要求更为苛刻,也更容易受到市场情绪、流动性及宏观因素变化的冲击,板块波动性会显著加大[5]
晚点独家丨吴永辉接管字节 Seed 这一年
晚点LatePost· 2026-02-09 16:01
Seed部门新任领导吴永辉的背景与使命 - 吴永辉于2025年初接管字节跳动大模型研究部门Seed,当时部门情况是:上千人团队投入上百亿元追赶两年,研发出的基础模型虽进入中国第一梯队,但迅速被规模更小(仅上百人)、资源更少的团队超越,部门负责人承认失误,公司CEO在全员会点名批评[2] - 吴永辉背负明确使命:将模型能力做到国内第一,并与国际领先模型公司竞争[2] - 吴永辉拥有深厚技术背景:2008年博士毕业后加入Google,前7年从事核心搜索排名工程,后转至Google Brain从事AI应用研究,2023年成为Google DeepMind研究副总裁,参与Gemini大模型研发[5] - 其管理风格被描述为“沉稳”,上任后密集与100多位核心研究员进行一对一沟通,并提拔了数位模型架构方向的研究员[3] 吴永辉接管Seed后的核心工作与组织调整 - 吴永辉聚焦两件核心事务:一是提升基础模型能力与研究效率以保证交付;二是营造研究导向的氛围,目标是“做第一流的研究,打造第一流的AI研究团队”[3] - 2025年1月,组建名为“Seed Edge”的虚拟团队,设置3年考核期,鼓励骨干研究更基础、更长期的AGI(通用人工智能)课题[6] - 随后抽调人员组建“Focus”团队,打破部门边界,负责基础模型的攻坚,研发下一代模型需要提升的部分;剩余基础模型团队划为“Base”团队,负责工程、数据、测评及当前一代模型研发[6] - 调整后,可以同时推进三代模型研发,人员与课题可相互轮换,实现资源盘活:Edge团队的成果可下放,Focus团队发现的长期课题可转入Edge,其成果可用于改进当前模型[6] - 推动内部数据与代码库透明化以提高效率,但对外保密[6] - Seed部门整体规模维持在约1500人,扩张速度较前两年放缓,几乎不再从外部招聘中高层技术管理者,更重视招聘应届毕业生和提拔年轻人[9] Seed部门的主要研发成果与进展 - 吴永辉接管一年来最核心的产出是即将发布的豆包2.0模型,这是一款类似Gemini的多模态模型,参数规模达10000亿(1万亿),是Seed成立以来训练的最大模型[17] - 在基础语言模型方向,Seed迭代了4版模型(包括豆包2.0),能力有较大提升,持续追赶海外领先模型,但承认仍需补课,填补过去几年留下的“技术债”[5] - 在多模态生成方向,Seed的文生图(Seedream)、文生视频(Seedance)模型在一些基准测试榜单上排在全球前列,豆包手机助手模型成为行业关注焦点[5][8] - 吴永辉加入后的三个月内,Seed团队发布的论文数量就超过了2024年全年,激发了研究者的自驱力[21] 研发过程中面临的挑战与应对 - 训练豆包2.0期间遇到基础设施(Infra)层面的重大挑战,由于过去两年持续追赶相对忽视了基础能力建设,扩大参数规模时系统不稳定,一度难以推进[18] - Seed的Infra团队有数百人,同时支撑内部数十款模型的研发,高层认为其水平国内第一,但重整难度大,需要投入大量人力物力并承担信任成本,最终采取“边开车边修轮子”的方式[19] - 为解决豆包2.0训练问题,多个团队配合,花费3个月时间,主要从模型架构、训练数据等方面入手,确保模型赶在春节前上线[19] - 公司内部存在资源分配矛盾:一方面鼓励创新和长期研究(可能只有20%的资源用于短期有用课题),另一方面又需要为应对竞争(如腾讯、阿里)提供短期“弹药”,资源不可避免向短期有成果的团队倾斜[21][22] Seed部门的文化与管理难题 - 吴永辉的目标是将Seed打造成一流的研究品牌,融合初创企业的专注活力与学术界的自由思维[20] - 公司为Seed提供了宽松环境:设置更宽松的考核机制(大部分取消OKR),2025年中发放独立于公司期权之外的“豆包虚拟股”激励员工,并多次提高薪酬[20] - 营造了宽松的工作与研究氛围,实习生能与最高层直接交流,甚至允许研究员自发研究方向,在得到上级认可后从上到下推进[20][21] - 但面临核心管理难题:创新需要适当的灰度和混乱,而应对竞争需要秩序和纪律,如何平衡长期一流研究目标与短期产出压力是持续挑战[1][22][23] - 从2023年三季度开始,公司管理层对Seed团队发论文提出了“高质量”、“内容与正迭代的核心技术无关”等新要求,之后每月发布的论文数量有所减少[22]
AI视频的“1毛钱战争”与“万亿生意”
创业邦· 2026-01-30 14:07
AI视频行业概览与竞争格局 - AI视频技术正以“周”为单位快速迭代,海外如PixVerse、Runway与国内公司如字节即梦AI、快手可灵AI均在激烈竞争,模型份额月初与月底可能发生显著变化[5][7][9] - 行业竞争激烈源于退一步面临“流量危机”,进一步则是“万亿蓝海”,AI视频有望带来更沉浸体验并已开始抢夺用户注意力,未来可能蔓延至漫剧、游戏及电影等领域[9] - AI视频不仅是技术进步,更是个性体验、内容生产和商业效率的“三重革命”,对字节、快手等视频平台而言是一场不得不参与的竞争[11] 字节(即梦AI)与快手(可灵AI)的技术与产品路径对比 - 技术路线差异显著:字节即梦基于多模态基础大模型Seedance,优化模型以实现参数知识共享并降低维护成本;快手可灵则聚焦打磨视频模型基座,通过产品交互创新提升生成可控性[16][17][20] - 产品策略与目标不同:即梦旨在“突破产品技术上限”并定义下一代超级入口,其探索方向是结合AI技术解锁全新场景与产品形态;可灵则走“产品创新驱动”的务实路线,聚焦服务专业创作者(P端)和企业客户(B端),对大众市场(C端)保持探索[22] - 资源投入悬殊:2025年字节在算力、芯片等方面的资本投入达1500亿元,断层领先行业;内部采用“饱和式”投入与“内部赛马”机制,即梦2025年获得的算力资源同比增加300%[23][25] - 生成效果与成本存在权衡:可灵2.6 Pro生成视频画面细节更丰富但排队时间超30分钟,每分钟生成成本为4.2美元;即梦生成速度更快(1分钟内)且成本更低,其Seedance 1.5 pro模型API定价为每分钟1.56美元[13][15][29] - 用户增长呈现不同态势:可灵凭借务实策略在发布一年内用户总量从600万飞升至4500万;即梦则凭借低价格和高效率,截至去年9月月活用户达到2037万,是可灵的13倍[27][28] AI视频行业的商业化现状与挑战 - 当前AI视频生成可能并非一门好生意,存在用户留存率低与创作门槛高的问题,例如Sora的30天用户留存率仅1%,且高达90%的生成视频为不可用的“废片”[33][35] - 商业化表现分化:专注大众市场的产品如即梦AI和Minimax的海螺AI年化营收均未破亿;而聚焦专业创作者的可灵累计收入已达7亿元,预计全年收入10亿,其中近70%营收由P端订阅会员贡献,B端客户规模超2万家[37][39] - 成本效益显著:AI视频能将传统视频制作时间从平均7小时缩短至45分钟,制作成本节省一半,这使其成为对专业创作者有吸引力的生产力工具[39] 字节与快手的长期战略与市场展望 - 字节即梦采取放眼长期增长的战略,认为视频是更理想的AI产品形态,内部判断“长期看,即梦的价值空间可能是剪映的十倍”,参照剪映2024年近百亿收入,即梦瞄准千亿级市场[41] - 为培育大众市场,即梦在产品设计、流量扶持和价格上积极布局:通过短视频交互推荐内容、利用抖音生态导流(2025Q1该路径贡献37%新用户)、并设定极具竞争力的低价,单条视频生成最低仅0.1-0.19元[42][44] - 快手可灵则专注即时收益,采取“先落袋为安”的务实策略,但其也面临挑战,创作者可能组合使用多家厂商的专精模型,导致用户被分流[46][47] - 行业未来形态未定,但科技正加速发展,无论是快手的“务实当下”还是字节的“豪赌未来”,都在等待市场验证[48][50]
AI应用的三个真相:革命未至,真金浮现
36氪· 2026-01-15 21:47
文章核心观点 - 2025年AI应用正从泡沫破裂低谷期迈向稳步爬升期,进入价值实现与规模起量阶段,但尚未催生决定性新物种 [1] - 消费端应用感知度更高,但企业端付费意愿更强、市场潜力巨大,两者正以不同商业逻辑并行发展,整体市场规模尚未有定论 [1][2][3][4] - 新的用户入口正在酝酿,2026年或将成为AI在多市场实现规模收益的第一年,多个热门赛道有望爆发 [1][6][7] - 中美AI落地路径呈现差异,美国已深入支柱产业,中国需加速AI在制造、新能源等核心产业落地以转化为生产力与竞争优势 [1][11][12] 消费端与企业端应用现状与对比 - **消费端应用特点**:高度贴近手机场景,天然适配对话与生成式交互,大众感知明显 [2] - **消费端主要赛道**:集中在AI助手App、AIGC生成工具、手机厂商智能助手、AI教育辅导四类 [2] - **消费端市场数据**:2025年12月周活跃用户前五为字节豆包(1.55亿)、DeepSeek(8156万)、腾讯元宝(2084万)、蚂蚁阿福(1025万)、阿里千问(872万)[2] - **消费端商业化**:AI教育辅导付费率达25%~30%,率先实现付费闭环 [2] - **手机智能助手市场**:被低估,OPPO小布2025年8月月活达1.7亿,浪潮信息称其算力消耗长期位居前列 [2] - **企业端应用范围**:已在汽车、金融、农业、医药等多个行业铺开,各行业均在拥抱AI [3] - **企业端高潜力领域**:AIGC、AI硬件、AI短剧、AI Agent处于爆发前夜,AIGC流程跑通后对模型与算力的消耗将是指数级大爆发 [3] - **企业端应用规模争议**:一方认为消费端AI助手、文生视频占据最大市场(如豆包每天消耗50万亿tokens)[3],另一方认为企业级市场(如AI编程、标书审查、科研文献整理)调用量巨大,空间不低于消费端 [4] - **企业端付费优势**:企业级付费意愿和商业化空间更高,同样的token消耗价值高于消费端 [4] - **市场规模衡量挑战**:当前以Token为使用量指标存在结构性偏差,大量企业私有化部署、端侧推理、开源模型应用等产生的Token未进入公有云API统计体系 [4][5] - **隐形企业级市场**:2025年数据中心与智算中心亿元级公开招投标项目已超过222个,大量算力建设与AI应用在公开tokens统计之外 [5] 2026年热门赛道与产业拐点 - **发展速度**:AI落地速度明显快于以往技术周期,从提出到产业化被压缩至2-3年 [6] - **产业阶段判断**:AI尚未完成“革命”,但2026年或将成为形成规模收益的第一年 [1][6][7] - **文生视频赛道**:自谷歌推出Veo 2后,开始具备商业化可能,呈现多强竞争格局,紧盯快消、美妆、3C电子等市场,广告自动化生成已开始起量 [7] - **AI手机赛道**:字节与中兴联合推出GUI Agent手机激起行业研发,各厂商路径不一(GUI路线与MCP/A2A路线并存),后续竞争有看点 [7] - **具身智能/人形机器人赛道**:2025年全球出货量约1.3万台,前十厂商中六家来自中国,Omdia预测2035年出货量将达260万台 [8] - **具身智能技术主线**:一看“大脑”(新型模型架构或于2026年下半年突破),二看灵巧手(仿生手研发复杂度远超外界想象)[8] - **B端行业深化应用**:预测性维护等智能体产品已从头部向中腰部客户复制,客户ROI评估转向要求AI完成过去做不到的事 [10] - **高价值智能体特征**:复杂度高,能自动编排二三十步任务,实现端到端业务流程闭环与自适应调整,为企业创造巨大价值 [10] 中美AI落地路径差异与中国核心产业机遇 - **中美调用结构差异**:中国公有云MaaS主要调用来自手机与互联网应用,美国最大调用方是SaaS企业(如SAP是OpenAI全球前五大客户)[11] - **美国应用领域**:已将AI用于科研、生物医药、金融等支柱产业,AI Coding是第二大调用来源,以Claude模型为例,其2025年收入已接近百亿美元 [11][12] - **中国核心落地产业**:需加速将AI落地于制造、电子电气、新能源、农业、互联网等自身核心支柱产业,以转化为效率、社会价值与GDP增量 [1][12] - **“AI+制造”的战略地位**:被视为关键战场,关乎全球制造业竞争格局与产业话语权,对中国是“必选题” [12] - **中国制造业AI挑战**:与欧美头部企业存在应用差距,制造业数字化水平参差不齐,需补“数据债、信息债、自动化债、工业软件债”,落地挑战高于金融、互联网 [14] - **工业AI实施复杂性**:需融合多模态模型、机理模型甚至世界模型,并依赖生态协同,是一场长期工程 [14] - **政策支持**:2025年国务院发布《关于深入实施“人工智能+”行动的意见》,国资委上线人工智能“焕新社区”平台,推动AI与支柱产业结合 [14] - **技术迭代预期**:未来两个月内全球大模型将迎来迭代高潮,市场期待在多模态、Coding模型、世界模型等方向突破,从而再次拉动应用层爆发 [15]
火山引擎总裁谭待:大模型市场不是零和博弈,明年市场可能还要再涨十倍
新浪财经· 2025-12-18 15:30
豆包大模型年度表现评估 - 火山引擎总裁谭待表示豆包大模型整体成绩肯定还可以 在国内肯定还是很明显 [2][4] - 但对比全球领先模型如OpenAI和Gemini 公司认为仍需更加努力 [2][4] - 公司旗下Seedance和Seedream模型在全球的表现也不错 [2][4] 对大模型市场竞争格局的看法 - 公司认为2026年大模型市场最重要的不是竞争 而是把市场做大 [2][4] - 公司预期明年市场可能还要再涨十倍 届时关注的将是增量而非存量市场的零和博弈 [2][4]
中国互联网行业_专家-视频生成式人工智能
2025-11-24 09:46
**涉及的公司和行业** * 行业:中国互联网行业,重点关注视频生成式AI领域[2] * 公司:快手(Kuaishou Technology)及其视频生成AI模型Kling,同时提及字节跳动(Bytedance)的Seedance、OpenAI的Sora 2、Google的Veo3等竞争对手[2] **核心观点和论据** **1 快手Kling在视频生成AI领域的技术领先地位** * 专家根据内部测试结果对视频生成AI性能排名为:快手Kling > Sora 2 > Veo3 > 字节跳动Seedance[2] * Kling的优势在于更强的提示学习能力、相对更长的视频生成时长以及对细节更精确的控制[2] * 专家预计Kling的领导地位在短期内可持续,得益于快手公司层面对视频生成AI的全力投入,集中了计算和训练资源以及顶尖的工程、多模态和算法人才[2] * 其他顶级玩家(如字节跳动、Google、OpenAI)在视频生成AI上的投入程度不如快手[2] * 技术上,Kling受益于快手“设备优先、边缘辅助、云端增强”的混合架构,该架构允许80%的生成工作负载在设备上运行,显著降低了成本和延迟[2] * 其自研的深度学习引擎针对中低端硬件高度优化,使其拥有独特的大规模可触达用户群[2] * 结合快速、用户驱动的模型微调和实用功能,快手在技术性能、更快迭代周期、更好成本效益和更强商业吸引力方面表现突出,使Kling在国内市场确立了领导地位[2] * 专家还指出Kling与字节跳动Seedance在目标用户上的差异:Kling更侧重于面向消费者的专业用户,而Seedance则通过订阅和私有部署模式瞄准面向企业的变现[2] **2 视频生成AI运营商当前的单位经济效益与未来改善路径** * 专家指出,考虑到研发和训练成本,视频生成AI运营商目前的单位经济效益仍然较低,甚至为负[3] * 现阶段,大多数运营商优先考虑市场份额和模型性能,而非投资回报率和盈利能力,专家预计视频AI模型定价在不久的将来会继续下降[3] * 改善单位经济效益的关键因素包括:1)通过结合进口和更便宜的国产GPU构建更异构的计算平台来降低计算成本;2)模型训练和推理效率的创新[3] **3 视频生成AI当前阶段的主要应用场景** * 专家强调视频生成AI技术可应用于广告和电子商务领域[4] * 企业客户将视频生成用于电子商务内容、数字人生产、客户服务场景、全息投影、动画/电影/电视剧制作、专业摄影和动作捕捉工作流程等[4] * 从传统的拍摄-编辑-制作-发布工作流程转向AIGC辅助的流程,可将整体生产效率提升60%以上[4] * 在数字人和电子商务直播中,数字人可以持续降低劳动力成本,允许更个性化的广告材料,并可以24/7工作,其输出效率远超传统基于人工的生产模式[4] **4 瑞银对快手的积极看法和投资建议** * 瑞银对快手持建设性观点,考虑因素包括:1)核心业务增长且估值合理(2025/26年预期市盈率为13/11倍,2024-26年预期每股收益复合年增长率为20%,或剔除Kling因素后2026年预期市盈率为10倍);2)视频生成AI进展带来的基本面和估值上行空间;3)投资者持仓仍相对较低[5] * 瑞银对快手给予“买入”评级,目标股价为95.37港元(截至2025年11月14日股价为67.10港元)[20][26] **其他重要内容** **风险因素** * 中国互联网行业的主要风险包括:1)竞争格局演变和竞争加剧;2)技术以及互联网用户需求和偏好的快速变化趋势;3)不确定的变现能力;4)流量获取、内容和品牌推广成本上升;5)IT系统的维护;6)向国际市场扩张;7)市场情绪的不利变化;8)监管变化[7] * 快手的具体风险包括:1)竞争加剧导致用户增长低于预期以及用户时间被分流;2)在线视频、直播和网络游戏行业监管收紧;3)变现速度慢于预期;4)中国经济放缓可能导致在线广告收入增长降低;5)投资超预期且盈利能力弱于预期[8]