核心观点 全球多模态AI技术持续迭代,国产模型在视频、音频生成等领域实现局部超越,商业化进程显著提速。多模态大模型正深度赋能内容产业链,在视频、游戏、营销等赛道创造增量市场,并因单位Token算力占用提升而进一步扩大算力需求缺口,看好相关产业链投资机会[3][4]。 全球多模态技术迭代与国产模型进展 - 全球技术持续迭代:自2021年Open AI发布DALL-E起,海外科技大厂持续优化多模态模型架构,从扩散模型向自回归架构演进,生成内容质量、效率、成本不断优化[3][12]。海外多模态AI独角兽涌现,如Midjourney营收破亿美元,Runway ARR由2022年底的100万美元提升至2026年的9000万美元,ElevenLabs及Suno在2026年ARR分别突破5亿美元和3亿美元[12]。 - 国产模型实现局部超越:2026年,国产大模型在视频生成、音频/音乐生成领域居全球前列。据Artificial Analysis,截至5月14日,文生视频榜单前三模型分属阿里巴巴、字节跳动、快手;昆仑万维、MiniMax在音频领域全球领先[15][17]。商业化快速推进,快手可灵模型2026年5月ARR已达5亿美元,比春节前翻倍[15]。 多模态AI商业化进程与市场空间 - 下游应用广泛,市场高速增长:多模态大模型可赋能内容生产、营销、工业制造等多个领域。据前瞻产业研究院及Precedence Research,2025-2034年全球多模态大模型市场规模年复合增长率(CAGR)有望达37%;2024-2030年中国市场规模CAGR有望达67%[20][21][24][28]。 - 国产模型Token调用量与ARR高速增长:豆包大模型日均Token调用量从2024年5月的1200亿增长千倍至2026年3月的120万亿[36]。智谱截至2026年3月的API ARR突破2.5亿美元,同比增长60倍,年初以来增长6.4倍[36]。对比海外,Open AI ARR超250亿美元,Anthropic ARR在2026年5月超440亿美元,较2025年底的90亿美元提升389%[3][36][39][40]。 - 多模态应用显著拉升Token消耗:相较于文本,多模态内容消耗Token量级更高。输入环节,单秒音频/单张图像/单秒视频比单个文字高1-2/3/2-3个量级;输出环节则高1/2-3/4个量级[3][41]。报告测算,仅国内视频消费场景每日所需Token即有望达349.92万亿,是2026年3月全国日均Token调用量140万亿的2.5倍[3][41][44]。 AI+视频:原生内容越过奇点,成本下降打开市场 - 短剧市场高速增长:2025年中国短剧市场规模达1000亿元,同比增长98%;海外短剧收入23.8亿美元,同比增长263%,下载量突破12.1亿次[49][50][52]。海外短剧对短视频用户渗透率仅5.6%,对比国内58.6%的渗透率,提升空间广阔[49][52][53]。 - AI大幅降低制作成本并拓宽题材:AI技术将单部短剧成本下探至5-10万元,而传统真人实拍成本普遍在50-100万元[56][59]。AI翻译成本仅为人工翻译的10%,AI制作视频成本仅为传统海外实景拍摄成本的20%[59]。2026年4月,抖音集团端原生AI短剧新增播放量突破1472亿,环比增长85.8%[59][62]。 - AI漫剧与电影取得突破:2026年3月,快手及字节漫剧日耗峰值加总达9000万元[61][64]。据DataEye研究院预估,2026年海外AI剧/漫剧市场规模预计达6.5亿美元,同比实现6倍增长[61][65][70]。博纳影业出品的AI电影《三星堆:未来往事》已获“龙标”,标志AI电影上映路径跑通[66][67]。 AI+游戏:重构开发流程,创新交互体验 - 行业供需两旺:2026年1-4月国产游戏发放版号600个,同比增长25%[72][73]。2026年第一季度中国游戏市场累计收入约972亿元,同比增长13%[72][75]。 - AI赋能研发全流程降本增效:AI工具将游戏开发中角色动画制作周期缩短40%,部分项目角色技能原型验证时间从2周压缩至3天[77]。AI自动蒙皮工具将需1.5-3.5天的工作缩短至1-3小时,节省70%-90%人工;3D场景资产构建中,20%-30%的次级资源可用AI工具解决,达到千万元级别降本[78][80]。 - UGC生态与AI交互玩法受益:支持UGC或Mod的游戏,其五年累计收入提升约31%,用户留存提升超过115%[80][82]。AI驱动的动态剧情生成打破线性叙事局限,如《Suck Up!》相关内容在YouTube播放量累计破亿[87][88]。《和平精英》“AI队友”系统已吸引超1.1亿玩家体验,最高日活达1770万,显著提升社交压力大玩家的总对局数[87][89]。 AI+营销:驱动广告个性化升级 - 程序化广告市场稳步增长:2022-2026年,程序化广告收入有望从4225亿美元增长至5875亿美元,CAGR达8.6%,占广告行业收入比例从82%提升至86%[92][93][97]。 - 多模态技术实现深度个性化推荐:快手生成式推荐广告系统GR4AD已全量部署,服务超4亿用户,对比基准模型,其商业化广告收入高4.2%,中小广告主投放量提升17.5%,广告转化率提升10.17%[95]。Open AI预计其广告收入将从2026年的25亿美元提升至2030年的1000亿美元,CAGR达151%[96]。 多模态AI扩大算力需求缺口 - 算力供需失衡推高价格:2026年第一季度,国内头部云厂商算力价格上涨5%-34%[4]。多模态输入提升单位Token算力占用,应用发展或进一步扩大算力缺口[4]。 - 科技大厂加大算力投资:字节跳动/阿里巴巴/腾讯2025年资本开支同比增长分别为88%/71%/3%,2026年均计划加大算力投资力度[4][11]。亚马逊等海外四大科技企业2026年资本开支规模总值或超7000亿美元[11]。
行业投资策略:多模态AI:逐光前行,加速进击