Workflow
AI需求侧核心逻辑正式向多模态大模型延展-国产算力认知强化!Tokens消耗 | 投研报告
中国能源网·2025-10-08 10:01

2、国内——多模态能力崭露头角。快手可灵2.5Turbo于10月2日在全球视频生成模型榜单中登顶图生视 频与文生视频双榜首,体现其在视频生成与内容质量上的国际领先水平。字节跳动于10月2日与UCLA 推出Self-Forcing++视频生成技术,可生成4分15秒高清视频,视觉稳定性提升至2.6倍;旗下豆包1.6- Vision模型于9月30日更新,通过工具调用将图像融入思维链,提升视觉理解精度。腾讯9月28日推出并 开源混元图像3.0,作为业界首个开源工业级原生多模态生成模型,快速登顶Hugging Face热榜并保持领 先。我们认为,当前AI应用落地的竞争核心从单一语言智能转向多模态生成与理解能力。国内头部厂 商正快速补齐这一关键环节并在国际基准测试中崭露头角。 投资要点 为什么我们认为这一轮多模态大模型的发布具有"划时代"意义? 1、海外——Sora2打样多模态交互入口,多模态能力突破带动C端付费意愿提升。OpenAI方面,10月1 日上线Sora2/Pro App,支持最长15s的文生视频,物理运动更精准、并支持用户"客串"生成内容,发布 三天后登上美区App Store第一名。10月7日的开发者大会上 ...