LightX2V
搜索文档
“国产GPU四小龙”上市潮下的生态协同:AI巨头企业牵头构建国产AI芯片全适配网络
每日经济新闻· 2026-01-05 16:11
国产GPU行业资本化进程 - 国产GPU领军企业壁仞科技、摩尔线程、沐曦股份、天数智芯密集冲刺资本市场,迎来资本化高潮 [1] - 壁仞科技于2026年1月2日登陆港交所,成为港股“国产GPU龙头股”,上市首日开盘股价较发行价上涨82%,市值一度超过1000亿港元 [1] - 摩尔线程于2025年12月5日率先登陆资本市场,上市首日涨幅超400% [1] - 沐曦股份于2025年12月17日上市,首日涨幅飙升至692.95%,两家公司市值均迅速突破3300亿元大关 [1] - 天数智芯已启动招股并确定上市日期 [1] 商汤科技与国产芯片生态协同 - 壁仞科技、摩尔线程、沐曦股份、天数智芯四家国产GPU领军企业均为商汤科技的长期、稳定的战略合作伙伴 [1] - 合作基于“算力供给-算法需求”的核心匹配逻辑,以国产替代战略为共同导向,形成“技术互补、资源共享、场景互哺”的合作生态 [1] - 商汤科技已率先完成与包括壁仞科技、寒武纪、沐曦等在内的十余家顶尖芯片企业的深度适配 [2] - 商汤科技构建了从底层硬件到上层应用的全栈国产化生态,共同推动国产AI芯片从“可用”迈向“好用” [2] 商汤科技国产芯片适配网络与能力 - 商汤科技联合华为、海光、寒武纪、壁仞科技等十余家国产生态伙伴,共同发布“商汤大装置算力Mall”,帮助客户低成本获取高性能国产算力 [3] - 寒武纪、壁仞、沐曦等国产GPU已完成与商汤SenseCore大装置的全面适配,近期IPO的摩尔线程MTT S系列GPU也已完成全面适配并加入算力Mall [3] - 摩尔线程GPU首次在千亿参数大模型的训练与推理中经受工业级考验 [3] - 商汤完成了华为昇腾910C 384超节点的全面适配,推动国产AI算力在系统协同与工程化方面实现关键突破 [3] - 商汤开源行业首个实时视频生成推理框架LightX2V,通过国产化插件模式支持寒武纪、沐曦、海光、华为昇腾等多款芯片 [3] - 商汤为释放国产算力潜力,在模型与框架设计中引入低比特量化等硬件友好创新机制,将推理性能提升3倍以上 [4] - 商汤依托自研异构互联技术与调度平台,实现跨多种加速卡的统一训练能力,显著缩短训练周期 [4] - 商汤与记忆张量合作攻克GPGPU适配难题,实现PD分离技术在国产GPU上的首次大规模商用,推理性价比提升150% [4] 技术积累的产品化与生态影响 - 商汤Seko是行业首个多剧集生成智能体,其背后的日日新Seko系列模型已成功完成对国产AI芯片寒武纪的适配 [2] - Seko多剧集生成智能体依托自研模型与国产算力适配能力,展现高效的视频创作能力 [5] - 小浣熊等应用通过端侧深度优化,在个人PC及国产终端上提供安全可靠的高精度AI服务 [5] - 大晓机器人、如影营销智能体等新品借助商汤与国产芯片的协同优势,推动具身智能、数字营销等领域的国产化替代进程 [6] - 从算力底座到C端产品,商汤正在用全栈能力重构国产AI生态的竞争力 [6]
当国产 AI 不再是「备胎」
虎嗅APP· 2025-12-17 18:31
国产AI发展趋势与市场热潮 - 国产AI概念成为市场热点,相关公司股价表现强劲,例如“国产GPU第一股”摩尔线程上市五天内暴涨700%,沐曦股份上市最高涨幅达744.64% [2] - 国产算力已从断供背景下的“备胎”选项,发展成为涵盖硬件、模型到应用的完整体系,成为AI领域不可忽视的趋势 [2] - 国产AI技术生态已实现从“可用”到“好用”、“易用”的蜕变,进入效用提升、应用建构与生态协同的新阶段 [2] AI国产化的基石:模型适配 - 行业初期面临的核心问题是算力与模型适配,目标是实现“可用”,但当时产品在能效和易用性方面相对欠缺 [4] - 模型适配是AI国产化的最重要基石,商汤科技自2020年起投入AIDC“大装置”解决该问题,至今已有寒武纪、沐曦、华为昇腾、摩尔线程、壁仞等多家国产芯片完成与商汤大装置SenseCore及“日日新”大模型体系的全面适配 [5] - 适配工作进度加快,例如商汤发布Seko 2.0当天,寒武纪即完成对该模型的“Day 0”适配,在模型效率、算力增强等方面取得显著成果 [6] - 行业通过异构混合调度方案(如接入DeepLink开放计算体系)优化算力调度与跨域训练,提升多种国产芯片间的协同与资源利用率 [7] 国产AI的下一步:应用突破 - 应用是当前国产AI发展的最大瓶颈,算力和模型的进步尚未充分转化为产品性能提升和商业竞争力 [10] - 根据报告,2025年国内头部科技企业AI算力投入预计达4500亿元,其中30%用于国产芯片验证与适配,70%用于算力基础设施建设,但主流AI应用的国产化率仍较低 [11] - 商汤发布的Seko 2.0基于LightX2V框架,该框架设计考虑了国产化适配,通过技术创新使推理能力相比之前提升3倍以上,是国产算力在应用层的优秀出口案例 [11] - 公司通过优化模型核心能力、算力利用率及资源管理机制(如长序列处理、低比特计算、分层调度)来适应国产芯片,并探索端侧应用国产化,如推出搭载“小浣熊”AI助手的全国产智能办公一体机 [12] 国产AI的未来:生态协同 - 国产AI正超越“替代”定位,发展出从芯片、模型到应用的完整技术生态,该生态化进程处于初期但趋势明确 [14] - 商汤联合华为昇腾、寒武纪、沐曦等十余家伙伴发布“商汤大装置算力Mall”,成为早期支持全栈国产的AIDC大装置试验场,旨在提供从硬件到平台服务的全生态灵活产品矩阵 [14][15] - 生态化将降低构建全国产AI技术栈的成本和门槛,实现“即插即用”,使国产算力与模型在注重性价比的场景中具备与国际前沿竞争的实力 [15] - 未来,“国产可控”有望从一项特殊任务转变为默认选择 [16]
商汤科技发布多剧集生成智能体Seko2.0 与寒武纪完成适配
凤凰网· 2025-12-17 10:33
产品发布与核心功能 - 商汤科技于12月15日正式发布AI视频生成智能体Seko的2.0版本 [1] - 该产品定位为“创编一体”的多剧集生成工具,主要面向短剧与漫剧创作者 [1] - Seko 2.0推出了SekoIDX技术,旨在解决多剧集生成中角色一致性的问题 [3] - Seko 2.0的SekoTalk功能可支持两人以上的精准口型同步 [3] 产品性能与成本优化 - 使用Seko 2.0可将传统漫剧制作周期缩短80%至90% [3] - 为降低生成成本,公司应用了名为Phased DMD的蒸馏技术 [3] - 其开源的实时视频生成推理框架LightX2V已完成对寒武纪、沐曦等国产芯片的适配 [3] 用户数据与市场表现 - 自2025年7月上线以来,Seko用户量已突破20万 [3] - 用户中短剧与漫剧创作者合计占比达50% [3] - 由Seko生成的真人短剧《婉心计》曾登顶抖音AI短剧榜 [3] 行业合作与应用探索 - 商汤科技与长江电影集团达成战略合作,计划共同探索AIGC在影视制作中的应用 [3] - 双方预计在明年推出系列短剧及联合孵化院线电影 [3]
商汤发布业内首个多剧集生成智能体Seko2.0
证券日报网· 2025-12-15 19:43
公司产品发布与升级 - 商汤集团正式发布AI视频生成智能体Seko2.0,该产品是行业首个创编一体、多剧集生成智能体,专为短剧、漫剧行业的个人创作者与工作室打造 [1] - Seko2.0实现全新UI升级以提升视觉效果和沉浸式创意体验,支持多剧集生成功能,可管理超长上下文并支持100集以内剧本的连续创作 [1] - Seko2.0实现Agent智能调度,能在不同剧集中灵活关联人物、场景和道具,并支持人物妆造随场景改变 [1] 产品市场表现与用户基础 - 前代产品Seko1.0于2025年7月上线后,仅用两个月用户量即突破10万,不到半年已聚集超20万创作者 [1] - 在Seko1.0的用户社区中,30%为短剧创作者,20%为漫剧创作者,形成了一个高浓度的创作者社区 [1] 技术突破与成本优化 - 针对AI短剧/漫剧多剧集创作涉及海量分镜的高成本问题(如一个5秒视频需生成近10万token,一键生成10-20个分镜总token需求高达100万-200万),商汤提出PhasedDMD蒸馏技术以降低综合成本 [2] - PhasedDMD蒸馏技术是一套多步蒸馏框架,将分阶段蒸馏思想与专家混合模型相结合,使不同模型专精于生成流程的不同阶段,在不增加推理成本的前提下提升模型整体能力与效率 [2] - 商汤开源了行业首个能实现实时视频生成的推理框架LightX2V,通过DiT蒸馏加速、轻量化VAE、稀疏注意力等优化,实现低成本、强实时的视频生成 [2] - LightX2V在消费级显卡上能以不到5秒的时间生成5秒视频,该框架目前累计下载量已超350万次 [2] 未来发展方向 - 商汤未来将为创作者提供国产化方案选择,旨在以极致性价比开启AI视频创作的“低成本”时代 [3]
响应上海AI应用赋能,商汤Seko 2.0助力“一人剧组”
国际金融报· 2025-12-15 16:55
行业趋势与市场痛点 - AI漫剧、短剧赛道呈爆发式增长态势 [1] - 市面上大部分AI视频生成产品仅支持单集短片或片段素材生产 [1] - AI短剧、漫剧多剧集创作存在token需求量大、成本居高不下的痛点 一个5秒视频就需近10万token 10至20个分镜的总token需求高达百万量级 [1] 公司产品发布与核心功能 - 商汤科技于12月15日正式启动产品发布周 多款兼具开创性与实用性的AI产品将陆续亮相 [1] - 当日首发的核心产品Seko2.0 是行业首个创编一体、多剧集生成智能体 助力“一人剧组”成为现实 [1] - SekoIDX通过在扩散模型的高噪阶段引入“负参考图” 解决了多剧集、跨分镜的角色一致性行业难点 同时避免内容与参考图过度相似 在响应不同表情、姿态、场景等指令时能保持高度稳定 [1] 技术突破与效率提升 - 底层技术的突破直接转化为生产力的飞跃 传统工作流中一支团队完成50集作品通常需要3个月以上 借助Seko 2.0 漫剧制作周期可缩短80%至90% [1] - 公司通过创新Phased DMD蒸馏技术破解成本难题 该技术采用分阶段蒸馏结合专家混合模型的架构 让不同模型专精生成流程各环节 实现效率提升与推理成本零增加 [2] - 公司开源行业首个实时视频生成推理框架LightX2V 依托DiT蒸馏加速、轻量化VAE等优化 在消费级显卡上不到5秒即可生成5秒视频 效率远超同类产品 [2] - LightX2V累计下载量超350万次 [2] 国产化与生态适配 - LightX2V已完成寒武纪、沐曦等国产芯片适配 实现全国产化部署 [2]
国产芯片也能跑AI视频实时生成了,商汤Seko 2.0揭秘幕后黑科技
机器之心· 2025-12-15 16:10
行业背景与核心问题 - 自Sora 2发布以来,各大科技厂商迎来新一轮视频生成模型“军备竞赛”,纷纷推出迭代版本[2] - 行业面临一个本质问题:这些模型距离真正的生产力工具还有多远[2] - 当AI视频生成模型步入短剧制作等实战场景时,会撞上由效率、成本、质量构成的“不可能三角”[11] - 目前即便如Sora 2级别的产品,生成10秒视频往往需要数分钟乃至十分钟,严重制约创作效率[11] - 开源模型生成一段5秒视频通常超过十分钟,商用闭源模型生成5秒视频通常也需1至10分钟不等[12] - 一个仅5秒的视频片段就需要生成接近10万token,而一键生成通常会产生10到20个分镜,单次操作的token消耗量达到100万到200万级别[12] - 当行业试图通过降低推理步数、压缩模型参数等方式提升速度、降低成本时,往往会遭遇生成质量下降的挑战[13] 商汤科技Seko 2.0产品发布 - 商汤科技于12月15日上线全新的Seko 2.0版本,让AI短剧创作真正实现“一人剧组”[2] - 只需输入一句简单的提示词,Seko 2.0能策划剧本大纲,生成分镜和视频[4] - 该产品能生成1分半钟的3D艺术风格动画短片,以及唇形同步精准的数字人音乐MV[5][6] - Seko是行业首个创编一体、多剧集生成智能体,已经服务上百家短剧工作室,大量AI短剧成功上线[7] - 用商汤Seko创作的《婉心计》登顶抖音AI短剧榜第一[9] - 此次2.0版本的升级,背后是商汤在视频生成底层技术上的深度突破,从开源推理框架LightX2V到产品化落地,再到国产芯片的全面适配,商汤正在构建一条完整的AI视频生产链路[9] LightX2V开源框架的技术突破 - LightX2V是由商汤科技与北航联合研发的成果,是业界首个开源的实时视频生成推理框架[16] - 该项目上传的模型累计下载量已突破350万次[16] - 其核心价值在于真正做到了实时视频生成,生成5秒视频所需时间小于5秒,速度达到现在行业主流的数倍甚至十倍以上[17] - 商汤原创设计的Phased DMD步数蒸馏技术,让视频生成在4步推理下就能实现高质量的一致性和动态性[19] - 该技术产出的Wan2.1、Qwen-Image等多步模型,登上HuggingFace趋势榜前10,累计下载量超过358万次[19] - Phased DMD是一个结合了阶段式蒸馏和专家混合思想的多步蒸馏框架[19] - LightX2V团队发布了LightVAE、LightTAE系列高效视频自编码器模型集合,旨在实现高达10倍以上的性能提升[27] - LightVAE对Wan2.1 VAE剪枝75%,成功将显存占用减少了约50%(降至约4-5 GB),同时将推理速度提升了2到3倍[27] - LightTAE系列将显存占用降至极低的约0.4 GB,并实现了极快的推理速度[28] - 实际测试中,处理一段5秒81帧的视频时,官方Wan2.1 VAE解码时间约为5.46秒,显存需求超过10 GB;LightVAE解码时间缩短到约2.07秒,显存降至5.57 GB左右;LightTAE解码时间仅需约0.25秒,显存几乎可以忽略不计[28] LightX2V的工程与架构创新 - LightX2V构建了一个面向低成本、强实时的视频生成推理完整方案,覆盖了模型、调度、计算、存储和通信五个维度[31] - 通过低比特量化、稀疏注意力、特征缓存、高效Offloading和多卡通信优化等技术,形成了清晰且高效的五层体系结构[31] - 该框架的算子实现层集成了Flash Attention V3、Sage Attention V1/V2/V3、Radial Attention和Ring Attention等创新算子[32] - 这种全栈优化带来的直接效果是显存门槛降至8GB以下,入门级消费卡即可流畅运行;在RTX 5090等消费级显卡上,已经实现了1:1的实时生成效果[35] - 框架提供了多样化的接入方式,包括集成到ComfyUI Workflow、通过Gradio Web快速部署在线演示服务、支持本地服务器部署,以及提供用于稳定生产环境的静态推理接口[35] 国产化芯片适配与商业化前景 - 商汤在Seko 2.0中实现了全面适配国产化芯片的关键布局[39] - 借助LightX2V框架,Seko已成功支持多款国产AI芯片,真正实现了视频生成模型的全国产化部署能力[40] - 从实际效果来看,在国产芯片与英伟达芯片上生成的视频,质量差距并不明显[41] - 虽然国产芯片的生成速度略慢,但其性价比优势突出[41] - 未来商汤计划给创作者提供国产化和非国产化两套方案,使用国产化方案的用户将获得更优惠的价格政策[41] - 打通从算法框架到硬件芯片的全链路国产化能力,意味着中国AI产业在核心技术上迈出了实质性的一步[42]
从分钟级等待到20倍超速:LightX2V重写AI视频生成速度上限
机器之心· 2025-12-08 12:27
核心观点 - 开源项目LightX2V通过算法与工程的全栈优化,旨在将高质量视频生成推向消费级硬件上的1:1实时体验,其技术栈在社区中迅速流行,单月下载量超过170万次[2] 技术架构与性能 - 项目目标是在主流硬件上实现视频生成的1:1实时体验,远超现有框架[2][4] - 通过系统级优化,将生成5-10秒视频的时间从几分钟压缩到与视频时长接近的水平,实现接近1:1的实时体验[7] - 在同类开源方案中,相比SGLang Diffusion、FastVideo等框架,在延迟和吞吐上具有明显优势,尤其在8GB-24GB消费级显卡区间能跑满硬件能力[7] 核心算法创新 - **Phased DMD步数蒸馏**:将原本40-50步的视频扩散过程压缩到4步,同时保持时间一致性和运动细节,基于此技术的少步模型在Hugging Face趋势榜长期靠前,累积下载量达百万级[10][11] - **LightVAE轻量级VAE**:针对视频生成场景设计,在保持高清画质和时间一致性的前提下,有效降低编解码开销,为4步推理释放更多预算[12] - 两项核心算法协同,先在算法层面打通路径,再通过工程优化榨干硬件性能[13] 全栈性能工程优化 - 通过一系列关键技术模块,将“能跑”变成“跑得快、跑得省”,并支持从单机单卡扩展到多卡集群[14][15][16] - **显存门槛**:通过步数蒸馏、低比特量化和分级Offloading,将完整工作流的显存需求压至8GB以下,入门级消费卡即可运行[21] - **吞吐与延迟**:综合使用低比特算子、稀疏注意力与特征缓存,在常见5秒视频场景下达到接近1:1的实时生成速度[21] - **低比特算子**:采用MXFP8/MXFP6/NVFP4等技术,在不明显损伤画质的前提下压缩计算与带宽,释放硬件算力[21] - **稀疏注意力算子**:利用视频时空特征的稀疏性,减少冗余计算,提升大分辨率下的吞吐[21] - **特征缓存**:对中间特征进行缓存与复用,降低重复计算,进一步缩短延迟[21] - **三层延迟隐藏Offloading**:通过精细化的显存-内存调度,在8GB显存上完成28B级别MoE模型推理[21] - **FP8通信多卡并行**:结合FP8通信和流水线/序列并行,在多卡环境下提升吞吐,面向5090等消费级新卡实现更高帧率的强实时目标[21] 模型与硬件生态支持 - **模型生态**:已支持Wan2.1/Wan2.2、CogVideo1.5、HunyuanVideo1.5等主流视频生成模型,以及Matrix Game、MagicDrive等世界模型,并提供4步或少步数配置与加速方案[21] - **应用生态**:深度集成ComfyUI,其LightVAE等核心组件已进入社区主干工作流,用户可在图形界面中直接调用加速推理[21] - **硬件生态**:除支持NVIDIA 3060/4090/5090及A100/A800/H100/H800/H200等显卡外,还原生支持寒武纪MLU590、沐曦C500等国产AI芯片,为本地化、大规模部署提供基础[21] 使用与落地场景 - **个人开发者**:只需带独显的笔记本或台式机,即可本地启动带前端界面的视频生成工具,在ComfyUI中完成素材调试、风格迭代和项目输出[21] - **企业用户**:通过服务化部署方案,可一键搭建面向外部的API服务和Web应用,并按需扩展到多机多卡集群,支持批量视频生产和内部工具集成[21] - **普通用户**:可直接访问网页版入口x2v.light-ai.top,在浏览器中体验少步视频生成和实时预览[21] - 应用覆盖从图像转视频、文本转视频,到世界模型和自动驾驶仿真等领域,旨在通过开源方式将高质量、低成本、强实时的视频生成能力普及[19]