Workflow
LightX2V
icon
搜索文档
当国产 AI 不再是「备胎」
虎嗅APP· 2025-12-17 18:31
国产 AI 的风口来了。 12 月 5 日,「国产 GPU 第一股」摩尔线程上市,五天内暴涨 700%,刷新了市场对国产算力的认 识,17 日,沐曦股份上市,最高涨幅744.64%。热潮背后,市场对「国产 AI」概念既缺乏足够了 解,又怀有灼灼期待。 仅仅几年前,国产算力还只是断供背景下,不得已要做的一个「备胎」选项。但现在,随着越来越多 的力量汇入这股潮流,它正在成为 AI 领域最不可忽视的趋势之一。 国产从最初的「替代方案」, 成长为一套从硬件、模型到应用的完整体系,种下了未来生态化的种子。 12 月 15 日,商汤发布了行业首个多剧集生成智能体 Seko 2.0,并于发布当天寒武纪即完成了与商 汤"日日新"的适配,成为寒武纪官宣「Day 0」适配的又一大模型体系,此前是DeepSeek。 国产 AI 的技术生态构建,已经从最初的模型兼容适配,发展到了效用提升、应用建构、生态协同的 新阶段,实现了从「可用」到「好用」、「易用」的蜕变。 AI 国产化的基石:模型适配 题图|视觉中国 AI 行业尝试用国产算力作为替代方案的初期,悬在头顶的最大问题在于算力和模型适配。 在这个「从无到有」的阶段,国产芯片的核心目 ...
商汤发布业内首个多剧集生成智能体Seko2.0
证券日报网· 2025-12-15 19:43
本报讯 (记者李乔宇) 12月15日,商汤集团股份有限公司(以下简称"商汤")正式发布Seko2.0。作为AI视频生成行业首个创 编一体、多剧集生成智能体,Seko2.0专为当下炙手可热的短剧、漫剧行业的个人创作者与工作室量身 打造,让"一人剧组"变成可能。 此前,Seko1.0已成功帮助大批创作者摆脱了在多工具间疲于切换、为复杂提示词耗费心力的困扰。 2025年7月Seko1.0上线后,仅用两个月的时间即实现用户量突破10万,不到半年已聚集超20万创作者, 其中30%为短剧创作者、20%为漫剧创作者,成为高浓度的创作者社区。 全新Seko2.0能够在加速创意落地的同时,进一步降低创作门槛。具体来看,新Seko2.0实现全新UI升 级,突出视觉效果呈现,打造沉浸式创意体验;支持多剧集生成功能,实现超长上下文管理,支持100 集以内剧本的连续创作;实现Agent智能调度,不同剧集中,人物场景道具灵活关联,人物妆造可随场 景改变。 从成本来看,AI短剧、漫剧的多剧集创作涉及海量分镜,仅一个5秒视频就需生成接近10万token,若一 键生成10~20个分镜,总token需求量更将高达100万~200万。对此,商汤提 ...
响应上海AI应用赋能,商汤Seko 2.0助力“一人剧组”
国际金融报· 2025-12-15 16:55
底层技术的突破直接转化为生产力的飞跃。传统工作流中一支团队完成50集作品通常需要3个月以 上,如今借助Seko 2.0,漫剧制作周期可缩短80%至90%。 此外,AI短剧、漫剧多剧集创作存在token需求量大、成本居高不下的痛点,一个5秒视频就需近10 万token,10—20个分镜的总token需求更是高达百万量级。 当下AI漫剧、短剧赛道呈爆发式增长态势。但目前,市面上大部分AI视频生成产品仅支持单集短 片或片段素材生产。12月15日起,商汤科技正式启动产品发布周,多款兼具开创性与实用性的AI产品 将陆续亮相。当日首发的核心产品Seko2.0,作为行业首个创编一体、多剧集生成智能体,助力"一人剧 组"成为现实。 "多剧集、跨分镜的角色一致性一直是行业难点。"商汤科技董事长兼CEO徐立表示,SekoIDX通过 在扩散模型的高噪阶段引入"负参考图",既保证角色在多剧集、跨分镜中的一致性,又避免内容与参考 图过度相似,同时在响应不同表情、姿态、场景等指令时依然能保持高度稳定。 对此,商汤通过两大核心技术突破破解成本难题:一是创新Phased DMD蒸馏技术,采用分阶段蒸 馏结合专家混合模型的架构,让不同模型专精 ...
国产芯片也能跑AI视频实时生成了,商汤Seko 2.0揭秘幕后黑科技
机器之心· 2025-12-15 16:10
机器之心报道 编辑:杨文 自 Sora 2 发布以来,各大科技厂商迎来新一轮视频生成模型「军备竞赛」,纷纷赶在年底前推出更强的迭 代版本。 视频来自 Seko 官网,创作者:噪维 AIGC 谷歌推出 Veo 3.1,通过首尾帧控制和多图参考解决了以往视频生成「抽卡」随机性太强的问题;Runway 拿 出 Gen-4.5,强化了物理模拟和表情动作迁移;快手祭出 Kling 2.6,实现了原生音画同步…… 各家都在炫技,但一个更本质的问题却常被忽略:这些模型距离真正的生产力工具,究竟还有多远? 12 月 15 日,商汤科技产品发布周正式开启,第一天就重磅上线了全新的 Seko 2.0 版本 ,让 AI 短剧创作真 正实现「一人剧组」。 比如只需输入一句简单的提示词,它立马就能策划剧本大纲,生成分镜和视频,整个过程相当麻溜。 视频来自 Seko 官网,创作者 : 小铭 AI 百宝箱 无论是 1 分半钟的 3D 艺术风格的动画短片: 还是唇形同步精准的数字人音乐 MV,Seko 2.0 也都能在最短时间内信手拈来。 视频来自 Seko 官网,创作者 : AI 制片人 Webb 作为行业首个创编一体、多剧集生成智能体 ...
从分钟级等待到20倍超速:LightX2V重写AI视频生成速度上限
机器之心· 2025-12-08 12:27
核心观点 - 开源项目LightX2V通过算法与工程的全栈优化,旨在将高质量视频生成推向消费级硬件上的1:1实时体验,其技术栈在社区中迅速流行,单月下载量超过170万次[2] 技术架构与性能 - 项目目标是在主流硬件上实现视频生成的1:1实时体验,远超现有框架[2][4] - 通过系统级优化,将生成5-10秒视频的时间从几分钟压缩到与视频时长接近的水平,实现接近1:1的实时体验[7] - 在同类开源方案中,相比SGLang Diffusion、FastVideo等框架,在延迟和吞吐上具有明显优势,尤其在8GB-24GB消费级显卡区间能跑满硬件能力[7] 核心算法创新 - **Phased DMD步数蒸馏**:将原本40-50步的视频扩散过程压缩到4步,同时保持时间一致性和运动细节,基于此技术的少步模型在Hugging Face趋势榜长期靠前,累积下载量达百万级[10][11] - **LightVAE轻量级VAE**:针对视频生成场景设计,在保持高清画质和时间一致性的前提下,有效降低编解码开销,为4步推理释放更多预算[12] - 两项核心算法协同,先在算法层面打通路径,再通过工程优化榨干硬件性能[13] 全栈性能工程优化 - 通过一系列关键技术模块,将“能跑”变成“跑得快、跑得省”,并支持从单机单卡扩展到多卡集群[14][15][16] - **显存门槛**:通过步数蒸馏、低比特量化和分级Offloading,将完整工作流的显存需求压至8GB以下,入门级消费卡即可运行[21] - **吞吐与延迟**:综合使用低比特算子、稀疏注意力与特征缓存,在常见5秒视频场景下达到接近1:1的实时生成速度[21] - **低比特算子**:采用MXFP8/MXFP6/NVFP4等技术,在不明显损伤画质的前提下压缩计算与带宽,释放硬件算力[21] - **稀疏注意力算子**:利用视频时空特征的稀疏性,减少冗余计算,提升大分辨率下的吞吐[21] - **特征缓存**:对中间特征进行缓存与复用,降低重复计算,进一步缩短延迟[21] - **三层延迟隐藏Offloading**:通过精细化的显存-内存调度,在8GB显存上完成28B级别MoE模型推理[21] - **FP8通信多卡并行**:结合FP8通信和流水线/序列并行,在多卡环境下提升吞吐,面向5090等消费级新卡实现更高帧率的强实时目标[21] 模型与硬件生态支持 - **模型生态**:已支持Wan2.1/Wan2.2、CogVideo1.5、HunyuanVideo1.5等主流视频生成模型,以及Matrix Game、MagicDrive等世界模型,并提供4步或少步数配置与加速方案[21] - **应用生态**:深度集成ComfyUI,其LightVAE等核心组件已进入社区主干工作流,用户可在图形界面中直接调用加速推理[21] - **硬件生态**:除支持NVIDIA 3060/4090/5090及A100/A800/H100/H800/H200等显卡外,还原生支持寒武纪MLU590、沐曦C500等国产AI芯片,为本地化、大规模部署提供基础[21] 使用与落地场景 - **个人开发者**:只需带独显的笔记本或台式机,即可本地启动带前端界面的视频生成工具,在ComfyUI中完成素材调试、风格迭代和项目输出[21] - **企业用户**:通过服务化部署方案,可一键搭建面向外部的API服务和Web应用,并按需扩展到多机多卡集群,支持批量视频生产和内部工具集成[21] - **普通用户**:可直接访问网页版入口x2v.light-ai.top,在浏览器中体验少步视频生成和实时预览[21] - 应用覆盖从图像转视频、文本转视频,到世界模型和自动驾驶仿真等领域,旨在通过开源方式将高质量、低成本、强实时的视频生成能力普及[19]