爱诗科技发布通用实时世界模型PixVerse R1,支持最高1080P分辨率
新浪财经·2026-01-14 09:53
核心观点 - 爱诗科技发布通用实时世界模型PixVerse R1 将视频生成延迟从“秒级”降至“即时”响应 标志着AIGC视频生成从“静态输出”迈入“实时交互”新阶段 [1][3] 技术突破与产品特性 - 延迟与分辨率:PixVerse R1支持最高1080P分辨率 首次将视频生成延迟降至“即时”响应 实现“所想即所见、所说即所现”的实时交互体验 [1][3] - 核心技术架构:模型通过Omni原生多模态基础模型、自回归流式生成机制与瞬时响应引擎三大核心技术 系统性解决传统视频制作高延迟、固定时长的痛点 [1][3] - Omni原生多模态模型:采用Transformer架构与统一Token流 将文本、图像、音频与视频融合为单一生成序列 实现端到端跨模态理解与输出 全程原生分辨率训练避免上采样模糊与伪影 [1][3] - 自回归流式生成:引入记忆增强注意力模块 可生成任意长度视频并长期维持角色身份、物体状态与环境逻辑的一致性 支持用户在生成过程中随时插入新指令并即时响应 [2][4] - 瞬时响应引擎(IRE):通过时间轨迹折叠、引导校正和自适应稀疏采样三大创新 将传统扩散模型所需的50+采样步数压缩至1–4步 计算效率提升数百倍 达到人眼可感知的“即时”响应阈值 [2][4] 行业影响与演进方向 - 解决行业痛点:传统视频制作流程存在高延迟、固定时长生成的痛点 难以满足用户对实时响应与内容共创的需求 [1][3] - 推动行业演进:PixVerse R1推动数字媒体从“预录制回放”向“实时动态生成”演进 AIGC视频生成正式进入“实时交互”全新阶段 [1][3]