第一个同时为人类和Agent设计的AI视频产品,它叫,LibTV。
数字生命卡兹克·2026-03-18 11:02

文章核心观点 - 在AI时代,成功的产品需要同时为人类用户和AI智能体(Agent)进行设计,提供两个并行的入口:为人类设计的复杂专业UI界面和为Agent设计的简单易用Skills [1][59][61] - Liblib公司发布的AI视频产品“LibTV”是该理念的首个具体实践案例,它通过“无限画布”和“Skills”两种形态,优雅地解决了同时兼顾专业创作者与普通用户需求的行业难题 [1][3][4][59] - 未来的主流创作模式将是“Agent出初稿,人类在专业工具上优化”,两种入口共享同一套底层原子化能力,最终实现人类与Agent的共生 [57][58][59][60][63] 产品设计理念与架构 - 双入口设计:产品采用双重架构,为人类用户提供功能全面、基于节点连线的“无限画布”专业界面;为Agent用户提供开箱即用、仅需触发和通信的“Skills”接口 [3][4][40][59] - 能力内核统一:两个入口背后是同一套底层原子化能力,通过不同方式进行重组,以服务不同用户群体 [60][63] - 核心竞争力保护:公司采取的策略是,用户侧的Skill仅负责触发和通信,核心的创作逻辑、模型调用策略等关键Know-how和工程能力都封装在后端Agent中,这既保护了商业壁垒,又便于持续迭代 [40][42][45] 面向人类用户的功能(无限画布) - 全链路专业创作:画布支持从剧本、图片、视频到音频的AI生成与编辑全流程,旨在服务追求顶级效果的AI短片、广告等专业创作者 [6][7] - 强大的图像处理:提供高清、扩图、重绘、擦除、抠图等基础功能,并具备“多角度”和“灯光”等雕花级特色功能,可一键生成任意视角或调整光照效果,稳定性极高 [10][12][14][16] - 精细的摄像机控制:UI界面集成了相机实物、镜头、光圈、焦距等参数控制,实现了接近专业摄像机的控制级别 [20][21] - 视频生成与后期:可将处理好的图片节点连线,调用多种视频模型生成视频,并支持后续剪辑、超分辨率等操作 [27][28] - 剧本与分镜生成:提供独特的脚本节点,可根据输入的剧本或“角色设定+一段话”自动生成对应的分镜脚本,对AI短剧、漫剧创作非常有用 [29][30][32][34] - 项目与资产打通:生成的任务会自动在画布中创建为真实项目,所有节点已串联好,便于后续联动与优化 [49] 面向Agent用户的功能(Skills) - 简易集成:Agent(如Claude Code、Codex、OpenClaw)可通过一句话指令安装LibTV Skill,用户需提供个人Access Key作为使用凭证 [38][39][41] - 全功能覆盖:通过Skill可调用LibTV几乎全部核心功能,包括写脚本、生图、改图、生视频、编辑视频、生成音乐等,一个Skill即可替代多种单一功能Skills [40] - 自动化工作流:用户通过自然语言提出需求(如生图、生视频),Skill将指令传至后端Agent处理,后端自动进行轮询并将最终结果(如图片、视频文件及项目链接)返回给用户 [42][46][49][54] - 高效创作示例:用户可通过一句话指令完成复杂任务,例如“根据坂本龙一《Rain》音乐,做一个MV视频”,Agent能快速生成70分左右的初稿内容,供人类进一步优化 [56][57] 产品生态与商业策略 - 用户体系打通:LibTV的积分和会员体系与原有的liblib平台直接打通,用户可无成本迁移原有权益 [36] - 生态建设思路:该产品为AI时代的应用生态建设提供了参考范式,即对外提供接口而非开放全部核心大脑,在保持生态开放性的同时保护自身商业化空间 [45] - 当前局限与展望:产品目前尚未集成最先进的视频模型Sora(文中称Seedance 2.0),但其架构已为未来集成更多能力做好准备 [28]

第一个同时为人类和Agent设计的AI视频产品,它叫,LibTV。 - Reportify