Workflow
LibTV
icon
搜索文档
龙虾也能当导演了!LibTV解锁全自动拍片,一句话从剧本干到成片
量子位· 2026-03-20 13:04
产品发布与核心创新 - LiblibAI正式推出其首款AI视频产品LibTV,这是一个全新的一站式AI内容创作社区[1] - 该产品的核心创新在于首次将人类用户和AI Agent(龙虾)作为两个平等的用户来设计,提供了“人+Agent双入口”的产品形态[4] - 产品玩法新颖,通过“无限画布+节点工作流+独家专业功能+全网顶级模型”实现一站式创作体验[12] 人类用户创作功能详解 - 创作界面是一块可以无限延伸的画布,用户双击可放置文本、图片、视频、音频、脚本五种基础节点[13][17] - 节点之间可自由连接,上游输出成为下游输入,用户可像搭积木一样搭建专属创作流程,实现多素材协同创作[19] - 平台内置超过20种专业实用功能,其中多机位九宫格、剧情推演四宫格、25宫格连贯分镜、电影级光影校正、角色三视图生成等功能被描述为行业独有[5][34][35] - 图片生成器内置专业摄像机控制功能,可自由选择相机类型、更换镜头、调节焦距和光圈[25] - 生成的图像支持一键高清、智能扩图、局部重绘、擦除、抠图、多角度生成、打光调节等精细化编辑功能[27][29] - 独有的“标记”功能允许用户精准标记不同图中的元素并融合生成,例如让图1中的人手握图2中的香水[31][32] - 脚本节点支持三种生成模式:剧本生成分镜脚本、视频参考生成分镜脚本、角色生成分镜脚本[50] - 生成的脚本可批量生成对应的分镜图像,并能一键转换成动态视频分镜[52] - 画布设计使用户无需在不同工具间反复切换,并能将创作流程“打组”为可复用的工作流模板,便于高效复刻爆款风格[56][57][59] AI Agent自动创作功能 - LibTV通过OpenClaw解锁了“自动挡拍片模式”,用户只需给AI Agent(龙虾)一句话指令,它便能自动调用LibTV的Skill完成从理解需求到成片交付的全过程[61][62][63] - 以生成“龟兔赛跑”短片为例,AI Agent自动完成了剧本创作、角色视图生成、6个分镜设计、视频生成及配乐剪辑,最终返回成片和项目画布链接[64][65][66][72][76][77] - 如果AI生成的视频不符合预期,用户可手动对画布中的每个节点进行编辑,然后让其重新生成[79] 公司背景与竞争优势 - LiblibAI是一家成立于2023年的年轻公司,发展势头迅猛,于去年10月完成了1.3亿美元B轮融资,这是国内AI应用赛道迄今为止最大的一笔融资[90] - 公司已成长为中国最大的多模态模型与创作社区,平台聚集了超过2000万创作者,拥有超10万款原创风格模型[92] - 公司在产品形态探索上领先,于2025年率先在设计领域推出了垂直Agent产品“星流”,为LibTV接入Agent能力完成了技术验证与实践[92][93] - LibTV的推出标志着公司定位从“图片生成/模型社区”转向综合性的AI创作平台[94] - 产品定价策略具有明显竞争力,年卡最低可至39折,部分模型享约6折叠加优惠,综合折扣低至2折,会员SKU价格较竞品低76%,模型积分定价可比竞品低92%[96]
一款产品,同时为人类和 Agent 设计,LibTV 是怎么做的?
Founder Park· 2026-03-19 20:23
LibTV产品定位与核心创新 - 公司旗下AI视频创作平台LibTV于3月18日正式上线,定位为市面上第一个从产品设计第一天起就同时为人类创作者和Agent设计的视频创作工具[4][5] - 产品采用“一款产品,两扇门”的设计理念,人类创作者和Agent各有独立的入口,在产品架构层面并行,而非先做图形用户界面再补充应用程序接口[11] - 核心目标是融合两类工具的长处:将围绕自动化交付设计的Agent工具与围绕人的操控感设计的专业工作流工具,在同一个产品里真正合流[9][10] 创作者端功能与工作流 - 创作者端界面是一块可以无限放大的画布,用户可自由摆放文本、图片、视频、音频、脚本五种节点,并用连线串联成可反复运行的工作流,实现从剧本到成片的全程操作[12] - 已上线超过20个专业创作功能,包括9/25宫格分镜生成、剧情推演四宫格、多机位镜头设计、角色三视图、画面时间推演等[12] - 集成了可灵3.0、Wan 2.6等主流视频模型,并在图片和文本侧接入了多个模型[12] - 通过角色三视图等功能锁定主角形象,确保后续所有镜头基于同一设定生成,解决传统多工具切换导致的角色“变脸”问题[14] - 支持将完整工作流保存为模板,便于复用,提升创作效率[14] Agent端功能与协作模式 - Agent通过Skill接口接入平台,可直接调用短漫剧生成、视频复刻、音乐MV生成等打包好的创作能力[15] - Agent发起创作后,平台返回sessionId、projectUuid、projectUrl三样东西,使Agent能持续查询进展,且整个创作挂载于一个可持续编辑的项目对象上,人类可随时打开画布接管[15] - Agent交付的不是孤立的MP4文件,而是一个完整的、可继续编辑的项目[15] - 在实际测试中,Agent能根据一句自然语言指令(如制作2分钟赛博朋克风格动画短片),自主完成6幕剧本拆分、定调色方案、逐场景生成分镜、逐镜头出视频、配乐剪辑等全流程,并返回成片链接和项目画布[16][18] 为Agent设计软件的核心差异 - 能力包装方式不同:为Agent设计时,需将能力打包至“Goldilocks”中间层(如LibTV的Skill),每个Skill内含完整决策链路,Agent可用自然语言表达意图,由系统侧完成编排,而非提供碎片化的工具或过于粗放的一键出片[21] - 决策方式不同:人类创作者依赖审美直觉,而Agent缺乏直觉,其方法是通过批量生成多个版本,再按一致性、构图、风格匹配度等维度自动筛选,用算力换取审美[22] - 记忆与状态管理方式不同:人类创作者依赖空间记忆和视觉锚点管理项目,而Agent需要系统显式地为其传递和记忆任务状态、角色约束、色调等上下文信息[25] 定价策略与成本考量 - 视频创作的核心成本在于“抽卡”,即大量生成与反复试验,一支好作品背后可能是几十上百次的生成与筛选[27] - 公司定价策略激进,旨在降低试错成本,使创作者可以依靠大量尝试产出好作品[28][29] - 对于Agent生态而言,低廉的价格至关重要,因为Agent天然需要多版本生成与比选,调用频次远高于人工操作,单次调用成本过高将使Agent视频创作在经济上不可行[29][30] 公司的能力与积累 - 公司在模型层拥有三年多模态视觉创作经验,与主流模型厂商和算力平台建立了长期合作,这支撑了其激进的定价策略[31] - 用户层方面,公司平台拥有超过2000万创作者,社区沉淀了超过十万款原创风格模型,产品团队从中深刻理解创作流程,并提炼出如9/25宫格分镜、角色三视图等功能设计[31] - 产品经验层方面,公司早在2025年就在设计领域推出过垂直Agent产品“星流”,积累了为Agent设计入口、封装Skill、跑通人机协作流程的经验,LibTV的双入口设计是在此基础上的迭代[31] - 超过2000万创作者社区沉淀的十万款风格模型和大量已验证的工作流,构成了平台的审美资产,这些审美偏好可通过工作流模板在社区内流通,形成“人出审美,Agent出产能,社区做流通”的飞轮效应[32] 行业趋势与意义 - 行业正在发生加速变化,越来越多的产品团队开始将Agent视为一类真实的用户来对待,并据此重新设计产品[34] - 例如,项目管理工具Linear为Agent设计了独立的任务分配、进度跟踪面板和权限体系;电商平台Shopify推出Universal Commerce Protocol和Checkout Kit,让Agent能自主完成发现商品、比价、下单、支付全流程[34][35] - Sierra公司为电信、银行、保险等行业搭建定制化客户服务Agent,并按Agent自主解决问题的数量收费,其定价模型表明Agent本身就是产品,而非附属功能[35] - 行业领袖观点认为,Agent是下一代基础设施的核心,每家公司都需要制定自己的Agent系统战略,这将是新一代的软件即服务[35][36] - LibTV被视为在视频创作这一垂直领域,对“如何接住Agent这类新用户”这一行业共同问题的早期回答[36]
苹果CEO库克现身成都,不久前否认退休传闻;钉钉直播相机项目已暂停;微信正灰测折叠发图新功能;奇瑞汽车战略入局可控核聚变丨邦早报
创业邦· 2026-03-19 08:09
苹果公司 - 苹果CEO蒂姆·库克现身成都苹果零售店,据称主要为参加Apple 50周年特别活动 [3] - 库克此前驳斥了关于其即将退休的猜测,表示相关说法纯属传闻 [3] 腾讯控股 - 腾讯董事会主席兼首席执行官马化腾首次公开谈及“养虾”,认为“龙虾”应用能让AI落地到丰富场景,并可与微信去中心化理念结合 [5] - 腾讯本地AI助手QClaw宣布版本更新,微信入口升级为小程序,支持文件传输、快速创建定时任务等功能,并上线“灵感广场” [5] - 腾讯2025年全年营收达7517.7亿元,第四季度营收同比增长13%至1943.7亿元 [9] - 腾讯2025年全年研发投入创新高至857.5亿元,AI资本开支达792亿元 [9] - 腾讯元宝月活突破1亿,AI工作台ima月活超1300万,QQ浏览器AI功能累计服务用户超1.3亿,搜狗输入法AI用户数破1亿 [9] 人工智能与大模型 - 月之暗面Kimi创始人杨植麟在英伟达GTC大会上披露Kimi技术路线,聚焦Token效率、长上下文及智能体集群三个维度 [9] - 百度任命原大模型算法部何径舟轮岗至移动生态事业群组,以推动大模型与搜索、推荐业务的融合 [10] - 英伟达CEO黄仁勋称OpenClaw“绝对是下一个ChatGPT”,并描述其为一项能极大拓展个人使用AI能力的基础性变革 [10] - 德国政府计划到2030年,将通用数据中心算力在2025年基础上至少翻一番,其中AI算力至少增至2025年的4倍 [10] - 字节跳动安全团队发布《OpenClaw安全规范和使用指引》,并面向员工推出基于火山引擎ArkClaw企业版构建的ByteClaw服务 [20] 汽车行业 - 吉利集团高级副总裁杨学良确认,格力电器董事长董明珠个人及下属员工合计订购9辆极氪009 [7] - 奇瑞汽车宣布正式战略布局可控核聚变,投身“人造太阳”研发 [9] - 理想汽车L系列部分配置已售罄,其中L9已停止接单,公司正在准备新款,全新一代理想L9将于第二季度发布 [9] - 广汽集团宣布正式成立动力总成BU,作为集团首个实现一体化运营的零部件级单元 [10] - 别克首款纯电MPV至境世家纯电版上市,售价48.99万元,搭载900V超快充电池,CLTC续航601公里 [18] 消费电子与硬件 - 钉钉与猛犸合作的直播相机硬件项目已暂停,原计划应用于B端大型会议直播场景 [7] - 三星电子工会投票通过集体斗争行动议案,赞成率93.1%,计划于5月举行总罢工,可能对DRAM、NAND闪存芯片产能及先进制程晶圆代工业务造成冲击 [10] - 体育AI科技品牌XbotGo发布第三代旗舰球场相机猎鹰Falcon,具备AI追拍和全自动跟拍功能 [15] 融资与上市动态 - 机器人租赁平台擎天租完成天使轮及天使+轮两轮融资,累计融资金额达亿元级 [11] - AI虚拟角色交互团队CODE27完成天使轮及天使+轮融资,总融资额超千万美元 [11] - AI视频生成企业Video Rebirth完成8000万美元融资 [11] - 蓝芯算力完成A轮、A+轮及A++轮融资,总金额达数亿元人民币 [11] - 深度智耀完成D轮系列近2亿美元融资,估值达数十亿美元 [11] - 潞晨科技完成数亿元人民币B轮融资,2026年第一季度云端产品化收入占比达87%,海外收入占比提升至79% [11] - 仿生柔性机器人公司擎羽科技完成数千万元天使+轮融资 [11] - AI Agent原生工作环境平台Floatboat完成200万美元种子轮融资 [11] - 斑马智能向港交所递交上市申请 [11] 其他行业动态 - 网易回应“使用AI清退全部外包员工”为不实消息,称近期人员变动为正常业务调整 [10] - 根据CINNO•ICResearch数据,2025年中国半导体产业总投资额达7841亿元,同比增长17.2% [20] - 法拉第未来宣布推出高管及员工购股计划,预计税后金额约50万美元用于购股 [10] - 华纳兄弟探索公司CEO戴维·扎斯拉夫或将从公司出售给派拉蒙的交易中获得超过6.672亿美元收益 [10] - 马斯克正与美国证交会就其未及时披露收购推特前持股一事进行和解谈判 [10] 产品与功能更新 - 微信正灰度测试“折叠发图”新功能,发送多张图片可合并展示,iOS版消息通知显示头像功能也在灰度发布中 [12][14] - LiblibAI宣布推出AI视频创作产品LibTV,用户在使用OpenClaw等Personal Agent时可直接调用其创作能力 [15]
腾讯研究院AI速递 20260319
腾讯研究院· 2026-03-19 00:06
生成式AI - **OpenAI发布轻量级模型GPT-5.4 mini和nano,性价比显著提升**:GPT-5.4 mini在SWE-Bench Pro编码测试中得分达54.4%,仅比满血版低3.3%,在计算机使用OSWorld测试中达72.1%媲美旗舰版;其输入价格为每百万token 0.75美元,输出价格为4.5美元,仅为GPT-5.4价格的1/3;GPT-5.4 nano价格更低至输入每百万token 0.2美元,输出1.25美元,并已向ChatGPT免费用户开放 [1] - **OpenAI提出子智能体架构,优化资源使用**:公司提出“大模型决策+小模型执行”的子智能体架构,GPT-5.4 mini在Codex中仅消耗旗舰版配额的30%,尽管长上下文处理仍是短板,但分层调度思路正成为行业共识 [1] - **Anthropic推出跨设备Agent功能Dispatch**:通过Cowork新功能Dispatch,用户可通过手机扫码配对远程指挥Mac上的Claude操作电脑,实现从“盯着AI干”到“AI自己干”的跨设备Agent跃迁 [2] - **Dispatch功能实测表现与部署策略**:MacStories实测综合成功率约50%,能完成文件查找、Notion操作、邮件总结等任务,但打开应用、跨应用发送和Safari操作仍失败;该功能目前仅面向Max订阅用户,所有操作在本地Mac执行不经过云端,手机仅作为遥控器,与此前面向程序员的Claude Code Remote Control形成双线布局,覆盖GUI桌面和命令行两大场景 [2] - **MiniMax发布首个深度参与自我迭代的大模型M2.7**:M2.7是首个模型深度参与自身迭代的模型,能自主构建RL Harness、更新记忆、驱动强化学习并优化过程,在内部脚手架上自主迭代超100轮实现30%效果提升 [3] - **M2.7在多项专业测试中表现优异并支持多智能体协作**:模型在SWE-Pro编码测试中得分56.22%接近Opus水平,VIBE-Pro端到端项目交付测试得分55.6%,支持原生Agent Teams多智能体协作,40个复杂skills保持97%遵循率;在GDPval-AA专业办公ELO测试中得分1500为开源最高,可自主完成从研报分析、营收建模到PPT/Word/Excel全套交付,公司同步开源了互动娱乐框架OpenRoom [3] - **腾讯QClaw进行重大更新,降低使用门槛**:微信入口从客服号升级为小程序,支持直接接收电脑端文件,即将支持语音、图片等多模态交互;全新上线“灵感广场”功能,围绕办公提效、深度研究、娱乐游戏等场景预置常用任务和skills,用户无需编写指令即可一键运行 [4] - **QClaw基于OpenClaw封装并计划扩展功能**:该产品基于OpenClaw进行极简封装,主打下载即用的零门槛体验,后续将支持通过小程序创建定时任务、实时接收消息、远程切换底层模型等能力 [4] - **LiblibAI推出同时面向人与Agent的AI视频创作平台LibTV**:该平台同时为人类创作者提供无限画布专业工具和为Agent提供Skill接口,支持从剧本到成片的全流程闭环创作 [5][6] - **LibTV上线多项独家AI能力并实现高性价比**:一次性上线20多个独家AI能力,包括角色三视图、360度角度呈现、多机位9宫格、大师运镜、视频精准编辑等专业控制功能;已发布OpenClaw适配的Skill,Agent可一句话完成从剧本生成到视频剪辑全流程,平台集成可灵3.0等顶级模型,定价比竞品低最高达92% [6] 前沿科技 - **2025年图灵奖授予量子信息科学奠基人**:ACM将2025年图灵奖授予Charles Bennett和Gilles Brassard,表彰二人创建量子信息科学基础,这是图灵奖首次颁给与量子物理直接相关的研究 [7] - **获奖者贡献奠定了量子通信与互联网的基石**:两人于1984年提出的BB84量子密码协议,其安全性直接根植于量子力学定律而非数学假设;1993年又证明量子隐形传态可行,奠定了量子互联网的技术基石 [7] - **量子信息领域从边缘想法发展为战略领域**:二人合作始于1979年,历经四十余年将量子信息从边缘想法发展为拥有完整学科体系和国家战略的领域,BB84协议的变体已在全球量子通信网络中实际部署 [7] 报告观点 - **Anthropic内部Skill构建已形成体系化经验**:公司Claude Code团队内部已积累数百个活跃Skills,并将其归纳为9大类型,包括库和API参考、产品验证、数据获取分析、业务流程自动化等 [8] - **Skill构建的核心最佳实践**:核心经验包括将Skill视为文件夹而非单个Markdown文件,利用文件系统实现渐进式信息披露;内容应聚焦“常见坑”专区而非陈述显而易见的知识;给予方向而非剧本避免过度约束 [8] - **推荐实现Skill记忆与效果衡量的方法**:推荐使用日志文件或SQLite实现Skill记忆能力,通过PreToolUse Hook记录调用日志来衡量效果,并建议团队建立内部插件市场以实现Skills的发现与分发 [8] 行业动态与战略 - **月之暗面提出重构Transformer底层技术路线**:公司创始人杨植麟认为单纯堆算力不够,需对优化器、注意力机制和残差连接等底层基石进行重构,推出的Kimi Linear和Attention Residuals方案获得Karpathy和马斯克高度评价 [9] - **月之暗面将Kimi进化逻辑归纳为三个维度并实现高估值增长**:公司将Kimi进化逻辑归纳为Token效率、长上下文和智能体集群三个维度的共振,K2.5通过Orchestrator机制将复杂任务拆解给数十个子Agent并行处理;公司估值从去年底的43亿美元在不到半年内跳涨至180亿美元,正进行10亿美元融资,并计划继续开源MuonClip、Kimi Linear等底层创新 [9] - **英伟达CEO黄仁勋对AI影响持乐观态度并发布新产品**:黄仁勋表示AI不会让人失业,反而会让人更忙碌,因为30分钟完成过去一个月的工作意味着人们将持续处于执行关键任务中 [10] - **英伟达发布新一代产品并大幅上调收入预期**:公司发布Rubin架构的7颗芯片和5个机架等新品,将加速芯片收入预期提至1万亿美元;展望10年后,公司员工将从4.2万增至7.5万,并配备750万个全天候工作的智能体 [11] - **英伟达高度看好OpenClaw生态**:黄仁勋高度看好OpenClaw,称其为开源代理式AI标准,类比Linux生态将持续获得全球开发者贡献,英伟达已针对性推出NemoClaw软件栈 [11]
第一个同时为人类和Agent设计的AI视频产品,它叫,LibTV。
数字生命卡兹克· 2026-03-18 11:02
文章核心观点 - 在AI时代,成功的产品需要同时为人类用户和AI智能体(Agent)进行设计,提供两个并行的入口:为人类设计的复杂专业UI界面和为Agent设计的简单易用Skills [1][59][61] - Liblib公司发布的AI视频产品“LibTV”是该理念的首个具体实践案例,它通过“无限画布”和“Skills”两种形态,优雅地解决了同时兼顾专业创作者与普通用户需求的行业难题 [1][3][4][59] - 未来的主流创作模式将是“Agent出初稿,人类在专业工具上优化”,两种入口共享同一套底层原子化能力,最终实现人类与Agent的共生 [57][58][59][60][63] 产品设计理念与架构 - **双入口设计**:产品采用双重架构,为人类用户提供功能全面、基于节点连线的“无限画布”专业界面;为Agent用户提供开箱即用、仅需触发和通信的“Skills”接口 [3][4][40][59] - **能力内核统一**:两个入口背后是同一套底层原子化能力,通过不同方式进行重组,以服务不同用户群体 [60][63] - **核心竞争力保护**:公司采取的策略是,用户侧的Skill仅负责触发和通信,核心的创作逻辑、模型调用策略等关键Know-how和工程能力都封装在后端Agent中,这既保护了商业壁垒,又便于持续迭代 [40][42][45] 面向人类用户的功能(无限画布) - **全链路专业创作**:画布支持从剧本、图片、视频到音频的AI生成与编辑全流程,旨在服务追求顶级效果的AI短片、广告等专业创作者 [6][7] - **强大的图像处理**:提供高清、扩图、重绘、擦除、抠图等基础功能,并具备“多角度”和“灯光”等雕花级特色功能,可一键生成任意视角或调整光照效果,稳定性极高 [10][12][14][16] - **精细的摄像机控制**:UI界面集成了相机实物、镜头、光圈、焦距等参数控制,实现了接近专业摄像机的控制级别 [20][21] - **视频生成与后期**:可将处理好的图片节点连线,调用多种视频模型生成视频,并支持后续剪辑、超分辨率等操作 [27][28] - **剧本与分镜生成**:提供独特的脚本节点,可根据输入的剧本或“角色设定+一段话”自动生成对应的分镜脚本,对AI短剧、漫剧创作非常有用 [29][30][32][34] - **项目与资产打通**:生成的任务会自动在画布中创建为真实项目,所有节点已串联好,便于后续联动与优化 [49] 面向Agent用户的功能(Skills) - **简易集成**:Agent(如Claude Code、Codex、OpenClaw)可通过一句话指令安装LibTV Skill,用户需提供个人Access Key作为使用凭证 [38][39][41] - **全功能覆盖**:通过Skill可调用LibTV几乎全部核心功能,包括写脚本、生图、改图、生视频、编辑视频、生成音乐等,一个Skill即可替代多种单一功能Skills [40] - **自动化工作流**:用户通过自然语言提出需求(如生图、生视频),Skill将指令传至后端Agent处理,后端自动进行轮询并将最终结果(如图片、视频文件及项目链接)返回给用户 [42][46][49][54] - **高效创作示例**:用户可通过一句话指令完成复杂任务,例如“根据坂本龙一《Rain》音乐,做一个MV视频”,Agent能快速生成70分左右的初稿内容,供人类进一步优化 [56][57] 产品生态与商业策略 - **用户体系打通**:LibTV的积分和会员体系与原有的liblib平台直接打通,用户可无成本迁移原有权益 [36] - **生态建设思路**:该产品为AI时代的应用生态建设提供了参考范式,即对外提供接口而非开放全部核心大脑,在保持生态开放性的同时保护自身商业化空间 [45] - **当前局限与展望**:产品目前尚未集成最先进的视频模型Sora(文中称Seedance 2.0),但其架构已为未来集成更多能力做好准备 [28]