数字生命卡兹克
搜索文档
刚刚,飞书CLI开源,Claude Code也可以丝滑操控飞书了。
数字生命卡兹克· 2026-03-28 17:23
飞书开源CLI的战略意义 - 飞书开源其官方命令行工具,标志着其向AI Agent时代迈出了关键一步,其战略意义被认为不亚于OpenClaw首次接入飞书[2] - 该举措的核心在于为AI Agent(如Claude Code, Codex, OpenCode, OpenClaw)提供直接操控飞书的接口,而非主要面向普通用户[24][25][26] - 此举可能牺牲传统以图形界面打开为标准的日活跃用户等指标,但旨在从根本上提升用户效率和使用价值[27] 软件形态的范式转变 - 未来软件产品将呈现两种形态:面向普通用户的图形用户界面和面向开发者及AI的命令行界面[5][6][7] - 图形用户界面是为人类视觉设计的交互方式,而命令行界面因其基于命令的特性,天然适合被AI理解和操控[12][21] - 软件的发展路径正在从“命令行界面到图形用户界面”逆转为“图形用户界面到命令行界面”,核心驱动力是AI Agent成为新的“用户”[64][66][68][69] CLI的技术细节与优势 - 飞书开源的CLI工具包含19个Skills,基本覆盖了其核心功能,如日历、文档、云盘、即时通讯、邮件、表格、任务、知识库等权限[35][45] - 该CLI的错误信息反馈设计优秀,能明确指出具体参数问题、错误位置及修复命令,便于AI自主进行重试和修正[60] - 通过简单的安装和配置,用户即可在Claude Code等AI Agent环境中直接调用飞书功能,无需打开飞书图形界面应用[31][32][37] AI Agent与飞书CLI结合的应用场景 - **批量消息通知**:通过AI Agent操控飞书CLI,可向公司全部25名内部联系人个性化发送私信,整个过程耗时约一分钟[47][48] - **数据检查与自动化**:可自动检查飞书多维表格中的数据完整性,例如在1,511条项目记录中,发现“不含税成交价”字段缺失率为19.9%,“成本”字段缺失率为20.1%,并计划设置自动化任务每周提醒同事补全[51][53] - **快速开发与部署**:利用AI Agent和飞书CLI,可在几分钟内完成内部数据可视化网页、热点监控网站、日报自动生成与部署等开发需求,大幅提升效率[49][50][54][56] - **信息处理自动化**:可自动汇总指定邮箱内近一个月的简历内容,并将附件整理至统一网页,为后续筛选和复用奠定基础[58][59] 对行业的影响与启示 - 飞书此举旨在将自身定位牢牢锁定为“Agent基建平台”,为AI时代构建基础设施[30] - 效率工具的核心应服务于用户效率,即使这意味着改变传统的产品使用和衡量方式[27] - Agent时代的软件设计理念需要转变,应从为人类操作设计转向为AI操作设计,提供清晰、稳定的接口和命令[60][62][63] - 如果所有日常软件都能提供CLI层供AI直接调用,那么科幻作品中描绘的超级AI助理将接近实现[72][73][75]
杨植麟、张鹏、罗福莉等齐聚一堂,他们关于OpenClaw的观点值得一听。
数字生命卡兹克· 2026-03-27 14:24
文章核心观点 文章记录了2026年中关村论坛人工智能主题日的一场高信息密度圆桌讨论,核心观点聚焦于人工智能产业,特别是大模型和智能体(Agent)技术,正从“聊天”范式转向“干活”范式,这一转变引发了算力需求爆发、模型架构创新、基础设施重构以及产业生态演变等一系列深刻变革 [3][5][13] 根据相关目录分别进行总结 行业趋势:从聊天到“干活”的范式转变 - 以OpenClaw为代表的智能体框架标志着人工智能应用从简单的对话交互转向能够完成复杂任务的“干活”助手,这极大地拓展了AI的想象力空间和应用价值 [6][8][13] - 范式转变导致对模型能力的要求发生根本变化,模型需要具备长程任务规划、自主循环、多模态信息处理和持续调试等复杂能力 [13] - 应用范式的转变直接驱动了推理阶段token消耗量的急剧增长,无问芯穹公司透露其token用量从一月底开始每两周翻一番,累计已增长十倍,类比于3G时代手机流量的爆发速度 [9] 模型层:架构创新与商业价值回归 - 为适应“干活”需求,模型在长上下文处理和推理效率方面进行重点创新,中国的模型团队在有限算力条件下催生了如细粒度MoE、混合稀疏注意力等高效的模型结构创新 [18] - 长上下文能力是实现高生产力任务和模型自进化的关键前提,其竞争焦点在于如何在百万甚至千万token的上下文长度下实现足够低的推理成本和足够快的速度 [19] - 随着模型任务复杂化,完成一个任务所需的token量可能是简单问答的十倍甚至百倍,智谱公司对其GLM5 Turbo模型进行提价,反映了模型商业价值向真实成本与能力回归的市场信号 [5][13][14] 基础设施层:应对推理时代算力挑战 - 推理时代算力需求爆发式增长,过去一段时间内推理需求已增长近十倍,未来可能达到百倍,算力成为制约行业发展的最朴素且紧迫的问题 [9][20][29] - 无问芯穹作为基础设施厂商,通过软硬件协同,接入国内十几种芯片和几十个算力集群,致力于打造高效的“token工厂”,以优化资源利用和转化效率 [15] - 为充分发挥智能体潜力,基础设施需要从为人类工程师设计转向为AI原生设计(Agentic Infra),以支持智能体秒级甚至毫秒级的任务调度,长远目标是使基础设施本身进化为由智能体管理的自主组织 [16][17] 智能体(Agent)层:技术痛点与生态发展 - 智能体在规划、记忆和工具使用三个维度存在技术痛点:复杂垂直领域规划知识不足、记忆系统面临信息压缩与召回精度挑战及海量上下文管理压力、技能生态存在质量参差不齐和安全风险 [21][22] - 智能体框架通过开源和模块化设计(如技能体系)降低了创建门槛,不仅拉高了国内模型在具体任务上的完成度上限,也激发了社区对Agent层的热情和广泛参与 [11] - 智能体交互模式取得突破,OpenClaw以即时通讯软件式的嵌入方式提供了更强的“活人感”,其轻量级操作系统式的设计通过生态撬动更多工具,与开源生态紧密结合 [12] 未来展望:未来12个月的关键词 - **生态**:智能体要从个人助手转化为真正的“打工人”或协作者,需要整个技术生态的共同努力,推动软件、数据和技术向“Agent Native”模式演进 [24][25] - **自进化**:在强大模型和智能体框架的激活下,模型能够在执行长程任务中持续自我学习和优化,实现对科学研究的指数级加速,这一进程可能在未来一两年内变得更为务实 [25][26][27] - **可持续token**:从基础设施视角,需要确保在资源有限的条件下,能够持续、稳定、大规模地提供token供给,构建从能源、算力到token产出的可持续经济化链路,并探索将中国的优势转化为全球“token工厂”的潜力 [27][28] - **算力**:所有技术进步和效率提升的前提是充足且可负担的算力支持,推理需求的爆发(十倍甚至百倍)使得算力成为未来十二个月行业面临的最大实际问题 [5][29]
安利一个11万Star的必装插件,能让你的Agent体验直接质变。
数字生命卡兹克· 2026-03-26 10:30
Superpowers插件概述 - 一款名为Superpowers的AI辅助编程插件,在GitHub上拥有112,000个star,是Anthropic官方认证的Claude插件,安装量达到233,901,在官方市场中排名第二 [5][6][8] - 该插件被定义为一套指导AI智能体(Agent)完成任务的工作流系统,而非传统工具,旨在通过结构化流程解决AI智能体倾向于跳过设计、测试和审查直接写代码的问题 [9] - 该系统由14个核心技能(Skills)组成,通过强制注入标准化工作流程,旨在将最终任务产出质量提升数个档次 [10][15] 核心功能与工作流程 - **强制结构化流程**:系统核心技能`using-superpowers`作为“宪法”,强制要求AI智能体在执行任何任务前必须检查并调用匹配的技能,内置“反合理化”机制以防止跳过流程 [14] - **深度需求挖掘**:`brainstorming`技能在开发前通过苏格拉底式提问强制细化模糊需求,一次只问一个问题以深入探索,替代了原生`/plan`模式的并行浅层提问 [3][14][40][50] - **隔离开发环境**:`using-git-worktrees`技能在需求确认后自动创建独立的Git工作树和分支,确保开发工作与主分支隔离,避免影响现有代码 [14][74] - **精细化任务拆解**:`writing-plans`技能将设计文档拆解为每个耗时2至5分钟的微小、明确的任务,目标是让缺乏经验和上下文的初级工程师也能准确执行 [14][75] - **多阶段审查机制**:执行阶段通过`subagent-driven-development`技能派遣子智能体并行开发,每个任务完成后需经过两轮独立审查(需求符合度与代码质量),全部任务完成后还需进行全局集成审查 [14][80][81][84] 应用效果与案例对比 - **解决中文场景适配问题**:通过Superpowers流程开发的ADHD中文网页阅读器,成功解决了仿生阅读技术对中文无效、以及无法适配国内公众号、知乎等平台的问题,而原生Claude Code开发的产品则因需求不清而失败 [31][32][33][35][36][89] - **提升产出质量与效率**:案例显示,使用Superpowers后,开发流程遵循“规划2小时,执行10分钟,审查1小时”的原则,前期深度规划确保了最终交付物符合预期,避免了因需求不清导致的返工 [70][71][90][92] - **降低对模型能力的依赖**:该系统的精细化任务拆解使得能力一般的AI模型也能获得巨大加持,因为任务被设计得足够简单明确 [76] 行业意义与扩展应用 - **揭示AI开发核心瓶颈**:文章指出,在AI辅助开发时代,真正的瓶颈并非执行速度,而是动手前将模糊想法转化为清晰、完整、无歧义需求的能力 [3][39][71] - **工作流可跨领域复用**:Superpowers系统本质是一个通用的“规划-拆解-执行-审查-复盘”工作流,其方法论可应用于营销方案、PPT制作、数据分析等多种创造性任务 [15][16] - **强调流程规范的重要性**:通过自身开发AIFUT票务小程序时因流程不规范、需求考虑不周而导致上线故障的案例,反证了标准化、审查严格的工作流程对于交付可靠产品至关重要 [71]
Claude能直接操控你的电脑微信了,这才是真正的上位小龙虾。
数字生命卡兹克· 2026-03-25 10:11
文章核心观点 - Anthropic公司推出的Claude AI助手,通过整合“Computer Use”(视觉操控)和“Dispatch”(远程任务分发)两大新功能,实现了对电脑本地软件(如微信)的纯视觉自动化操控,这标志着其AI Agent(智能体)能力取得了突破性进展,用户体验和通用性得到极大提升,被作者认为是当前最强大的AI Agent产品 [2][6][48] Claude产品功能更新与组合 - **Computer Use(视觉操控)**:该功能允许Claude通过屏幕截图“看见”用户桌面,并控制键盘和鼠标来操作任何本地应用程序,弥补了传统API/CLI方案无法操控未开放接口软件(如微信、剪映)的短板,据估计能覆盖电脑上剩余约**20%** 的操作场景 [6][7] - **Dispatch(远程任务分发)**:该功能允许用户通过手机向电脑端的Claude发送指令并启动任务,任务会根据类型(如开发类、知识类)自动路由到Claude Code或Cowork等不同模块中执行,实现了跨设备的持续对话和任务同步 [9][24] - **功能组合威力**:“Computer Use”与“Dispatch”的结合形成了强大组合,使Claude能够通过纯视觉方案完成复杂的跨应用任务,例如自动阅读并总结微信社群消息、浏览朋友圈、搜索B站视频并自动编辑发布朋友圈等,展示了高度的自主性和通用性 [26][33][34][37][38][42] 产品部署与使用设置 - **使用门槛**:“Computer Use”和“Dispatch”功能目前仅对Pro或Max会员开放,且需要将桌面端和移动端应用更新至最新版本 [43] - **平台支持**:“Dispatch”功能已支持Mac和Windows系统,而“Computer Use”功能目前仅限macOS系统,Windows版本尚未推出 [43] - **配置流程**:用户需在电脑端Claude应用的设置中开启“Computer Use”开关,并通过手机扫码完成“Dispatch”的配对授权,即可通过手机远程操控电脑 [14][15][16][17][18][20] 安全与权限管控机制 - **应用访问控制**:Claude在首次尝试操控一个新应用程序时会主动请求用户授权,不会偷偷打开软件,且对于投资交易平台、加密货币等敏感应用默认禁止访问,用户无法手动开启 [43][44] - **黑名单功能**:用户可以在设置中自定义“Denied apps”黑名单,禁止Claude访问特定应用(如飞书),被禁止后Claude的访问请求会被系统自动拒绝 [44][45] - **提示词注入防护**:模型在使用“Computer Use”时会自动扫描网页或文档中可能存在的恶意指令(如钓鱼攻击),以防止被误导执行危险操作,但官方表示该防护能力仍在进化中 [47] 公司产品迭代速度与行业地位 - **极快的迭代速度**:根据文章整理的更新日志,Anthropic在**2024年3月**对其产品线(Claude.ai, Cowork, Claude Code)进行了密集更新,平均每**2~3天**就推出一项新功能或重大升级,速度远超行业预期 [49][50][51] - **功能更新密集**:3月份的重大更新包括:发布Sonnet 4.6和Opus 4.6新模型、开放**100万(1M)** 上下文窗口、向所有用户开放Memory记忆功能、推出交互式图表、企业级自助购买以及前述的“Computer Use”和“Dispatch”等 [50] - **行业竞争态势**:文章认为,Anthropic通过模型公司亲自下场深度整合开发Agent,实现了更丝滑的体验和更快的迭代,其产品能力已“远远把曾经的对上OpenAI甩在了身后”,并对其他AI产品公司构成了巨大竞争压力 [48][51]
2026,我们倾尽所有,想为大家办一场万人AI大会丨AIFUT。
数字生命卡兹克· 2026-03-23 10:11
大会概况 - 公司将于2026年4月8日至9日在北京亦庄的北京智慧电竞赛事中心举办名为“AIFUTURE北京亦庄AI未来大会”的AI大会[1] - 大会规模预计达到万人级别,包含1518个主论坛席位和3500平方米的外围展区,并设有超过30个游戏化互动展位[3] - 大会的核心理念是打造一个“不是高高在上、而是与大家息息相关、有趣”的AI活动,旨在营造“氛围最不一样的AI大会”[3] 大会筹备背景 - 举办大型AI大会的想法始于2025年,但因组织复杂性(协调数十位嘉宾、上千人主会场、万人展区)及对精力、财力、心力的巨大消耗而一度被搁置[6] - 2025年11月底,在得到创始人罗振宇的鼓励下,公司决定将大会计划提上日程[6] - 2025年12月,公司将注册地址迁至北京亦庄后,北京经开区(信产局)领导对大会想法给予了“全力支持”,为大会的最终诞生提供了关键助力[6] 大会日程与核心内容 - **4月8日上午**:活动以融合碳基音乐与硅基生成式歌手的“泥与电的咏叹调”开场秀拉开序幕,随后进行领导致辞[8] - 核心议题包括“AI的未来,不该只有星辰大海”、“AI时代,人还能做什么?”、“最适合Agent的大模型究竟是什么?”、“AI时代的教育应该是什么样子?”以及“AI企业的胜负手,是产品经理还是科学家?”[8][10] - **4月8日下午**:议题涵盖“为什么大模型是工具的AGI时刻?”、“具身智能离我们还有多远?”、“AI会不会替代人类?”、“人人都能coding了,软件会消失吗?”以及“人与AI,到底是什么关系?”[12][14] - 下午设有“AI话题辩论赛”环节[14] - **4月9日上午**:议题包括“让更多人因为AI而强大”、“有了AI,是不是人人都能拍电影了?”、“当AI替你干活,你还能干什么?”以及“Agent时代应该如何保护我们的安全?”[17][18] - **4月9日下午**:内容包括“家庭的第一个机器人终端”展示、“5v5 Prompt Battle电竞赛”、“AI原生时代的影视工作,是什么样子的?”、“AI时代的创业,前路在哪里?”以及“2026年, AI还能投什么?”[20][21] - 下午设有“5v5 Prompt Battle电竞赛”环节,利用电竞场馆特色,旨在增加活动的趣味性和互动性[23] 嘉宾阵容 - 大会邀请了来自AI产业界、投资界、内容创作界及学术界的多位知名人士[8][10][12][14][17][20][21] - 产业界代表包括智谱AI CEO张鹏、猎豹移动董事长兼CEO傅盛、智元机器人董事长稚晖君、昆仑万维董事长兼CEO方汉、Vbot维他动力创始人兼CEO余轶南等[8][12][17][20] - 投资界代表包括华兴资本CEO王力行、嘉实基金分析师张泓、广发证券联席首席分析师廖志国等[10][21] - 内容与传媒界代表包括得到创始人罗振宇、虚实传媒创始人&CEO卡兹克、B站UP主特效小哥008、硅星人创始人&CEO骆轶航、电影《流浪地球》团队代表等[8][10][12][14][17] - 其他领域代表包括AI教育实践者谷大白话、13岁独立开发者吕思彤等[10][21] 大会运营与参与方式 - **门票销售**:主论坛采取收费制,单日票定价489元,双日联票定价899元,预计全部售罄可收回100多万元成本,门票将于指定时间在小程序实名发售[62] - **外围展区**:3500平方米的外围展区将免费向公众开放,设有大量互动展台和休息区[64] - **互动机制**:展区采用游戏化设计,参与者通过完成互动获取和消耗“FUT币”来兑换礼品,主论坛付费用户将获得更充裕的初始FUT币[64][66] - **直播安排**:大会全程将在“数字生命卡兹克”视频号进行直播,未能到场的观众也可在展区户外通过巨型大屏观看[67] - **时间安排**:活动特意安排在周三、周四(4月8日、9日)两个工作日,旨在不占用嘉宾、工作人员及合作伙伴的周末休息时间[72][73][75]
分享10个你可能不知道的Claude Code隐藏命令。
数字生命卡兹克· 2026-03-20 10:18
文章核心观点 - Claude Code 作为一款强大的通用 AI 编程助手,其功能更新迭代速度极快,许多实用但未被广泛知晓的隐藏命令和快捷键能极大提升开发效率和体验 [8][9][114][116][117] 一. /btw 命令 - `/btw` 命令于 2025年3月11日推出,允许用户在 Claude 正在执行任务时,插入一个并行的问题而不污染主要任务的对话历史 [12][13] - 该功能解决了“上下文污染”问题,用户提问不会中断原有任务进程,且回答后可一键清除,几乎不消耗额外 token [16][19][21][22] - 该命令发布后在 Twitter 上获得超两百万阅读量,表明用户需求强烈,属于“用了就回不去”的高频实用功能 [13][23] 二. /rewind 命令 - `/rewind` 命令(或按两下 Esc)提供类似“撤销”或“回退”的功能,类似于设计软件中的 Ctrl+Z [24] - 该命令在 2025年2月 升级后,允许用户分别回退代码或对话历史,而无需整体回退 [25][29] - 回退时会弹出菜单提供多个选项:1) 同时回退代码和对话;2) 仅回退对话;3) 仅回退代码;4) 从该点开始总结对话以释放上下文窗口 [34] - 此功能特别适合进行代码实验,允许快速试错并保留对话记忆,避免了频繁使用 `git reset` 的麻烦 [35][36][37] 三. /insights 命令 - `/insights` 命令会生成一份详细的 HTML 报告,分析用户过去一个月使用 Claude Code 的习惯,包括常用命令、重复性操作模式等 [39][42] - 报告会基于用户行为推荐自定义命令和 Skills,并记录一些操作中的“翻车现场”以帮助改进 [45][48] - 报告会提供具体建议,例如如何修改 `CLAUDE.md` 文件中的规则以避免常见错误,如错误使用 SSH 用户、通过符号链接安装到错误目录等 [50] - 建议用户每月运行一次此命令,以重新认识并优化自己的使用习惯 [56] 四. /model opusplan 命令 - `/model opusplan` 是一个隐藏命令,在需要复杂推理时自动使用 Claude Opus 4.6 进行规划,然后切换到 Claude Sonnet 4.6 执行具体任务 [57][58][59] - 此模式在标准的 `/model` 切换菜单中不可见,对于每月 20美元 的 Pro 订阅用户尤其有价值,能更高效地利用有限的 Opus 模型额度 [60][62][63] - 该模式基于规划需要深度思考(Opus 更强)而具体编码任务 Sonnet 已足够且更快的理念,帮助用户在节省成本的同时保证复杂任务质量 [64][65][66][67] 五. /simplify 命令 - `/simplify` 是 2025年2月底 集成到 Claude Code 的内置 Skill,本质上是一个三合一的并行代码审查工具 [68][69] - 输入命令后,会同时启动三个平行的 Agent,分别从代码复用、代码质量和运行效率三个角度审查用户的代码改动 [69][70] - 该工具能有效识别 AI 编写代码中常见的微妙冗余,如多余的 import、重复逻辑等,相当于“找了三个同事帮你同时 review” [71][72] - 作者习惯在完成几个大的功能更新后都运行一次此命令,认为其比旧的 `/review` 命令更好用 [70] 六. /branch 命令 - `/branch` 命令(原名 `/fork`)允许用户将当前对话分叉出一个新的独立会话,原会话进度不受影响 [74][75] - 此功能适用于在讨论到一半时,想尝试另一个方向但又不想丢失当前进度的情况,类似于“平行宇宙” [76][77][80] - 与 `/rewind`(后悔药)不同,`/branch` 是创建分支而非回退 [79][80] 七. /loop 命令 - `/loop` 命令允许用户让 Claude 定时重复执行某个任务,例如 `/loop 5m 检查一下部署状态` 会每五分钟执行一次,默认间隔为 10分钟 [81][82][83] - 循环任务的结果会保留在对话上下文中,便于 Claude 基于结果进行后续判断和操作 [86] - 为防止遗忘,循环任务在创建 3天后会自动过期并自我删除,若需长期运行需使用桌面版 [87][88][89] 八. /remote-control 命令 - `/remote-control` (或 `/rc`) 命令于 2025年2月底 推出,允许用户通过生成的 URL 在手机上远程控制 Claude Code 会话 [91][92][93] - 手机与电脑终端完全同步,双方操作实时更新,但代码执行、文件系统等仍保留在本地电脑,手机仅作为安全的“遥控器”窗口 [94][95][96] 九. /Export 命令 - `/export` 命令可将当前整个对话导出为 Markdown 文件,便于保存有价值的架构讨论、决策推敲过程等对话内容 [97][99][100] - 导出的内容可作为未来项目的详细上下文,或用于与其他 AI 工具(如 Codex)协同工作,进行交叉分析和问题诊断 [101][102] 十. 实用快捷键 - `Ctrl+V` (Mac 用户注意不是 Cmd+V) 可直接粘贴截图,Claude 能“看图说话”分析报错,无需先保存文件 [105][106][107] - `Ctrl+J` 或 Mac 的 `Option+回车` 可在命令行中实现换行 [109] - `Ctrl+U` 可删除整行输入 [111]
一文总结飞书新品发布会 - 向Agent平台的跃迁。
数字生命卡兹克· 2026-03-19 16:32
飞书新品发布会核心观点 - 飞书通过对其AI助手“飞书aily”和低代码开发平台“飞书妙搭”进行重大升级,正在向一个真正的Agent原生平台演进,成为国内最方便使用Agent的平台[4][6][12] 飞书aily升级:企业级智能助手 - **定位与类比**:飞书aily定位类似于OpenClaw的企业版,是一个常驻在飞书联系人列表中的智能助手Agent,而飞书妙搭则类似于Claude Code,是一个专业的开发Agent[8][9][10][11] - **核心升级**:aily从一个问答式AI助手升级为开箱即用、完全内置的Agent,原生支持调用企业内所有数据,无需复杂部署和授权[14][15][16][17] - **原生优势**:aily能直接访问用户的飞书消息、文档、多维表格、日程和任务,并继承飞书的用户分层权限,实现无缝数据整合[18][20][26][35] - **功能演示**:aily能够根据聊天记录、会议纪要等自动生成周报,并支持设置定时任务(如每周五晚10点自动推送周报)[19][39][40][46][50][51] - **技能扩展与迁移**:aily支持通过官方SkillHub安装技能以扩展能力,用户可以从OpenClaw等平台迁移记忆和身份设定,并快速安装现有技能列表[28][30][32][33][52] - **实际应用案例**: - **内容沉淀**:aily可以读取公众号文章链接,自动生成结构化学习笔记并保存至飞书云文档[56][57][58][59] - **效率提升**:aily帮助社群运营人员自动处理社群申请表与成员状态匹配,将原本每天超过1小时的手动工作简化为两轮对话,处理了**2,726条**基础记录,成功自动匹配**498条**,将备注清理从**609人**减少到**114人**[64][65][66][69][71][72][73][74] 飞书aily专业版 - **定位差异**:专业版提供独立的Web端和移动端工作台,拥有GUI界面,适用于更复杂的任务拆解、文档生成、代码运行和数据分析,而普通版更适合在IM聊天框内处理日常事务[78][81][82][83][84][85][86] 飞书妙搭升级:原生Code Agent - **核心升级**:妙搭底层升级为原生Code Agent,深度集成飞书生态,解决了使用外部工具(如Claude Code)开发飞书机器人时面临的权限、API调用等复杂问题[88][89][90][91][92][95] - **开发模式**:提供“灵感探索”和“应用开发”两种模式[96] - **实际应用案例**:通过妙搭快速开发“合同填写助手”应用,自动将**29个字段**填入合同模板并一键分发给指定同事,极大提升了商务部同事处理重复性工作的效率[98][99][101][102][107][108][109][112][115] - **生态优势**:深度集成飞书的身份和权限体系,应用在群内分享时权限可自动扩展,降低了业务团队自主开发工具的门槛,推动了企业AI化进程[120][121][122][123][124] 飞书多维表格Agent - **功能定位**:旨在降低多维表格的使用门槛,提升数据洞察效率[125][126] - **实际应用案例**:多维表格Agent能根据用户需求,为包含近**500条**数据的公众号运营表格自动创建数据看板,生成折线图、柱状图并进行趋势分析,提供智能总结[127][130][131][132][133][135] 对Agent平台发展的洞察 - **成功要素**:企业级Agent要真正发挥作用需要三大要素:**上下文**(了解用户身份、工作内容与协作关系)、**工具**(能实际操作各类办公软件)和**权限**(集成企业级安全与权限管控体系)[146][147][148][149] - **平台价值**:飞书作为集成了沟通、文档、日程、任务等核心工作流与数据的平台,为Agent提供了最肥沃的生长土壤,是效率端Agent的重要入口[144][145][150][154] - **行业启示**:对于希望拥抱Agent的企业而言,采用像飞书这样已深度集成工作流与数据的平台,是比单纯部署外部AI工具更快的路径[151][152][153]
刚刚,小云雀的短剧Agent上线了,背后是字节自己的Seedance 2.0。
数字生命卡兹克· 2026-03-19 11:31
核心观点 - 字节跳动旗下产品“小云雀”推出了一款基于Seedance 2.0模型的AI短剧创作Agent,该工具通过自动化剧本生成、角色场景设计、分镜脚本到视频合成的全流程,将AI短剧/漫剧的制作效率提升至“生产力级别”,标志着AI影视工业化在短剧领域取得实质性进展 [2][37][38] 产品功能与性能 - **全流程自动化**:用户仅需提供一个剧本或故事设定,Agent即可自动完成从剧本拆解、角色与场景生成、分镜脚本到最终视频合成的全部工序,无需人工进行参考贴图、提示词编写和剪辑 [2] - **底层模型强大**:产品以“世界第一的AI视频模型”Seedance 2.0为技术基底,具备强大的导演思维和分镜能力 [2][37] - **高效率**:使用该Agent制作一集短剧仅需不到一小时,半天时间即可完成四集高质量短剧,相比手动使用Seedance 2.0模型(一集需两三天)效率实现飞跃式提升 [5][8][9] - **多风格支持**:工具不限制创作风格,能够生成包括真人武侠风、19世纪欧洲风格、国漫3D风格乃至创意改编(如猫猫版迅哥)在内的多种类型视频 [10][11][14][15][17] 用户体验与操作流程 - **两种输入模式**:支持用户直接输入完整剧本,或通过口述故事梗概由AI自动生成剧本 [21] - **标准化创作流程**:操作遵循“点子-剧本-人物-分镜-分场生成”的顺序,交互顺畅,易于掌握 [36] - **可控性与可修改性**:在生成过程中,用户可检查并重新生成单个角色、场景或分场视频,对结果拥有较高的控制权 [29][34] - **快速合成**:所有分场视频生成完毕后,点击“合成全集”按钮,仅需等待两三分钟即可得到一集完整的短剧 [33] 剧本创作方法论 - **人机协同**:高质量剧本创作依赖于“人类的审美标准+AI的执行力”,即由人类提供审美指导和关键输入,AI负责高效执行 [47] - **参考学习法**:通过向AI(如Claude模型)提供优秀剧本作为参考,让其总结创作规律,再根据特定要求(如小说改编)进行剧本写作 [48][49] - **处理长篇内容**:对于长达近两千章的网络小说改编,建议先由人类提炼核心“事件列表”以明确故事主线,再交由AI根据列表、剧本格式和原文进行改编,避免生成无关的“水情节” [51][53][55] - **质量定位**:当前方法生成的AI剧本质量尚无法与资深编剧的作品相比,但这代表了AI影视工业化进程中的一个重要实践阶段 [58] 行业意义与未来展望 - **生产力变革**:该工具实现了“人类只出脑子,让AI来干码字、出分镜、剪辑”的创作模式,极大解放了创作者在前期制作中的生产力 [57] - **技术迭代预期**:预计未来将从Seedance 2.0升级至3.0,Agent能力也将变得更加强大和高效 [58] - **人类创作的不可替代性**:尽管技术高效,但源于真实生活体验的情感、恐惧、愤怒与审美构成了人类艺术创作的核心文脉,这是AI无法替代的部分 [60][61] - **新时代的机遇**:工具降低了视频创作门槛,为创作者在AI视频新时代找到自身定位提供了可能 [61]
第一个同时为人类和Agent设计的AI视频产品,它叫,LibTV。
数字生命卡兹克· 2026-03-18 11:02
文章核心观点 - 在AI时代,成功的产品需要同时为人类用户和AI智能体(Agent)进行设计,提供两个并行的入口:为人类设计的复杂专业UI界面和为Agent设计的简单易用Skills [1][59][61] - Liblib公司发布的AI视频产品“LibTV”是该理念的首个具体实践案例,它通过“无限画布”和“Skills”两种形态,优雅地解决了同时兼顾专业创作者与普通用户需求的行业难题 [1][3][4][59] - 未来的主流创作模式将是“Agent出初稿,人类在专业工具上优化”,两种入口共享同一套底层原子化能力,最终实现人类与Agent的共生 [57][58][59][60][63] 产品设计理念与架构 - **双入口设计**:产品采用双重架构,为人类用户提供功能全面、基于节点连线的“无限画布”专业界面;为Agent用户提供开箱即用、仅需触发和通信的“Skills”接口 [3][4][40][59] - **能力内核统一**:两个入口背后是同一套底层原子化能力,通过不同方式进行重组,以服务不同用户群体 [60][63] - **核心竞争力保护**:公司采取的策略是,用户侧的Skill仅负责触发和通信,核心的创作逻辑、模型调用策略等关键Know-how和工程能力都封装在后端Agent中,这既保护了商业壁垒,又便于持续迭代 [40][42][45] 面向人类用户的功能(无限画布) - **全链路专业创作**:画布支持从剧本、图片、视频到音频的AI生成与编辑全流程,旨在服务追求顶级效果的AI短片、广告等专业创作者 [6][7] - **强大的图像处理**:提供高清、扩图、重绘、擦除、抠图等基础功能,并具备“多角度”和“灯光”等雕花级特色功能,可一键生成任意视角或调整光照效果,稳定性极高 [10][12][14][16] - **精细的摄像机控制**:UI界面集成了相机实物、镜头、光圈、焦距等参数控制,实现了接近专业摄像机的控制级别 [20][21] - **视频生成与后期**:可将处理好的图片节点连线,调用多种视频模型生成视频,并支持后续剪辑、超分辨率等操作 [27][28] - **剧本与分镜生成**:提供独特的脚本节点,可根据输入的剧本或“角色设定+一段话”自动生成对应的分镜脚本,对AI短剧、漫剧创作非常有用 [29][30][32][34] - **项目与资产打通**:生成的任务会自动在画布中创建为真实项目,所有节点已串联好,便于后续联动与优化 [49] 面向Agent用户的功能(Skills) - **简易集成**:Agent(如Claude Code、Codex、OpenClaw)可通过一句话指令安装LibTV Skill,用户需提供个人Access Key作为使用凭证 [38][39][41] - **全功能覆盖**:通过Skill可调用LibTV几乎全部核心功能,包括写脚本、生图、改图、生视频、编辑视频、生成音乐等,一个Skill即可替代多种单一功能Skills [40] - **自动化工作流**:用户通过自然语言提出需求(如生图、生视频),Skill将指令传至后端Agent处理,后端自动进行轮询并将最终结果(如图片、视频文件及项目链接)返回给用户 [42][46][49][54] - **高效创作示例**:用户可通过一句话指令完成复杂任务,例如“根据坂本龙一《Rain》音乐,做一个MV视频”,Agent能快速生成70分左右的初稿内容,供人类进一步优化 [56][57] 产品生态与商业策略 - **用户体系打通**:LibTV的积分和会员体系与原有的liblib平台直接打通,用户可无成本迁移原有权益 [36] - **生态建设思路**:该产品为AI时代的应用生态建设提供了参考范式,即对外提供接口而非开放全部核心大脑,在保持生态开放性的同时保护自身商业化空间 [45] - **当前局限与展望**:产品目前尚未集成最先进的视频模型Sora(文中称Seedance 2.0),但其架构已为未来集成更多能力做好准备 [28]
AI,正在吞噬所有软件。
数字生命卡兹克· 2026-03-17 10:11
文章核心观点 - 文章认为,AI正在吞噬软件,正如2011年Marc Andreessen提出的“软件正在吞噬世界”一样,这标志着一个时代的终结和另一个时代的开始[1][2][4][7] - 核心论点是:AI驱动的Agent和Skill将从根本上改变软件的生产方式、产品形态、商业模式以及组织架构,其核心是“中间层”的消亡[7][126][138] 一. 软件生产民主化 - **人人可造软件成为共识**:在Claude Code、Codex等AI工具的推动下,软件开发已从专业技能转变为像使用Excel一样的基础能力,开发成本从几十万降至接近零[8][9][18] - **Vibe Coding普及**:用户无需编程知识,只需用自然语言描述需求,AI即可生成并运行代码,个人也能快速创建满足特定需求的“软件”[10][13] - **个人开发实例**:作者作为非程序员,已利用AI在飞书开发者后台创建了多个处理公司事务的机器人,并构建了带有人类反馈迭代功能的AI热点监控站[14][15][17] 二. 软件属性转变 - **从资产变为耗材**:传统SaaS模式的核心前提——“软件很难做”正在瓦解,软件正从需要长期维护和增值的资产,转变为可随时替换、用完即弃的耗材[19][26][32][36] - **SaaS商业模式受冲击**:SaaS模式依赖高迁移成本,但AI使快速创建替代工具成为可能,导致客户粘性下降[20][24][27] - **市场表现印证**:截至2026年1月底,多数SaaS公司股价较52周高点下跌30%-80%,如Figma下跌约80.98%,Trade Desk下跌约75.05%,且至3月份跌势更甚[27][30][31] - **指标恶化**:行业增长放缓,获客成本上升,衡量老客户增购意愿的关键指标净收入留存率(NDR/NRR)在许多SaaS公司中从高位回落[37][38] 三. Agent重塑人机交互 - **OpenClaw的启示**:其意义在于让大众理解了Agent的概念,认知的拉平是时代变革的真正入口[40][43][45] - **软件的本质是翻译层**:传统UI(按钮、菜单等)的存在是为了弥合人类意图与机器执行之间的鸿沟,即实现模型与心理模型之间的差距[48][49][55][60] - **Agent填平交互鸿沟**:用户只需用自然语言下达指令,Agent即可自主调用相关Skill完成任务,无需用户与复杂界面交互,从而消除了传统软件中大量的“翻译”工作[61][69][72][74] - **产品形态从App转向Skill**:未来的产品可能以无界面的“Skill”形式存在,由Agent直接调用,企业核心能力从打造好用的界面转变为将业务封装成可被Agent调用的标准化Skill[78][79][82][83] 四. 用户主体的变迁 - **用户从人变为Agent**:在Agent调用Skill完成任务的场景中,直接用户是Agent,人类是最终受益者而非交互者[86][92][93][94] - **产品设计逻辑改变**:产品优化重点从人类的操作路径(如按钮位置、流程顺畅度)转向Agent的决策路径(如接口稳定性、文档清晰度、调用成本)[102][103][104] - **增长与竞争逻辑变化**:企业竞争焦点从争夺人类用户的时间和注意力,转向争夺被主流Agent默认接入、被工作流引用的“调用权”[105][106][107] - **产品价值要素重构**:界面美观和操作流程的重要性下降,可调用性、可靠性、信任度和可组合性成为关键价值要素[109][110][113][114][115] 五. 中间层的系统性消亡 - **技术变革的规律**:历次重大技术变革都致力于提高信息流转效率,消灭中间层,如印刷术消灭抄写员,电商消灭经销商[119][120][121] - **软件本身即是中间层**:过去15年,软件作为中间层吞噬了世界,而AI正在吞噬软件这个中间层,将其拆解为轻量的能力原子(Skill)[122][123][126][127] - **类比电网革命**:AI+Agent+Skill构成新的“电网”,提供按需、即时组装的能力;传统软件如同将被淘汰的独立发电机[128][131][134] - **组织中间层面临同样命运**:公司管理层作为意图与执行之间的信息翻译层,其职能与软件UI类似。当Agent能直接处理信息和任务时,主要承担信息搬运和任务分发的管理角色将被大量压缩[138][142][146][148][149] - **颠覆速度加快**:此次由AI驱动的对产品、公司、行业各层面中间层的冲击,其速度远比15年前软件吞噬世界时要快[154][159]