Workflow
Google Workspace CLI
icon
搜索文档
为什么一夜之间大家都在做CLI?
虎嗅APP· 2026-04-01 23:23
文章核心观点 - 近期多家看似不相关的公司(如飞书、Google、Stripe、ElevenLabs、网易云音乐)不约而同地发布命令行工具,这标志着CLI正在被重新发明,成为AI能力扩展的关键基础设施[5][43] - 命令行工具与AI特别适配,因为AI是“文字进、文字出”的,而CLI是纯文本的,AI天生就在这个环境中运作[12][13] - 新一代CLI工具从设计之初就假设调用者可能是AI,它们将执行能力、标准通信协议和使用说明书打包在一起,形成了一个跨平台、免审核、人和AI都能使用的“事实上的插件”,这比传统的插件模式更具优势[31][42][44][90] 一、CLI的定义及其与AI的适配性 - CLI是命令行界面,用户通过输入文本指令来执行任务,与图形界面相比,它更精确且易于自动化[10][12] - 由于AI本质上是处理文本的,因此CLI是AI的天然操作环境,AI可以通过执行一行命令来完成复杂任务,而无需操作图形界面[12][13] 二、AI的能力边界与扩展 - AI的能力边界取决于它能调用的工具和获得的上下文(说明书),没有工具,AI无法执行相关任务[18][21][23] - AI的实际能力 = 它能调用的工具 + 它拿到的上下文[23] - 对于训练数据中未包含的新工具,AI极度依赖显式的说明书(如Skills文件)来学习如何使用,工具越新,这种依赖性越强[24][25][26] 三、新一代CLI的设计哲学 - 传统CLI是为人类程序员设计的,输出是给人看的彩色文字,并可能包含交互式菜单,这会导致AI卡住[29][30] - 新一代CLI为AI设计:所有操作通过参数一次性传入,避免弹出交互式菜单;输出采用JSON等结构化格式供AI直接解析[31][36] - 以飞书CLI为例,它包含200多条命令,覆盖日历、消息、文档等11个领域,AI可通过调用相应命令直接操作,无需打开飞书App[31][32] 四、CLI作为AI的万能插件 - 新一代CLI工具集成了MCP、Skills和Plugin三者的功能,成为一个跨平台、模型无关的执行层[42][47][52] - 与平台锁定的Plugin不同,CLI工具安装后,可以被不同的AI模型(如Claude Code、Cursor、Gemini CLI)调用[45][46] - CLI工具可以通过Shell管道进行组合,实现更复杂的工作流,这是当前Plugin模式难以做到的[51] 五、当前CLI工具面临的问题与挑战 - **安全问题**:CLI直接执行Shell命令,缺乏Plugin沙箱环境中的细粒度权限控制,目前主要依赖`--dry-run`和弹窗确认来补救[56][58] - **说明书过大**:庞大的Skills文件会占用大量AI上下文窗口,导致推理质量下降,例如Google Workspace CLI的Skills文件平均为1.6KB,设计精良[60][61] - **交互设计问题**:为人类设计的交互式提示会卡住AI,需要增加`--no-interactive`等参数[62] - **输出信息过载**:查询可能返回数万字符的JSON,淹没关键信息,需要像Google Workspace CLI使用`field masks`来控制返回字段[64][65] - 根本原因在于“为AI设计”和“在AI中验证”是两件事[66] 六、AI管理自身工具的实践 - 在开发工具时,应转变思路,让AI来管理自己的工具,例如让AI读取`--help`信息、处理安装错误和权限配置,这比编写覆盖所有边界情况的传统安装逻辑更可靠[70][72][74] - 提出了一个5维Agent兼容度评分,从是否为AI设计、是否支持结构化输出、自查、预览和注意上下文大小五个方面评估CLI工具的AI友好度,以呼吁工具开发者重视对AI的适配[74][75] 七、行业生态的缺口 - **发现机制缺失**:用户难以知晓有哪些可用的AI CLI工具,npm和GitHub有条件但缺乏动力成为AI工具的“应用商店”[79] - **认证流程繁琐**:不同服务(飞书、Google、Stripe)有各自的登录认证体系,用户安装多个工具时需要重复登录,体验不佳[81] - **安装体验不佳**:现有的包管理器(如npm、brew)是为懂命令行的开发者设计的,当操作者变为AI时,权限、依赖缺失等问题成为障碍[83][84] - 行业当前缺乏让工具、协议和说明书能被高效发现、安装和信任的基础设施层,构建此层基础设施的公司将成为AI时代的npm[86][87] 八、总结:CLI成为AI能力分发的关键 - CLI正成为当下效率最高的AI能力分发方式,每个好用的CLI工具都为AI增加一项技能,同时减少上下文噪音[89][91] - 行业正处于新旧交替的混乱时代,旧的格式、数据壁垒、包管理器与新的AI原生工具链交织在一起[92][93]
为什么一夜之间大家都在做 CLI?
歸藏的AI工具箱· 2026-03-30 08:33
行业趋势:AI驱动CLI工具复兴 - 近期,包括飞书、Google、Stripe、ElevenLabs、网易云音乐在内的多家看似不相关的公司,不约而同地发布了命令行界面工具[1][2] - 这一趋势的核心驱动力是AI代理的兴起,因为CLI的纯文本交互模式与AI“文字进、文字出”的运作方式天然契合[8][9] - 行业观点认为,CLI正在成为当下效率最高的AI能力分发方式,一个CLI工具同时包含执行能力、通信协议和使用说明,构成一个完整的AI插件[85][86] CLI工具的设计哲学转变 - 新一代CLI工具的设计初衷是假设调用者可能是AI,因此与传统面向程序员的CLI有本质区别[24] - 为适配AI,新工具的设计原则包括:所有操作通过参数一次性传入以避免交互式弹窗、默认输出JSON等结构化格式以便AI解析、自带`Skills`说明书文件、支持`--dry-run`预览模式[26] - 这些工具还支持AI通过查询来了解其命令和参数,无需阅读完整文档[26] CLI作为AI的能力扩展基础设施 - AI的实际能力取决于其能调用的工具和获得的上下文(说明书)[17] - 对于训练数据中未包含的新工具(如2026年发布的飞书CLI),AI极度依赖显式提供的`Skills`说明书文件来了解其功能[19][20] - 工具越新,AI对其显式说明书的依赖就越强,因为训练数据永远追不上工具的发布速度[21][22] - 通过安装不同的CLI工具(如ffmpeg处理视频、飞书CLI管理日程),AI能够获得相应的新技能[14][15][16] CLI对比传统AI插件的优势 - 新一代CLI工具将执行能力(CLI命令)、通信协议(如MCP)和使用说明(`Skills`)三者打包,形成了一个事实上的插件[34][36] - 相较于平台锁定的插件(如Claude Code的插件只能在Claude Code中使用),CLI工具是模型无关的执行层,任何AI模型(如Claude、Cursor、Gemini、DeepSeek、Qwen)都能调用[38][39][40] - CLI工具的分发更自由,通常通过`npm`等包管理器发布,无需经过严格的平台审核流程[41] - CLI支持通过Shell管道进行工具组合,这是几十年前的设计但在AI时代重新焕发价值,而插件之间通常是隔离的,缺乏标准组合方式[44] 当前CLI工具面临的主要挑战与缺陷 - **安全性是结构性缺陷**:CLI直接执行shell命令,缺乏类似插件沙箱的细粒度权限控制(如“只读不写”),目前仅靠`--dry-run`和弹窗确认作为补救措施[48][49][50] - **说明书过大影响AI性能**:部分工具的`Skills`文件过大,会占用大量AI上下文窗口容量,导致推理质量下降;作为正面案例,Google Workspace CLI的`Skills`文件平均仅1.6KB[53] - **交互式提示导致AI卡死**:早期Stripe CLI等工具设计的交互式选择菜单会导致AI代理无法处理,后来通过增加`--no-interactive`参数解决[54] - **输出信息过载**:一些查询会返回数万字符的JSON,淹没有用信息;Google Workspace CLI采用`field masks`设计来限制返回字段大小,但跟进者尚少[56][57][58] 行业基础设施的缺口与未来机会 - **缺乏发现机制**:用户目前难以系统性地发现有哪些CLI工具可供AI使用,`npm`和`GitHub`最有条件成为AI工具的“应用商店”,但缺乏相关动力[75] - **认证体验碎片化**:不同工具(飞书、Google、Stripe等)拥有独立的登录认证体系,给用户带来巨大摩擦[76] - **安装流程对AI不友好**:现有的包管理器(如`npm`、`brew`)是为懂命令行的开发者设计的,当操作者变为AI时,权限问题、依赖缺失、路径冲突等会成为实际障碍[77][78] - 行业当前不缺工具、协议和说明书,缺的是让这三者能够被发现、被便捷安装、被信任的基础设施层,谁能构建出这一层,谁就将成为AI时代的`npm`[81][82][83]
计算机行业周报:行业大幅下跌,腾讯免费安装OpenClaw-20260309
国元证券· 2026-03-09 16:18
报告行业投资评级 - 行业投资评级为“推荐” [6] 报告核心观点 - 尽管本周计算机行业指数大幅下跌,但AI Agent技术正加速成熟并进入落地周期,相关应用有望推动Token消耗快速增长,建议关注提供相关AI服务的厂商 [4][21] 根据相关目录分别总结 1. 指数表现 - 本周(2026.3.2-2026.3.6)计算机(申万)指数大幅下跌5.29%,跑输主要指数,在申万一级行业涨幅榜中排名倒数第三 [1][11] - 同期,上证指数下跌0.93%,深证成指下跌2.22%,创业板指下跌2.45% [1][11] - 细分板块全部下跌:计算机设备指数下跌5.19%,IT服务Ⅱ指数下跌5.36%,软件开发指数下跌5.29% [1][13] - 板块内个股涨少跌多,上涨、下跌、走平数量分别为38、310、10只,涨幅前三为南网数字(26.53%)、科远智慧(17.64%)、中科星图(15.21%) [13][15] 2. 重大事件 - **OpenAI发布GPT-5.4系列**:首次在通用模型中内置Computer Use能力,合并代码、推理、桌面操控能力;在多项评测中超越人类基准;标准版API定价为输入2.50美元/百万tokens,输出15美元/百万tokens,Pro版溢价12倍;Tool Search机制将token消耗降低47% [16] - **Google Workspace CLI上线GitHub**:覆盖全部Workspace产品,输出为JSON格式,支持MCP Server模式并内置大量技能文件,可被Claude Code等Agent调用 [16] - **模型更新与竞争**:谷歌推出Gemini 3.1 Flash-Lite,输入定价0.25美元/百万tokens;OpenAI发布GPT-5.3 Instant,优化对话体验,联网幻觉率降低26.8% [16] - **OpenClaw生态发展**:字节、阿里、腾讯已在各自云平台上线OpenClaw服务,中国创业者围绕其进行爆发式创新,涌现多种Agent应用 [16] - **英伟达发布专用推理芯片**:将在GTC大会发布基于Groq LPU架构的芯片,首位客户为OpenAI,提供3GW专用推理算力,理论推理速度可比GPU快100倍 [16][17] 3. 重点公告 - **星环科技**:正在研发新一代“认知数据库”,将AI和机器学习集成到数据库引擎中,旨在实现从“数据存储中心”向“智慧分析中心”的跨越 [2][19] - **中控技术**:预计2026年1-2月营业收入为5.20亿元至6.20亿元,同比增长20.59%至43.78%;预计归母净利润为-0.74亿元至-0.62亿元,同比增长32.95%至43.82% [2][19] - **辰安科技**:向特定对象发行A股股票事项已获得国务院国资委及安徽省国资委批复 [3][19][20] - **其他行业动态**:Anthropic为Claude上线“导入记忆”功能;小米推出系统级AI Agent产品“miclaw”,封装超过50个系统级工具并打通IoT生态 [19] 4. 投资观点 - 行业下跌主要受全球大环境影响 [4][21] - **腾讯云推出OpenClaw免费安装服务**:提供一站式部署、配置服务,其轻量应用服务器Lighthouse已成为国内开发者部署Agent的首选入口,单日部署规模突破历史峰值 [4][21] - **核心判断**:AI Agent技术趋于成熟,相关应用进入落地周期,预计将带动Token消耗快速增长,建议关注提供相关AI服务的厂商 [4][21]
一键接入OpenClaw,谷歌开源CLI狂揽15k Stars,Agent开始接管Workspace
机器之心· 2026-03-08 12:08
谷歌发布Google Workspace CLI工具 - 谷歌发布了名为Google Workspace CLI(gws)的命令行工具,并将其开源在GitHub的Google Workspace官方组织名下[2] - 该工具将Drive、Gmail、Calendar、Sheets、Docs、Chat、Admin等Google Workspace云API封装为一个统一的命令行接口[2][3] - 项目发布后短时间内已获得15.3k的GitHub Stars和559个Forks,显示出极高的社区关注度[3] 工具的核心功能与定位 - 核心功能是为AI智能体(Agent)自动化工作流提供标准化接口,通过结构化JSON输出,方便接入包括OpenClaw在内的各类AI Agent系统[2][4] - 该CLI将Google Workspace API变成了一个既适合人类开发者也适合AI Agent调用的统一接口,人类无需手写API请求,AI无需编写额外工具[4] - 对于人类开发者,工具提供`--help`帮助信息和`--dry-run`预览请求功能,并自动处理分页[4] - 对于AI智能体,所有返回结果都是结构化的JSON,结合内置的Agent技能,大型语言模型(LLM)可直接管理Google Workspace而无需额外工具[4] 技术架构与实现 - 采用两阶段解析策略:首先识别要调用的服务并获取其Discovery Document进行缓存,然后动态构建命令树并解析剩余参数,最后完成认证和执行请求[4] - 所有输出,包括结果、错误信息和元数据,均以结构化JSON形式返回[4] - 项目使用Rust语言编写,但通过npm安装时无需安装Rust工具链,因为包中已包含预编译的原生二进制文件[10] 内置的AI Agent技能 - 工具内置了超过100个Agent Skills,以`SKILL.md`文件形式提供,每个支持的API都对应一个技能,并包含用于常见工作流程的高层辅助技能[6] - 提供了50个精选使用示例,覆盖Gmail、Drive、Docs、Calendar和Sheets等核心Google Workspace应用[6] - 主要技能包括`gws-shared`(认证、全局标志和输出格式)、`gws-drive`(管理文件和共享云端硬盘)、`gws-sheets`(读写电子表格)、`gws-gmail`(管理邮件)和`gws-calendar`(管理日历和事件)[8] - `gws-shared`技能包含安装配置,若系统环境变量中未检测到gws CLI,OpenClaw等AI Agent会自动通过npm安装它[7] 市场反响与安装要求 - Google Cloud AI总监Addy Osmani在社交媒体上宣传此项目,相关帖子浏览量突破了500万[3] - 安装要求包括:Node.js 18或更高版本(用于通过npm安装)、一个用于获取OAuth凭证的Google Cloud项目,以及一个拥有Google Workspace访问权限的Google账号[12] - 除了通过npm安装预编译二进制文件,用户也可以从GitHub Releases下载二进制文件,或从源码构建[11][12]
腾讯研究院AI速递 20260306
腾讯研究院· 2026-03-06 00:31
OpenAI GPT系列模型进展 - GPT-5.4已在内部进行A/B测试,测试版一次提示可生成超过6000行代码 [1] - GPT-5.4将配备极限推理模式,上下文窗口从40万tokens翻倍至100万tokens [1] - GPT-5.4可能实现永久记忆功能,疑似结合SSM与Transformer架构,上下文长度或超预期 [1] - OpenAI发布GPT-5.3 Instant,主打对话体验优化,联网幻觉率降低26.8%,减少不必要拒答和免责声明,写作能力和语气自然度显著提升 [3] - OpenAI发布GPT-5.3 Instant时暗示GPT-5.4即将到来,并宣布GPT-5.2 Instant将于2026年6月3日正式下线 [3] 谷歌产品与技术更新 - 谷歌发布Workspace官方CLI工具,覆盖Drive、Gmail、Calendar、Sheets、Docs等全线产品,所有输出为JSON格式 [2] - Workspace CLI工具实时读取谷歌API目录自动生成命令,支持MCP Server模式一行命令启动,内置100多个SKILL.md文件和50个常用操作配方,可直接被Claude Code等Agent调用 [2] - 该工具仓库包含专为AI编程助手编写的AGENTS.md贡献指南,支持Google Cloud Model Armor防注入攻击,当前版本v0.3.4仍在活跃开发中 [2] - 谷歌推出Gemini 3.1 Flash-Lite模型,定价为输入0.25美元/百万tokens,首token响应速度比Gemini 2.5 Flash快2.5倍,输出速度提升45%,Arena Elo评分达1432 [3] - 谷歌NotebookLM发布影院级视频概览功能,由Gemini 3担任总导演把控叙事逻辑、Nano Banana Pro负责生成创意图片、Veo 3制作流畅动画和音效,三模型协同工作 [4] - NotebookLM新版支持一个笔记本存储多个同类型产出,可为不同语言、不同岗位定制专属版本,并支持多任务处理 [4] - NotebookLM界面改版为音频、视频、思维导图、报告四大区块,功能将在未来几周陆续发布,目前已向Ultra用户推出英文版 [4] 其他AI公司模型与产品发布 - MiniMax发布Music 2.5+模型,新增纯音乐创作能力,支持古典管弦、极简主义、电子、氛围音、自然声景等多元风格,覆盖冥想助眠、广告配乐、游戏影视等场景 [4][5] - MiniMax Music 2.5+具备强大的跨风格融合能力,可将东方民族乐器与西方管弦乐自然融合,对笛子、琵琶、古筝等中国传统乐器的音色还原处于行业领先水平 [5] - 该模型单一模型即可处理从纯自然声到多轨器乐编排的完整复杂度,声场三频分明,已开放C端产品体验和API接口 [5] 机器人技术前沿 - 宇树发布春晚武BOT技术论文,提出OmniXtreme双阶段框架:流匹配预训练构建统一动作策略,执行器感知后训练弥合仿真与现实鸿沟 [6] - 真机测试完成157次独立试验覆盖24种高动态极限动作,后空翻成功率达96.36%,端到端推理延迟控制在10毫秒,全部在宇树G1机载Orin NX芯片上原生执行 [6] - OmniXtreme架构已同步开源,通过写实驱动器建模、激进域随机化和功率安全正则化,首次解决了高保真动作追踪与多动作可扩展性之间的长期权衡难题 [6] AI行业生态与趋势 - 外媒称OpenClaw在中国AI圈的发酵速度远超硅谷想象,字节、阿里、腾讯已在各自云平台上线OpenClaw服务,开发者可直接在云端运行Agent [7] - 中国创业者围绕OpenClaw爆发式创新,春节黑客马拉松涌现AI相亲平台、AI招聘网站、AI旅行日志等Agent应用 [7] - OpenClaw的影响已从软件溢出到硬件领域,广州初创公司实现通过Agent远程控制充电设备,创业者认为这是中国AI行业一次「不可逆的冲击」 [7] - Anthropic CEO表示Scaling Law没撞墙,甚至将激进加速,并用棋盘稻米寓言类比AI发展,称当前正处于第40格,前39格的所有震撼加在一起不过是后24格的零头 [8] - Anthropic端到端生产效率已翻两到三倍,模型开始搭建工具和脚手架改进自身工作流,递归式自我改进初现端倪 [8] - 面对Meta开出1亿至5亿美元挖角单个研究员的天价,Anthropic仅流失两人,7位联合创始人至今全部在职 [8] - Sam Altman表示,AI同等智能水平的成本在18个月内下降约1000倍,智能成本将持续趋近于零,GDP将因AI通缩效应变成糟糕的衡量指标 [9] - Altman认为科学进步和经济引擎将被同时自动化,代码领域的变革将以相同模式复制到金融、医疗、法律等所有行业,最被低估的机会是「零人公司」 [9] - Vinod Khosla预言2035年世界将进入极其通缩的经济体,双方共同强调能动性和好奇心是AI时代最重要的元技能 [10] AI在科研领域的应用 - 88岁图灵奖得主Don Knuth发表论文《Claude's Cycles》,记录Claude Opus 4.6在约一小时内通过31次探索,解决了他研究数周未果的三维环面图哈密顿环分解问题 [11] - Claude发明了「蛇形模式」并从失败的模拟退火结果中提取隐藏规律,找到适用于所有奇数维度的通用构造方法,Knuth据此证明共存在760种同类分解方案 [11] - 偶数情况后由GPT-5.3-codex解决,形成Claude解奇数、GPT解偶数,两个AI各解半题的局面 [11]