Workflow
谷歌太壕了!编程Agent大招至简:开源且免费,百万上下文、多模态、MCP全支持
量子位·2025-06-26 10:11

谷歌推出Gemini CLI - 公司推出开源免费的Gemini CLI工具,允许用户在终端直接访问Gemini模型,提供业界最高免费限额:100万上下文窗口的Gemini 2.5 Pro,每分钟60次请求,每天上限1000次 [2] - 工具不仅限于编程,还支持多模态功能,如通过命令行生成视频(调用Veo和Imagen)和图像 [3][4] - 发布后GitHub仓库标星一夜飙升至10.8k,引发广泛讨论,网友认为其免费策略对竞品(如Cursor、Claude Code、OpenAI Codex CLI)形成冲击 [4][5] Gemini CLI核心功能 - 能力覆盖代码理解、文件操作、命令执行和动态故障排除,支持自然语言指挥模型写代码和Debug [8][9] - 编码功能包括:支持100万上下文窗口查询编辑大型代码库、集成GitHub自动执行任务(如管理pull requests和分支)、根据PDF或草图生成App [11] - 多模态支持:调用Imagen、Veo、Lyria生成图像视频,并整合谷歌搜索功能 [11] 技术细节与安装 - 工具与谷歌AI编程助手Gemini Code Assist技术共享,采用Apache 2.0开源协议 [13][14] - 安装需Node.js 18+环境,通过npx或npm命令部署,登录谷歌账号即可获取免费额度,更高用量需申请API密钥 [15][16][17] - 官方提供prompt示例,如自动化生成幻灯片展示近期git历史,更多用例可在GitHub仓库查看 [18][19][20]