Serverless
搜索文档
为什么 Claude Code 放弃代码索引,使用 50 年前的 grep 技术?
程序员的那些事· 2025-09-25 10:53
文章核心观点 - Claude Code选择使用grep等无索引、实时搜索的方式,这一看似技术倒退的选择,实则是对Unix无状态设计哲学的现代传承,在性能上大幅超越了其他方案[5] - 无状态设计的核心优势在于通过放弃复杂的状态管理,获得更好的可组合性、可靠性和可扩展性,这在计算机科学历史上被反复证明[5] - 在AI时代,Claude Code的选择重新定义了“智能”工具的标准:真正稀缺的不是智能本身,而是可预测性、行为的确定性以及知道何时遗忘[54] 引言:一个看似倒退的选择 - 当主流AI编程助手采用向量索引实现语义搜索时,Claude Code选择了grep这个诞生于1973年的命令行工具,不建立持久代码索引,每次搜索实时执行[5] - 这一选择引发行业讨论,有观点认为这是“一步烂棋”,并质疑其grep-only方式会消耗过多tokens[3] 理解状态的本质 - 状态的本质区别在于:无状态计算的输出仅取决于当前输入(Output = f(Input)),而有状态计算的输出则同时依赖于输入和历史(Output = f(Input, History))[12] - 银行账户是有状态的典型例子,需要记住所有历史交易;而汇率转换是无状态的,只需当前汇率即可完成计算[9] 无状态思想的历史脉络 - 无状态思想可追溯至17世纪的数学函数,其确定性和可预测性成为无状态设计的理论基础[11] - 1973年Unix管道概念的提出将无状态思想带入实践,通过管道符号将多个无状态工具串联,每个工具只做一件事并做到极致,从而获得无限的组合可能[14][16] - 2000年REST架构将无状态作为核心约束,因其在分布式系统中显著降低了横向扩容的复杂度[20][22] - Serverless架构(如2014年的Lambda)通过强制无状态的编程模型,换取运维的简单性和成本的弹性[23][25] 无状态设计的优势 - 可组合性:无状态组件像乐高积木,可通过自由组合解决不同问题,每个新需求只需在已有组合上微调,无需重写整个程序[30][31] - 并行自然性:无状态设计让并行变得简单高效,例如16个CPU核心可独立工作,将搜索任务从42秒缩短至3.8秒,实现10倍性能提升[32][34] - 简单性:无状态服务无需复杂的生命周期管理(如启动准备、关闭清理、崩溃恢复),降低了开发复杂度和系统可靠性风险[35] - 可测试性:无状态函数具有确定性,相同输入永远产生相同输出,测试时无需准备环境或清理状态,排错更简单[35] 现实的权衡 - 某些场景状态是必需品,如游戏世界需要持续性、用户界面需要响应性、资源管理需要经济性[39][41] - 判断标准是:如果系统崩溃重启,用户能接受从零开始则为无状态,否则为有状态[41] - 现实系统通常采用混合策略,最常见的是无状态计算与有状态存储结合,如无状态API服务器搭配有状态数据库[43][44][45] - 核心洞察是:选择无状态或有状态是工程权衡的艺术,状态本身并非问题,无管理的状态才是问题根源[47] AI时代的新思考 - Claude Code的“agentic search”方案在性能测试中大幅超越了RAG(向量索引)等其他方案[49] - 其优势包括零配置自由(立即可用,支持管道组合)、确定性价值(行为完全可预测)、隐私根本保障(完全本地执行,架构上杜绝泄露)以及维护零成本(无索引卡住或缓存损坏问题)[50][51] - 不同技术方案有各自适用场景:Cursor向量索引适合创意编程和探索代码库;JetBrains传统索引适合企业级开发;Claude Code无索引方案则适合重视简单、可控、可组合的场景[52][53] - 在AI时代,无状态设计的意义在于重新思考智能工具的标准,强调可预测性和行为确定性比单纯的记忆更重要[54]
云上技术服务方案和实践
阿里云· 2025-09-22 13:42
**报告行业投资评级** - 该报告未明确提供行业投资评级 [1][18] **报告的核心观点** - 游戏行业已发展成融合技术、艺术与人文的庞大生态系统,技术革新与架构突破是产业飞跃的关键 [4] - 游戏开发与运维面临复杂性指数级增长,需系统化解决方案应对高效稳定架构、千万级玩家体验及数据价值挖掘等挑战 [4] - 阿里云提供全链条技术方案,覆盖游戏架构、网络优化、安全防护、数据管理及AI美术创新,助力行业构建稳定、安全且具创意的游戏世界 [5][16] **根据相关目录分别进行总结** 游戏架构 - 游戏分类基于运行平台(端游、主机、手游、页游、云游戏、VR/AR)和玩法类型(MMORPG、SLG、MOBA等),不同类别对架构设计、资源需求及网络延迟要求差异显著 [20][55][60] - 游戏架构涵盖系统架构(玩法逻辑与内容设计)、技术架构(服务端、客户端、数据处理及网络通信)和部署架构(全球分布式部署),需综合考虑延迟要求、数据合规性、扩展性及成本效益 [21][54][80][95] - MMORPG强调分布式服务器架构与全球低延迟同步 [101][105];SLG侧重集中部署与数据合规 [110][113];MOBA要求极低延迟与高实时交互 [117][120];放置经营类注重异步设计与经济系统稳定性 [124][126] 游戏网络 - 网络需满足实时性(MOBA延迟<100ms)、可靠性(99.99%可用性)及扩展性(分钟级扩容)三大基础特性 [127] - 节点选型策略基于用户区域分布:国内全局服延迟要求100ms以内(上海/杭州),海外全局服200ms以内(新加坡/香港/美西) [129][133] - 网络拓扑采用多活架构(同城双活+异地灾备)、分层设计(接入层-逻辑层-数据层)及弹性带宽预留(20%~30%冗余),结合全球加速(GA)、CEN组网及智能运维工具(Terraform)提升体验与运维效率 [135][136][139][143] 游戏安全 - 安全架构需应对三类挑战:业务主机直接暴露公网端口、集群暴露四层/七层接口 [27] - 防御体系包括高冗余水位防护、高可用容灾、全链路多重防护及可用性监控 [28] - 重保实践涵盖防护能力梳理、配置巡检、监控告警及应急预案演练 [29] 游戏下载 - 高可用架构采用多CDN厂商+主备源站、OSS源站高可用及CDN缓存优化方案 [30] - 安全防护聚焦OSS安全策略与防篡改机制 [30] - 运维监控通过客户端/服务端埋点日志及监控告警实现,容灾预案包括限流与质量预案,活动准备涉及CDN/OSS资源报备及预热 [31] 游戏数据库 - 灾难类型包括资源生命周期问题、实例误操作、错误配置及数据删除 [32] - 恢复原理分实例层级(整体恢复)和SQL层级(细粒度数据恢复) [33] - 规避方案涵盖账号/实例维度管控、权限限制、定期备份、云产品高频备份及跨地域灾备 [35][36] 游戏大数据 - 运营场景依赖实时湖仓架构(云原生或开源生态)及Flink等工具挖掘玩家行为数据 [38] - 常见问题包括Flink高频问题、数据备份及产品容灾能力 [39] 游戏美术 - AIGC可提升美术效率(通义系列辅助创意与个性化设计)但存在创造力局限、质量控制及版权问题 [42][45] - 美术设计阶段涵盖角色、场景、UI/UX、特效及后期合成 [40] 游戏内容审核 - 审核方法包括人工、自动化及混合式(人机协作),面临语境复杂性、模型偏见、对抗攻击等挑战 [46] - UGC安全审核需解决业务痛点并通过技术方案实现合规与效率提升 [47][50] 游戏行业展望 - 技术演进从"基建时代"(本地化到互联网化)到"智能运营时代"(云原生驱动),未来将进入"虚实共生时代"(全面云化、AI深度融合、UGC 3.0及元宇宙入口) [51][52]
Agent应用爆发,谁成为向上托举的力量?
36氪· 2025-08-06 18:31
AI Agent发展现状 - AI Agent正从被动响应迈向主动决策 成为连接数字世界与物理世界的核心枢纽 [1] - 具备推理、规划、记忆与工具使用能力的智能体正在重塑产业形态 涵盖企业Agent、学术Agent和个人Agent [1] - 2025年AI Agentic基础设施迎来爆发拐点 开源大模型突破提供认知"大脑" 模型上下文协议生态繁荣赋予灵活"四肢" [1] - 全球80%企业将在年内部署Agent 大脑与四肢的协同进化倒逼基础设施全面升级 [1] 企业应用痛点 - 早期RPA产品只能自动化简单单一工作流程 不具备真正智能且不能解决复合化复杂问题 [3][4] - 生成式AI出现后真正具备智能的Agent应用带来效率提升 但网页或App形式不适合专业开发者与企业用户 [5] - 本地部署面临五大核心痛点:AI推理算力限制、任务执行算力弹性不足、工具配置复杂、权限冲突问题、安全性差 [5][6][7][8][9] - 消费级设备无法部署高精度大模型 云端算力成为主流方案但存在弹性扩展难题 [6] - 超过43%的MCP服务节点存在未经验证Shell调用路径 83%部署存在配置漏洞 88%AI组件未启用防护机制 [9] - Agent缺乏长期记忆影响业务使用范围 语义记忆和场景记忆缺失限制任务完成能力 [10] 基础设施解决方案 - 云厂商竞相推出新一代Agent Infra架构:AWS AgentCore解决长时执行与状态记录 Azure AI Foundry集成Serverless计算 Google Vertex AI优化长时运行需求 [12] - 阿里云函数计算Function AI提供自主选择模型与工具的组装式设计 PPIO推出国内首个Agentic AI基础设施服务平台 [13] - 新一代基础设施聚焦长时运行、会话亲和、会话隔离、企业级IAM和VPC及模型框架开放等技术突破 [18] - 突破传统Serverless执行时长限制(如AWS Lambda15分钟上限)支持数分钟至数小时连续工具调用 [18][19] - 通过状态持久化、冷启动优化和开放集成解决LLM Agent持续推理、Workflow Agent状态流转和Custom Agent灵活定制需求 [22] - 开发范式从手动拼凑传统组件转向利用原生Infra实现高效安全可扩展的开发部署 [23] 市场机遇与发展趋势 - Agent Infra成为模型公司、云厂商和初创公司积极拓展领域 创业公司存在显著机会 [24] - 机会存在于现有Infra的AI-native需求环节 包括更快冷启动速度、更强隔离性及更好的AI workflow结合 [24] - 易用性高且价格合理的Infra产品有望被广泛采用 因Agent开发追求研发投入ROI [24] - 基础设施持续创新推动Agent生态共建 使开发变得像组装乐高积木一样便捷 [24]
Cloudflare's Latest Product Could Be a Game Changer
The Motley Fool· 2025-04-29 19:10
Cloudflare开发者平台新动态 - Cloudflare基于其全球边缘计算网络为开发者提供多种产品,包括Serverless函数(Workers)、网站托管(Pages)、全功能数据库(D1)和事件驱动系统(Queues),近期还推出多款AI产品以实现超快速AI推理 [1] - 现有开发者平台缺乏部署任意第三方应用的能力,例如内容管理系统或身份验证系统,Workers虽能运行JavaScript/Python代码但适用场景有限 [2] 容器产品技术突破 - 公司将于6月推出Containers开放测试版,容器技术可将应用代码与依赖项打包,实现标准化快速部署 [3] - 新容器产品使任何能部署在AWS等传统云服务商的应用均可部署至Cloudflare平台,突破原有开发者平台的主要限制 [4] - Containers将与Workers深度集成,支持编程式启停容器、流量路由和实例扩缩容,简化传统容器环境的复杂配置 [5] 目标客户与竞争优势 - 容器产品特别适合计算需求波动大的企业,采用按秒计费的CPU/内存/磁盘使用量定价模式,支持闲置休眠和流量峰谷自动扩缩 [6] - 公司现有24万付费客户包括35%的财富500强企业,容器产品将帮助这些客户将工作负载从传统云服务商迁移至Cloudflare平台 [7] - 相比AWS等传统云服务商,Cloudflare带宽成本显著更低,对成本敏感且工作负载波动大的AWS客户具有价格优势 [8] - 未绑定任何云服务商的初创企业可能被Cloudflare按用量付费、无需预留容量的定价模式吸引,有助于快速扩展业务 [9] 产品发展路线 - 容器产品6月进入开放测试阶段,未来正式发布后将支持过去无法在Cloudflare上运行的各类工作负载 [10]