Coding

搜索文档
深度|吴恩达:语音是一种更自然、更轻量的输入方式,尤其适合Agentic应用;未来最关键的技能,是能准确告诉计算机你想要什么
Z Potentials· 2025-06-16 11:11
Agentic系统构建 - 从讨论"是否是Agent"转向"Agentic性光谱"的思维转变 更有效减少定义争论[4][5] - 实际应用中更多机会集中在简单线性流程自动化 而非高度自治的复杂系统[6][7] - 企业面临的主要挑战是如何将现有工作流拆解为可自动化的"微任务"并建立评估体系[7] AI开发关键技能 - 掌握LangGraph/RAG/memory/evals等工具的组合应用能力 如同搭建乐高积木[9][11] - 建立系统性评估体系至关重要 可避免在错误路径上浪费数月时间[10] - AI辅助编程显著提升开发效率 但部分企业仍禁止使用[15] - 语音技术栈(voice stack)被严重低估 在降低用户交互门槛方面潜力巨大[15][18] 技术演进趋势 - MCP协议通过统一API标准显著简化数据对接流程 使集成成本从N×M降至N+M[21][22] - Agent间协作仍处早期阶段 跨团队Agent协同目前几乎没有成功案例[23] - 语音交互面临延迟挑战 需采用预响应机制等技巧优化用户体验[19] 初创企业建议 - 执行速度是初创企业成功的第一关键指标[26] - 技术知识深度比商业知识更为稀缺和关键[26] - 编程能力将成为基础技能 能明确表达需求比编码本身更重要[24]
深度|GitHub CEO :真正的变革不是程序员被AI取代,而是写代码的起点、过程与目的正在被AI重构
Z Finance· 2025-06-15 10:05
核心观点 - AI正在重构软件开发的起点、过程与目的,从代码自动补全到多模型Agent协作,开发者角色从执行者转变为系统指挥者[1][2] - GitHub Copilot将正式开源,延续VS Code的开源策略,推动开发者生态创新[2][17] - 未来软件架构将融合确定性代码与非确定性生成,开发者需在自然语言抽象与代码实现层间切换[24][25] - Agent系统将形成互联生态,个人Agent与工作Agent分工协作,改变知识工作范式[40][42] 技术演进路径 - 2020年GPT-3/Codex首次实现无编译器支持的语法完美代码生成,颠覆传统编程认知[1][5] - Copilot预览版数据显示AI生成代码占比达25%(Python更高),用户净推荐值72分(-102-100范围)[5][6] - 从Tab补全(延续20年IDE传统)到"氛围编程",AI缩短"想法→实现"周期,保持开发者心流状态[7][10][32] - 多模型协作成为趋势,代码补全用低延迟模型,Agent任务用强工具调用模型[16][22] 开发者角色转变 - 工程师核心能力转向验证Agent输出,确保符合业务目标与安全要求[13][31] - 编程教育仍需重视系统思维培养,基础计算机科学知识成为现代通识教育[11][12] - 开发者需掌握"技艺进化"能力,20年前全栈工程师概念不存在,未来需持续适应AI工具[14][15] - "匠心"不会被取代,但可委托Agent处理测试、修Bug等繁琐工作,专注创意实现[33] 行业生态影响 - VS Code十年更新超100版本,Copilot开源将激发IDE插件、代码迁移工具等衍生创新[17][22] - 允许"自带密钥"连接第三方模型(如OpenAI/Olama),推动多模型协作生态[22] - 技术债务转化市场显现,COBOL→Java等遗留系统迁移需求催生新商业机会[22] - 零代码门槛降低催生新型开发者,但复杂系统架构能力仍为专业壁垒[35][36] 未来趋势预测 - 操作系统内核持续存在,但用户界面将Agent化,如Jarvis式智能助手[26][27] - 实时生成的一次性应用兴起,解决特定需求后自动销毁,降低软件维护成本[27][28] - Agent间通信协议标准化,形成跨设备/场景的智能体网络[39][40] - 软件工程领域出现"杰文斯悖论"——效率提升刺激更多需求产生[38]
Cursor CEO 最新专访:五年内所有编程将用 AI 进行,「品味」才是工程师的核心竞争力
搜狐财经· 2025-06-14 21:36
公司估值与融资 - 估值接近百亿 最新一轮融资高达9亿美元 [1] - 公司是今年风头最劲的AI产品 创造了「vibe coding」理念 [1] 产品理念与技术方向 - 目标是发明新型编程方式 通过描述需求直接构建软件 [3][4] - 专注于帮助专业程序员 目前AI生成代码占比40%-50% [5] - 产品从编辑器底层构建 而非浏览器插件 以实现对未来编程形态的完全控制 [38] - 每天处理超过5亿个模型调用 具备大规模推理能力 [27] 行业发展与市场定位 - AI编程领域存在十几家竞争者 但公司凭借前瞻性产品路线脱颖而出 [38] - 2022年是关键转折点 从CAD领域转向编程领域 因对自身专业更熟悉且数据更丰富 [24][30] - 坚信模型能力将持续快速提升 产品设计始终围绕"扩展法则"规划 [35][37] 技术挑战与解决方案 - 面临代码库规模与上下文窗口限制的瓶颈 1000万行代码约1亿token [9] - 需要解决持续学习与长期背景知识获取的问题 [9] - 用户界面设计是关键挑战 需平衡高层次控制与细节编辑能力 [10] 未来展望 - 预计5-10年内编程方式将发生根本性变革 [4] - 专业开发者效率将大幅提升 千人规模项目进展速度有望加快 [15] - 非软件公司将更容易获得定制化开发能力 降低工程门槛 [17]
巨头博弈下,Agent 的机会和价值究竟在哪里?
海外独角兽· 2025-06-14 19:42
核心观点 - 2025年是Agent技术加速发展的关键年份,但真正实现用户价值闭环的产品仍稀缺 [6] - Agent的真正门槛在于基础设施而非模型能力,包括记忆系统、上下文感知、工具调用和可控环境等模块 [6] - Coding被视为衡量AGI最关键的先验指标,可能占据大模型产业阶段性90%的价值 [6][45] - AI Native产品需要构建同时服务于AI和人类的双向机制 [34] - Agent商业模式正从按token/调用次数计费向按结果/工作流计费演进,未来可能出现直接雇佣Agent的模式 [6][39] 01 通用Agent是大模型公司主战场 - 通用Agent领域表现最佳的是"模型即Agent"(Model as Agent)模式,如OpenAI的Deep Research和o3模型 [12] - 通用Agent市场已成为大模型公司的主战场,创业公司难以仅靠通用需求做大 [13] - 垂直领域Agent分为前台(与人交互)和后台(重复性工作)两类,典型案例包括HappyRobot(物流沟通)和AI for Science创业公司 [14][15] 02 Cursor是从Copilot发展到Agent - Cursor通过三个阶段完成从Copilot到Agent的转型:自动补全→代码重构→后台异步执行 [22][23] - 关键策略是先从Copilot切入收集用户数据,逐步过渡到Agent形态,而非一开始就追求完全自动化 [18] - 产品设计注重用户交互心智,通过同步交互收集反馈数据,为后续Agent能力奠定基础 [23] 03 Coding是衡量AGI最关键的先验指标 - Coding数据具有干净、可验证、易闭环的特性,最可能率先实现数据飞轮 [24] - 数字世界是实现AGI的第一环境,Coding能力提升将带动指令遵循等核心能力 [25] - 若AI无法规模化完成端到端应用开发,在其他领域进展会更缓慢 [25] 04 做一个好的Agent需要什么条件 - 需要构建可验证的反馈机制和数据飞轮环境,如代码和数学领域 [26] - 产品需同时考虑人和Agent的需求,实现AI Native设计 [28] - 评估标准包括任务完成率(行业及格线约50%)、成本效率(计算/时间成本)和用户指标(留存/付费率) [30][32][33] 05 Agent定价会从基于成本转向基于价值 - 商业模式演进路径:按成本→按动作→按工作流→按结果→按Agent本身 [39] - 典型案例Hippocratic AI的AI护士成本仅为人类护士的1/4 [39] - 未来可能出现智能合约模式,通过Crypto技术实现Agent经济价值分配 [40] 06 人与Agent该如何交互协作 - 交互模式分为Human in the loop(持续参与)和Human on the loop(关键节点介入) [41] - 未来高重复性任务将实现高度自动化,人类仅需复核摘要 [42] - 新的异步协同方式将出现,需要探索Agent与Agent之间的交互机制 [43] 07 Agent爆发离不开Infra - 环境(虚拟机/浏览器)是Agent开发早期80%问题的根源 [55] - 关键基础设施包括上下文管理(记忆/检索)、工具发现平台和安全机制 [57][58] - 未来机器搜索需求可能达万亿次/天,远超人类搜索规模(200亿次/天) [59] - 大厂分化明显:Anthropic专注Coding,OpenAI布局多方向,Google具备端到端能力 [52][53]
张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?
Founder Park· 2025-06-14 10:32
2025 年,是 Agent 按下加速键的一年。 从年初 DeepSeek 引发的惊叹,到 GPT-4o 和 Claude 3.5 接连登场,大模型的边界一次次被重 写。但真正让 AI 产业链神经绷紧的,不是模型的性能迭代,而是 Agent 的横空出世。 Manus、Devin 等产品的爆火,都在重申一个共识: 大模型将不再只是工具,而是要成为可以自 我调度的智能体 。 Agent 由此成为继大模型之后,全球科技圈最快形成共识的第二个风口。 从巨头的战略重构到创业赛道的快速跟进,Agent 正成为下一个全民下注的方向。但在 C 端产品 密集涌现、开发者为其狂热的同时,真正跑通用户价值闭环的项目却凤毛麟角,越来越多的产品 陷入了「用老需求套新技术」的焦虑。 热浪过后,市场也回归冷静:Agent 究竟是一场范式的重构,还是一次新的包装?所谓「通用」 与「垂直」的路径分野,是否真的带来可持续的市场空间?而「新入口」背后,是交互方式的进 化,还是旧世界的投影? 顺着这些疑问继续下探,我们会发现,Agent 的真正门槛,或许并不在模型能力,而在其赖以生 存的底层设施。从可控运行环境,到记忆系统、上下文感知、工具调用,每 ...
为何字节大力投入AI Coding?
虎嗅APP· 2025-06-13 08:17
对于洪定坤和TRAE幕后团队的所有人来说,他们希望软件开发能够 all in one,让 AI 成为调度者,更大幅度地降低开发的门槛,提升开发效率。AI Coding是可预见的未 题图| 字节跳动技术副总裁洪定坤在演讲现场 虎嗅注: 昨天的火山引擎 Force 原动力大会主论坛,是字节跳动技术副总裁洪定坤的首次公开 露 面 , 三 十 多 分 钟 的 演 讲 , 主 题 全 部 围 绕 "AI Coding" 和 字 节 跳 动 自 研 AI IDE "TRAE"。 AI Coding,一直以来是大模型落地最具潜力的方向之一。伴随着底层模型编程能力的 突飞猛进,AI Coding 已经开始在程序员的日常开发工作中产生了深刻影响。包括在字 节跳动公司内部,超过 80% 的工程师都在使用 TRAE 这样的 AI Coding 产品辅助开 发。值得一提的是,作为首个中文 AI IDE,TRAE 目前的月活用户数量已经超过了 100 万。 在演讲中,洪定坤还分享了自己用TRAE做AI Coding的一些实践,比如在三天时间 里,如何"见缝插针"地开发一个英语学习应用。 来,但"AI Development"是更高级的 ...
为何字节大力投入AI Coding?
虎嗅APP· 2025-06-13 08:05
字节跳动AI Coding产品TRAE的核心介绍 - 字节跳动技术副总裁洪定坤首次公开介绍自研AI IDE产品TRAE 该产品专注于AI Coding领域 月活用户已超过100万[1][3] - TRAE名称含义为"The Real AI Engineer" 体现公司对大模型变革编程领域的预期[2] - 豆包大模型1.6版本在编程能力上有显著提升 为TRAE提供更强技术支撑[3][21] AI Coding的战略意义 - 技术普惠:通过AI降低编程门槛 案例显示11岁儿童可借助TRAE开发奥数题库网站[5][6] - 提升研发效率:字节内部超过80%工程师使用TRAE辅助开发 相当比例代码由AI生成[8][10] - 追求智能上限:编程作为高度结构化任务 有助于提升大模型的逻辑推理和算法设计能力[11] TRAE的产品特性 - 核心功能包括代码补全和局部代码生成 能根据上下文精准预测修改位置[16] - 从MarsCode插件升级为完整IDE 支持代码重构 批量修改 知识问答等复杂任务[17][18] - 支持自然语言编程 案例中85%代码通过自然语言对话生成 3天完成3000行代码开发[18][20] AI Development的愿景 - 目标超越Coding环节 覆盖文档 运维 调试等全流程 当前写代码仅占软件开发40%工作量[23] - 引入Agent能力实现工作流自动化 未来可能将数天工作量压缩至数小时[25][26] - 强调人机协作模式 即使AI生成大部分代码 仍需工程师主导技术方案和代码审查[27][28] 实践案例展示 - 现场演示英语学习应用"积流成江" 包含对话 单词管理 用户登录等复杂功能[14][15] - 该应用开发周期从传统数周缩短至3天 已实际发布而非演示版本[15][20] - 开发过程视频和完整代码将公开 供用户体验和参考[15][20]
Z Product|Lovable背后关键产品,YC校友Supabase再融两亿美元,Vibe Coding的全栈开发工具
Z Potentials· 2025-06-12 12:24
Vibe Coding与Supabase的兴起 - Vibe Coding由OpenAI联合创始人Andrej Karpathy提出,核心是以自然语言驱动编码,AI生成原始代码,降低编程语言限制,聚焦产品创新与用户体验[2] - Supabase作为Firebase开源替代方案,提供Postgres数据库、身份验证、实时API等后端服务,GitHub星标超8万[3][6] - 客户案例显示Supabase节省75%开发时间,基础设施成本减半[5] Supabase核心技术架构 - **数据库**:基于PostgreSQL构建,内置身份验证与精准访问控制,每个项目为独立Postgres数据库[3] - **身份验证**:整合Google、Apple等十多个平台,快速搭建多渠道认证体系[4] - **边缘计算**:自动扩展后端资源,支持Node.js项目平滑迁移,降低人力成本[4] - **存储功能**:开源多类型内容存储,与身份验证/数据库集成,支持API管理权限[4] - **实时功能**:提供数据同步解决方案,适用于协作工具、聊天室等实时应用[4] 公司发展历程与融资 - 成立于2020年,联合创始人Paul Copplestone(B2B领域连续创业者)与Ant Wilson(金融科技背景)[6][8][9] - 2025年4月完成2亿美元D轮融资,Accel领投,投后估值20亿美元,7个月内估值从9亿翻倍[12][13] - 开发者社群达170万人,注册率因Vibe Coding(如Cursor)过去三月翻倍[12][13] 产品定位与市场影响 - 初期定位"实时Postgres",后调整为"Firebase开源替代品",Hacker News热度历史第二(仅次于Stripe)[11] - 数据库部署量从80增至800个,从实验性工具转变为实用基础设施[11] - 创始人称未来十年社区将扩展至企业用户,与AI编程趋势深度绑定[12]
红杉专访 OpenAI Codex 团队:AI Coding 的未来,应该是异步自主 Agent
Founder Park· 2025-06-11 22:40
OpenAI 5 月份推出的 Codex Agent 跟其他 Coding 产品不太一样。 全新的 codex-1 编程模型,可以并行处理多个任务,而且能够独立完成编程全任务流程,目标是可以作 为「任务委托」的助手,接管整个开发流程,而不只是编码补全。 Sam Altman 对这个产品颇多赞誉,说这是第一次让他有 「接近 AGI」 感觉的产品之一。 从「代码补全」到「任务委托」,AI 编程正在朝着新的,更能解放生产力的方向发展。 OpenAI 是如何思考这个产品的,为什么要单独出一个编程模型?未来 AI Coding 的想象力在哪里? Codex 的研究员 Hanson Wang 和产品负责人 Alexander Embiricos 近期在接受红衫资本的专访中分享了关 于 Codex 的核心理念、技术演进、以及对于未来 AI 编码工具交互方式的设想等内容。 TLDR: 超 6000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 邀请从业者、开发人员和创业者,飞书扫码加群: 未来最高效的 AI 编程模式,不是 AI 在开发者电脑上进行实时代码补全(结对),而是开发者将 整个任务打包委托给在云端 ...
红杉专访 OpenAI Codex 团队:AI Coding 的未来,应该是异步自主 Agent
Founder Park· 2025-06-11 22:39
产品定位与核心功能 - Codex Agent 是 OpenAI 推出的全新编程模型 codex-1,能够并行处理多个任务并独立完成编程全流程,目标是从「代码补全」升级为「任务委托」的助手 [1] - 产品核心理念是让 AI 在云端独立环境异步完成任务并交付完整方案,而非仅提供实时代码补全 [6] - 模型与 o3 同源但通过强化学习微调,重点解决从「优秀程序员」到「优秀软件工程师」的转变,学习专业开发者的工程实践品味和偏好 [6][14][27] 技术实现与创新 - 采用容器化环境统一训练和生产环境,解决现实代码库缺乏一致测试框架和文档标准的难题 [6][28] - 模型支持长时间任务执行(最长30分钟),具备制定计划、引用工作成果和输出验证信息的能力 [29][34][37] - 训练重点包括 PR 描述规范、代码风格一致性、测试验证等工程实践细节,相当于为模型补足「三年工作经验」 [15][27] 行业影响与未来趋势 - AI 编程将大幅降低开发门槛,预计专业软件开发者数量增加而非减少,催生更多个性化软件需求 [6][25][26] - 开发者角色将从编码转向审查、验证和高层规划,顶尖用户每天可通过 Codex 完成超10个 PR [21][26] - 2025年可能成为「Agent 之年」,编程交互方式将融合同步与异步体验,界面可能类似 TikTok 信息流 [54][49][52] 产品生态与战略 - OpenAI 愿景是未来仅保留通用助手 ChatGPT,通过接入专用工具实现多功能,而非构建独立智能体 [6][39][48] - Codex CLI 作为终端环境中的协同工具,与云端独立工作的 Codex Agent 形成互补 [13][38] - 竞争优势在于模型泛化能力,可结合 Operator、Deep Research 等其他 Agent 获取外部上下文信息 [47][48] 用户体验优化 - 采用「富足心态」使用模式更高效,建议并行运行多个任务并接受多次尝试 [6][19] - 修复 Bug 是典型优势场景,能自主验证问题并提供可行方案 [17][18] - 任务粒度设计是关键挑战,建议先通过「提问模式」生成高级计划再细化执行 [30][31]