Workflow
AI Coding
icon
搜索文档
我不给人做产品,给 Agent 做 | 42章经
42章经· 2025-06-29 22:48
Agent Infra市场机会 - Agent Infra被视为下一个投资热点 未来Agent数量将达到SaaS的几千倍[1][2] - 现有互联网基础设施不适合AI使用 需要为Agent重构[2] - Agent Infra市场规模巨大 类比AWS级别的机会[17] - 互联网上40%流量来自机器人 但大模型流量仅占0.1% 未来可能有10万倍增长空间[23][56] Agent与人类差异 - 交互方式:Agent通过文本和多模态后端交互 人类依赖前端界面[5] - 学习方式:Agent可同时执行任务和学习 人类无法并行[5] - 工作模式:Agent多线程并行 人类单线程按流程执行[6][7] - 责任界定:人类可负责自身行为 Agent需要安全边界[8][10] - 执行状态:Agent需保持多任务状态 人类天然不需要[8] Agent浏览器特性 - 云端化运行 持续工作不需休息[24] - 无前端界面 直接后端交互[25] - 设计反馈循环 支持自主迭代[26] - 安全机制:本地处理账号密码 不泄露给大模型[28][29] - 支持多线程任务连续性 避免资源浪费[31] Agent Infra技术架构 - 三层架构:Runtime层(浏览器内核) Agentic层(交互控制) Knowledge层(领域knowhow)[32] - Runtime层解决网页拉取和渲染 Agentic层控制AI与网页交互[33] - 必须同时构建Runtime和Agentic层才能实现完整功能[35] - Browserbase估值3亿美元 专注Runtime层[22][34] Agent Infra细分领域 - 主要环境:Coding环境(逻辑执行) Browser环境(网页交互)[37] - 工具类:身份认证 支付能力 通讯工具等可重做[38] - 场景切入:旅游Agent需CRM 搜索 支付等工具[40] - 数学环境:公式执行器 定理检索等工具[42] - 物理环境:传感器 具身智能 空间智能等[38] 市场发展阶段 - 类比22年AI Coding 当前Browser Use处于早期[44] - 全球软件开发市值3-4万亿美元 AI Coding仅100亿 增长空间大[47] - 互联网活动通过AI提升5%效率将创造巨大市场[48] - 差异化关键:深耕细分场景 抢占99.9%未开发市场[56] Agent产品设计核心 - 反馈循环设计比上下文或数据更重要[50] - 人类知识可能非必要 Agent可通过强化学习自主迭代[51][52] - AlphaProof案例:仅用+1/-1奖励机制 不参考人类解法即获奥数银牌[52] - 未来范式:Agent通过环境体验获取真实反馈 自主进化[53]
出门问问发了新硬件,AIGC第一股急需新故事
36氪· 2025-06-25 19:54
公司战略转型 - 公司放弃大模型研发,转向Agent和AI Coding等热门领域,推出内置Shadow AI的TicNote录音笔 [1][3] - 公司调整硬件策略,从原创研发转向成熟硬件形态+AI软件开发的模式,降低研发成本 [3][12] - 公司海外业务收入占比达41.8%,智能硬件95%以上销往海外,AIGC解决方案收入同比增长88.5% [18] 产品表现与市场定位 - TicNote海外首月销量"很低",国内定价999元低于竞品Plaud的1140元,试图通过Shadow AI实现差异化 [14] - 智能手表TicWatch销量持续下滑:2023年比2022年少卖6万块,2022年比2021年少卖12.6万块 [7] - 公司产品线包括AI配音、数字人、视频生成和智能硬件,但均非行业第一梯队 [3][19] 行业竞争格局 - 卡片录音笔品类已验证PMF,竞品Plaud 2024年创收1000万美元 [3] - 数字人赛道竞争激烈,2024年中国相关企业达114.4万家,2025年前5月新增17.4万家 [19] - 华为/小米/三星凭借手机生态挤压公司硬件空间,公司ODM模式缺乏护城河 [10] 财务与资本市场表现 - 公司连续4年亏损,2024年营收3.9亿元为近4年最低水平 [4][18] - 股价从上市3.8港元跌至0.35港元,跌幅超90% [6] - 端侧AI硬件存在成功案例:Oura Ring销量250万件/5亿美元,Liberlive吉他年营收10亿元 [11]
TRAE 如何思考 AI Coding :未来的 AI IDE,是构建真正的「AI 工程师」
Founder Park· 2025-06-25 18:19
AI Coding赛道发展 - 越来越多的玩家涌入AI Coding赛道,覆盖从低代码平台到专业IDE的全场景[1][2] - 编程语言发展史是不断抽象和求简的过程,从汇编语言到Python代码行数减少95%(2000行→100行),全球开发者数量从百万级增长至GitHub破亿规模[9][10] - AI Coding将推动下一次飞跃,通过自然语言生成代码、智能调试等方式降低编程门槛,重塑开发者边界[10] TRAE产品理念 - 定位为国内首个AI Native IDE,核心是构建「AI+工具」模式,推出以AI对话为核心的Solo模式[3][31] - 目标是打造The Real AI Engineer(TRAE),具备自主理解、思考、优化和协作能力,解放开发者重复性工作[11][12] - 产品设计三要素:模型能力(大脑)、工程能力(手和脚)、产品能力(语言),三者有机结合[13][16] 核心功能与数据 - 代码补全功能「cue」支持预测补全位置和连续补全,帮助开发者进入心流状态[17][18] - 自然语言编程功能允许开发者通过对话完成需求分析、技术预研和代码生成,支持多Agent协作[19][20] - 月活用户突破100万,累计生成60亿行被采纳代码,日均处理150万次查询[24] 未来发展方向 - 从代码生成扩展到软件全流程生成,案例显示非技术背景产品经理可独立完成APP开发[25][27] - 提出「统一工作空间」概念,将工具模块化并由统一AI调度,推出Solo模式实现端到端开发[31][32] - 未来产品形态分为AI交互区(左)和工具集区(右),集成文档、Terminal和预览工具,计划开放第三方生态[32]
百文心快码正式发布AI IDE,首创设计稿一键转代码、支持MCP
AI前线· 2025-06-24 14:47
百度文心快码Comate AI IDE发布 - 公司发布行业首个多模态、多智能体协同的AI原生开发环境工具Comate AI IDE,首创设计稿一键转代码功能,目前百度每日新增代码中43%由文心快码生成[1] - 该工具定位为AI时代工程师的"工作台",具备AI辅助编码全流程、多智能体协同、多模态能力增强等核心能力,支持MCP对接外部工具[2] - 产品设计理念强调重构开发工作流而非依附现有平台,在编辑器界面、底层逻辑及开发者生态层面掌握主动权[1] 技术特性与竞争优势 - 多模态能力突出表现:支持Figma设计稿转代码(F2C)节省80%重复劳动,实现图片/自然语言转代码并实时预览调整,前端场景还原度高[3] - 编程智能体Zulu升级后具备自主任务拆解、决策及思考过程可视化能力,开发者可通过自然语言交互完成复杂需求[2][4] - 对比Cursor产品,在中文理解、F2C、需求主动追问、页面调试等方面具有显著优势,更适配国内研发场景[3] 市场影响与用户案例 - IDC预测AI Coding市场将在2025年进入爆发期,用户认为自研独立IDE代表更先进的智能代码助手发展方向[1] - 实际案例显示算法工程师借助Zulu两周内完成医疗辅助诊疗系统开发,实现从单一技术角色向全栈能力跨越[4] - 产品降低编程门槛,可服务视障开发者及小学生等群体,体现技术普惠价值[1] 产品易用性与生态建设 - 内置文件检索、代码分析等十余种开发工具,支持快速迁移原有IDE配置,覆盖需求分析至代码提交全流程[3] - 多智能体协同架构允许不同专长智能体组合工作,在专精场景、行为能力等维度持续专业化升级[2]
AI算力逻辑闭环
国盛证券· 2025-06-22 15:24
报告行业投资评级 - 增持(维持) [5] 报告的核心观点 - AI编程成为现象级应用,海外投资机构a16z报告显示软件开发是AI企业应用采用率最高的用例,代码生成行业预计2024 - 2029年复合年增长率达53%,海外AI编程龙头Cursor商业化进展迅速 [1][16] - Agent成为AI新增长引擎,推动海外B端AI采用率攀升,企业AI预算增长超预期,未来一年预计平均增长约75% [2] - 头部大模型高速增长驱动算力需求激增,谷歌、OpenAI、Anthropic等公司的模型使用量和营收大幅增长 [3] - 国内AI应用与算力需求闭环持续孕育,以字节跳动为例,在AI Coding、Agent与多模态方面重点发力,同时驱动算力需求增长 [4][8] 各部分总结 Coding已成为现象级AI应用 - 软件开发是AI企业应用采用率最高的用例,代码生成行业预计2024 - 2029年复合年增长率达53%,专业开发人员占Claude对话的37% [1][16] - 2025年5月23日Anthropic推出Claude 4系列模型,编程能力提升,GitHub将使用Claude Sonnet 4作为GitHub Copilot新编码Agent的基础模型 [1][18] - 海外AI编程龙头Cursor商业化成果显著,截至2025年6月ARR突破5亿美元,较4月中旬增长60%,6月完成9亿美元融资,估值达99亿美元 [1][23][24] Agent成为AI新增长引擎,海外B端AI采用率攀升 - Agent能自主理解复杂目标、拆解任务等,推动各行业加速采用AI,截至2025年5月美国企业AI采用率为9.2%,高于2024年第四季度的7.4% [2] - 企业AI预算增长超预期,从试点项目和创新基金成为核心IT和业务部门预算的经常性项目,未来一年预计平均增长约75% [2] - 企业使用的模型份额中,OpenAI领先,谷歌和Anthropic过去一年进步较大,不同规模企业对模型的采用率有差异 [34] 大模型用量快速增长,算力需求激增 - 谷歌每月处理的token总量超480T,较去年同期增长50倍,超700万开发者使用Gemini模型,月活突破4亿 [3] - OpenAI全球约8亿 - 10亿人使用ChatGPT,2025年2月周活超4亿,付费企业用户突破300万,预计今年营收达127亿美元 [3][42] - Anthropic第一季度年化营收达20亿美元,较上一季度增长一倍多,年消费超10万美元的客户数量较去年同期增长八倍 [43] 国内AI应用与算力需求闭环持续孕育 - 字节跳动在AI Coding、Agent与多模态方面重点发力,AI编程产品TRAE月活用户超100万,内部超80%工程师使用 [44] - 字节做AI Coding的意义包括技术普惠、提升研发效率、追求智能上限,未来AI有望统筹软件开发各环节 [45][48] - 火山引擎大会升级发布多款产品和开源项目,构建大模型开发全链路工具矩阵,为开发者提供一站式解决方案 [50] - 多模态方面,豆包App实时通话功能升级,支持视频聊天问答,豆包视频生成模型Seedance 1.0 pro发布,性能强大且性价比高 [4][52] - 国内AI产业进展强化算力需求,豆包大模型日均tokens使用量超16.4万亿,较去年5月增长137倍,阿里云和百度智能云2025年一季度营收增速达近三年最高点 [8][56] 建议关注 - 算力:寒武纪、海光信息等多家公司 [9][58] - Agent:阿里巴巴、腾讯控股等多家公司 [9][58] - 自动驾驶:江淮汽车、赛力斯等多家公司 [9][59] - 军工AI:能科科技、品高股份等多家公司 [10][60]
对话 ClackyAI 李亚飞:「套壳」之上还有厚度,数据闭环没那么重要
Founder Park· 2025-06-20 20:30
产品定位与核心优势 - ClackyAI定位为云端AI Coding Agent产品,主打"人类负责架构,AI编写代码"模式,通过云端IDE实现专业级软件开发[2] - 相比市面同类产品,其差异化在于能构建包含前后端和数据库的完整专业软件,而非仅Demo级产品[22][23] - 核心优势来自三年云端编程技术积累+一年专注研发,形成"产品+架构"的双重能力[10][24] 技术架构与工程实践 - 采用云端CDE(Cloud Development Environment)架构,为AI预装完备开发环境(数据库/测试工具等),实现开箱即用[47][48] - 关键know-how是最小测试单元机制,通过即时Lint检查/单元测试等形成快速闭环,提升代码质量[54][55] - 工程实践强调复用人类现有技术栈(如MySQL/PostgreSQL),而非创造新体系,确保可维护性[34] 行业趋势判断 - AI Coding领域将分化为模型公司与应用公司,应用层价值增长斜率已超过模型层[12][15] - 云端开发是未来趋势,本地IDE是过渡形态,AI工作流最终会迁移到云端环境[45][46] - 专业级软件需求持续存在,但开发成本将大幅下降,未来1-2人团队可完成原需6-8人的工作量[30][32] 产品演进路线 - 当前处于L3阶段(人机协作各占50%),计划演进至L3.8(人类仅需架构审核)[58][61] - 交互设计逐步弱化人类干预,未来实现需求输入→AI拆分任务→多Agent协同交付的自动化流程[61] - 通过共享上下文工作区解决AI记忆局限,实现跨thread的项目信息协同[63][64] 市场竞争策略 - 认为数据积累优先级不高,当前应聚焦产品定义和流程设计[14][18] - 大厂因资源诅咒和KPI导向难以主导该赛道,创业公司凭借原创性更易突围[69][70] - 市场空间足够容纳多家企业,重点在于降低专业软件开发门槛[67][30] 人才需求变化 - 初级程序员需求减少,未来可能出现"业务设计师"等新角色,侧重需求抽象而非编码[79][80] - 架构师角色可能弱化,因AI遵守规范可减少架构污染,但架构思维仍需保留[43][44] - 学习编程仍必要,但AI辅助可大幅降低学习曲线,加速新人成长[79]
对话言创万物创始人:AI Coding 是在「垒砖」,我们想用 AI「盖房子」
深思SenseAI· 2025-06-18 09:56
AI Coding与AI SWE行业分析 核心观点 - AI Coding是当前最火热的AI赛道之一 但仅占软件工程(SWE)全流程的30%左右 真正的机会在于AI SWE即用AI重构软件研发全链路[1][3][9] - 严肃场景的软件开发复杂度远超Vibe Coding的范畴 需要解决架构设计、测试部署等系统性难题[2][11][21] - 未来AI Agent将成为软件研发的Controller和Planner 渗透到需求沟通、代码生成、测试运维等各个环节[16][17][39] 行业现状与机会 AI Coding局限性 - 当前AI主要聚焦单个模块代码生成 仅占工程师工作时间的30-35% 无法覆盖SWE全流程[9][11] - Vibe Coding适合demo开发 但严肃场景需要解决多模块协同、负载均衡等复杂问题[2][11] - GitHub Copilot等工具仍依附传统IDE形态 未来可能被多Agent协同的工作台取代[17][29] AI SWE市场潜力 - 软件工程是价值极高的存量市场 2025年云厂商、数据库等SWE相关企业市值已达千亿级[12] - 大厂在AI SWE领域进展缓慢 GitHub Copilot体验落后于Cursor等创业公司产品[13][14] - 技术快速迭代打破现有优势 创业公司有机会在细分领域超越资源更丰富的大厂[14][15] 技术演进路径 发展阶段划分 - L0-L2:从代码补全到局部任务自动化 当前行业处于L2阶段[35] - L3-L4:实现模块级和系统级自动化 具备初级架构设计能力[35][38] - L5:SWE AGI实现Result-as-a-Service 人类仅需需求输入和结果验收[35][39] 关键技术突破 - 需构建Agent专用基础设施 如Superbase后端服务、MCP通信协议等[17] - 端到端Agent Learning将用户反馈数据融入模型训练 提升任务完成率[48] - 沙盒隔离、服务发现等Infra支持Agent安全自主运行[31][48] 公司战略与差异化 产品定位 - 聚焦大粒度任务自主完成 而非代码补全等单点功能[29][31] - 从目标而非代码出发 对齐工程师与产品经理的任务目标[22][31] - MVP版本已开发10万行代码 复杂度远超普通AI应用[49][51] 竞争优势 - 无存量用户包袱 产品架构围绕Agent自主运行设计[30][31] - 团队效率达大厂2-5倍 全员使用多款AI工具实现原生提效[31][32] - 30人精干团队专注技术突破 避免大厂常见的组织效率折损[47][53] 未来工作模式 人机协作演进 - 短期:工程师带领5-10个Agent协同工作 聚焦创造性任务[42] - 长期:优秀工程师可管理100个Agent 通过高效调度提升生产力[42] - 初级工程师可能被替代 高阶工程师成为需求澄清和结果验收的关键节点[41][42] 组织形态变革 - AI原生组织会议减少50% 工程师日均会议不超过2场[53] - 软件设计原则将重构 现有面向人类的工程方法可能不再适用[33] - 团队规模控制在40人以内 通过技术深度而非人力规模取胜[47][54]
对话言创万物创始人:AI Coding 是在「垒砖」,我们想用 AI「盖房子」
Founder Park· 2025-06-17 17:49
AI Coding与AI SWE行业分析 行业现状与核心观点 - AI Coding是当前最火热的AI赛道之一,模型代码能力的提升将解锁更多应用场景[1] - Vibe Coding虽受非专业人群关注,但严肃软件生产场景复杂度远超预期[2] - 软件开发是构建数字世界的基础产业,写代码仅占软件工程全链路的30%以下[3][11] - AI SWE(AI软件工程)是价值极高的存量市场,2025年初前TikTok算法负责人陈志杰创立言创万物专注该领域[4] 市场机会与竞争格局 - AI SWE覆盖场景广泛且复杂,目前尚无公司能解决所有环节问题,预计未来将出现多家高价值公司而非垄断[15] - 大厂推进速度未必快于创业公司,如GitHub Copilot体验已被Cursor超越,谷歌Jules工具表现平平[15] - 创业公司优势在于:用户因单点体验不佳易流失、技术迭代快打破现有优势、资源投入更聚焦(Cursor早期仅30人团队)[16] 技术演进路径 - AI对SWE影响分阶段:当前L2阶段(局部任务自动化)→L3(模块级自动化)→L4(系统级实施)→L5(SWE AGI)[38] - 未来产品形态将突破传统IDE框架,通过控制台调度多Agent协同工作(编码/测试/修复等),开发者仅需验收结果[19][20] - AI擅长解决SWE中的"人为困难"(占工作量70%),如规范遵循、沟通协调、进度估算等痛点[25][26] 公司战略与产品方向 - 言创万物聚焦"大粒度任务自主完成",从目标导向而非代码导向设计产品,强调Agent对工具的调用能力[23][24] - 当前MVP版本已含10万行代码,复杂度远超表面"套壳"应用[50][52] - 团队30余人中90%为工程师,采用AI原生工作模式,效率达大厂时期的2-5倍[31][49] 未来工程师角色演变 - 高阶工程师将转变为"Agent管理者",1人可协调100个Agent并行工作,专注创造性架构设计[42][43] - 初级工程师可能被快速替代,但技术决策仍需人类工程师兜底最后5%关键问题[41] - 衡量标准从代码量转变为解决问题的能力,形成"Result as a Service"新型工作模式[40][44] 技术瓶颈与突破方向 - 当前AI在架构设计中的局限在于缺乏隐性经验,需系统性接入业务场景知识[37] - 需构建AI专属基础设施:沙盒隔离系统(E2B)、多Agent通信协议(MCP)、服务发现机制等[19][47] - 软件工程原则将重构,现有面向人类的开发范式(如函数封装)可能被Agent-centric模式取代[33]
关于 Multi-Agent 到底该不该做,Claude 和 Devin 吵起来了
Founder Park· 2025-06-16 22:16
多智能体系统核心观点 - Anthropic与Cognition两篇文章共同揭示了多智能体系统的适用场景与局限性:Anthropic强调多智能体在低依赖、可并行任务中的高效性(如研究任务),而Cognition指出高依赖、紧耦合任务(如AI Coding)目前不适合多智能体架构 [2][12][39] - 多智能体系统性能提升显著但成本高昂:Anthropic的测试显示多智能体系统比单智能体性能提升90.2%,但token消耗达普通聊天的15倍 [9][10] - 当前技术限制下,多智能体系统需满足三大条件:任务价值足够高、需要大量并行处理、信息量超出单个上下文窗口 [12][16] 多智能体架构设计 - 编排器-工作器模式为核心架构:主智能体负责协调,子智能体并行执行任务,通过动态搜索替代传统RAG的静态检索 [13][16][19] - 并行工具调用实现效率飞跃:引入两层并行化(主智能体同时启动3-5个子智能体,子智能体并行使用3+工具)使复杂查询研究时间缩短90% [25][26] - 上下文管理策略关键:采用外部内存存储关键信息、智能压缩机制防止溢出,子智能体输出直接写入文件系统减少token开销 [35][36] 多智能体适用场景 - 最佳应用领域:开放式研究任务(如跨领域软件开发、商业策略制定、学术研究),可覆盖信息量超出单智能体能力的广度型查询 [9][38] - 当前不适用场景:需要共享同一上下文的高依赖任务(如实时编码协调),LLM智能体尚无法有效处理任务分配与实时协调 [12][57] - 典型成功案例:Anthropic多智能体系统完成标普500公司董事会成员搜索等复杂研究任务,而单智能体系统失败 [9] 多智能体工程挑战 - 提示工程决定系统行为:需开发智能体心理模型,明确任务分配规则(简单查询1个智能体3-10次调用,复杂研究10+子智能体) [21][23] - 调试复杂度指数级增长:微小提示改动引发连锁反应,需建立模拟环境观察失败模式(如子智能体重复搜索、工具选择错误) [21][31] - 部署策略特殊:采用彩虹部署逐步迁移流量,避免中断运行中的智能体状态 [33] 多智能体评估方法 - 传统评估方法失效:需采用最终状态评估而非路径验证,LLM评判者规模化评估事实准确性、引用质量等维度 [27][28][29] - 人工测试不可替代:发现自动化评估遗漏的边缘情况(如SEO内容偏好),修正信息源选择偏差 [29] - 涌现行为需监控:智能体交互产生非预期行为,需追踪决策模式与交互结构 [30] AI Coding领域实践 - Cognition实践表明:2025年技术条件下,编程任务采用多智能体会导致系统脆弱,因决策分散且上下文共享不足 [57] - 单线程线性agent更可靠:Claude Code子agent仅回答明确定义问题,避免并行工作导致的矛盾输出 [55] - 上下文工程是核心:需压缩历史对话关键细节,微调专用模型管理长上下文 [53]
为何字节大力投入AI Coding?
虎嗅APP· 2025-06-13 08:17
字节跳动AI Coding产品TRAE的核心观点 - 字节跳动推出自研AI IDE产品TRAE,月活用户已超过100万,公司内部超过80%工程师使用该产品辅助开发 [2][4][9] - TRAE基于豆包大模型1.6开发,针对工程场景优化,支持代码补全、局部生成、重构等核心功能,能完成85%代码自动生成 [14][15][17][18] - 产品目标从AI Coding升级为AI Development,通过Agent能力整合文档、调试、运维等全流程开发环节 [19][21][22] - 开发案例显示,3天完成3000行代码的英语学习应用开发,效率较传统方式提升显著 [13][17] 技术实现与产品特性 - 采用自然语言编程模式,工程师用200字技术方案描述可生成300行功能代码 [15][17] - 具备上下文感知能力,可预测代码修改位置并自动跳转,补全效率高于传统IDE [14] - 支持自定义Agent,允许用户串联不同开发工具和工作流程 [22][24] - 相比早期MarsCode插件形态,TRAE IDE实现更完整的AI开发体验 [14] 行业影响与发展方向 - AI Coding显著降低编程门槛,案例显示11岁儿童可借助TRAE开发奥数题库网站 [5][8] - 编程作为高度结构化任务,对提升大模型智能上限具有特殊价值 [10][11] - 未来方向是实现AI调度全流程开发(AI Development),将代码占比40%的传统开发模式升级为AI主导的全流程自动化 [19][21] - 行业需突破复杂场景应用能力,当前测试方法(如贪吃蛇游戏)难以反映真实开发需求 [25]