Coding

搜索文档
拾象 AGI 观察:LLM 路线分化,AI 产品的非技术壁垒,Agent“保鲜窗口期”
海外独角兽· 2025-08-22 12:06
大模型行业分化趋势 - 大模型公司正从通用模型向垂直领域分化 Google Gemini和OpenAI继续专注通用模型 Anthropic聚焦Coding和Agentic领域 Thinking Machines Lab探索多模态和下一代交互[6][7] - 行业呈现横向全家桶与纵向垂直整合两大路线 ChatGPT代表横向全家桶模式 Gemini代表纵向垂直整合模式[6][37] - 模型能力趋同导致前三名格局稳定 OpenAI、Gemini和Anthropic形成第一梯队 其他公司难以突破前三名壁垒[24][26] 头部公司战略与表现 - Anthropic通过聚焦Coding实现爆发式增长 2024年底ARR达9.5亿美元 预计2025年收入超120亿美元 月复合增速达20-30%[8][11] - OpenAI在C端建立强大壁垒 ChatGPT成为10亿用户最快增长产品 ARR达120亿美元 与Anthropic合计占AI产品营收70-80%[29][30] - Thinking Machines Lab获史上最贵天使轮融资 估值100亿美元融资20亿美元 团队来自OpenAI核心infra部门[13][18] - xAI面临战略定位困境 超大算力投入未带来相应回报 可能在未来半年并入Tesla[22] 产品与技术创新 - L4级别体验产品已出现 ChatGPT Deep Research和Claude Code分别实现信息搜索和软件开发的端到端体验[49] - Coding领域成为当前最大红利 Claude Code仅用3-4个月ARR反超Cursor 预计年底达15-20亿美元[33][50] - 模型保鲜窗口持续缩短 Perplexity窗口期近2年 Cursor窗口期9个月 Manus窗口期仅3个月[45] - Context能力成为关键差异点 Claude在long context领域具有独特优势 最新实现百万context能力[52] 市场竞争格局 - 头部效应加剧 OpenAI和Anthropic增速持续陡峭 其他公司出现明显断层[30] - 成本优势成为核心竞争力 不做模型的Coding公司将失去优势 未来竞争重点转向成本优化[3][53] - 谷歌规模效应开始显现 端到端整合TPU芯片、Gemini模型和安卓系统 后劲可能最强[37][60] - 产品形态趋向融合 ChatGPT计划推出广告平台 谷歌整合Gemini功能推出AI mode[55][58] 投资与创业环境 - 投资策略需要高度集中 头部公司拿走最大价值 错过头部项目意味着错过整个周期[65][66] - 创业窗口期缩小 科技巨头既看得懂又跟得动 留给创业公司的空间有限[37][39] - 华人团队全球影响力提升 在AGI领域扮演重要角色 需要积极开拓北美高价值市场[62][63] - 优秀AI产品经理画像变化 下一代PM需要算法或模型背景 才能更好利用模型红利[47] 技术发展前景 - 语言和代码仍是当前最大红利 多模态和机器人发展还需突破多个GPT-4级别技术[49][64] - 产品形态持续演进 可能打破APP端到端优势 介于手机屏幕和APP之间的新形态[60] - 世界模型与Coding可能本质相同 都是实现AGI的"虚拟子宫" 只是路径不同[12] - 智能与产品需要平衡 OpenAI在智能探索和产品转化方面做得最好[40][43]
张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?
Founder Park· 2025-06-14 10:32
Agent行业现状与趋势 - 2025年成为Agent技术加速发展关键年,DeepSeek、GPT-4o和Claude 3.5等推动大模型边界扩展,但行业焦点转向具备自我调度能力的智能体[1] - Agent成为继大模型后全球科技圈最快形成共识的风口,巨头战略重构与创业赛道跟进同步进行,但多数产品陷入"用老需求套新技术"的困境[2] - 行业面临核心挑战:底层设施缺位(可控运行环境/记忆系统/上下文感知/工具调用)制约Agent从演示走向实用[2] 技术路径与产品形态 - 通用Agent领域最佳实践是"模型即Agent"(Model as Agent),如GPT-4o整合LLM/上下文/工具使用/环境等组件端到端训练[14] - 垂直领域Agent分为ToB前台(如HappyRobot的物流电话Agent)和后台(AI for Science多智能体系统)两类[15][16] - Coding Agent发展路径:从Cursor的Copilot(Tab键补全90%准确率)逐步演进至后台异步运行的完整Agent形态[19][22] AGI发展关键领域 - 编程(Coding)被视为通往AGI的"价值高地":数据干净闭环可验证,可能占据大模型产业90%价值[24][47] - 数字世界优先实现AGI的逻辑:端到端软件开发能力是基础,未来两年Agent或能完成人类在数字设备上的所有操作[25] - 评估Agent核心指标:任务完成率+成功率(行业及格线50%)、成本效率(计算/时间成本)、用户粘性(DAU/MAU/留存)[30] 商业模式创新 - 收费模式演进:从基于成本定价→按动作收费(如物流电话单次几毛钱)→按工作流收费→按结果付费→未来可能按Agent本身付费[37][42] - 市场渗透策略变化:自下而上(如Cursor)替代传统SaaS销售模式,医疗领域OpenEvidence通过医生群体切入再植入商业广告[35] - 价值捕获方向:Coding可能服务全球3000万程序员后,通过"氛围编程"拓展至5亿平民开发者,激发应用软件大爆发[47][48] 基础设施需求 - 环境(Environment)构成最大挑战:需要虚拟机/沙盒(如E2B)保障安全执行,专用浏览器(如Browserbase)支持信息检索[56][59] - 上下文系统关键组件:信息检索(MemGPT)、工具发现平台、记忆管理系统[62] - 未来基础设施规模:万亿级Agent任务执行将重构云计算,机器搜索需求或达人类搜索量的50倍(日万亿次)[61] 未来技术演进 - 多模态大一统:理解与生成能力一体化将打开产品想象力,模型持续遵循Scaling Law和"思维链"双范式[63] - 自主学习突破:AI通过在线任务体验提升能力,进入"经验的时代",记忆系统完善将显著提升产品粘性[64] - 交互方式革新:从文字输入转向"永远在线"的异步交互,形成人机新型协作关系(Human on/in the loop)[44][45]
大模型非共识下,什么是 AGI 的主线与主峰?
海外独角兽· 2025-04-02 20:04
文章核心观点 - 2025年第一季度中美AI领域火热,AGI路线图上智能提升是唯一主线,要围绕智能投资和思考,模型公司壁垒在于成为Cloud或OS,未来模型和产品边界将模糊;最大非共识是pre - training空间大,Coding是实现AGI的最好环境,Agentic AI是未来关键,AGI时代组织和文化竞争力仅次于算力 [3] 重新重视Pre - training - pre - training空间大,还会涌现新能力,下一代SOTA模型能显著超过当前模型,只有pre - training能决定模型内在上限,post training和RL不涌现新能力 [5][6] - OpenAI看似不重视pre - training可能是战略选择和组织问题,战略上O系列刷分快、ChatGPT成长快占用精力,组织上pre - training核心团队动荡 [7] - RL能产生合成数据加入pre - training环节,可解决数据瓶颈问题,但training和RL inference融合难,涉及训练框架的Infra问题 [9] - 期待pre - training涌现新能力,如提升模型tool use能力,Manus是Anthropic tool use能力的“ChatGPT时刻” [9][10] - 对两年内实现AGI有信心,Coding是实现AGI最好的环境,是模型的“手”,现实世界多数任务可用Coding表达,Agent可通过操作电脑和手机任务接近AGI [11][12] - Anthropic在Coding上有领先优势,Cursor是热门编程IDE工具,多数开发者选Sonnet,Coding是$1T级机会,模型公司在AI for Science领域突破可达到$1T或$10T [14][15][16] - Coding应作为技术引擎,产品表达形式待定义,期待Cursor在交互表达上有新突破 [17] ChatGPT只是攀登AGI的第一站 - OpenAI和Anthropic在实现AGI路线上发生分化,OpenAI核心bet是O系列和ChatGPT,重视C端市场和自下而上组织文化;Anthropic专注pre - training、Coding和Agentic,重视B端市场和自上而下组织文化 [18] - 路线分化原因可能是Anthropic团队出身pre - training有信心,OpenAI O系列亮眼获更多资源,且pre - training团队变动大 [19] - O系列刷benchmark快,但不确定能否打开智能天花板,其提升的Coding多为竞赛型,Anthropic做实战型Coding更多 [20] - 硅谷对不同路线分歧大,本质是智能和流量哪个重要,更应相信AGI原教旨主义,智能提升是首要目标 [21][22] - 谁能做出显著领先的base model谁可能是赢家,长期来看Anthropic可能比OpenAI更有价值,OpenAI对pre - training重视不够 [23][24] - 国内公司有必要训练自己的闭源模型,智能处于早期阶段,认知差异可能源于想象力局限 [26] - AGI探索主线是智能提升,ChatGPT是第一站,后续还有Coding、Agent、AI for Science等,AI for Science是珠穆朗玛峰,多模态、Online Learning等大概率在主线上 [30][31] - 智能涌现带来Magic moment和流量迁移,当前AGI模型公司和产品无绝对壁垒,应围绕智能主线推动智能提升,应用承接智能红利 [32][33] - DeepSeek放弃Chat Bot流量是因组织文化和智能本质考量,AI Robotics排在AI for Science后面是因数据采集低效、算法架构未达成一致,AI for Science有自动化实验室和垂直领域基础模型等趋势 [33][34][35] Agent & Online Learning - AGI应用爆发少是因Agent产品供给受限,依赖模型能力,模型和云厂商未做好Infra准备,Agent有文本、Coding、通用日常任务等类型 [48] - Agent落地关键能力是Long Context reasoning、Tool use、Instruction following,对应不同Infra能力,Context很重要,存在支付宝级机会 [49][51] - Long Context对Agent完成多步骤任务很重要,但目前未找到有效突破方式,存在数据、成本、架构等难点,long - term memory可能取代Long Context [51][52][53] - 两年内实现AGI确定性高,路径是现有路径,AGI定义是在电脑或数字环境下满足3个90% [54] - 新的范式级路线可能是Online Learning,让模型自主在线探索学习,但存在无清晰reward和目标定义等挑战,可能通过模型微调等实现 [54][55] - 可通过坐标轴评价路线差异,重视数据,未来pre - training叙事和Agentic对算力刺激大,看好算力需求 [58] - 英伟达想成为云厂商,贾扬清的公司被卖符合其战略 [58] 大模型的壁垒到底在哪? - 应做研究驱动的应用,AI市场有泡沫,Agent泡沫刚开始,AI产品定价偏低 [60][61] - 通用Agent能否出现取决于pre - training和RL及关键能力,Reward Model泛化性微弱 [62][64] - 模型公司壁垒可能是成为Cloud或OS,OpenAI商业模式可能较好,Anthropic专注模型pre - training [65] - 投资人应投研究推动的应用,应用公司构建壁垒需考虑用户数据使用和独立环境构建,长期做大需具备调整模型和做Research的能力 [66] - 用户数据对提升模型能力作用微弱,模型和产品边界将模糊,应用公司和模型公司会相互渗透 [67][68] - Agent可能影响SaaS公司价值,模型训练是人类面向未来的大基建投入,价值链利润将向后迁移 [69][70][71] - AI市场可能出现黑天鹅,如全新架构、新的Agent产品形态等 [72] 全球AI公司的竞争格局 - OpenAI核心bet是O系列和ChatGPT,Anthropic专注pre - training、Coding和Agent,OpenAI领先优势加强,流量集中度提升,与Anthropic拿走市场revenue的80% [73][74] - Anthropic和xAI背后有Amazon和Musk支持,DeepSeek和xAI Grok跟随OpenAI路线,Google多模态强但其他bet不清晰 [75] - GPT - 4.5可能较强,GPT - 5可能是hybird model,预期今年夏天推出,有GPT - 3.5到GPT - 4量级的提升 [76][79][80] - OpenAI支持Anthropic的MCP协议,两家有竞争但路径分化,OpenAI与微软可能因利益冲突产生裂痕,分家对微软有影响 [81][82][83] - OpenAI整体较安全,但存在base model不够领先的风险,xAI Grok写作能力突出,与Twitter合并为了流量 [84][85][86] - AGI是普通本科毕业生操作电脑水平,ASI是爱因斯坦水平,实现ASI需突破,Mira的新公司团队强,可能做打败ChatGPT的产品 [87][88][89] - Manus和Perplexity执行力强,Manus更吃模型能力,ChatGPT的Deep Research后续会集成更多产品,有两个发展方向 [90][91][92] - Devin解决的问题易被模型公司覆盖,Cursor可能是阶段性产品,期待DeepSeek出现范式级创新 [93] - ilya和Noam对AGI推动贡献最大,其次是Dario和Alec等,Sam对业界贡献大但部分行为可能是烟雾弹 [94][95] 如何构建AGI portfolio - 构建AGI portfolio会投25%给Anthropic,25%给Bytedance,10%给OpenAI,10%给Mira的公司,5%给ilya的公司,5%给Cursor,5%给Manus,15%待定,若DeepSeek融资也会投25% [96] - 字节被低估,营收和利润好,可内生投入AGI,Anthropic团队、Roadmap和战略重点更受看好,Mira公司成功概率高 [97][99] - 未来3 - 5年投资最大的bet是AGI带来科学的文艺复兴,会出现多家市值超$10T的公司和下一个Google、Windows等 [101] 组织文化竞争仅次于算力 - 组织和文化竞争力是仅次于算力的核心竞争力,做AGI要有赌性,人才密度比数量重要 [103] - 判断AGI - native组织要看是否AGI first、Research first等,团队成员要年轻聪明、有想象力和执行力 [103][104] - 大概率OpenAI和Anthropic最早实现AGI,中国字节和DeepSeek等也可能实现,开源可突破地缘封锁 [105] - 中美差距快速缩小,中国人才强,字节Infra能力强,有望在AGI领域有突破 [105][106] - 硅谷多0 - 1创新,中国多1 - 100创新,未来中国创新模式可能变化,需资本充裕和冒险精神 [109] - 应把产品和技术做到极致,跨越地缘问题,激进全球化,期待更多中国跨国公司出现 [110][112]