Workflow
Founder Park
icon
搜索文档
LangChain CEO 再聊 Agent:chat 模式只是起点,Ambient Agents 才是未来
Founder Park· 2025-08-05 20:15
Agent与Workflow之争 - 核心观点:Agent和Workflow并非对立,而是互补关系,未来更可能是Agent+Workflow的组合优化[4][7] - Workflow本质是工具,只是工具中用到AI能力,适合流程化控制但想象空间有限[4][6] - Agent更具灵活性,任何人都可以构建,但存在风险,其"智能体化程度"(agenticness)是关键指标[9][10] - 两者核心区别在于描述任务的难易程度,Workflow更确定性而Agent更自然语言化[11] Agent的未来发展方向 - Chat模式只是起点,未来将向"环境化/常驻"(ambient)模式发展,主动监听事件流并异步执行[14] - 需要建立"指挥中心"(Command Center)来管理长时间运行的任务,而非简单对话列表[15] - 中间形态是"工作计划"(work plan),将大任务分解为子任务并委派给Agent[18] - 可靠性是当前主要限制因素,需要人类监控和任务分解来提高[17][19] Multi-Agent系统 - 未来不是单一万能Agent,而是由专业Agent组成的生态系统[20] - 在功能性记忆完善前,定制化Agent仍是必需,可指向正确数据和流程[20] - 可能出现"总管"Agent模式,由中央Agent协调多个子Agent完成任务[22] - 多Agent系统可通过辩论、批判等方式提高输出质量,目前处于研究阶段[23][24] 行业现状与创业策略 - 当前处于"AI的迷雾"时代,技术迭代极快,任何超过六个月的规划都可能被推翻[25] - 执行力是核心护城河,需保持比市场略微领先的产品构建速度[25][26] - 关键在于对目标的深刻理解,形成连贯的产品策略和体验[26] - 人才竞争激烈,初创公司需通过差异化定位吸引合适人才[28] 应用场景 - 客户支持、编码辅助、邮件处理、深度研究和市场营销是当前主要应用领域[13] - 可实现Slack讨论转GitHub工单、销售通话后自动填写CRM等新任务[13] - 代码领域是可靠性的"先行指标",因有明确验证标准[19]
前巨人CEO吴萌的新公司获心动、红杉、高榕、Monolith投资,估值近20亿人民币
Founder Park· 2025-08-05 17:02
心动收购MiAO股份 - 心动以1400万美元收购MiAO 5.3%股份 [5] - 根据交易计算MiAO整体估值达2.64亿美元(约20亿人民币) [10] - MiAO由前巨人CEO吴萌创立,已获多轮投资总额近5亿人民币 [7][10] MiAO公司背景 - 成立初期即获红杉、高榕、Monolith等机构1亿元天使轮融资 [8] - 主攻方向为大DAU长青游戏领域 [8] - 目前已有新品处于保密测试阶段且效果良好 [14] 创始人团队优势 - 创始人吴萌曾带领团队开发千万级DAU游戏《球球大作战》和数百万DAU游戏《太空杀》 [12] - 团队具备从零打造大DAU游戏的成功方法论 [12] - 吴萌现任心动非执行董事及战略发展委员会成员 [14] 行业地位与潜力 - 20亿人民币估值在游戏行业创业公司中极为罕见 [12] - 大DAU游戏成功可使公司价值快速跃升 [12] - 巨人网络市值提升至500亿被认为与吴萌系团队开发的《超自然行动》有关 [12]
Windsurf 员工再次面临选择:要么 996,要么走人
Founder Park· 2025-08-05 12:01
收购与员工安置 - Cognition收购Windsurf后要求约200名员工接受996工作制或选择9个月工资补偿买断方案[2][3][5] - 员工需在8月10日前决定是否加入Cognition的高强度工作文化(每周6天办公室工作,工时超80小时)[6] - Cognition最新估值40亿美元,通过收购使员工规模从39人暴涨五倍[7] Windsurf被收购背景 - Windsurf原为编程助手公司Codeium,曾与OpenAI洽谈30亿美元收购但谈判破裂[7] - 公司CEO及核心团队跳槽Google DeepMind,谷歌支付24亿美元获得技术非独家授权[7] - 剩余员工原被告知将转为员工持股企业,但三天后Cognition宣布收购剩余资产和人员[7] 硅谷AI初创公司工作文化 - 多家硅谷AI初创公司推行996工作制,如Rilla要求80名员工每周工作超70小时并明确写入招聘条件[10][12] - Rilla增长负责人称Z世代员工受企业家精神影响,将高强度工作视为改变世界的必经之路[12] - 部分公司采用双轨制:Fella & Delilah对自愿996员工提供25%涨薪和双倍股权奖励,但仅不到10%员工响应[12] 行业趋势与案例 - Meta收购Scale AI 49%股份后裁员200人(占总员工14%),类似案例显示被收购员工仍面临失业风险[9] - 英国风投家提出996可能不足,暗示更极端工作节奏成为初创公司竞争标配[13] - AI物流公司Sotira CEO认为创始团队需996但强制普通员工执行不厚道[12]
大模型年中报告:Anthropic 市场份额超 OpenAI,开源模型企业采用率下降
Founder Park· 2025-08-04 21:38
基础大模型发展趋势 - 基础大模型正成为生成式AI核心引擎并重塑计算未来 其能力与成本控制的演进将推动系统 应用及产业格局变革 [2] - 模型API支出在6个月内从35亿美元增长至84亿美元 企业重心从训练微调转向模型推理 标志阶段性转折 [2] - 代码生成成为首个大规模爆发的AI应用场景 基础模型能力升级路径新增"带验证器的强化学习"(RLHF with verifiers) [2] 市场竞争格局变化 - Anthropic以32%企业使用率超越OpenAI(25%)和Google(20%) 成为市场新领跑者 Meta Llama占9% DeepSeek仅1% [9] - Anthropic崛起始于2024年6月Claude Sonnet 3 5发布 2025年系列版本(Claude Sonnet 3 7/4 Opus 4 Claude Code)巩固领先地位 [12] - 企业投入集中流向少数高性能闭源模型 开源采用趋势因前沿突破放缓而减弱 [3] Anthropic成功驱动因素 - 代码生成领域占据42%市场份额(OpenAI为21%) 催生19亿美元生态系统及AI IDE 应用构建工具等新形态产品 [13][14] - 采用带可验证奖励的强化学习(RLVR)突破数据瓶颈 成为提升模型可靠性与实际能力的关键路径 [15] - 率先实现Agent范式突破 通过多轮自我优化及工具调用提升模型执行力 2025年被称为"Agent之年" [16] 开源模型发展现状 - 开源模型运行任务占比从19%降至13% Meta Llama仍领先但Llama 4表现未达预期 [17] - 中国公司贡献突出开源模型(DeepSeek 字节跳动 阿里巴巴等) 但性能落后前沿闭源模型9-12个月 叠加部署复杂度导致份额停滞 [17][20] - 开源吸引力在于定制化 成本优势及私有化部署 但初创企业生产负载正加速转向闭源 [20] 企业模型选择行为 - 66%开发者选择原供应商升级 仅11%切换供应商 性能(非价格)是核心决策因素 [24][27] - 性能优先逻辑下 旧模型即使降价十倍也无法挽回用户 Claude 4发布一个月内即抢占45%用户 [27][30] - AI支出从训练转向推理 初创企业推理任务占比从48%升至74% 近半数企业主要计算任务由推理驱动 [31]
别听模型厂商的,Prompt 不是功能,是 bug
Founder Park· 2025-08-04 21:38
AI投资与创业趋势 - Conviction投资的AI公司包括Cursor、Cognition、Mistral等,覆盖基础设施、模型和应用层[10] - AI公司收入增长迅猛,部分公司在极短时间内实现从零到1亿美元年化收入,增速超历史任何技术革命[11] - 传统行业拥抱AI速度最快,称为"AI跨越式发展效应",如法律、医疗等领域已实现规模化应用[31][33] AI技术进展与多模态机会 - 推理能力成为AI最显著突破,解锁高风险决策、序列化问题等新场景[13] - Agent类创业公司申请量增长50%,多模态应用如HeyGen、ElevenLabs年收入突破5000万美元[14][15] - 语音将成为多模态最先落地领域,医疗咨询、销售等场景迎来新机会[17] - GPT-4价格18个月内从$30/百万token降至$2,蒸馏版低至$0.1,推动应用普及[18] AI应用成功案例与方法论 - Cursor 12个月内收入从100万增至1亿美元,用户达50万开发者[21] - Cognition成为企业代码提交量最高"贡献者",Windsurf被OpenAI以30亿美元收购[21] - 代码成为AI应用突破口因:结构化逻辑、结果可验证、研究人员重视、工程师自我工具开发[23][24] - 成功产品需领域知识、智能编排、精心呈现输出,避免通用文本框[30] 产品构建与竞争策略 - Prompt是过渡阶段缺陷而非功能,最佳产品应"读懂用户心思"[28] - Copilot模式价值被低估,从辅助到自动化是完整光谱[32] - 执行力是AI时代护城河,Cursor通过卓越执行赢得市场[35] - 私有数据和深度工作流构成应用构建者优势,非模型巨头可轻易复制[36] 行业机会分布 - 法律行业Harvey成立两年年收入超7000万美元,医疗领域OpenEvidence覆盖美国1/3医生[33] - 机器人学、生物学等领域存在巨大机会,需创新数据收集方法[34] - 游戏规则每12个月重塑一次,新模型发布带来持续获胜机会[36]
模型与「壳」的价值同时被低估?真格基金戴雨森 2025 AI 中场万字复盘
Founder Park· 2025-08-02 09:09
核心观点 - 2025年AI行业迎来多个"李世石时刻",OpenAI通用大语言模型首次达到IMO金牌水准,标志着AI推理能力质的飞跃 [5][7][10] - AI应用和"套壳"价值被低估,Context Engineering成为关键竞争壁垒 [21][23][37] - Agent技术进入早期采用阶段,模型能力与产品设计协同推动生产力革命 [30][32][69] - 模型能力进化速度超预期,推理/编程/工具使用三大主线快速突破 [53][54][64] - 中国团队在AI应用层展现突出竞争力,Kimi等产品实现技术逆袭 [38][46][51] AI技术突破 OpenAI数学推理里程碑 - OpenAI通用大语言模型在2025年IMO竞赛中完成6题5对的成绩,达到金牌水平,且未针对数学专门优化 [5] - 该成绩获奥赛组委会官方认证,相比2024年Google专门设计的AlphaGeometry(银牌水平)更具泛化能力 [7] - 模型采用与GPT-4o相同底层架构,主要优化来自post-training和inference阶段 [9] - 数学证明属于"hard to verify"问题,突破意味着AI具备接近人类顶尖水平的逻辑推理能力 [8][13] 多模态与工具使用进展 - 图像生成从玩具级进化成生产力工具,ChatGPT图像生成可准确理解用户意图 [32] - Veo3模型实现虚拟世界真假难辨的生成效果,首次跨越恐怖谷效应 [33] - 工具使用形成API调用和视觉模拟两条技术路线,MCP生态初步建立 [64][65] 产品与应用演进 Agent技术发展 - ChatGPT Agent发布标志着行业共识形成,但产品体验仍有提升空间 [16][18] - Agent产品token用量相比Chatbot显著增长,Manus等产品进入Early Adopter阶段 [32][73] - 优秀Agent产品需为未来6-12个月的模型能力设计,当前任务完成率约20%,预期年底达70-80% [40][93] - 应用层通过Context Engineering构建三层壁垒:会话级/个性化/硬件增强上下文 [23][59][60] 中国团队突破 - Kimi K2开源模型在coding/Agent工作流/中文写作方面超越Claude,OpenRouter调用量快速攀升 [38] - 中国团队在长文本技术方向的前瞻布局得到验证,产品设计能力突出 [47][48] - 套壳应用展现持久价值,Manus等产品在特定场景表现优于ChatGPT Agent [19][21] 行业竞争格局 模型厂商动态 - Google Gemini 2.5实现技术反超,与OpenAI形成三强竞争格局 [55][56] - DeepSeek采取选择性突破策略,资源聚焦模型智能而非多模态 [42][43] - 模型benchmark出现钝化现象,实际用户体验差异成为新评估标准 [84] 人才与资本趋势 - 硅谷爆发acqui-hire抢人大战,顶尖人才薪资达disruptive级别 [80][82] - 推理算力需求爆发式增长,云服务商迎来新增长周期 [41][74] - 投资逻辑从"模型颠覆应用"转向"人机协作价值创造" [37][38] 未来演进方向 技术前沿展望 - 推理能力从7分到10分的质量提升,小模型开始具备强推理能力 [53][54] - 编程场景context长度与自我纠错能力持续优化,复杂代码一次通过率提升 [55] - 原生多模态、在线学习、高级Agent能力或成下一代模型突破点 [39][94] 社会影响预判 - 生产力提升带来"超级个体",3人团队可能实现独角兽级产出 [85] - 组织管理复杂度突破新量级,美团等企业将管理数百万AI协同体 [86] - 智能边界衡量成为新挑战,人类需建立评估超人智能的新标准 [84][87]
YC 2025 407 家创企复盘:B2B 模式占主导,AI 编程过度饱和,最大的机会还没人注意到
Founder Park· 2025-08-01 19:11
AI创业市场现状 - AI创业者过度集中在开发者工具领域,每4天出现一个新竞争对手,开发者工具领域有94家公司占26.2% [18][20] - 医疗健康、保险、建筑等传统行业存在巨大蓝海机会,如保险行业规模1.4万亿美元但几乎无AI初创公司涉足 [4][79] - 近90%的YC创业公司涉及AI开发,AI技术已成为创业默认选项 [7] 商业模式分布 - B2B模式占绝对主导地位,353家公司占比接近90%,因企业级变现路径清晰 [9][13] - B2C公司仅36家,混合模式16家,B2G仅1家(政府科技领域) [14][16][17] - YC更关注能完全取代高薪职位的AI产品(如法律分析、会计),而非辅助类工具 [8] 市场饱和度分析 过度饱和领域 - 开发者工具94家,生产力与工作流61家,销售与市场营销39家,合计占54.1% [20][23][25] - AI编程助手市场已饱和,YC建议转向构建能取代年薪10万美元工程师的完全自动化AI员工 [22] 蓝海机会领域 - 政府AI合规:6000亿美元市场中仅1家公司 [79] - 建筑AI调度:2万亿美元市场规模中仅2-3家公司 [79] - 法律与合规:仅3家公司,可创建AI律师事务所取代年薪15万美元法律分析师 [40][42][43] AI Agent发展趋势 - 34%的YC公司(139家)专注AI Agent开发,垂直行业Agent占比最高(22家) [47][51] - 语音Agent和物理世界融合是新兴方向,仅3家纯语音Agent公司,10家机器人/实体Agent公司 [59] - 基础设施层兴起,18家公司构建Agent平台/基础设施 [53] 市场定位策略 - 垂直化专业分工有效性9.8/10,如医疗细分场景救护车机构CareSwift [60] - 工作流专业化有效性9.2/10,如专注调试环节的Jazzberry而非端到端开发 [57][60] - 客户群体聚焦有效性8.5/10,如服务个体创业者的Cactus [60] - 行业知识壁垒高于技术壁垒,市场奖励以AI为工具的领域专家而非纯技术专家 [67][68] 突破性AI项目方向 - 硬件革命:芯片制造加速、3D半导体 [78] - 物理AI融合:量子加速服务器、高灵巧度机器人 [78] - 生物技术革命:CRISPR基因治疗、AI驱动光学系统 [78] - 六大蓝海方向包括政府合规、保险承保、建筑调度等,均存在万亿级市场机会 [79]
全球最赚钱 20 家 AI Agent 公司是这几个
Founder Park· 2025-08-01 19:11
AI Agent行业趋势 - AI Agent正从工具演变为"数字员工",能够自主完成任务并接管销售、法务、客服等核心业务流程[6] - 收入成为衡量AI初创公司竞争力的新门槛,商业化落地能力成为关键指标[6] - 行业呈现垂直化发展特征,覆盖编程、招聘、客服、法律、医疗等20+细分场景[5][6] 头部公司商业化表现 编程领域 - **Cursor**:ARR达5亿美元,拥有36万付费用户,日均生成数亿行代码,客户包括Stripe、OpenAI等[9] - **Replit**:ARR从1000万增至1亿美元仅用6个月,估值有望达30亿美元,主打零配置开发体验[13] - **StackBlitz**:ARR 4000万美元,人均创收114.3万美元,通过WebContainers技术降低开发门槛[18] 企业服务领域 - **Glean**:ARR 1亿美元,处理亿级Agent操作,整合多SaaS应用实现工作流自动化[10] - **Sana**:ARR 2000万美元,帮助企业构建专属AI助理,实现80%以上流程效率提升[24] - **Hebbia**:ARR 1300万美元,专注金融法律领域知识整理,估值7亿美元[28] 垂直行业解决方案 - **Harvey**:法律AI助手ARR 7500万美元,估值50亿美元,可执行法律研究、合同分析等任务[17] - **Nabla**:医疗AI助手ARR 1600万美元,覆盖13万家医疗机构,医生文档时间减少50%[25][26] - **Crescendo**:AI客服ARR 9100万美元,采用人机协同方案处理90%常规咨询[15][16] 高增长典型案例 - **Lovable**:8个月实现ARR 1亿美元,人均创收222.2万美元,支持无代码构建Web应用[14] - **11xAI**:6个月ARR突破200万美元,月增速50%,AI销售员工可自主完成客户开发全流程[33][34] - **Fyxer**:嵌入邮箱的AI助理,ARR从100万增至900万美元,服务Starbucks等100+企业[35][36] 技术创新方向 - 多模型组合架构(如Sierra整合OpenAI、Anthropic等模型)[22] - RAG技术应用(如Sana结合检索增强生成实现知识自动化)[24] - 无代码/低代码平台(如Torq实现安全流程自动化)[21]
上市首日暴涨 250%,All in AI 战略,拆解 Figma 的核心竞争力到底是什么?
Founder Park· 2025-08-01 16:31
Figma IPO表现 - Figma在纽交所上市,成为今年以来美股最大IPO项目[4] - 每股定价33美元,开盘后日内涨幅高达250%,市值从500亿美元飙升至680亿美元[5] 用户结构与产品定位 - 当前月活用户达1300万,其中设计师、前端工程师、其他职能人员各占1/3[5][11] - 产品已覆盖前端工作全流程,从设计工具升级为"前端协作开发操作系统"[6][15] - 产品矩阵包括FigJam、Figma Design、DevMode、Figma Make等6大模块,实现工作流打通[15] 增长驱动因素 - 前端工程师渗透空间大:当前团队中设计师与工程师比例达1:5~1:10[18] - 企业级变现加速:ARR>$100K企业数同比增长47%,F2000公司付费渗透率74%[18] - 国际化潜力:非美用户占比85%但收入贡献仅50%,印度、俄罗斯等市场粘性突出[20] AI战略与Figma Make - 招股书中"AI"出现200多次,Figma Make被定位为核心底层能力[5][22] - 支持设计稿直接生成代码目录,前端开发效率提升显著[23] - 与品牌资产库打通,支持guidelines.md文件确保生成内容合规[32][34] - 定价策略优势:Full Seats方案包含AI Credits,升级成本低于竞品[35][37] 产品技术壁垒 - Variables功能实现设计与代码联通,支持结构化差异对比[40][41] - Grid功能与DevMode深度集成,可直接生成CSS Grid代码片段[42] - 已构建包含1300万用户的生态网络,形成迁移成本壁垒[38] 行业趋势判断 - 前端开发将走向"GUI+GenAI"融合模式,创意价值进一步凸显[46] - 公司占据设计协作上游入口,比纯AI工具更易实现工作流整合[49] - 长期可能演变为前端协作开发操作系统,当前产品迭代路径正确[49]
基模下半场:开源、人才、模型评估,今天的关键问题到底是什么?
Founder Park· 2025-07-31 22:57
中国开源模型的崛起 - 中国开源模型如Kimi、Qwen、智谱GLM-4.5等近期密集发布,Hugging Face热门榜几乎被中国模型垄断[1][3] - 中国模型发展速度惊人,一旦模式被验证可行,中国擅长集中资源快速工程化实现[5][8] - 中国开源模型可能成为发展中国家的模型标准,尤其在"全球南方"市场占据优势[6][7] 中美AI竞争格局 - 大模型竞争已演变为中美之间的比拼,开源标准可能转向中国模型[3] - 美国如Meta等公司正加大投入,但中国在公私合作和资源投入方面更具优势[8][10] - 中国机构如清华大学已拥有先进语言模型,而美国部分高校资源相对不足[8][10] 模型训练与人才 - 不同机构间人才差异并不显著,模型好坏更多取决于资源利用效率[15][16] - 顶尖实验室内部普遍存在混乱,但关键在于能否产出有效模型[19][20] - 实验速度和基础设施比单纯追求"天才"更重要,需要重视团队协作价值[21][22] 模型评测与基准测试 - 当前更需要好的基准测试来评估模型能力,而非仅关注技术细节[3][24] - 制作高质量评测的门槛越来越高,但可能带来新的话语权[24][25] - 评测领域存在巨大蓝海机会,定义新任务不需要庞大算力[26] 强化学习与推理技术 - RL无法泛化到数学和代码之外的说法被夸大,这些领域只是更容易验证[32] - GSPO算法通过分组序列策略优化显著提升样本效率[28][29] - 模型推理研究进展有限,蒸馏小模型比RL更实用[27] 未来挑战与趋势 - 验证难度将越来越大,特别是在科学发现等复杂领域[36][37] - 智能体相关能力可能成为未来关键基准,参数规模扩张不再是主要路径[23] - 行业需要改变模型优势的传达方式,超越单纯基准测试分数[24]