Workflow
海外独角兽
icon
搜索文档
巨头博弈下,Agent 的机会和价值究竟在哪里?
海外独角兽· 2025-06-14 19:42
以下文章来源于极客公园 ,作者Moonshot 极客公园 . 用极客视角,追踪你最不可错过的科技圈。欢迎同步关注极客公园视频号 内容整理:极客公园 本期内容是极客公园创始人张鹏和拾象 CEO 李广密、AI Research Lead 钟凯祺的对话。 • 做 Agent 不一定一开始就要做完全自动化的 Agent,可以先从 Copilot 做起,并在这个过程中收集用 户数据、做好用户体验、占领用户心智,然后慢慢地转型; • AGI 有可能最先在 Coding 实现,Coding 是衡量 AGI 最关键的先验指标,有可能拿走整个大模型产 业阶段性 90% 的价值; • AI Native 产品需要内建一套同时服务于 AI 和人类的双向机制; • 一个好的 Agent 需要有可验证的反馈机制,能构建数据飞轮,实现强化学习和持续迭代; • Agent 商业模式 正在从按 token 或调用次数计费,演进到按结果、工作流计费,未来甚至可以实现 直接雇佣 Agent; • 未来或许是人与 Agent、Agent 与 Agent 的异步协同,这背后需要全新的交互方式与基础设施的支 撑。 …… 2025 年是 Agent 按 ...
从 AI 招聘到数据标注,Mercor 能否打造下一个 Scale AI?
海外独角兽· 2025-06-13 18:56
这一转型的 PMF 很快被验证,2025 年初 ARR 到达 7500 万美元。2025 年 2 月,在自身业务已达数 千万美元收入、现金流充裕的背景下,Mercor 仍然吸引了资本的追逐,以仅稀释 5% 的极低代价, 完成了由 Felicis Ventures、Benchmark、General Catalyst 等顶级机构加持的 1 亿美元 B 轮融资,估值 攀升至 20 亿美元。 作者:haina Mercor 所处的赛道是 AI 中一个关键且尚未被充分满足的供需交叉点:下一代 AI 模型对高质量、垂 直领域专家级 Human Data 的需求,以及相关人才稀缺所带来的供需不平衡。合成数据无法完全替代 Human Data,尤其是在特定领域知识和复杂判断方面。AI 模型的突破性进展高度依赖于垂直领域专 家的"人类智能输入"。 Mercor 最初的定位是 AI 招聘平台。在此基础上,它发现了一个机会:作为 BPO(业务流程外包) 服务商,为像 Scale AI 这样的大型数据标注公司提供"合同制人才(contract people)"。在这个过程 中,Mercor 发现其高效匹配与供给专家的能力,在 Hu ...
对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds
海外独角兽· 2025-06-12 21:27
嘉宾:辛华剑 访谈:penny Era of Experience 这篇文章中提到:如果要实现 AGI, 构建能完成复杂任务的通用 agent,必须借助"经验"这一媒介,这里的"经验"就是指强化学 习过程中模型和 agent 积累的、人类数据集中不存在的高质量数据。 强化学习是 AGI 的关键解法。从 OpenAI o1 到 DeepSeek R1,我们不断在看到强化学习的潜力:DeepMind AlphaProof 被认为是"经验时代"初露端 倪的一个例子,作为第一个在 IMO 获奖的 AI,AlphaProof 借助 RL 算法自行"做题",积累经验,AlphaProof 的案例表明,在像数学这样人类高水 平知识接近极限的领域,RL 通过互动试错可以突破瓶颈,取得超人类的成果。 以 AlphaProof 为开端,整个数学证明领域也在最近半年迎来了 AI 突破的密集期:除了 AlphaProof ,OpenAI 的 o1 模型在数学推理上展现出了惊 人表现,DeepSeek-Prover 三部曲也在形式化数学证明上不断创造新纪录。 为了理解数学和 AGI 的关系,海外独角兽访谈了 DeepSeek-Prov ...
押中 Figma、Scale AI 的 Thiel Fellowship, 今年下注哪些 AI 方向?
海外独角兽· 2025-06-10 20:22
作者:haina,zirong 从 Airbnb 到 Figma,从 Ethereum 到 Scale AI,Thiel Fellowship 一直是"小天才"创业者的"秘密起 点"之一。Thiel Fellowship 由 PayPal 创始人 Peter Thiel 2011 年创办,每年为每一位入选者提供 10 万 美金奖金和"辍学自由"。 在 AI 成为主叙事后,Thiel Fellowship 开始将重心放在 AI 带来的范式变革上。从 Cognition AI (Devin 背后的公司)的创始人 Walden Yan 和 ScottWu,Scale AI co-founder LucyGuo、再到 Mercor 的创始人 Adarsh Hiremath、Brendan Foody 和Surya Midha 等,越来越多来自 Thiel 网络的年轻创始 人,成为 AI 时代的结构性变量。 2025 年的 Thiel Fellow,延续了这种趋势。这届入选者呈现出几大显著特征: • 地域上,从传统的湾区、东北部高校,扩展到更广泛的全球化视野,包括德国、以色列、拉美等新 兴技术生态; • 项目方向上,A ...
专访张祥雨:多模态推理和自主学习是未来的 2 个 「GPT-4」 时刻
海外独角兽· 2025-06-09 12:23
本期内容是拾象 CEO 李广密对大模型公司阶跃星辰首席科学家张祥雨的访谈, 首发于「张小珺商业 访谈录」。 张祥雨专注于多模态领域,他提出了 DreamLLM 多模态大模型框架,这是业内最早的图文生成理解 一体化的多模态大模型架构之一,基于这个框架,阶跃星辰发布了中国首个千亿参数原生多模态大 模型 Step-1V。此外,他的学术影响力相当突出,论文总引用量已经超过了 37 万次。 一直以来,业界都相当期待一个理解、生成一体化的多模态,但直到今天这个模型还没出现,如何 才能达到多模态领域的 GPT-4 时刻?这一期对谈中,祥雨结合自己在多模态领域的研究和实践历 程,从纯粹的技术视角下分享了自己对多模态领域关键问题的全新思考,在他看来,虽然语言模型 领域的进步极快,但多模态生成和理解的难度被低估了: • 接下来 2-3 年,多模态领域会有两个 GPT-4 时刻:多模态推理和自主学习; • 多模态生成理解一体化难以实现的原因在于,语言对视觉的控制能力弱,图文对齐不精确,数据质 量有限,生成模块往往无法反向影响理解模块等; • 模型 scale 到万亿参数后,在文本生成和知识问答能力增强的同时,推理能力,尤其是数学, ...
专访张祥雨:多模态推理和自主学习是未来的 2 个 「GPT-4」 时刻
海外独角兽· 2025-06-08 12:51
多模态大模型发展现状 - 阶跃星辰发布中国首个千亿参数原生多模态大模型Step-1V 基于业内最早的图文生成理解一体化框架DreamLLM [3] - 多模态领域预计未来2-3年将迎来两个GPT-4时刻:多模态推理和自主学习 [3] - 当前多模态生成理解一体化面临四大挑战:语言对视觉控制能力弱 图文对齐不精确 数据质量有限 生成模块无法反向影响理解模块 [3] 计算机视觉领域瓶颈 - CV领域长期缺乏类似NLP的GPT时刻 主要受限于数据标注依赖和自监督方法局限性 [13][15] - 对比学习和MIM等方法在小模型有效 但缺乏scale up特性 因其学习的不变性来自人工设计而非数据驱动 [16][18][19] - 静态图像数据存在本质缺陷:生成 理解与人类对齐三者割裂 难以实现智能质变 [24][25][26] 多模态技术突破方向 - 短期解决方案是利用图文对齐数据 通过文字的自闭环特性赋予模型智能能力 [27] - 长期需探索视频和具身系统 视频数据蕴含更丰富信息但利用难度更高 [27] - 生成理解一体化需先解决视觉空间CoT问题 当前action space过于受限 [55][56] 大模型训练范式演进 - Next Token Prediction存在本质缺陷:更大模型在数学等推理任务上表现反降 因倾向跳步且优化目标与任务目标存在gap [38][40][42] - Rule-based RL通过直接优化任务目标 可抑制跳步并强化稳定思维路径 [44] - o1范式突破在于激发Meta CoT 允许模型在关键节点反悔重试 使推理从单线变为图状结构 [44][53] 多模态数据影响 - 图文混排训练中生成模块产生的gradient噪声大且信息量低 可能破坏语义理解 [62] - 高质量多模态数据应确保图文强相关 避免无关数据导致模型confuse [63][64] - 视频数据蕴含丰富思维过程但清洗难度大 是扩展action space的重要方向 [65][66] 未来技术趋势 - 多模态GPT时刻预计1年内到来 需解决生成可控性和视觉空间推理问题 [68][69] - 当前long context方案存在注意力涣散问题 未来可能采用multi-agent分层记忆架构 [69][73][74] - 模型自主学习是ASI关键路径 需解决环境scaling和自然语言反馈利用问题 [78][80][82]
为什么 AI Agent 需要新的商业模式?
海外独角兽· 2025-06-04 19:50
Agent商业模式演进 - Agent能力边界快速扩展,未来将深度参与社会经济运作,可能诞生Visa或Stripe级别的商业基础设施机会 [2] - 当前处于下一代Agent商业模式成型前夜,代表企业如Sequoia投资的Paid AI,以Agent实际产出为基础重构收益模型与交易结算网络 [2] - Paid CEO Manny Medina为连续创业者,曾创办估值44亿美元的B2B销售科技独角兽Outreach [2] 商业模式选择 - 垂直领域AI应用现阶段价值更大,专注解决具体问题可创造巨大价值,典型案例包括保险续签(Quandri)、货运协调(Happy Robot)、渗透测试(Expo) [6][7] - BPO外包市场是AI最佳落地场景,替代正在消失的劳动力市场(如保险精算师、理赔员),具有强粘性、高增长特性 [9][11] - 通用型AI助理(EAS)在跨时区等复杂场景仍不成熟,但房产经纪等单一业务方向已适用 [8] 定价模式创新 - 四种有效定价方式:按行动计费(如信用积分)、按工作流计费(如文档审阅)、按结果计费(设置结果奖金)、按Agent计费(替代人力成本) [13][14][15] - AI推动定制化合同成为趋势,可基于聊天界面解释条款并动态调整,突破传统CPQ系统限制 [14][15] - 定价成熟曲线需从基础计费升级至价值定价,避免陷入同质化竞争,关键是与客户定义"成功指标" [18][20] 成本与盈利结构 - AI总成本包含LLM调用、第三方API、数据服务等,多模态能力推高外围支出,当前成本分布不透明导致管理困难 [22][23] - 推理模型复杂度提升可能使Token成本中期上涨而非下降,需平衡错误率与可持续性 [22] - 行业存在价值与利润错配,部分公司低估服务价值,需建立"人类等效价值"测算体系 [23][24] Paid业务定位 - 定位为AI公司商业引擎,提供定价、计费、毛利管理等全流程运营系统,核心解决单位经济模型问题 [25][26] - 已推出定价引擎和利润管理系统,后续扩展催收、供应商管理等衍生功能 [26] - 采用人工协助上轻模式,基于行业最佳实践帮助客户优化定价策略 [29] 行业趋势洞察 - AI创业者更倾向从最小阻力客户群起步,避免早期过度扩展,聚焦单一场景更易实现产品市场匹配 [27][28] - 模型尚未商品化,推理能力需求使新一代模型输入成本比前代贵6-8倍 [35] - AGI可能已以潜在形式存在,但尚未被充分开发利用 [36] 创业建议 - 忽略TAM规模论,专注服务小群体创造卓越体验,"小市场"可转化为"大机会" [37] - 避免直接对标高薪岗位(如律师、医生),优先解决"没人愿意做"的低端流程 [10][11] - 协作型工作流是软件界"第八大奇迹",深度嵌入客户流程可建立竞争壁垒 [12]
AI-Native 的 Infra 演化路线:L0 到 L5
海外独角兽· 2025-05-30 20:06
为什么 Agentic 叙事下 infra 是确定性最高的机会?过去 Agent 开发大多依赖开发者手动使用传统 Infra 搭建,开发工程量大、流程复杂,如何缩小 Agnet 的开 发难度和周期是一个确定性需求。随着 Agent 开发需求彻底爆发,更多人才和资源投入到新工具搭建中,Agent 开发范式的重构和收敛已经在发生。 另一个视角则是: 如果我们把 Agent 看做互联网使用者和开发者的增量,这些"新用户"的爆发式涌入又会带来什么样的需求? 本文来自 Agent Infra 创业者 Hang Huang 的投稿,他以自己过去一年通过 AI 辅助进行产品开发的实践经验出发,为我们分享了第二个视角下 Agent Infra 的 在这篇文章中,他提了一个很有意思的观点" AI 的终极目标,不是帮人写代码,而是获得对整个软件生命周期的控制权 :从构思到上线,再到持续运维", 随着 AI 对工具利用深度和主动程度不断变化, AI-native Infra 也在相应进化,Hang Huang 把 AI-native 的 Infra 划分为了 5 个阶段,L0-L5,"在L5 阶段的 Agent-Native OS ...
AI x 保险图谱:第一家 AI-Native 的保险独角兽会长什么样?
海外独角兽· 2025-05-29 20:09
作者:haina 保险业是全球最大的行业之一,年保费超 7.4 万亿美元,美国市场以 2.5 万亿美元的体量位居首位, 行业占总 GDP 比例达 11.3%。但与其庞大规模形成鲜明对比的是其极低的运营效率,超过 60%的流 程仍依赖人工判断与数据录入,人工成本占总运营支出的 40%-60%。漫长的索赔周期(平均 7-15 天)和低下的客户满意度(NPS 仅 31 分)是行业常态。分销费用高昂、人工理赔成本巨大、欺诈损 失严重(美国每年约 1200 亿美元)以及普遍存在的信息孤岛,构成了这个人力驱动的"信息搬运工 行业"的结构性浪费。 过去两年,LLMs 在理解和操作复杂文本、合同、邮件等非结构化信息方面的巨大进展为 AI 接管保 险业核心流程(如核保、报价、索赔、合规、客户支持)提供了前所未有的可能性。 AI Agent 不仅 能作为效率工具优化现有流程,更可能催生出商业模式和成本结构上完全不同的"AI-native 保险公 司"。 本文系统梳理了 AI Agent 在保险行业的产业结构和应用图景。Voice AI 与 Agent 正在革新获客与客 户服务方式。Strada 正在为保险经纪人自动化销售外呼,F ...
Claude 4 核心成员:Agent RL,RLVR 新范式,Inference 算力瓶颈
海外独角兽· 2025-05-28 20:14
编译:haozhen 编辑:Siqi 海外独角兽原创编译 转载请注明 Anthropic 在上周五发布了 Claude 4,这是目前最前沿的 Coding 模型,也是最强的 Agentic 模型,可 以连续编程 7 个小时。本文是对 Anthropic 两位核心研究员 Sholto Douglas 和 Trenton Bricken 最新访 谈的编译,其中,Sholto 专注于 RL scaling,Trenton 则在做机制可解释性的研究: • 2025 年在模型训练上,最大的变化是 RL 终于有效,只要有合适的反馈机制,模型就能达到专家级 人类的表现和可靠性; • 今年年底会出现可以替代初级程序员的 Agent,到明年这个时候软件工程类的 Agent 将会在实际任 务中创造价值; • 可验证奖励强化学习 RLVR 的范式已在编程和数学领域得到证明,因为这些领域很容易获得此类清 晰的信号; • 模型自我意识的发展关键在于 reward。因为模型会以某种方式追求 reward,而这种追求会深刻地影 响模型的"人格"和个性,最终带来自我意识; • 让 AI 获得诺贝尔奖比获普利策小说奖更容易,因为要让模型具备像 ...