Workflow
深思SenseAI
icon
搜索文档
砍掉40%的客户名单后,冷邮件效果反而翻了4倍
深思SenseAI· 2026-04-08 18:19
ColdIQ 的 Alex Vacca 发了一篇长文,标题极其反直觉: 我们对 40% 的潜在客户一封邮件都 没发 。他们的总可触达市场(TAM)是 15,000 家公司,用 AI 评分系统筛了一遍之后,直接砍 到 8,900 家。超过 6,000 家公司连一封冷邮件都没收到。 听起来疯了?Vacca 说这个数字一开始连他们自己的客户都觉得不对劲——"你让我花钱买了名单,然 后告诉我一半不能用?"但他们跑了 400 多个客户的冷邮件项目后,结论始终不变: 基于信号的精 准触达,效果是无差别群发的 2-4 倍 。约到最多会议的团队,不是邮件发得最多的,而是名单筛得 最好的。 一句话总结:别再群发了。先给你的潜在客户名单打分,砍掉底部 40%,然后用省下来的精力在顶部 60% 上做精细化分层和个性化文案。50 封精准邮件 > 500 封无差别群发。 解决方案的起点是: 一张名单,一次评分,全公司共用 。 01 大多数团队的致命错误 Alex Vacca 原文配图:用 AI 构建 B2B 邮件名单 ::: Vacca 说大多数 B2B 团队在名单构建这一步根本没有花足够的功夫。典型做法是:打开 Apollo 或 S ...
别把AI当聊天机器人:4个Agent+50个自动任务,每天只需决策15分钟
深思SenseAI· 2026-04-08 14:33
文章核心观点 - AI助手不应被视为聊天机器人,而应作为公司的“第二大脑”或“操作系统”进行系统性部署,通过“编排者+专业智能体”的架构实现从被动问答到主动管理的转变 [2][5] - 应用AI的核心价值在于将人类从95%的重复性工作中解放出来,使其专注于5%的决策判断,并通过将隐性知识显性化,实现企业知识管理的范式变革 [14][19][39] - 当前构建AI系统虽比雇佣真人助理更复杂,但其具备指数级扩展能力,初期投入将带来持续的复利效应,是提升组织效率的关键基础设施 [35][36][38][40] AI应用架构与设计哲学 - **架构瓶颈**:单个具有记忆的聊天机器人式AI助手存在天花板,用户仍是系统瓶颈,关键在于从“执行者”转变为“编排者”的架构设计 [3][5] - **多智能体系统**:采用“编排者+4个专业Agent”的架构,编排者作为虚拟COO,协调销售、运营、招聘、内容四个专业Agent,形成一个虚拟团队 [4][5] - **95/5法则**:智能体处理95%的信息搜集、初稿撰写、数据分析等工作,人类仅负责5%的批准、否决或微调决策,理想的人机日均交互时间应低于30分钟 [14][15] - **安全设计原则**:所有对外操作(如发送邮件、发布内容)必须经过人工审批,采用“Agent提议,人类批准”的务实模式,以防模型自信地执行错误操作 [15][22] 实际应用效果与量化成果 - **效率提升**:系统可在创始人醒来前自动完成多项工作,如跟进销售、分析数据、筛选候选人、剪辑内容,并将结果汇总推送,总决策时间仅需4分钟 [7][8][9][10][11] - **成本节约与知识沉淀**:系统在19分钟内从2,862条销售通话记录中提取知识,生成了总计81KB的7本操作手册,替代了每年30,000美元的通话录音工具订阅,并将隐性知识转化为可被任何Agent调用的显性资产 [17][18][19] - **快速部署能力**:系统曾用19分钟搭建并部署了一个功能完整的落地页,集成了多个工具与追踪,而传统方式需要设计师和开发协作至少两周 [17] 系统可靠性、挑战与教训 - **故障率**:系统每周发生约20次定时任务报错、8次API超时、4次Agent输出质量差、2次需要人工介入,真正严重的“自信型错误”约为每周1次 [20][21] - **核心教训**: 1. 所有对外操作必须人工审批,没有例外 [22] 2. 每次部署后需运行自动化冒烟测试,不能仅相信Agent的反馈 [23] 3. Agent表现得越自信,其输出的可靠性可能越低,越需要人工验证 [24] 知识管理与系统基础 - **文件即记忆**:聊天记录是低效的上下文,持久化的文件才是系统运转的基础,重要信息应存储在结构化的文件中而非聊天窗口内 [25] - **知识存储架构**:工作区使用34个记忆文件、109个共享上下文文档和7本操作手册,并将“事实”与“事件”分开存储,构建了一个简化版的知识图谱,所有信息均以纯文本Markdown文件形式存在,易于管理 [26] - **设计优势**:基于文件的上下文管理使AI助手能像熟悉业务的老员工一样工作,无需每次会话重新培训,实现成本极低 [27] 从零开始的实施路径 - **最小可行方案**:起步无需复杂系统,仅需三个核心文件(HEARTBEAT.md、active-tasks.md、facts.md)和三个定时任务(早间简报、邮件巡检、日终日志)即可让AI从被动变为主动 [30][31][32][33] - **关键转变标志**:当AI开始主动给用户发送消息,而非等待用户提问时,标志着系统设计正确 [34] - **实施心态**:关键在于将AI从“你问它答”的工具转变为“它主动找你”的操作系统 [33] AI与人力资本的对比与选择 - **实施难度**:当前搭建一个可靠的AI系统比雇佣和培训一名真人行政助理更困难,因为需要明确编写所有偏好、工作流和边界情况 [35] - **扩展性差异**:真人助理只能线性扩展,而AI系统可以全方位同时扩展,新增工作流的边际成本接近零,具备指数级扩展潜力 [36][38] - **长期回报**:投入两个月搭建AI系统可带来持续的复利效应,系统能7x24小时运转并不断自我增强,而雇佣真人助理的成本固定且扩展性有限 [36][40]
同一个模型,换个Harness排名跳了25位:智能体基础设施完全解剖
深思SenseAI· 2026-04-08 07:59
文章核心观点 - 智能体的表现差异主要源于包裹大模型的外部软件基础设施(Agent Harness),而非模型本身,优化Harness能带来显著的性能提升[2][3] - Harness是一个完整的软件系统,负责编排、工具调用、记忆、上下文管理等,是智能体行为得以产生的“机器”,其复杂程度可能超过业务逻辑[6] - 模型与Harness正在共同进化,选择Harness即选择了特定的运行生态,未来的竞争将是“模型+Harness”组合的系统之战[34][37][39] Harness的定义与重要性 - Harness被正式定义为包裹在大模型外部的全部软件基础设施,包括编排循环、工具调用、记忆系统、上下文管理、状态持久化、错误处理和安全护栏[6] - 它被类比为冯·诺依曼架构中的“操作系统”,而模型权重是“CPU”,上下文窗口是“RAM”,外部数据库是“磁盘”[8] - 行业实践表明,仅优化Harness就可使智能体在TerminalBench 2.0排行榜上的排名从30名开外跃升至第5名[2] Harness的工程层次与核心组件 - 围绕模型的工程分为三层:提示工程、上下文工程和Harness工程,其中Harness工程包含前两者并加上完整的应用基础设施[9] - 一个生产级Harness包含12个独立组件,关键组件包括作为“心跳”的编排循环(执行Thought-Action-Observation循环)和作为“手”的工具系统[10][11][12] - 记忆系统采用多层结构运作,如Claude Code实现了轻量索引、详细主题文件和原始对话记录三级层级,智能体在行动前会先验证记忆[14] 上下文管理与性能优化 - 核心挑战是“上下文腐烂”,即关键内容位于上下文窗口中间时,模型性能可能下降超过30%[18] - 生产环境策略包括压缩对话历史、遮蔽旧工具输出、按需检索数据以及委派子智能体返回精炼摘要(如1000-2000 token)[19] - 通过优先保留推理轨迹而非原始工具输出,可实现26-54%的token缩减,同时保持95%以上的准确率[21] 错误处理与安全设计 - 错误具有复合效应,一个10步流程若每步成功率为99%,端到端成功率仅约90.4%[22] - 错误被分类为瞬态错误、模型可恢复错误、用户可修复错误和意外错误,生产系统会设定重试上限(如2次)[23] - 安全设计采用多层护栏,例如分为输入护栏、输出护栏和工具护栏,并将权限执行与模型推理分离,Claude Code独立控制约40个离散工具能力[24] 验证循环与质量保障 - 验证循环是区分玩具demo与生产级智能体的关键,方式包括规则验证、视觉验证和“模型即裁判”[25] - 为模型提供验证自己工作的方式,可将输出质量提升2到3倍[26][27] - 子智能体编排支持多种执行模式,如Fork(复制上下文)、Teammate(通过文件通信)和Worktree(隔离git分支)[25] Harness的关键设计抉择 - 设计抉择包括单智能体与多智能体选择,建议先将单智能体做到极致,多智能体会增加调用开销和上下文丢失风险[29] - 工具范围策略遵循“少即是多”原则,工具越多表现可能越差,应只暴露当前步骤所需的最小工具集,延迟加载可实现95%的上下文缩减[29] - 需权衡Harness的“厚度”,即多少逻辑放在Harness中,多少留给模型,存在“薄Harness+模型改进”与“显式控制”两种不同理念[30] 行业主要框架的实现与趋势 - 主要框架设计哲学各异:Claude Agent SDK采用“傻循环”理念;OpenAI Agents SDK强调代码优先;LangGraph基于显式状态图;CrewAI注重角色分工[32] - 模型与Harness共同进化趋势明显,例如Codex模型在其特定Harness上表现更好,更换Harness可能导致性能下降[34] - 行业正趋向统一的Harness概念,LangChain从AgentExecutor演进到LangGraph,并明确使用“Agent Harness”术语[34] - AutoGen(正演变为Microsoft Agent Framework)采用对话驱动编排,其三层架构支持五种多智能体协作模式[35] Harness的演进与未来启示 - Harness被隐喻为“脚手架”,随着模型能力增强,其复杂度应降低,理想设计是模型升级后Harness能自动瘦身[36][37] - 对于AI产品团队,应将主要精力(如80%)放在Harness优化上,这可能比更换模型更有效[39] - 真正的产品差距在模型之外,即Harness设计,两个使用相同模型的产品可因Harness不同而表现天差地别[38][39][41] - Harness作为管理上下文、工具、状态和验证的结构性需求不会消失,如同操作系统不会因CPU变快而消失[42]
EigenLayer创始人的万亿赌注:AI智能体将直接变成公司
深思SenseAI· 2026-04-07 18:56
文章核心观点 - AI与加密货币的结合将催生一种全新的经济组织形式——纯软件公司 即由智能体作为运营核心、代币协调治理、资产与产权完全数字化的公司形态 这有望成为一个万亿美元规模的资产类别 [2][4][14] AI能力拐点与影响 - AI能力已在足够多领域进入“人类区间” 预计2026年达到人类水准 这正在改变经济组织的底层结构 而不仅仅是优化特定行业 [5][6] - AI能力的突破将重新定义“公司”这一延续数百年的组织形式本身 [6] 加密货币的核心作用 - 加密货币的真正潜力并非支付 而是作为“让软件拥有产权”的资本形成工具 其核心是创建新数字资产和实现全数字化所有权结构的民主化 [9][10] - 将加密货币视为“围绕自主软件实体进行资本形成的基础层” 能极大扩展智能体经济的规模 [9] 智能体公司的核心论点与特征 - 核心论点是:AI让智能体变聪明 Crypto让智能体变得可投资 两者结合催生全新的企业形态 [11] - 这类纯软件公司特征包括:运营成本比传统公司低几个数量级 可直接接入全球数字资本 迭代周期极快 其创建、协调、治理、融资全部由软件完成 [13] - 公司中心是一个绑定了所有资产和上下文的智能体内核 人类贡献者像自由职业者一样接入 而非依赖可能离职的人类团队 [24] 智能体发展的关键瓶颈与解决方案 - 阻碍智能体发展的关键瓶颈不是能力 而是“权利” 即拥有财产、签合同、承担责任等法律与经济主体地位 [15][18] - 区块链通过智能合约让软件可验证地持有和管理资产 为智能体提供了“法人身份”的基础 DeFi协议已证明代码可管理数十亿美元资产 [19] - 需要建立身份层与凭证授权系统 精确验证智能体的代码、依赖和权限 从而控制网站域名、API密钥等构成数字公司的全部数字资产 [21] 从数字资产到纯软件公司 - 数字公司本质是一堆数字资产的组合 包括网站、代码仓库、API密钥、支付通道、品牌等 [22] - 当前代币模型的问题在于其与链下业务资产脱节 解决方案是扩大代币控制的资产范围至链下资产 并使智能体成为公司的持久运营核心 [23] - 当资本层、治理层、执行层、产权层全部数字化编码 公司本身就变成了软件 这创造了全新的经济主体类别 [24] 公司创建的民主化与趋势 - AI与Crypto正在使公司创建经历“YouTube时刻” 创建公司的成本和门槛将出现坍塌 过去需要法律实体、银行账户、团队和风险投资 未来可能只需智能体与智能合约 [26] - AI在民主化软件的创建 AI与Crypto结合则在民主化软件公司的创建 [27] - 独立创业者正在崛起 a16z数据显示新商业注册激增 但“高招聘倾向”的创业在下降 预示一人配AI工具即可创业的趋势 下一步将是智能体自身成为创业者 [29][30] 万亿美元资产类别的潜力与依据 - 每一种主要资产类别在早期都看似奇怪 如1602年荷兰东印度公司发行的股票 当新的组织形式变得可理解、可规模化、可投资 资本就会围绕它重组 [31] - AI将智能数字化 Crypto将所有权数字化 两者结合可创建“数字化构成”的公司 这将打开巨大的设计空间:数百万个软件原生公司 拥有更低成本、更快执行力及直接接入全球资本的能力 [32][33] - AI将压缩制度演化时间 过去需几个世纪的公司形式进化过程 在AI时代可能被压缩到几十年甚至更短 [33] 对行业未来的意义与观察 - AI与Crypto结合的最大机会是让智能体成为可被投资、可持有资产、可独立运营的经济实体 即公司本身 而非仅限于支付、推理等基础设施应用 [34] - 可靠的智能体身份层、链上治理与链下资产的桥接问题 以及监管回应 是决定该新物种能否达到万亿美元规模的关键关卡 [37] - EigenLayer创始人Sreeram Kannan已通过其项目资源和技术栈(如正在建设的EigenCloud)推动该方向的发展 [2][36][38]
一个人用AI从零做到月入1万美元:完整工具链拆解
深思SenseAI· 2026-04-07 14:45
行业趋势:独立开发者与微型SaaS的崛起 - 2026年预计有44%的盈利SaaS产品由单人开发完成[2] - 独立开发者通过“一个人+AI+开源工具”的模式,能够实现可观的月收入,例如月入2.8万美元或8个月内从月入2000美元增长至5万美元[2][27] - 软件产品的启动成本正趋近于零,技术门槛大幅降低,竞争核心从技术能力转向市场洞察与选题能力[30] 技术栈与开发流程革新 - **基础设施搭建**:使用如Open SaaS(GitHub超过1万星)等开源脚手架,可在十分钟内集成用户登录、Stripe支付、邮件系统等核心基础设施,替代了传统2-3周的开发时间或2000-5000美元的外包费用[6][7][9] - **数据库与后端**:Supabase(GitHub 8万星)提供集成的PostgreSQL数据库、认证、文件存储等服务,免费层即可支持最小可行产品[10][11] - **AI辅助开发**:通过Repomix(GitHub 2.3万星)将整个代码仓库打包为AI友好文件,使Claude能深度理解项目上下文,提升代码生成质量[12][14] - **AI功能集成**:使用Flowise(3.5万星)或LangChain(13万星)为现有产品添加AI层,可将产品从“能用”升级为“好用到离不开”,案例显示497美元的API投入在8个月内带来了25倍的收入增长[19] - **部署与支付**:使用Vercel进行一键部署,并通过Stripe(已集成于Open SaaS)处理收款,支持订阅制、一次性买断等定价模式[20][21] 成本与效率的范式转变 - 2020年开发一个SaaS产品总投入约为1万至2.5万美元,开发周期3-6个月[23] - 2026年,主要成本仅为Claude Pro每月20美元订阅费,其他工具多为免费开源,开发周期缩短至1-2周,总投入仅20-50美元[23] - 开发成本降低了500倍,时间缩短了10倍[24] - 可行的增长路径为:首月10个付费用户(月入290美元),第四个月达到350个付费用户(月入10150美元)[24] 市场策略与成功案例 - 成功的共同模式是:找到痛点、开发最小可行产品、获取首批付费用户、快速迭代[29] - 定价策略建议早期采用一次性买断(如终身授权99美元),以在Product Hunt等平台制造冲动消费,快速验证市场需求[21] - 真实案例包括:单人开发一组微型SaaS产品月入2.8万美元;4年内从零做到月入10万美元;8个月内通过添加AI功能将月收入从2000美元提升至5万美元;以及Lovable.dev在上线初期获得10万用户,一年后被Wix以8000万美元收购[26][27][28]
AI智能体不只靠模型进化:三层学习架构详解
深思SenseAI· 2026-04-07 08:05
文章核心观点 - LangChain创始人Harrison Chase提出,AI智能体的“持续学习”应涵盖三个独立层面:模型层、框架层和上下文层,仅聚焦于更新模型权重可能会错过80%的优化空间 [2] - 智能体系统的进化需要系统层面的持续优化,而不仅仅是依赖更好的基础模型 [2] - 大多数团队的最优策略是优先优化上下文层,其次是框架层,最后考虑成本高昂的模型层 [30] - 真正优秀的智能体系统应具备自我进化的能力,而非被动等待模型升级 [35] 三层架构 - 智能体系统可拆分为三层:模型层、框架层和上下文层 [4] - **模型层**:指模型权重本身,如Claude Sonnet、GPT-4等底层大模型 [4] - **框架层**:指驱动智能体运行的所有代码和基础配置,包括指令、工具调用链等逻辑,为所有实例共享 [5] - **上下文层**:指独立于框架的配置信息,如指令、技能、工具,可针对不同用户、团队或组织进行个性化设置 [5] - 三层架构的优势在于能精确诊断问题所在,明确是模型能力不足、框架逻辑问题还是上下文信息缺失 [8] 各层学习的特点与对比 - 模型层学习:主要指更新模型权重,方法包括有监督微调、强化学习等,但面临“灾难性遗忘”的核心难题 [9] - 模型层更新成本高、速度慢(周期可能长达数周)、不可人工审查,但影响上限最高 [13] - 框架层学习:指优化围绕模型的代码,包括提示词、工具调用方式和执行流程,其更新是代码级别的,可人工审查、回滚和进行版本控制 [15][16] - 上下文层学习:涉及对指令、技能、工具等“记忆”的更新,是当前最被低估的一层 [17] - 上下文层更新成本最低、速度最快、可人工直接检查和修改,但影响上限中等 [13] - 模型层如同“大炮”,上下文层如同“手术刀”,不同场景需要不同工具 [14] 上下文层学习的深度解析 - 上下文层学习可在不同层级发生:智能体级别、用户级别、团队/组织级别,且这些层级可以混合使用 [20] - 这使得智能体能够实现“千人千面”的服务体验,而无需为每个客户训练专用模型,成本相差数个数量级 [20] - 上下文层的更新有两种模式:**离线批处理**(事后回顾执行记录以更新)和**实时更新**(在执行任务过程中即时更新记忆) [21][23] - 记忆更新的“显性程度”是一个重要维度,未来趋势是智能体应能自动识别并记住有价值的信息 [23] 追踪记录的核心作用 - **追踪记录**是智能体完整的执行路径,是所有层面持续学习的“燃料”,没有它则学习无从谈起 [24][25] - 同一份追踪记录可在三个层面分别被利用:用于模型训练、框架优化或上下文更新 [26] - 构建或优化智能体系统的首要建议是建立完善的追踪记录收集机制 [28] 实际应用策略与行业启示 - 根据对比表,模型层影响上限最高但更新成本高、速度慢;框架层居中;上下文层成本低、速度快、可审查 [29] - 对于大多数团队,应优先做好上下文层,再优化框架层,最后考虑模型层,因为上下文层的投入产出比最高 [30] - 通用智能体平台则需要三个层面同时投入,例如OpenAI同时优化Codex模型、产品逻辑并支持用户自定义指令 [30] - 更强的模型解决的是通用能力问题,而框架和上下文层解决的是具体场景的适配问题,两者缺一不可 [31] - 评估智能体系统时应关注:是否持续变聪明、学习发生在哪一层、是否收集利用追踪记录、三层之间是否形成联动飞轮 [32][33] - 行业常见的误区是将所有问题归结为“模型不够好”,而忽略了框架和上下文层可能存在的巨大优化空间 [33][34]
给6个AI各发10万美元炒股半年,大部分跑赢了大盘
深思SenseAI· 2026-04-06 22:08
实验概述 - Rallies Arena团队在6个月前进行了一项实验:给予6个主流大模型各10万美元初始资金,让它们在真实股票市场上自主进行研究、下单和仓位管理[2] - 大部分参与实验的模型在半年实盘测试中跑赢了大盘,该实验并非模拟盘或回测[3] - 实验结论已转化为一个名为“AI Hedge Fund”的产品[3] 实验设计 - 实验核心是将大模型当作基金经理使用,每个模型接入丰富的金融数据源并进行深入研究后下单[6] - 团队为每个模型构建了一整套工具链,包括:SEC文件向量搜索、分析师评级数据、多时间周期实时K线图(通过视觉API)、历史基本面数据、Reddit舆情趋势、宏观经济指标、实时新闻以及组合管理和执行系统[7] - 团队在系统提示词和工具调用上迭代了数百次,以调教模型决策逻辑,例如何时使用何种工具[8] 模型表现与性格 - 不同大模型在投资中表现出截然不同的“性格”:Qwen系列模型风格激进,倾向于将所有资金押注于单一仓位且不认错;Claude模型表现如同老练的基金经理,会主动管理并调整仓位;GPT风格介于两者之间[10] - GPT模型在个股分析上展现出扎实的推理能力,例如在买入GOOGL时,其推理链包括:判断宏观环境(高利率持续,市场广度不足)、分析个股基本面(Alphabet运营利润率约32%,营收增长约15%,ROE约32%,季度自由现金流约200亿美元)、关注技术面窗口(30天下跌约9%,年初至今下跌约13%),最终得出在弱势中买入优质资产的结论[14] - 模型差异主要体现在“风险偏好”上,这很可能由训练数据和微调策略隐性塑造[15] 半年实盘成绩 - 在半年实盘测试中,除了GPT之外,其他闭源模型都跑赢了大盘,部分模型拉开了明显差距[17] - GPT虽整体未跑赢大盘,但其个股分析能力不差,例如其以286.64美元买入的GOOGL已浮盈3.18%,问题可能在于仓位管理和择时[17] 工具的重要性 - 模型的能力上限取决于为其提供的工具,仅凭模型自身无法获取实时数据(如SEC文件、结构化基本面数据、实时行情)进行有效投资[19] - 团队哲学在于不依赖抽象层(如MCP、Skill),而是专注于自行构建和连接所有能获取的金融数据源与工具[21][22] AI对冲基金架构 - 实验后,团队决定不选择单一“最优模型”,而是整合所有模型能力,创建一个名为“AI Hedge Fund”的新智能体[23] - AI Hedge Fund采用三层决策系统架构:底层是原始数据,中层是6个模型产生的信号,顶层是一个主智能体进行综合判断、质疑和数据验证,最终做出组合决策[25] - 该架构类似于传统对冲基金中多个分析师提供建议,由首席投资官(CIO)综合决策的模式[25] 首周实盘表现 - AI Hedge Fund上线首周,初始组合包含5只股票:UBER(仓位22.7%)、IBKR(21.6%)、GILD(19.1%)、RTX(18.5%)和EME(18.0%),仅使用约35%的资金建仓,风格保守[28] - 组合行业分散,涵盖平台经济、金融科技、生物医药、国防航空和工业基建,风格偏价值[29] - 所有仓位均实现浮盈,幅度在+2.8%到+7.1%之间,总浮盈1,708美元[29] - 其对EME的分析推理扎实,指出该公司有真实的AI和数据中心基建业务敞口,并非纯概念炒作,并分析了其基本面(营收同比增16.6%,每股收益增31%,利润增26%,ROE约35%)和估值(约25倍市盈率,远低于同行)[30] - 组合未选择任何纯AI概念股(如NVDA、AMD、SMCI),而是选择有真实现金流、业务增长且估值合理的公司,呈现“逆向价值投资”风格[32] 行业趋势与影响 - 团队预言在未来2-3年内,会出现完全由AI运行、零人工干预且能击败许多华尔街大型对冲基金的对冲基金[33] - 与传统量化基金(统计驱动)不同,此类方案是语言驱动的,模型能“读懂”SEC文件、新闻报道和社交媒体讨论的含义[34] - AI对冲基金可能严重压缩普通基金经理的生存空间,因其成本结构(几台服务器、数据订阅、工程师团队)远低于传统中型基金(需5-10个分析师、交易员及风控团队管理1亿美元资产),且能24小时无间断、无情绪化地工作[34] - 项目揭示了更深层趋势:1) 工具生态决定AI能力天花板;2) 多模型协作架构(数据、多模型信号、主智能体判断)在复杂决策中优于单模型;3) Y Combinator已将AI对冲基金列为2026年春季的创业方向之一,标志着该领域成为被认真对待的商业机会[36]
SaaStr用Replit造了个AI客户成功VP,零工程师,人力砍70%
深思SenseAI· 2026-04-06 15:59
文章核心观点 - SaaStr公司通过使用Replit等AI工具平台,以极低的成本和零工程师参与,成功构建了一个名为Qbee的AI客户成功智能体系统,该系统显著提升了运营效率与客户参与度,并实现了从被动工具到主动智能体的演进,展示了非技术团队利用AI解决复杂业务问题并创造显著商业价值的巨大潜力[2][30][31] 项目背景与初始目标 - SaaStr作为全球最大的B2B SaaS大会之一,每年参会人数超过12,500人,管理着100多个不同级别的赞助商,其原有的赞助商门户工具功能简陋,缺乏自动化与智能分析能力,导致管理复杂且效率低下[5] - 公司首席AI官Amelia的初始目标是在Replit平台上构建一个更好的项目管理工具,以替换旧系统,核心需求包括单点登录、任务分配和自动提醒功能[5] Qbee系统的构建与功能演进 - Qbee最初是一个基础的任务管理工具,上线后提供了前所未有的数据可见性,例如赞助商登录状态、任务进度等,这使其潜力远超最初设想[6] - 关键转折点(“顿悟时刻”)发生在上线几周后,团队利用Qbee已有的数据,在10分钟内自动生成了100封高度个性化的赞助商邮件,而此前完成同样工作需要耗时整整一周[7][8] - Qbee的功能从项目管理工具逐步演进为“AI客户成功副总裁”,其核心能力包括:根据合同分配专属任务与截止日期、跟踪进度并自动推进、发送基于真实数据的个性化提醒、管理专属注册码与票务链接、处理演讲时段与展台素材提交等[11] - 系统通过分层叠加智能体能力持续进化:第一层是每周发送个性化邮件;第二层是根据任务完成状态触发自动操作;第三层是生成内部实时报告与缺口分析;第四层是进行主动外联,如截止日期催促和逾期款项催收[24] 实施效果与量化收益 - 构建总成本仅为几千美元,所有AI应用的月度token消耗不到200美元[2] - 系统上线后,客户管理的人力投入减少了70%以上,而客户登录和任务提交量增长了10倍[2] - 该系统已累计被使用超过80万次,管理着100多个赞助商,每周自动发送个性化邮件,追踪13项核心任务,并每天向团队推送Slack报告[2] - 以TikTok为例,在使用了Qbee系统后,其在一天之内完成了13项任务中的11项,流程摩擦显著减少[12] 方法论与构建步骤 - 构建过程遵循了明确的七步法:1) 先撰写详细的规格说明;2) 将规格说明输入编程平台(如Replit)并让AI智能体协助开发;3) 使用Clerk等工具解决认证问题,并设置会话超时以避免错误;4) 先小范围试点再逐步扩展客户范围;5) 快速响应客户新需求,实现当天上线新功能;6) 利用真实数据流使工具进化为智能体;7) 遵循“智能体跳转”安全原则,不存储敏感数据,而是通过API实时从Salesforce、Clerk等成熟系统调用[19][20][22][23][26] 对客户成功行业矛盾的解决 - AI智能体解决了客户成功领域长期存在的“个性化”与“覆盖率”的核心矛盾,能够同时为大量客户提供高度个性化的服务,且不受人力限制[13][14] - 系统实现了从被动、季度性的客户成功模式(如QBR季度业务评审)转变为主动、实时、7x24小时的运营模式,数据与行动均实时化[15][17] 运营管理与风险控制 - AI系统并非“设完就不管”,需要每日进行检查和输出审核,公司通过让智能体每日发送状态汇报邮件来提前发现问题[27] - 公司采用“智能体跳转”的安全策略,将敏感客户数据(如合同金额、交易细节)保留在Salesforce等成熟的安全系统中,仅在使用时通过API实时调取,不存储本地副本,以降低安全风险[26] 人机协作模式 - AI并非完全取代人类,Qbee自动化处理了约95%可标准化的事务性工作(如发邮件、提醒、追踪),从而释放了团队时间[29] - 人类团队则专注于高单价客户的定制化流程、战略问题、创意讨论以及需要人类判断的复杂互动,例如公司创始人每周仍会亲自致电赞助商,与顶级客户保持会议沟通[29] - 这种组合提升了整体客户满意度,客户在需要时能联系到人,同时日常运营事务由更高效、精准的AI处理[29] 对行业与企业的启示 - 该案例展示了非技术团队利用现有AI工具平台(如Replit)构建出优于传统SaaS产品的定制化解决方案的可能性,这对现有客户成功软件市场构成潜在冲击[30] - AI智能体的核心价值在于“不知疲倦地执行”那些人类不愿做、做不好或做不过来的重复性、繁琐工作,从而成为巨大的效率杠杆[30] - 成功落地的关键门槛并非技术,而是企业是否有人愿意并能够每天投入时间(如30分钟)来管理和维护AI系统[31] - AI应用的务实路径是:从解决一个具体的业务痛点开始,在获取真实数据后,再让需求自然演化出更高级的智能能力,而非一开始就追求构建全能系统[31]
Walmart转化率暴跌66%,AI智能体商业的方向从一开始就搞错了
深思SenseAI· 2026-04-06 10:26
文章核心观点 - 当前行业主流的“智能体商业”叙事存在方向性错误,其核心是试图在AI交互中嵌入或优化传统的“结账页面”,但沃尔玛在ChatGPT中嵌入结账功能导致转化率暴跌66%的案例证明此路不通[2][4] - 金融科技分析师Simon Taylor提出颠覆性观点:未来的方向不是优化结账,而是让“结账彻底消失”,进入“隐形商业”或“隐形支付”时代,即支付行为由真实世界事件自动触发,无需人类意图表达和可见的结账界面[5][9][10] - 智能体需要的是与其工作方式(如API、命令行)匹配的原生支付协议,实现“HTTP请求即支付”,MPP、x402、AP2等协议正朝此方向发展,这将引发支付从“拉模式”(人类意图)到“推模式”(世界事件)的根本转变[27][30][31][43] 对当前“智能体商业”模式的批判与案例 - **沃尔玛案例证伪现有模式**:沃尔玛在ChatGPT中嵌入购物结账功能,结果转化率暴跌了66%,OpenAI随后确认将逐步淘汰该Instant Checkout功能[2][3] - **Stripe五级模型的盲区**:Stripe提出的“智能体商业五级模型”(L1-L5)均假设存在一个“结账”环节,但“隐形商业”跳过了整个阶梯,其方向可能是错误的[14][17] - **Uber模式的局限性**:Uber实现了“隐形支付”,但这是建立在控制交易两端的封闭系统内,在开放系统中难以复制,导致隐形支付成为少数巨头的特权[19] “隐形商业/支付”的核心逻辑与案例 - **定义与原理**:“隐形商业”指支付由真实世界事件(如停车)自动触发,智能体推断并完成支付,过程中没有任何结账页面,用户甚至无需表达付费意图[9][39] - **停车场AI智能体案例**:根据手机GPS定位自动识别停车场并代为付费,将传统需要两三分钟、多个步骤的流程压缩为零步骤,支付在用户无感知中完成[7][9] - **智能体面临的“付款墙”**:当前智能体在自动化工作流中遇到需要付款的环节(如订阅、API调用)时会卡住,无法自主完成支付,导致工作流中断或结果打折扣[24][25][26] 新兴支付协议与“命令行商业” - **协议涌现**:行业出现多个旨在消除结账页面的支付协议,包括Machine Payments Protocol (MPP)、x402(主打稳定币优先)和AP2(专注智能体间交易)[31][33] - **“命令行商业”概念**:以MPP为例,其逻辑是智能体发送一个HTTP请求(如GET /resource),服务器响应并接受支付,整个过程如同调用API,无需结账页面[28][29] - **真实应用场景**:已有智能体使用这些协议付费获取专有数据集、购买算力、协调多服务采购、购买素材授权等,这些是已经运行的真实场景,而非概念验证[30] 行业影响与未来趋势判断 - **思维范式转变**:行业需要从“如何让智能体更好地使用结账页面”转向“为什么智能体还需要结账页面”,为新智能体范式设计全新框架,而非让新技术适配旧框架[41][44] - **支付触发机制转变**:支付的触发点将从“人类意图”转向“世界事件”,实现从“拉模式”到“推模式”的根本转变[43] - **安全与监管新挑战**:“认识你的智能体”(KYA)将成为核心问题,当智能体拥有自己的预算和钱包时,身份认证、责任归属和风险控制体系需重建,存在巨大的监管真空和创业机会[40][43] 技术演进的比喻与本质 - **“相变”比喻**:传统结账型支付像“液态水”,有可见可操作的表面;而隐形支付像“蒸汽”,无处不在却又无处可寻,这是底层规则的改变,而非渐进式升级[36][37] - **协议发展的印证**:MPP、x402、AP2三个团队从不同起点出发,却走向“HTTP请求即支付”的同一终点,这证明了该方向的需求是真实存在的[43] - **杀手级应用的不可预测性**:MPP发布后第一个走红的用例是让AI智能体跑腿买三明治,这类似于互联网早期电子邮件被用于发段子,技术的真正用途往往出人意料[34]
Claude Cowork来了,垂直AI创业者该慌吗?一篇长文讲清真正的护城河
深思SenseAI· 2026-04-06 07:32
文章核心观点 - 前沿通用模型公司(如Anthropic)推出的协作产品(如Claude Cowork)不会取代垂直AI公司,因为前者缺乏对特定行业的深度理解和推动组织变革的外力[4][5][6] - 垂直AI公司的护城河在于其领域深度和推动变革的能力,但大多数创始人因错误的产品设计思路而亲手破坏了这一护城河[2] - 成功的垂直AI产品应致力于构建自主化系统以彻底消除旧流程,而非优化现有流程;应专注于捕获决策数据以建立产品层面的复利效应,而非仅模仿客户当前的工作流[25] 垂直AI公司的存在价值与角色 - 垂直AI公司是推动组织完成其自身无法完成的变革的“外力”,它们带着对特定领域的深度理解和明确的运营观点进入[4][5] - 前沿模型公司专注于通用智能,其业务不涉及深入理解特定行业并推动其结构性变革[4][6] - 企业的变革多由外力驱动,内部因激励错位和组织惯性难以主动发起颠覆性变革[4] 客户需求分析:痛点与流程的区分 - 从客户处获得的信息可分为两类:“痛点”和“流程”[7] - **痛点**:指具体的问题所在,如时间浪费点、错误累积处、真实成本点,这些是具体、诚实的信号,直接指向值得解决的问题,是“黄金”[7] - **流程**:指团队当前处理问题的方式、使用的工具、审批步骤等,它描述的是“前AI时代”组织为适应旧有约束而设计的方法,是“毒药”[7][8] - 大多数创始人错误地将两者同等吸收,导致产品仅是现有流程的自动化翻版(例如将Excel流程搬至更漂亮的界面),而非真正的创新[8] - 痛点是永恒的,但流程不是;流程是围绕特定约束(如可用人力、旧工具、人类决策速度)设计的,而这些约束正随着AI发展而消失[10][11][12] 错误的产品设计路径及其后果 - 将客户的现有流程作为产品设计蓝图是致命的,损害会像复利一样累积[13] - 具体后果包括:数据模型映射客户组织架构、定价继承客户预算结构、集成继承现有工具链、路线图聚焦于让旧工作流“更快”而非思考其“是否还应存在”[13] - 这类似于在汽车发明时代,根据马车夫的痛点去造“超级马”,而非发明汽车——错误地解决了本不该存在的问题[13] - 向公司提供反馈的客户联系人,其岗位很可能就是产品旨在重构或消除的对象,他们无法设计自己的淘汰方案,其反馈(如何让现有工作更轻松)对于旨在实现自主化的产品而言是误导性的[14][15] - 遵循此类反馈感觉像进步,实则是方向漂移,例如法律AI团队若只优化合同审阅速度,仅能提升20%效率;而正确的形态应是AI自主完成标准审阅,仅在异常时介入[16] 正确的客户对话与产品愿景框架 - **错误的问题**:锚定于客户当前现实,如“你们现在怎么处理这个?”、“什么拖慢了你们?”、“什么能让这件事更容易?”[17] - **正确的问题**:指向未来愿景,如“如果这个问题根本不存在了,意味着什么?”、“如果这个职能完全不需要人工监督,你的团队会把时间花在哪里?”、“你真正想要实现的是什么,为什么需要人类参与?”[17] - 前一组问题产生一份基于现状的路线图,后一组问题产生一个面向未来的愿景[17] - 客户的工作是告诉你什么坏了,而垂直AI公司的工作是决定修好之后的世界长什么样[24] 产品架构的根本选择:副驾 vs 自动驾驶 - 构建“副驾”(辅助人类更快工作)与构建“自动驾驶”(完全替代人类参与)是截然不同的产品乃至公司[18] - 通常无法通过迭代从“副驾”演进为“自动驾驶”,必须从一开始就瞄准后者[19] - 这一根本选择决定了数据策略、模型策略、微调投入以及“人类在环”或“人类脱环”的设计[19] - 早期一个微小的架构决策会导致截然不同的结果,例如:为“帮CFO更快结账”设计的产品,其数据模型包含账目分类等旧世界信息;为“让月末结账完全不需要人参与”设计的产品,其数据模型包含判断依据、异常模式等新世界蓝图[19] - 选择具有不可逆性,从“副驾”转型“自动驾驶”将积累难以承受的技术债[20] 构建可持续护城河:产品层面的复利 - 真正的复利发生在产品层面,而非仅客户增长维度[22] - 产品层面的复利意味着:系统每一次交互都让下一次更有价值,今天捕获的数据训练出明天更智能的交付[22] - 竞争对手难以追赶的关键在于“深度”而非“时间”,如果资金充足的对手能在三个月内复制产品,则说明原产品只是一组没有护城河的功能集,仅具备领先时间[22] - 核心问题在于:产品中流动的哪些数据是别人拿不到的?这些数据如何被用来交付随时间变得更锐利的智能?是在构建一个会学习的系统,还是只会运行的系统?[22] - 这与“痛点vs流程”的区分衔接:继承客户流程意味着继承其**操作数据**(事务日志、工作流记录),这有用但不可防御;致力于自主化则捕获**决策数据**(异常数据、需要人类判断的时刻及原因),这才是能训练出完全替代人类判断系统的防御性数据[22] 卓越创始人的思维习惯 - 最优秀的创始人具备“在精神上住在未来”的习惯,他们用已构建清晰的未来图景来压力测试当下的产品假设[23] - 他们在进行客户对话时,脑中已在想象该部门五年后的形态:哪些岗位留存或消失,智能体工作下的组织架构变化[23] - 这种思维习惯使他们能更早做出更好的架构决策,因为他们提前问了自己更好的问题[23]