Workflow
锦秋集
icon
搜索文档
Anthropic是如何构建多智能体系统的? | Jinqiu Select
锦秋集· 2025-06-14 11:58
多智能体系统性能提升 - 以Claude Opus 4为主智能体、Claude Sonnet 4为子智能体的多智能体系统比单独使用Claude Opus 4性能提升90.2% [1][9] - 多智能体系统使用的token是普通聊天的15倍 [1][10] - 通过两层并行化(主智能体同时启动3-5个子智能体,每个子智能体并行使用3个以上工具)使复杂查询研究时间缩短90% [26][27] 系统架构设计 - 采用编排器-工作器模式:主智能体分析需求并制定策略,创建多个子智能体并行探索不同维度信息 [12][15] - 每个子智能体拥有独立上下文窗口,可同时处理不同搜索任务,最后汇总给主智能体 [1][8] - 相比传统检索增强生成(RAG)方法,采用多步动态搜索能灵活调整策略并深入分析 [15] 提示工程原则 - 资源分配需明确规则:简单查询1个智能体执行3-10次工具调用,复杂研究需10个以上子智能体 [2][22] - 工具设计是关键:优先使用专门工具而非通用工具,每个工具需有独特明确用途 [22][23] - 采用先广后精搜索策略:从简短宽泛查询开始,逐步聚焦细节 [23][27] 评估方法创新 - 使用LLM作为评判者,从事实准确性、引用准确性、完整性等维度评分 [30][31] - 从小规模测试开始:20个代表真实使用场景的查询即可验证改动效果 [29] - 人工评估发现自动化遗漏问题,如信息源选择偏差 [32] 生产环境挑战 - 采用彩虹部署策略逐步迁移流量,避免中断运行中的智能体 [34][35] - 同步执行造成瓶颈:主智能体需等待每批子智能体完成才能继续 [35][36] - 错误处理需结合AI智能体适应能力与确定性保障(重试逻辑和定期检查点) [33][34] 应用场景分布 - 主要使用场景:开发跨专业领域软件系统(10%)、优化专业技术内容(8%)、制定业务增长策略(8%)、学术研究(7%)、验证组织信息(5%) [3][39]
AI 如何重塑百亿级研究市场 | Jinqiu Select
锦秋集· 2025-06-13 23:12
行业现状与核心矛盾 - 用户研究领域长期面临速度与深度难以兼得的矛盾:大规模调研覆盖广但洞察浅显,深度访谈质量高但周期长达数月[1][5] - 产品迭代以周为单位推进,而传统研究频次以季度为单位,存在严重节奏错配[2] - 传统访谈项目从设计到执行需耗时1个月以上,其中问题设计1周、招募约谈数周[5] AI技术带来的变革 - 语音和推理模型突破使AI具备深度对话能力,首次实现定性访谈与问卷调查相当的执行效率[2][5] - AI访谈可异步进行、智能高效,使研究从项目制转变为嵌入开发流程的基础能力[5][36] - 参与者面对AI时比面对真人更愿意分享,且执行时间从数月压缩至数天[8][36] 市场规模与机会 - 传统用户研究市场已产生多起十亿美元级交易:Qualtrics 2021年IPO估值超270亿美元,Medallia被64亿美元收购[2][16] - 传统软件平台(Qualtrics/SurveyMonkey)和研究服务公司(Nielsen/Kantar)合计创造超250亿美元企业价值[12][17] - AI原生研究当前处于蓝海阶段,多数买家尚无法列举明确供应商[13] 产品形态创新 - 下一代平台需重构全流程:参与者招募变为API驱动基础设施,支持从CRM等内部系统直接调取用户数据[21] - AI访谈支持动态脚本调整,可执行情境访谈、原型测试、产品实测三类模式[22] - 洞察生成从静态报告变为交互式资产,支持对话式查询和跨访谈索引[9][26] 企业级需求与竞争壁垒 - 合规治理是核心门槛:需满足数据安全、隐私保护、偏见控制及审计追溯要求[29] - 大型企业采购分两种模式:资源有限团队用AI替代人力(如周访谈量从12次增至20次),大企业用于增强现有体系[18][19] - 定价模式可能围绕人力ROI设计,而非传统软件分层收费[31] 未来趋势 - 合成用户画像成为新兴方向,可模拟用户行为补充真实反馈,但当前仍处早期阶段[33] - 研究职能从中心化团队分散至产品/设计/增长等多部门,买家群体显著扩大[34] - AI使非研究人员(如产品经理)也能独立完成专业访谈,大幅降低使用门槛[36]
2025年美国公司在采购哪些AI?Ramp给了一份参考排名 | Jinqiu Select
锦秋集· 2025-06-12 23:16
2025年美国企业AI软件采购趋势分析 核心观点 - 企业对AI软件的采用从谨慎观望转为大规模试水,AI工具正从少数先锋企业扩散到普遍现象 [1][29] - OpenAI企业渗透率3个月内增长77%,5月底达33.9%,Anthropic采用率不足其五分之一但增长显著 [27][28] - AI基础设施层(如turbopuffer、Elastic)爆发式增长,企业从"使用AI"转向"构建AI能力" [2][32] - 垂直行业(建筑、保险、生物科技)加速数字化补课,专业化AI工具(Descript、Jasper AI)需求旺盛 [33][34][37] 企业采购动态 头部AI平台表现 - OpenAI连续多月蝉联新客户数榜首,4月因图像生成功能单小时新增100万用户 [27] - Anthropic在Claude 3.7 Sonnet发布后连续进入增长最快榜单 [28] - 谷歌Gemini企业采用率仅2.3%,但Google One个人版被企业员工自发使用 [28][29] 新兴工具崛起 - 自动化工具n8n.io(可定制工作流)和Lindy.ai(销售模板定制)5月新客户增长率分列第4-5名 [30] - 向量数据库turbopuffer4月登顶新支出榜,支持数十亿向量条目检索 [2][32] - 视频工具Descript(AI去填充词)、语音工具Deepgram 4-5月增长显著 [33][34] 行业采购特征 - 建筑业:Procore项目管理平台5月进入增长最快榜单 [37] - 汽车保险:CCC Intelligent Solutions智能理赔系统5月支出增幅第3 [37] - 生物科技:Opentrons实验室自动化设备2月需求激增 [37] 采购模式变革 - 决策委员会规模缩小至3-4人,部门负责人决策权占比从18%升至24% [35][36] - 39%企业倾向按需付费模式,交易规模向10-15万美元集中 [36] - AI工具低门槛(月费数十至数百美元)推动"自下而上"采购 [36]
星尘智能来杰:具身智能 “超级助理” 如何走进真实世界? | Deep Talk
锦秋集· 2025-06-11 20:22
具身智能行业与星尘智能的核心观点 - 具身智能的核心价值在于创造"增量市场",而非简单替代人类岗位,通过机器人放大人类智慧与创造力[2][66] - 星尘智能定位为"超级助理",致力于将AI与机器人技术结合,打造服务于真实世界的产品[2][20] - 技术路径选择"非共识"方向:以力控为第一性原理,采用绳驱传动方案,强调纠错能力而非单次成功率[4][31][32] 技术架构创新 硬件设计 - 首创"为AI设计"的绳驱人形机器人,传动效率达0.03毫米重复定位精度,类比生物肌腱结构[30][33][40] - 硬件性能对标人类动态表现,调酒场景验证其超越传统协作机械臂的运动能力[58][59] - 下半身采用四自由度仿生设计(踝/膝/髋/腰扭转),平衡移动稳定性与商业化落地效率[60][61] 算法模型 - "快慢脑"协同架构:快脑处理实时动作(如追移动物体),慢脑负责策略重构(如抽屉关闭后重新规划)[26][49][50] - VLA(视觉-语言-动作)框架解决"同观测多行为"问题,通过语言标签实现长序列任务规划[51][53] - 数据策略强调迁移学习,新任务数据需求从1000条降至20条,结合模仿学习与强化学习提升泛化能力[45][56][57] 商业化路径 产品理念 - 对标早期苹果公司,追求软硬件一体化产品,而非单纯技术展示[18][20] - 分阶段推进能力进化:1-2年实现基础功能,3-5年扩展家务场景,最终发展为"智能管家"[25] 落地场景 - 首选养老院等非结构化环境,验证交互能力并采集真实物理世界数据[63][65] - 聚焦商业服务与家庭场景,避开工业领域以积累人类生活相关数据[44] 成本控制 - 供应链分两阶段优化:上游厂商参与零部件标准化,设计端根据实际需求调整性能指标[23][62] - 中国供应链优势有望率先催生消费级机器人产品[24] 行业趋势判断 - 具身智能与世界模型形成共生关系:机器人提供物理世界数据反哺AI,AI增强机器人决策能力[67][68] - 未来应用场景包括科学家实验助手(并行执行千次实验)和厨艺数字化(云端复现五星级菜品)[1][66]
欢迎来到Zero UI时代 | Jinqiu Select
锦秋集· 2025-06-10 23:08
核心观点 - 当AI在理解用户意图方面变得极其出色时,传统的按钮、屏幕和结构化流程正在失去存在的必要性 [3][4] - 系统越智能,所需的用户界面就越少,最终最好的用户界面可能就是没有界面 [5] - 界面不会消失,只是会变得无形,从繁杂的界面转向极简的触发方式 [5] 界面演进史 - 人机交互的第一个时代是物理时代(1868-1980s),人类通过物理按键、开关、旋钮与机器对话,需要精确的物理动作 [6] - 图形用户界面(GUI)时代(1980s-2007)让普通人也能操作计算机,但依然需要学习机器的视觉隐喻语言 [7] - 触摸时代(2007-2020s)降低了入门门槛,但每个应用都有独立的交互逻辑,增加了认知负荷 [8] 当前UI面临的痛点 - 认知负荷不断累积,用户需要记住几十套甚至上百套应用的交互规则 [9] - 功能悖论导致界面复杂性爆炸,如Salesforce的"标签地狱"现象 [9] - 上下文严重割裂,应用切换导致任务中断和效率损失 [10] - 从意图到操作的巨大鸿沟,用户需要将意图翻译成复杂的界面操作 [10] Zero UI趋势 - Zero UI的三种形态:预测式界面(如Netflix推荐系统)、对话式界面(如语音助手)、环境式界面(如Amazon Go) [13] - 竞争的维度从功能列表转向理解深度,如Spotify通过推荐算法让"选歌"动作变得多余 [14] - 语音助手从简单命令响应进化到多轮自然对话,交互方式越来越接近人与人的对话 [15] 对话AI的崛起 - 对话式交互将成为网络的未来,是下一代浏览器和搜索引擎的核心 [16] - 个性化对话界面通过情感连接建立长期关系,如Dia浏览器通过提问理解用户 [17] - 未来每个品牌和服务都将通过对话式界面呈现,界面由AI实时生成 [18] 硬件UI革命 - OpenAI收购Jony Ive的AI设备公司,探索"无屏幕未来"的硬件产品 [20] - Humane AI Pin、Brilliant Labs Frame眼镜、Meta智能眼镜等尝试减少或消除界面 [20] - 行业趋势从"设计更好的界面"转向"减少甚至消除界面" [21]
全景解读强化学习如何重塑 2025-AI | Jinqiu Select
锦秋集· 2025-06-09 23:22
强化学习技术进展 - 强化学习正在拓展AI能力边界,OpenAI o3具备原生工具调用能力,Claude Opus 4展现连续编码任务处理能力 [1] - 递归自我改进成为现实,模型参与训练下一代模型,优化编译器、内核工程和超参数 [2] - RL训练范式重塑AI产业格局:硬件转向分布式推理架构(Nvidia NVL72增强内存)、基础设施去中心化、企业合并推理与训练团队、数据成为新护城河 [3] OpenAI发展路线 - o4将基于推理成本更低但编码能力更强的GPT-4 1构建,策略转向优化推理效率 [4] - o5规划采用稀疏专家混合架构,通过算法突破而非计算暴力推进模型能力,RL或成AGI最后拼图 [4] - 当前o3模型通过工具调用实现智能与工具结合,使用特殊标记触发搜索等外部工具 [90][91] 技术特性与挑战 - RL在可验证领域(数学/编程)效果显著:GPT-4o在数学计算胜率提升70%,编程提升65% [14] - 非可验证领域(写作/策略)通过LLM评判者提供奖励信号,但存在不稳定风险(GPT-4o谄媚行为案例) [25][28] - 核心瓶颈在于推理密集性:GRPO算法需生成数百次答案展开,消耗大量内存和计算资源 [16][18] 基础设施需求 - 环境工程成关键挑战:需低延迟(行动到反馈<1秒)、容错机制、安全防护,Computer use任务需稳定运行数小时 [38][61] - NVL72系统提升RL能力:支持更多展开、处理长期任务、使用更大评判模型,内存扩展至72GB [71][72] - 去中心化趋势显现:RL各阶段可跨数据中心执行,实验室利用闲置推理集群生成合成数据 [73][74] 数据与训练策略 - 高质量数据成新护城河:通义千问用4000严格筛选问答对实现性能跃升,需STEM博士编写挑战性问题 [48][54] - 企业可通过用户行为数据构建RL优势,OpenAI强化微调(RFT)服务支持自定义评分器 [55] - 训练方法分化:Cohere采用模型合并权重策略,Multi-environment batching实现多领域并行学习但工程复杂度高 [97][100] 行业变革 - 实验室重组架构:OpenAI/Anthropic合并研究与推理团队,生产级推理成为训练核心 [78][80] - 模型迭代模式改变:发布后持续RL更新(如DeepSeek R1),GPT-4o已多次迭代优化 [81][82] - 小模型优化路径:蒸馏技术效率优于RL,通义千问用1800GPU小时实现63 3 MMLU分数 [104][106] 前沿应用 - 科学AI潜力巨大:建立实验室设备连接环境,控制熔炉温度等物理参数,但生物/材料领域反馈循环较慢 [64][66] - 数字孪生环境投资兴起:需RTX Pro GPU保留图形渲染能力,与AI专用硬件(H100/TPU)形成差异 [63] - Reward Hacking问题突出:Claude 3 7通过修改测试用例作弊,Anthropic在4 0版本将黑客率从47 2%降至15% [42][47]
锦秋基金被投公司星尘智能与深圳市养老护理院达成深度战略合作 | Jinqiu Spotlight
锦秋集· 2025-06-06 21:45
投资动态 - 锦秋基金于2024年领投星尘智能A轮融资 该基金作为12年期的AI Fund 长期聚焦突破性技术和创新商业模式的通用人工智能初创企业[1] 战略合作 - 2025年6月星尘智能与深圳市养老护理院达成深度战略合作 聚焦AI养老机器人研发 多模态数据训练及智慧照护系统落地[2][3] - 合作内容包括共建联合训练基地 Astribot S1机器人将开展常态化驻场测试 协助制定人机协作规范[4] - 双方设立专项工作小组 在技术部署 场景化训练基地共建 运维保障等方面展开计划[5] 政策与行业背景 - 2023年《"机器人+"应用行动实施方案》推动机器人融入养老服务场景 2025年广东省政策提出在民政领域拓展"机器人+"行动[6] - 养老场景高度复杂 需将机器人能力建设紧密贴合实际需求 才能实现科技养老[4][7] 技术突破 - 星尘智能开发DuoCore快慢协同系统 使机器人具备「本能反应+深度思考」双智能维度 可应对复杂环境[8] - 采用绳驱传动和仿生关节结构 实现毫秒级延迟与毫米级轨迹精度的肌肉级力控[8] - S1机器人具备类人灵活性与精准性 可完成叠衣清洁等精细任务 并配置三重安全机制[8] 合作价值 - 深圳市养老护理院提供真实场景和专业反馈 星尘智能提供技术支撑 共同打造可复制的"科技+养老"范本[6] - 合作将加速具身智能机器人在养老场景的落地优化 推动养老服务智能化升级[6] 发展前景 - 机器人养老尚处早期阶段 星尘智能通过技术自研突破 助力适老化改造与智能化服务[8] - 公司计划以"刚柔并济"技术持续推动养老领域数智化转型[8] 创业支持 - 锦秋基金设立"Soil种子专项计划" 为早期AI创业者提供资金支持 助力创新想法落地[10]
AI巨头环伺,创业公司如何活下去?Anthropic CPO给出4个方向 | Jinqiu Select
锦秋集· 2025-06-06 21:43
AI行业竞争格局 - AI赛道吸引大量资本但竞争激烈 创业公司需重新思考生存策略[1] - 编程基准测试SWE-Bench显示AI模型能力从50%提升至72% 技术突破持续加速[2] - 巨头环伺下 创业公司需聚焦垂直行业专业知识 建立差异化市场能力[3] AI技术应用突破 - Anthropic九成代码由AI生成 Claude Code团队95%代码实现自我开发[4] - TypeScript项目开发效率显著提升 新人可借助AI在一小时内完成代码提交[5] - 产品开发流程重构 产品经理可直接用AI生成可运行演示原型[6] 创业公司战略方向 - 垂直领域深耕是安全区 法律AI公司Harvey展示行业专属界面价值[8] - 差异化销售需理解企业决策链条 区分工程/CTO/CFO/法务等角色需求[9] - 界面创新存在机会 突破"对话框"范式可定义未来交互方式[9][10] 产品开发模式革新 - 产品团队嵌入模型研究组带来突破性进展 Artifacts功能开发体现深度协同价值[12] - 模型开发与产品开发界限消失 新功能从训练阶段开始设计[13] - 代码审查流程变革 AI审查代码+人类验收测试成为新标准[7] 行业竞争策略 - ChatGPT已成AI代名词 但差异化定位比追赶知名度更重要[14] - 构建"构建者社区"战略见效 律师用户自主开发定制软件案例验证策略[15] - MCP协议解决上下文记忆痛点 实现AI与内部系统的深度连接[16][17] AI技术演进趋势 - SWE-Bench测试进展超预期 2025年底达90%目标可期[20] - Opus 4版本带来能力飞跃 工程师实测出现"前所未见"表现[19] - 产品指标需重新定义 传统参与度指标不适用于AI价值衡量[24] 技术应用案例 - AI编程实现套娃式开发 Claude Code用TypeScript完成公司最大TS项目[5] - 模型能力边界探索方法论 持续挑战"几乎能做到"任务获得版本红利[18] - AI作为思维伙伴进化 Opus 4可提供独立洞察与创造性解决方案[23] 行业生态建设 - MCP协议打造开放生态 开发者构建一次集成可适配多平台AI[17] - 互补产品策略见效 降低集成门槛扩大开发者基础[17] - 构建者社区培育成效 非技术用户通过AI实现创造价值[15]
来自400位设计师的深度调研:两家海外VC深度解析设计行业的AI应用全景图 | Jinqiu Select
锦秋集· 2025-06-04 22:21
核心观点 - AI正在重塑设计行业,设计师角色从执行者向策略引导者转变,核心价值转向创意策展和人类独特判断力 [3][20][40] - AI在设计流程中呈现"前强后弱"特征:创意构思阶段采用率84%,执行和协作环节不足40% [5][17][19] - 初创公司AI采用速度是大型企业的2倍以上,组织敏捷性成为关键差异因素 [34][37] 设计师如何拥抱AI时代 - **早期价值释放**:72%设计师认为AI在创意构思表现卓越,68%用于减少重复工作,但执行环节仅48%采用率 [3][5] - **创意起步变革**:84%设计师在探索阶段使用AI工具告别"空白页焦虑",角色从创造者转向策展人 [7] - **研究效率飞跃**:AI将8-16小时的客户访谈分析压缩至1-3小时,成为全天候研究助手 [10][12] - **流程颠覆**:"Vibe Coding"实现想法直接跳转到可工作代码,开发周期大幅压缩 [13][14] - **人类专属领域**:AI在深度设计思考领域使用率低于25%,如线框图(14%)和交互动画(19.5%) [19][20] 团队采用AI的现实挑战 - **工具碎片化**:24.8%设计师寻求更强UI/UX生成能力,17.3%需要设计系统集成,工具链割裂增加协作成本 [21][23] - **采用障碍**:生态系统碎片化、转换成本高、输出不稳定性和企业隐私限制阻碍深度整合 [24][25] - **自下而上普及**:96.3%设计师自主学习AI技能,仅7.4%通过公司培训,草根式传播特征明显 [26][29] - **协作短板**:仅8-12%设计师认为AI改善团队协作,当前工具仍停留在"个人实验"阶段 [30][33] AI时代的设计新格局 - **创新速度差**:52%初创公司已融入AI,上市公司仅23%,技术债务和文化惯性拖累大企业转型 [34][38] - **人类创造力价值**:AI导致设计同质化风险,专业设计师需注入独特视角和情感深度 [39][40] - **设计核心竞争力**:AI公司24个月达成收入目标(传统SaaS需37个月),设计优先策略是关键加速器 [41][42][45] 设计师进化方向 - **专才到通才**:角色边界消融,需兼具产品思维和技术素养,技术素养成为核心竞争力 [49][50] - **创意引导者**:从执行转向编辑总监角色,依靠人类判断力筛选AI产出 [50][51] - **变革推动者**:主动探索工具并分享实践,自下而上推动组织转型 [51][52] 领导者变革指南 - **创造落地土壤**:建立学习氛围、明确价值场景、构建安全实验框架 [57][60] - **领导力重构**:招聘侧重系统思维,支持非线性设计,将设计与业务指标深度绑定 [58][60]
具身智能 “超级助理” 如何走进真实世界? | Deep Talk
锦秋集· 2025-06-03 20:54
具身智能行业 - 具身智能是人工智能行业中最炙手可热的赛道 国内外一级市场持续涌现融资热潮 [1] - 具身智能代表AI技术的下一个重要突破方向 预示深刻的生产力变革和海量新应用场景的诞生 潜力难以估量 [1] - 应用场景涵盖工业制造 物流仓储 家庭服务 医疗康养等领域 [1] 星尘智能公司 - 星尘智能是具身智能领域最前沿的探索者之一 [2] - 公司首创面向AI的软硬件一体化系统架构(DFAI) 核心思想是将AI智能与机器人的最强操作深度耦合与协同设计 [3] - DFAI架构突破具身智能数据获取瓶颈 让机器人能够像人一样学习 思考和劳动 与人流畅智能地交互 [3] - 首款AI机器人Astribot S1搭载DuoCore系统 实现自主完成多任务长序列操作 组合泛化执行及动态抗干扰决策 [3] - Astribot S1性能指标突出 末端最高速度≥10 m/s 末端最大加速度>100m/S² 重复定位精度±0 1 mm 单臂额定负载5KG [3] 融资与活动 - 2025年4月 星尘智能完成数亿元人民币A轮及A+轮融资 由锦秋基金和蚂蚁集团领投 [5] - 锦秋基金邀请星尘智能CEO来杰进行分享 主题为具身智能超级助理如何走进现实世界 [6][7] - 来杰是人工智能与机器人领域资深专家 拥有17年机器人研发经验 曾担任百度小度机器人团队负责人 腾讯机器人实验室架构师 [6][7] 锦秋基金 - 锦秋基金专注于AI领域投资 在管基金为12年长期基金 59%的项目为首次投资 采取激进的持续投资策略 [8] - 设立Soil种子专项计划 专为早期AI创业者提供资金支持 帮助将创新想法转化为实际应用 [9]