锦秋集
搜索文档
锦秋基金跟大家聊一聊新一代 AI 创始人 |Jinqiu Spotlight
锦秋集· 2025-09-25 17:53
追踪锦秋基金与被投企业的每一个光点与动态, 为创业者传递一线行业风向。 9 月 20 日,由硅星人组织的AI Creators Carnival——AI 创造者嘉年华上,AI 开发者及创业者、不 断迭代创新的AI产品公司、 活跃在一线的投资人聚集在一起,共同分享 AI 新浪潮中的观察和体 验。 锦秋基金合伙人臧天宇 应邀参加圆桌论坛 "聊聊新一代的 AI 创始人" ,同场的还有 主持人播客 《乱翻书》主理人潘乱,嘉宾真格基金合伙人刘元、蓝驰创投合伙人曹巍、峰瑞资本投资合伙人陈 石。 创新不是个例,而是日常;不是凑个热闹,而是持续耕耘。 「Jinqiu Spotlight」 如果你想与我们交流,可以直接与我们联系,或是参与锦秋为为创业者打造的常态化闭门社交活动 —— 「锦秋小饭桌」 。 以下是近期饭桌上新菜单,欢迎找我们一起品鉴! AI Agent@深圳 09.26 具身智能@北京 10.10 机器人派对@深圳 10.17 关于 AI 原生创业的探讨,锦秋还在持续。 我们希望在这场新浪潮中,与更多的创业者、技术产品专家、 投资人、 创新观察家共同对话,来构 建我们同频的学习场域。 | Jinqiu | 美国 T ...
Demo 能博眼球,生产才赢生存:64页AI Agent 创业者落地指南 | Jinqiu Select
锦秋集· 2025-09-25 13:54
AI Agent开发范式转变 - AI Agent开发代表软件工程领域的一次范式转变,使初创公司能够自动化复杂工作流并创造新用户体验[7] - 从有前景的原型到生产就绪的Agent需要解决非确定性行为管理、复杂推理路径验证等新挑战[7] - 现实表明用户不会为炫酷Demo买单,企业不会把关键流程交给"不确定的模型玩具",从Demo到生产隔着工程化、可靠性和商业化的深渊[1] 谷歌云Agent生态系统 - 谷歌云支持Agent系统的全面开发,包括构建自定义Agent、使用预构建谷歌云Agent或引入合作伙伴Agent[13] - 在模型上下文协议(MCP)和Agent2Agent(A2A)协议支持下,通用框架专为互操作性设计[13] - 生态系统提供从使用ADK进行代码优先开发到通过Google Agentspace进行无代码Agent创建的全套工具[7] Agent核心架构组件 - AI Agent核心组件包括"大脑"(模型)、"双手"(工具)、执行功能(编排)以及实现信息准确性的"知识注入"(Grounding)机制[4] - 把Agent当系统而不是模型:大脑(LLM)、工具(API)、记忆(上下文)、编排(工作流)、运行时(限速/监控)缺一不可[4] - 模型分层选型:用"小模型"覆盖80%常规任务,大模型只做复杂/高价值环节以降低成本[4] 生产级运维框架(AgentOps) - 掌握确保Agent在生产环境中安全、可靠且可扩展的系统性方法,涵盖从持续评估、轨迹调试到安全监控的全过程[4] - 可观察性先行:对任务步数、调用失败率、成本、时延打点,才能发现"不确定性"的来源[4] - 限速、限步、限费防止失控:设硬阈值(token、费用、时延),超限必须降级或中止[4] 代码优先构建方法 - 使用谷歌Agent开发工具包(ADK)一步步构建、测试和部署自定义Agent,并与已有工具和工作流集成[4] - ADK为创建对话式和非对话式Agent提供强大灵活环境,能够处理复杂任务和工作流[17] - 使用ADK构建的Agent可部署在Vertex AI Agent Engine上,这是专为此目的设计的可管理、可扩展环境[17] 知识注入技术演进 - Grounding优先:答案必须有据可依,RAG→GraphRAG→Agentic RAG是可靠性的核心路径[4] - RAG通过在生成答案前从外部知识库检索相关信息来增强LLM响应,确保回答有基于事实的可验证基线[78] - Agentic RAG将Agent从检索数据被动接收者转变为知识搜索中主动推理的参与者[93] 工具与编排系统 - 工具要少而准:工具接口越清晰、越语义化,Agent才能更稳地调用,避免"工具堆积"[4] - 编排是执行力:顺序/并行/循环三类工作流覆盖90%场景,要有终止条件、失败回退[4] - ReAct框架建立动态多轮循环,模型以交错方式生成推理轨迹和特定任务行动[69] 数据架构设计 - 三分记忆模型:长期记忆(用户/知识库)、工作记忆(短期上下文)、事务记忆(审计/一致性)[4] - 长期知识库是Agent智能、知识注入和个性化基础,与实时对话的快速短期上下文不同[58] - 工作记忆层管理正在进行的任务或对话所需瞬时信息,必须提供极低延迟访问[59] 商业化落地策略 - 找高频刚需的工作流切入:Demo不等于生意,优先做频次高、痛点大、能量化ROI的SOP[4] - 计费单元要透明:token+检索+API调用,需要像云计费一样拆账单,用户才会信任[4] - "答案可追溯"是销售力:企业客户要的不是酷炫,而是"答案可追溯",证据列表能显著提高成交率[4] 团队组织要求 - 团队三角色必须齐全:Agent PM(定义任务)、编排工程师(工具/工作流)、Agent SRE(监控/评估)缺一不可[4] - 差异化强的自己做,标准化/合规重的优先集成以快速扩展产品边界[4] - 创业公司必须用"可扩展、可计费、可合规"的标准要求自己,生产落地才赢市场[4]
继OpenAI千亿豪赌后,阿里3800亿入局:全球算力之战,谁能给出终极答案?
锦秋集· 2025-09-24 18:17
全球算力投资格局 - 英伟达与OpenAI宣布千亿美元级别AI算力集群合作[1] - 阿里巴巴宣布投入3800亿人民币加强AI基础设施并持续追加投资[2] - OpenAI、谷歌、Meta、xAI及阿里巴巴等全球科技巨头均加入算力竞争[3][4] 算力竞争战略核心 - 算力基础设施成为AGI和ASI竞赛的战略基石[5] - 构建算力壁垒需具备未来预判、工程执行、系统架构颠覆和开发者生态构建能力[6][7] - 英伟达作为核心硬件供应商提供行业参考标准[8] 英伟达与英特尔合作 - 英伟达向英特尔投资50亿美元联合开发定制数据中心和PC产品[10] - 合作使英伟达投资增值30%获利10亿美元[10] - 双方合作开发chiplet封装PC产品显著提升笔记本电脑市场竞争力[10] 市场竞争影响 - 英伟达与英特尔合作对AMD构成重大威胁[11] - ARM架构因英伟达获得英特尔技术支持面临竞争压力[11] GPU市场动态 - GPU市场经历从产能紧缺到价格战再回归产能为王的周期变化[12] - 初创公司获取少量GPU容易但大规模部署困难[12] 云服务商战略 - 甲骨文凭借强大资产负债表为OpenAI等客户提供3000亿美元超长期计算订单[13] - 采用灵活硬件策略兼容英伟达Infiniband和Arista以太网技术[13] - 通过精密数据中心模型预测算力增长和收入[13] AWS复苏策略 - AWS通过为Anthropic等客户提供海量GPU和自研Trainium芯片推动收入增长超20%[14] - 升级传统数据中心成本相比GPU价格微不足道[14] - Trainium芯片在特定大规模场景下展现效率优势尽管通用性较差[15] Blackwell架构性能 - GB200部署成本为H100的1.6倍但性能提升高度依赖工作负载[17] - 预训练任务性能提升约2倍属边际提升[20] - 特定推理任务性能提升达6-7倍每美元性能提升3-4倍[20] 系统可靠性挑战 - GB200 NVL72将72个GPU互联形成单一故障域[18] - 故障爆炸半径问题导致单GPU故障可能使整个机柜下线[20] - 采用64+8工作负载管理策略应对可靠性挑战[20] 硬件架构演进 - AI推理分为预填充(计算密集型)和解码(内存带宽密集型)两个阶段[28] - 业界采用分离式部署策略优化不同任务[21] - 英伟达推出专用CPX芯片剥离HBM降低制造成本[21] 英伟达核心竞争力 - 创始人黄仁勋采用YOLO式大胆决策策略如提前投资Xbox芯片产能[23] - 通过锁定供应链产能策略主导市场[23] - 管理风格依赖商业直觉而非数据报表[24] 技术执行力 - 芯片设计实现一次成功能力避免多次修订延迟[26] - Volta芯片在最后时刻增加Tensor Cores奠定AI硬件霸主地位[26] - 强大执行文化确保产品准时交付[25] 未来资金部署 - 英伟达年产生数千亿美元自由现金流面临巨额资金部署挑战[27] - 反垄断监管限制大型并购选项[27] - 可能投资数据中心、能源基础设施或机器人和AI工厂[27]
美国 Top 15的AI 天使投资人都投了哪些公司? | Jinqiu Select
锦秋集· 2025-09-24 17:02
当中国创业者走向海外,他们最该争取哪些海外的 AI 天使投资人?当中国早期投资人寻找参照,他们又该向谁学习? CB Insights 近日发布了全球 Top 15 AI 天使投资人榜单。 锦秋基金(公众号:锦秋集;ID:jqcapital)认为某种程度上,对创业者;这是一份融资Pitch List,对投资人,这是一份值得榜样名单。 因此, 锦秋基金(公众号:锦秋集;ID:jqcapital)基于这个名单 ,继续搜集整理了Top15的投资人在AI领域的代表性投资案例。希望能给关注AI的读者朋友提供 有价值的参考。 基于我们的观察和整理,Top15的天使投资人押注的项目,并非散点式的"随缘下注",而是呈现出高度一致的共性和清晰的趋势。 1 在赛道选择上,他们集中在两大方向:基础设施与高价值垂直场景。 基础设施层的投资覆盖了 AI Agent 平台、世界模型、自动化开发工具以及算力、数据管理、AI 安全等核心领域,例如 Anysphere(AI Coding)、Resolve AI(自动 化)、Yupp(评测平台)、Roboflow(计算机视觉工具)。 与此同时,他们也倾向于投向法律、医疗、金融、制造等高门槛、强需 ...
寻找你的AI同频搭子|「锦秋小饭桌」活动上新
锦秋集· 2025-09-23 17:44
活动信息 - 锦秋小饭桌是为创业者打造的常态化闭门社交活动,每周五晚在北京、深圳、上海、杭州等地举办 [22] - 活动形式为非正式会谈和产品技术人社交饭局,围绕技术、投资、硅谷和国内进展等话题进行真诚交流 [23] - 2025年9月至10月将举办三场活动:9月26日深圳AI Agent专场、10月10日北京具身智能专场、10月17日深圳机器人派对 [3][5][50] 大模型在决策任务中的应用局限 - 现阶段大模型不适合直接用于严肃的长序列决策任务(如游戏AI),其表现不如传统的小型强化学习模型 [25] - 决策任务具有一步错满盘皆输的特性,而大模型擅长的感知/生成任务容错率较高 [25] - 大模型训练数据中缺乏高质量的决策过程知识和数据,例如在斗地主游戏中性能仅能勉强战胜随机出牌的智能体 [26] 信息检索范式演进 - 传统RAG通过外部的Embedding、Ranking、Retrieval等工程化手段进行信息召回 [32] - 新一代模型(如Claude)具备原生上下文感知能力,能自主决定使用何种工具进行语义和场景强相关的信息检索 [33] - 模型原生能力效果好但成本高,适合模型开发者,应用层公司为控制成本仍需采用外部工程方案或混合使用 [35] Agent架构与发展趋势 - 目前主流应用基于React的单智能体模式,通过思考-行动循环完成任务 [36] - 多智能体系统正在兴起,通过规划、解题、验证等多个角色智能体协同工作,可取得超越单智能体的效果 [36] - 让AI Agent交付预期结果的关键在于前期生成清晰明确的需求文档、软件架构图和任务列表 [38] AI Agent基础设施技术流派 - Sandbox模式以Manus为代表,为每个Agent启动一个独立的完整Linux系统沙箱,功能强大但资源消耗大 [39] - 模块化组件模式以AWS Agent Core为代表 [40] AI硬件与交互方式演进 - 通用Agent的机会在于交互方式变革,如从打字到语音输入,未来可能出现新硬件设备利用AI服务时间 [42] - 主动式AI硬件是下一代产品,但面临技术挑战,预计还需2-3年才能被工程化验证 [43] - Meta发布的Rayban Display是中间产品,备货量仅1-2万台,性能表现不佳且演示出现故障 [44] 大模型记忆管理与数据源 - Memory管理是大模型能力提升的下一个赛点,需找到模型自发压缩状态的方案以突破transformer架构的上下文限制 [45] - 拥有多样化数据源的Agent在理解用户语境方面表现更好,例如谷歌通过浏览器、云盘、邮箱等服务覆盖用户生活场景 [46] - 开发专有浏览器是为AI功能提供最高权限的技术路径,可避免频繁权限提示,提供更流畅体验 [46] 创业支持 - 锦秋基金设立Soil种子专项计划,专为早期AI创业者提供资金支持,帮助将创新想法转化为实际应用 [57]
Nvidia砸千亿美元助力OpenAI,马斯克狂飙造全球最大AI集群 | Jinqiu Select
锦秋集· 2025-09-23 12:44
行业核心观点 - AI行业竞争从算法和产品层面进入基础设施和算力的硬核较量阶段 [2] - 模型层顶级玩家通过资本、算力和速度构建了难以撼动的护城河 [3] - 模型智能水平将持续提升,为非模型层创业者创造基于趋势设计业务的机会 [4] Nvidia与OpenAI合作 - Nvidia宣布向OpenAI投入高达1000亿美元的战略投资 [1] - 双方将携手打造至少10吉瓦的数据中心基础设施,用于支撑下一代模型的训练与部署 [1] xAI的算力基础设施布局 - xAI从2025年3月起迅速启动Colossus 2项目,半年内完成约200MW冷却能力和机架安装,速度远超业界平均水平 [5][11] - 为解决孟菲斯本地电力限制,xAI在密西西比州Southaven收购旧电厂并获临时许可运行燃气涡轮机,形成跨州供电方案 [5][14] - 与Solaris Energy Infrastructure合作,通过租赁和合资模式快速部署超过460MW涡轮发电机组,规划总装机规模扩大到1GW以上 [5][19][24] - 通过多层布局和高密度设计,将现有站点容量提升到超过1GW,增强单一相干集群优势 [5][27] xAI的财务状况与融资 - Colossus 2所需资本支出高达数百亿美元,xAI尚未产生有意义的外部收入 [29] - 传闻中的9位数年化经常性收入绝大部分是X.com到xAI的公司间转移 [29] - 正准备新一轮数百亿美元融资,公司估值接近2000亿美元,沙特公共投资基金将扮演重要角色 [31] - 未来两三年仍需持续投入数百亿美元资金,高度依赖外部融资及Elon Musk其他企业内部资金转移 [5] xAI的技术与产品 - Grok 4在技术指标上已达到一线AI实验室水平,但商业收入和企业客户接受程度表现不足 [5] - API产品存在性价比劣势,Grok 4定价与Claude Sonnet 4持平但编码能力稍逊 [5][45] - 发布蒸馏模型Grok Code Fast 1,以更小体积保留Grok 4部分性能,在OpenRouter上需求激增 [45][47] - 采用独特的强化学习路径Ani,通过人类情感与互动环境训练模型,而非仅局限于数字生产力领域 [5][53] xAI的人才与文化 - 从DeepMind、Meta、英伟达等公司成功引进大量顶尖人才,员工超过一千名并持续扩张 [41] - 公司文化以高压和极快工作节奏著称,人员流动性极高,长期组织稳定性面临风险 [5][42] - 前首席财务官加入后不到4个月离职,部分高级研究员也已离开 [42] xAI的市场策略与挑战 - 产品选择与Elon Musk旗下X深度融合的路线,消费者侧取得进展但企业端表现乏力 [5][50] - 在企业方面采用率非常低,部分由于模型幻觉问题及对特定话题的敏感行为 [49] - 与OpenAI、Anthropic等公司专注于代码和自动化应用的策略不同,xAI追求更通用的AGI路径 [52]
119页报告揭示AI 2030 关键信号:千倍算力,万亿美元价值 | Jinqiu Select
锦秋集· 2025-09-22 20:53
文章核心观点 - 报告基于当前趋势外推,描绘了2030年AI发展的“保守基线”或“默认未来”,其核心是算力规模化的持续指数级增长将驱动AI能力的显著提升,并带来巨大的经济影响 [1][3][5][9][10] - 若当前趋势延续,到2030年,最大AI模型的训练算力将达到当今水平的约1000倍(10^29 FLOP),硬件投入将达约2000亿美元,AI数据中心用电量可能占全球的2%以上 [1][5][21][24] - 能力进步将首先在数字世界(如软件工程、数学)快速兑现,逐步渗透物理世界,并对经济产生实质性影响,例如将10%的远程任务产出翻倍可能带来1-2%的GDP增长 [4][6][7][96][107] 算力趋势 - 自2010年以来,训练算力以每年4-5倍的速度增长,预计此趋势将持续至2030年,最大模型的训练算力将达到当今水平的约1000倍(10^29 FLOP)[5][24][39][40] - 推理算力规模化是AI持续改进的另一重要来源,与训练算力并非零和关系,更强的训练模型能使同等推理预算完成更多有效工作 [5][31][39][46] - 训练算力的增长主要来自扩大加速器集群规模和使用更强芯片,而非显著延长单次训练时长 [5][74][76] 投资量级 - 为支撑算力千倍扩张,前沿AI集群的资本开支将达到约2000亿美元量级,单个大模型的摊销开发成本达数十亿美元 [1][5][21][47] - 若头部AI实验室收入延续近年“年同比约3倍”的增长轨迹,至2030年其收入规模可达数千亿美元,形成“高投入-高产出”的经济闭环 [5][10][24][58] - 算力已成为模型开发成本的最大组成部分,并且其占比预计将继续增加 [53][55] 数据格局 - 高质量人类生成文本数据即将见顶,增长动能将转向多模态(图/音/视频)数据和合成数据 [5][62][64][67] - 大量能力提升来自后训练与强化学习叠加“推理时算力”带动的数据生成与筛选,真正稀缺且最具价值的是可验证、与经济价值强耦合的专业数据 [5][59][69][70] - 2024年初,OpenAI每日生成约1000亿个token的合成数据,这为持续的数据规模化提供了重要途径 [68] 硬件与集群形态 - AI能力提升主要依赖更大的加速器集群和更强芯片,下一代基于超过10万个H100 GPU的集群已在建设中 [5][74][77][80] - 为缓解功率与供电瓶颈,多数据中心、跨站点的分布式训练将成为常态,训练与推理在地理与架构层面进一步解耦 [5][73][81] 能源与排放 - 到2030年,AI数据中心用电可能达到全球用电量的2%以上,最前沿单次训练的峰值功率可达吉瓦级(约10吉瓦)[1][5][21][84] - 基于当前电网平均碳强度估算,AI用电可能占2030年全球排放量的0.03%至0.3% [24][85][86] - AI在电网优化、工业流程和交通等领域具备带来可观减排的潜力,但这严重依赖于社会对部署的决策 [6][24][91] 能力发展与部署 - 一旦某项任务在基准上出现“能做”的迹象,继续扩规模通常会可预测地提升性能 [6][11][30][93] - 软件工程将从助手走向可自主完成定义明确的实现与修复,数学迈向证明草图形式化,分子生物学拓展到相互作用预测,天气预测持续改进 [4][6][11][109][110] - 部署面临三大核心挑战:可靠性(如幻觉问题)、工作流集成以及成本效益平衡,专业数据的可得性贯穿影响这三点 [6][111][112][115][116] 经济影响 - 自动化将产生巨大经济价值,若将10%的远程任务产出翻倍,约可带来1-2%的GDP增量;若将一半远程任务产出翻倍,则对应6-10%的GDP增量 [4][7][104][107] - AI技术采纳速度是历史上最快的之一,当前AI收入增长趋势与到2030年产生数千亿美元收入、证明巨额投资合理性相符 [10][24][58][102] - R&D的自动化将与更广泛的经济自动化同步发生,但更大的短期至中期经济效应源于整个经济体任务的自动化 [96][100][101]
锦秋基金被投公司地瓜机器人提出纯视觉机器人操作方法VO-DP | Jinqiu Spotlight
锦秋集· 2025-09-22 15:15
投资事件 - 锦秋基金于2025年完成对地瓜机器人的投资,该基金是一家拥有12年历史的AI基金,以长期主义为核心投资理念,专注于寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [1] 公司概况与市场地位 - 地瓜机器人是业界领先的机器人软硬件通用底座提供商,其前身为2015年成立的地平线机器人 [2] - 公司构建了从芯片、算法到软件的完善产品体系,核心产品包括旭日智能计算芯片和RDK机器人开发者套件,算力覆盖范围从5到500 TOPS,可满足人形、四足狗、家庭服务等多种机器人计算需求 [2] - 旭日系列芯片累计出货量已超过500万片,平台拥有超过200家中小创客、200多家头部高校以及来自全球20多个国家的近100,000名个人开发者,创造了数百种形态的智能机器人产品 [2] 技术突破:VO-DP方法 - 公司联合同济大学推出了全新的纯视觉机器人操作方法VO-DP,该方法采用纯视觉方案,融合先进的视觉基础模型,突破了传统点云模型的局限 [2][4] - VO-DP方法的核心创新在于引入了基于Cross-Attention的融合模块,对来自VGGT模型的语义特征(DINOv2)和几何特征(Alternating Attention)进行有效融合与压缩,作为下游策略头的输入 [6][16] - 该方法设计了一种空间特征压缩模块,将融合后的特征适配下游任务输入,并研发了名为DRRM的多机多卡并行训练框架 [14] 技术优势与性能表现 - 纯视觉方案具有显著的硬件成本效益,RGB相机的硬件成本可降低数倍至数十倍,且无需多传感器标定,工程便利性更高 [11] - 在仿真实验中,VO-DP(3帧)与基于3D点云的DP3方法在精度上已持平,而VO-DP(1帧)的表现甚至略微超过DP3,证明了纯视觉方案在精度上可与3D方案对齐甚至超越 [5][30] - 在特定任务上,VO-DP表现更优,例如在Pick Apple Messy任务中,VO-DP(3帧)成功率达到80.0%±0.8,显著高于DP的31.0%±0.8和DP3的18.7%±2.9 [22][26] - VO-DP方法已成功部署到真实机械臂上,并能成功执行桌面收纳、混合堆叠等复杂任务 [5][35] 行业背景与研究路径 - 端到端的机器人操作学习是具身智能领域的关键研究方向,当前主流技术分支为VA和VLA [4][7] - 公司研究聚焦于VA,认为在单一任务场景下,对观测到行动的预测是更基础的问题,有助于深刻理解时空表达如何影响动作预测 [8] - 视觉基础模型(如VGGT)的快速发展为纯视觉方案提供了可靠预训练模型,其能力已从二维语义感知提升到三维空间感知 [10]
n8n 爆红,创业公司如何做“AI 版 n8n”?| Jinqiu Select
锦秋集· 2025-09-22 14:30
n8n公司发展概况 - 2025年3月完成约6000万美元B轮融资,估值约2.5-3亿欧元,8月由Accel牵头的新一轮融资将估值推高至约23亿美元[1] - 年度经常性收入(ARR)突破4000万美元,在数月内增长五倍[1] - 公司作为开源自动化平台代表,其热度持续攀升,反映出自动化工作流正成为AI应用的核心基础设施[1] 自动化平台行业趋势与创业机会 - 国内外多个团队正尝试将大语言模型(LLM)与自动化平台结合,以打造更智能的工作流和代理系统,形成“AI版n8n”的创业浪潮[2][3] - n8n已成为行业参照系,创业公司或直接对标,或在其基础上延展功能,试图抢占“自动化+AI Agent”的新入口[3] - 下一代产品的机会在于从“连接”转向“理解”和“推荐”,用户可通过自然语言告知系统目标,由AI生成并优化工作流,将智能代理嵌入高频场景[6][7] 市场需求分析(基于招聘数据) - 基于2025年4-5月收集的2209条招聘信息进行分析,招聘平台是主要需求来源,其中Upwork提供2072条机会,Reddit提供82条,n8n官方论坛提供55条[11][15][16] - 自由职业在市场中占主导地位,在2100条明确工作形式的信息中占比超过80%[19] - 在541条明确时间要求的信息中,大多数为短期或中期合作:一次性工作147条,兼职198条,全职196条[23][24] 定价模式与预算水平 - 按小时计费是最常见形式(839条信息),价格区间为最低17.68美元至最高45.03美元,平均31.36美元[27] - 按项目计费的信息有738条,价格区间为最低531.69美元至最高866.53美元,平均699.11美元[27] - 月薪制信息较少(20条),月薪区间为最低792.5美元至最高1182.5美元,平均987.5美元[27] 需求地域分布与时区特征 - 需求方地域分布显示美国是最大需求国(40条),其次为澳大利亚(14条)和英国(10条)[39] - 主要时区分布为印度标准时区(IST)1042条,美国东部时区(EST)677条,形成“欧美客户+印度执行”的典型模式[39] 主流业务用例与行业垂直 - 最频繁出现的自动化场景是API工作流、CRM更新和邮件自动化,这些需求具有“刚需+可扩展”特性[5][38] - 房地产和软件即服务(SaaS)行业对自动化的需求最为稳定[42] - 用户偏好低成本、快速交付和稳定运行的解决方案,核心诉求是“快、省、好”[5]
当机器人能自己教自己:DeepMind发布自我改进的具身基座模型
锦秋集· 2025-09-19 16:41
近日,Google DeepMind Generalist 团队发布新作《Self-Improving Embodied Foundation Models》,为该领域贡献了一个具有里程碑意义的框架: 一个真正可实现机 器人自主练习、自我奖励、并不断超越初始训练数据限制的双阶段后训练方法 。 通过系统性的算法设计与大规规模真实机器人验证,该研究提出将传统的行为克隆(BC)与创新的"步骤到-go预测"目标相结合,在监督微调(SFT)之后引入一个 名为"自我改进"的在线强化学习阶段。 该方法不依赖人工奖励设计,而是从预训练基础模型中自动导出奖励信号与成功判断,使多台机器人可在人类极简监督下并行练习。 在核心机制维度,文章系统展示了如何通过步骤到-go预测构建密集奖励函数、实现鲁棒的成功终止判断、并显著提升策略样本效率。仅增加10%的自主练习时间, 即可在Block2Block任务上带来超过30%的成功率提升,效果显著优于单纯扩大8倍模仿数据。 过去的机器人会模仿,却始终学不会举一反三。今天,真正的挑战是:如何让机器人像人一样,在反复尝试中自己变聪明。 进入2025年,具身智能的核心命题逐渐清晰: 如何让机器人通过 ...