Workflow
数据飞轮
icon
搜索文档
朱啸虎投资,Refly.AI黄巍:n8n、扣子太难用,Vibe Workflow才是更大众的解决方案
搜狐财经· 2025-12-15 19:30
种子轮拿到数百万美元融资、估值近千万,朱啸虎的金沙江创投、高瓴创投和 Classin 共同投资。 Refly.AI 给自己的定位是更适合大众的 Vibe Workflow 产品。 为什么要做 Vibe Workflow?原因很简单,现在的 Workflow 产品 n8n、扣子都太难用,以及团队对于 Workflow 价值的认可。 他们的目标,是让不会技术的人也能轻松把自己的流程经验复制并分享给其他人,实现价值。 不仅仅是用 AI 来降低搭建 Workflow 的难度,Refly.AI 还把 n8n 中的节点升级成为单独的 agent,每个 agent 配上 2-3 个工具。在保留 agent 动态性的同 时,获得传统 Workflow 的可控性与稳定性。 看起来有些激进,但 Refly.AI 确信这样的方式才是有效利用模型能力的最好方式。 为什么如此笃定?既然做 Workflow,怎么控制成本,怎么保证完成度?Refly.AI 取代 n8n 的底气又来自哪里? 在 Refly.AI 的新版本发布之际,我们和创始人& CEO 黄巍聊了聊,想搞清楚,AI-native 的 Workflow 应该长什么样。 以下内 ...
首届AI日开幕在即,Rivian(RIVN.US)迎来复刻特斯拉的“Model Y时刻”?
智通财经· 2025-12-11 21:19
公司战略与产品规划 - 公司将于周四举办首届“自动驾驶与人工智能日” 旨在展示其技术路线图进展 包括自动驾驶汽车平台和数据飞轮 [1] - 公司正转向人工智能技术以助力其增长前景 特别是在整个电动汽车行业增长放缓的背景下 [1] - 公司计划在明年上半年推出更经济实惠的中型电动SUV R2 该车型和技术路线图预计将对公司的增长和盈利能力产生“真正的变革性”影响 [3] 技术路径与差异化 - 公司未来的差异化将建立在“以人工智能为中心的端到端方法”之上 这与特斯拉FSD v12版本所采用的“端到端神经网络”技术路线高度重合 [2] - 公司旨在开发与所有车辆控制系统集成的AI助手 大部分AI软件堆栈由内部开发 同时与其他公司合作开发特定的代理式AI功能 [1] - 公司试图向资本市场证明其拥有构建“数据飞轮”的能力 即通过现有车队收集数据训练AI 再通过OTA升级反哺车队以形成技术壁垒 [2] 行业背景与市场挑战 - 公司效仿特斯拉的估值逻辑 试图被市场视为一家人工智能公司 而非单纯的汽车制造商 [2] - 行业面临普及速度放缓 7500美元税收抵免取消以及消费者对里程焦虑 充电基础设施 残值 电池技术 可负担性等持续担忧的挑战 大众市场汽车可能在短期内难以克服这些不利因素 [3] - 对于公司而言 计划推出的R2中型SUV被视为其“Model Y时刻” [3]
朱啸虎投资,Refly.AI黄巍:n8n、扣子太难用,Vibe Workflow才是更大众的解决方案
Founder Park· 2025-12-10 16:07
公司融资与定位 - 种子轮融资数百万美元,估值近千万美元,投资方包括金沙江创投、高瓴创投和Classin [1] - 公司定位为更适合大众的Vibe Workflow产品,旨在降低自动化流程搭建门槛 [2] - 核心目标是让非技术人员也能轻松复制和分享流程经验,实现价值 [4] 产品理念:Vibe Workflow - Vibe Workflow是Agent与传统Workflow的结合体,旨在保留Agent动态性的同时,获得传统Workflow的可控性与稳定性 [10] - 产品将传统Workflow中的节点升级为单独的Agent,每个Agent配备2-3个工具,以更有效利用模型能力 [4][5] - 核心特点包括:搭建成本无限降低(一句话生成Workflow)、通过Agent白盒化编辑器简化操作、用沙箱环境解决复杂逻辑 [11] - 内部测试显示,一个Refly.AI节点可替代大约20个n8n节点的功能 [11] 产品优势与成本控制 - 搭建Workflow的token消耗极低,仅需几千至上万个token,而用n8n搭建类似流程可能消耗大几十万token [14] - 执行层面,每个简化后的任务仅消耗1至2个积分,成本约0.1至1元人民币,相比Manus单任务数美元的成本降低了至少5至7倍 [14] - 后续调用时,token消耗可能仅为原本的50%甚至10% [14] - 产品交互完全基于自然语言,无需用户理解搭建逻辑 [13] 目标市场与用户画像 - 早期核心用户是有n8n、Dify使用经验但寻求更简单方案的群体,产品支持从其他平台一键迁移Workflow [19] - 重点聚焦自媒体场景,帮助用户串联不同模型(如Claude Opus和Gemini)自动抓热点、生成文章、播客等内容 [19][20] - 公司自身在Twitter拥有约3万粉丝,对该场景有较强体感 [20] - 未来计划向教育、职场白领(写报告、产品分析)、金融(财报分析)等偏赚钱和职场的场景扩张 [20] - 明确放弃需要100%准确性的企业自动化操作场景,更侧重于内容创作型任务,接受70%左右的准确率 [15][17][18] 技术架构与数据战略 - 技术路径分层:首先让Agent生成Workflow,其次将每个Workflow节点设计为Agent并通过引擎串联,最后建立成规模的Tools体系 [45][46][47] - 核心数据战略是收集用户在完成中长程、复杂任务过程中的“思维链行为数据”,即用户与AI交互的完整路径和反馈 [23][26][27] - 这些行为数据可用于预测用户下一步行动,是公司构建数据飞轮、优化产品的基础 [24][25][26] - 通过用户修改节点、多次生成、运行成功以及社区评分等多维度反馈,持续优化Prompt和自有小模型 [28][29][32] 竞争壁垒与发展策略 - 团队背景来自字节跳动早期“大模型+低代码+Workflow”项目,自认为是全球Vibe Workflow赛道最有竞争力的团队 [34][43] - 当前工程复杂度高,预计15-20人的小团队难以在3-6个月内超越,大厂复刻也需要50-100人团队投入一两年 [59] - 采用“站在模型肩膀上”的策略:利用强模型(如GPT-5)做任务规划与拆解,利用便宜且稳定的模型(如Kimi K2)做具体执行,模型能力增长会使产品更强 [56][57][61] - 产品设计比模型能力迭代快3-6个月,并在此窗口期内完成商业化验证,以建立竞争优势 [62][72] - 抽象层设计可兼容不同模型和模态,避免被单一模型厂商锁定 [63] 团队建设与商业化 - 团队规模约13-14人,强调职能完备(产品、运营、研发、算法、测试等),不盲目追求“一人公司”的通才理论 [49][50][53] - 招聘策略是寻找各领域的专才,并为其配备强大的AI工具以提升效率,而非泛泛的通才 [53] - 商业化核心假设是封装有价值的流程并进行规模化销售 [36] - 短期现实目标是销售AI时代的Workflow模板 [69] 行业展望与公司愿景 - 短期看,AI可能催生新的原生内容平台,实现内容的实时、个性化生产与消费 [66][71] - 长期终局是构建一个能承接用户全方位意图和行为数据的环境,最终形成用户的数字化版本,帮助其完成物理世界的任务 [66][68] - 期待AI在自动修复小问题(如代码bug)和细粒度内容编辑能力上取得进展,这将大幅提升创作者工具的上限 [70][71] - 给AI应用创业者的建议包括:拉长时间维度思考产品生命力、确保产品不被模型本身取代、早期招聘要避免偏见并找到能实战的团队成员 [72][73]
从一场展会,看美的为何能重新定义“家”的万亿价值?
格隆汇APP· 2025-12-05 21:39
文章核心观点 - 智能家居行业竞争正从“功能叠加”向“生态闭环”与“数据融合”的战略纵深演进[2] - 公司通过高端与大众双线布局定义智能家居标准并扩大用户基盘,同时通过与车企合作构建“人-车-家”生态,旨在从硬件销售商转型为拥有用户锁定效应和数据网络优势的科技生态公司,其长期价值锚点正在发生变化[2][10][11][15] 智能家居战略:双线并行的操作系统 - 公司展示了两套智能生活“操作系统”:以AI HOME为核心的“顶层设计”和以Smart for Joy为理念的“普惠体验”[3][4] - 高端线以COLMO品牌为载体,定位为“空间智能服务系统”,通过墅智家庭主机和图灵2.0套系等产品,提供能自主学习、预判需求并跨设备协同的主动式智能服务,追求“无感自适应”的用户体验[5] - 大众线通过“小美AI”、美的美居APP与基础硬件深度融合,提供“轻量化、高获得感”的智能产品,如AI天瀑光护眼台灯和T6空气机,以降低尝鲜门槛并培养用户习惯[8] - 双线布局的战略意图在于“高端立标杆,大众抢心智”:高端线用于定义标准、提升品牌溢价和毛利率,并创造高替换成本以形成用户粘性;大众线用于扩大用户基盘、培育生态,为未来增值服务积累数据资产[7][10] 生态拓展:构建“人-车-家”智慧闭环 - 公司与比亚迪达成战略合作,共同推进“人-车-家”智慧生态,实现智能家电与汽车数据及控制链路的打通[11] - 合作将实现“车控家”与“家控车”功能,例如用户可在车内提前管理家居或在家中远程备车,相关功能将率先搭载于腾势N8L及2026款夏、汉L、唐L等车型[11] - 该合作旨在打破“出行”与“居住”场景的数据壁垒,获取用户连续性行为数据,以训练更个性化的AI服务,构筑数据护城河[13] - 生态协同将衍生出“能源管理”、“健康管理”、“楼宇与社区”智慧联动等创新服务模式,为公司从硬件利润转向持续性服务与数据变现开辟空间[13] - “人-车-家”生态将形成强大的用户锁定效应,提高客户切换成本,提升客户生命周期价值并构建竞争壁垒[14] 公司转型与价值重估 - 公司正在经历商业范式变革,其估值逻辑不应再仅锚定硬件销售利润,而需关注其用户生态的服务变现潜力、跨场景数据资产的独家优势以及生态协同带来的客户锁定效应[15] - 公司已转型为覆盖智能家居、楼宇科技、工业技术、机器人与自动化、健康医疗及智慧物流的多元化科技集团,为生态数据流转与应用提供了基础[13] - 通过与比亚迪的合作树立“超级样板”,公司有望向定义智慧生活范式并掌握核心数据命脉的科技生态公司演进,具备价值重估的可能[14][15]
从一场展会,看美的为何能重新定义“家”的万亿价值?
格隆汇· 2025-12-05 21:37
文章核心观点 - 公司在首届全球智能机械与电子产品博览会上展示了其智能家居战略的深刻转变,标志着行业竞争正从“功能叠加”向“生态闭环”与“数据融合”的战略纵深演进 [1] - 市场对公司的审视将超越传统的营收与成本周期,聚焦于其能否在AI时代构建一个拥有用户锁定效应、数据网络优势及持续服务收入的生态体系 [1] - 公司的展示为其长期价值锚点提供了新的线索,暗示其正经历一场深刻的商业范式变革,估值逻辑需从硬件销售利润转向用户生态的变现潜力、跨场景数据资产优势及生态协同带来的长期价值 [1][15] 双线并行的智能家居“操作系统” - 公司展示了以AI HOME为核心的“顶层设计”和以Smart for Joy为理念的“普惠体验”两套智能生活“操作系统”,形成互为犄角的布局 [2][3] - 高端线以COLMO品牌为核心,定位为“空间智能服务系统”,通过具备本地算力和组网能力的墅智家庭主机、集成40+高精度传感器的图灵2.0套系家电,构建能自主学习、预判需求并跨设备协同的“家庭大脑”,旨在提供“无感自适应”的主动式智能服务 [3] - 高端全屋智能解决方案每套价值数十万乃至更高,服务于高净值客群,旨在定义行业标准、提升品牌溢价和整体毛利率,并通过高替换成本和数据沉淀形成用户粘性,为后续软件服务、耗材更换及场景升级带来持续性收入 [5] - 大众线通过基础硬件与“小美AI”、美的美居APP深度融合,提供直观数据看板、语音交互和场景自定义,聚焦于关键生活触点提供“轻量化、高获得感”的智能体验,以降低尝鲜门槛、培养用户习惯 [6] - 大众线的目的是扩大用户基盘、加速智能家电渗透率,庞大的用户基数及其产生的场景数据是未来增值服务和训练更强大AI的基础 [8] - “高端立标杆,大众抢心智”的双线布局显示了公司对市场的深刻穿透力,同时回答了行业关于智能家居终极形态和普通人如何步入智能生活的问题,并展现了其通吃全价格带、构建从入口到生态完整商业闭环的野心 [8] “人车家”闭环与数据飞轮战略 - 公司与比亚迪达成战略合作,共同推进“人-车-家”智慧生态,打通旗下多品牌智能家电与比亚迪全系车型的数据与控制链路,实现“车控家”与“家控车”的无缝融合 [9][10] - 相关功能将率先搭载于腾势N8L及2026款夏、汉L、唐L等车型,用户可在车内提前管理家居环境,亦可在家中远程备车 [10] - 此次合作旨在打破“出行”与“居住”两大生活场景的数据壁垒,实现车辆地理位置、状态信息与家庭设备状态、环境数据的实时互通与双向驱动,为用户提供无感而精准的智能服务 [12] - 对公司而言,此举使其AI能首次获取用户从离家到归家的连续性行为数据,这是训练真正个性化、主动式智能服务的稀缺燃料,有助于构筑纯家电或纯车联网企业难以逾越的数据护城河 [12] - 公司作为覆盖智能家居、楼宇科技、工业技术、机器人与自动化、健康医疗及智慧物流的多元化科技集团,其庞大业务版图为生态数据的流转与应用提供了可能,未来可衍生出“能源管理”、“健康管理”、“楼宇与社区”智慧联动等创新服务模式,为从一次性硬件利润转向持续性服务与数据变现打开想象空间 [12] - “人-车-家”生态形成了强大的生态锁定效应,当用户的汽车、全屋家电及其他可能接入的设备都在一个协同生态内时,切换成本极高,这不仅能提升客户生命周期价值,更构建了抵御跨界竞争的坚实壁垒 [13] - 此次合作为行业树立了“超级样板”,证明通过深度数据融合与生态协作能创造1+1>2的颠覆性体验与商业价值,公司有望向定义智慧生活范式并掌握其核心数据命脉的科技生态公司演进,具备价值重估的可能 [13]
智能制造分论坛 - 2026年度策略报告会
2025-11-28 09:42
行业与公司 * **行业**:智能制造、人形机器人、具身智能[1] * **公司**:特斯拉、语数科技、云深处、乐趣、巨脑磐石、Figure、银河、浙江恒帅、英伟达、Google、阿里巴巴、百度、华为、小米、开放原子开源基金会、欧文龙社区[1][3][5][32][36][47][66][67][73] 核心观点与论据 市场表现与驱动因素 * 2025年人形机器人市场表现分为三个阶段:年初至3月涨幅显著;4月因中美贸易战升级及行业因素回调盘整;7月至9月中旬再次上涨后回调[1][3] * 市场波动与特斯拉产业链进展高度相关,年初CES展上马斯克宣布量产计划为市场提供了估值锚点[3] * 人形机器人热度预计至少持续至2035年,推动力源于促进实体经济与数字经济深度融合的国家战略[43] * 未来商业模式将依赖软件增值服务,而非硬件利润,马斯克已宣布硬件零利润策略[43] 产业链进展与投资机会 * **国内产业链加速上市**:语数科技已完成上市辅导,预计2026年上市;云深处、乐趣等公司也开始接受券商辅导,预计2026年将有多家本体、灵巧手及零部件公司进入上市流程[1][5] * **核心零部件**:包括关节模组、灵巧手、触觉传感器、轻量化散热、高功率转矩密度电机等[6] * **量产关键卡点**:灵巧手是当前量产的关键卡点,其复杂性不亚于整机制造,技术路线尚未统一[4][13] * **二级市场投资建议**: * 关注特斯拉供应链,重点关注身体关节执行器、减速器、电机及灵巧手供应商[7] * 关注国产优质资产,如即将上市的语数科技及其关键模组供应商[7] * 可通过假设出货量、市占率、净利率等指标评估市值增厚潜力,例如核心模组价值1万元,每100万台出货可增厚135亿市值[7][8] * **一级市场投资热点**:尽管整体融资热度下降,但对核心部件(本体、大脑、传感器)及“卖铲子”的基础设施服务商投资热情依旧较高[14] 技术发展与挑战 * **具身智能目标**:替代人类与增强人类两个方向可互补发展[9] * **算法与硬件关系**:算法(大脑)与硬件(身体)同等重要,目前系统集成和二次开发环节相对薄弱[10][11][12] * **数据与模型**: * 数据飞轮对产业至关重要,高质量、多样化、大规模的数据是推动力[22] * 行业对模型与数据重要性存在争议,一派认为模型架构创新优先,另一派认为核心是数据量不足[23][24] * 仿真数据与实际采集数据各有优劣势,仿真与现实存在差距,复杂场景仍需实际数据微调[25] * 数据规模重要,但多样性更关键,已有累积超过1万小时的数据集但效果未达预期[26] * **技术融合与突破**: * VRV与世界模型融合探索已开始,例如Stanford和清华大学的融合实现了44.7%的效果提升[27][28] * 认知科学与计算机科学融合(内脑、脑启发等)是2026年前沿技术方向[75] * 软件与硬件是强耦合综合体,需结合场景融合定义[29] * **关键能力与瓶颈**: * 当前技术集中在智能、作业、行走三大能力,智能仅达初步思考阶段[45] * 灵巧手是明显热点,需要高度精密的软硬结合[45] * 实时控制系统要求高,现有标准为40毫秒响应,但需求是10毫秒内[54] * 视觉系统和AI模型存在不足,纯视觉系统动态范围不足,大脑模型不统一,泛化能力差[55] * 训练大规模参数模型成本高昂且效果不佳,未来重点应放在推理而非重训练[56] * 特殊场景(如太空、高危领域)数据稀缺,无法通过传统仿真生成[57] 商业化、应用与成本 * **商业化前景与场景**: * 文体娱乐领域近三年将创造巨大价值[48] * 医疗按摩等垂直细分市场有潜力,例如通过五指灵巧手和OTA方案提升体验[48] * 养老服务是优先发展场景之一,应对老龄化及护理人员供给不足[71][72] * **制造业应用与挑战**: * 制造业占据70%的市场份额,但机器人在传统组装厂的替代率仍然有限,需要深度融合产线系统[50] * 实现大规模生产需解决电池续航(目前仅2-4小时,理想为8-12小时)、AI算力功耗散热等问题[51] * **成本与产能预期**: * 当前Optimus机器人成本约4万美元,大规模生产成本可降至2万美元左右[59] * 若2025年能实现周产2000-2500台,到2027年将形成明确风向标[59] * 预计2026年交付量在1万到2万台之间[50] * 到2027年全球市场存量预计可达140万台左右[51][52] 产业生态与政策 * **开源与协同**: * 中国积极推动开源,欧文龙社区贡献近700万行代码,乐趣捐赠数据集,开放百万条白虎数据集,并计划建七个训练场[3][36][37] * 开源促进了技术体系构建和产业链聚集,将开发流程从模型驱动转变为数据驱动[38] * 产业协同开发深度前所未有,本体厂商与上游供应链需求协同程度高[15][16] * 2025年大产业链交融合作是最大变化,汽车、家电、消费电子企业跨界入局加速解决问题[63] * **政策支持**: * “十五五”规划强调智能化、绿色化、融合化,人形机器人和具身智能受更多关注[68] * 政策通过“两重两新”对重大能力建设和项目实施提供支持,服务机器人产品最高可获得20%补贴[71] * 工信部已组建人形机器人标准组,推动标准协同创新[33] 其他重要内容 * **行业现状与心态**:2025年行业发展速度快但技术路线未收敛,导致焦虑情绪;行业需要时间积累,不必跟随每年热点[62] * **创业公司策略**:巨脑磐石等创业公司选择聚焦垂直领域模型和特定场景解决方案,而非与科技大厂竞争基础模型[73] * **2026年投资者关注点**: * 硬件增量赛道(如材料、磨床)[76] * 数据的重要性[76] * 模型进化与技术路线收敛(如VRA加世界模型)[76] * 从情绪价值驱动转向经济价值驱动[76] * 非制造业(如文娱)机器人的应用[76] * 出海机会[76] * **文化自信**:认为中国历史工业底蕴有助于在现代制造业中建立自信,应鼓励持续创新和原始创新[35]
AI公司,怎么越来越像NBA了
创业邦· 2025-11-25 13:08
文章核心观点 - 人工智能行业的竞争焦点已从硬件算力转向顶尖人才,AI实验室的运作模式越来越像职业体育俱乐部,通过天价薪酬和高度流动的雇佣协议争夺核心人才[5][8] - 人才成本已成为继硬件之后的第二道关键竞争壁垒,只有资金极其雄厚的巨头才能持续支付数亿美元级别的薪酬包,这有效圈定了赛道玩家数量[9][12] - 人才争夺只是赢得入场券,行业竞争的终极战场是构建独特的数据飞轮效应和垂直行业应用分发网络,以实现长期可持续的垄断优势[26][27][30] AI行业人才竞争态势 - 顶尖AI科学家的薪酬方案达到职业运动员级别,对于最顶尖的天才甚至可达数十亿美元,这被视为对万亿价值AGI的战略性投资[5][9] - 基础算力作为稀缺资源的地位已让位于人类的突破性智慧,拥有能够发现新 scaling law 或开创全新推理机制的大脑就拥有了垄断未来的入场券[8][9] - AI人才雇佣协议具有短期和高度流动性特点,与传统硅谷长期稳定的工程师文化形成鲜明对比,每位顶尖研究员都相当于身处"合同年"[16][17] 巨头竞争策略与行业格局 - 仅有大规模集群不够,人才是实现下一个突破的唯一钥匙,这种高门槛使AI领域竞争结构类似NBA,只有少数顶级强队争夺总冠军[12][14] - Meta收购Scale股份并引入其CEO Alex Wang领导新AI实验室,赋予巨大自治权,体现了"创始人模式"下核心人才拥有球员兼总经理的巨大话语权[20] - AI巨头正有意识通过高薪和股权搭建高度互补的"三巨头"核心团队,需要基础模型架构、工程部署优化和革命性研究方向等不同领域专家协同作战[23] 行业长期发展趋势 - 过度沉迷人才短期争夺可能导致目标错位,真正战略焦点必须转向构建不可复制的数据飞轮效应,通过产品服务吸引用户产生独家反馈数据[26][27] - 行业价值分配最终取决于对垂直行业控制权的争夺,如法律、医疗、金融等,目标是成为企业核心业务流程中无法被替换的操作系统[27][29] - 人才优势是暂时的,数据壁垒和分发网络渗透性才是长期的,公司必须用巨额人才成本购买的时间窗口来建立不可逆转的数据和产品体系[30]
AI公司,怎么越来越像NBA了
36氪· 2025-11-24 16:08
行业竞争焦点转变 - 科技巨头竞争焦点从数千亿美金的显卡战争转向顶尖AI人才的脑力竞赛[1] - 基础算力趋同,人类突破性智慧成为最稀缺的瓶颈和决定性因素[1][3] - AI实验室运作模式从传统科技研发中心转向由顶薪巨星主导的精英体育俱乐部[3] AI人才薪酬体系变革 - 顶尖AI科学家薪酬方案达到数千万、数亿甚至数十亿美元,与职业运动员相媲美[1][2] - 天价薪酬是对数万亿价值AGI或垄断级应用的战略性投资[1][3] - 人才成本成为继硬件之后的第二道竞争壁垒,推高行业入场门槛[4][5] 人才市场流动性特征 - AI雇佣协议短期流动,人才可随时被挖走,形成高流动性自由球员市场[2][6] - 人才与公司权力天平倾斜,核心人才获得研究方向掌控权和团队决策权[7][8] - 巨头推行创始人模式,赋予核心人才近乎完全自主权,如Meta引入Alex Wang领导新实验室[8] 团队组建新策略 - AI实验室战略目标转向精准组建能产生化学反应的核心团队,类似NBA三巨头模式[9] - 需要不同子领域顶尖专家协同作战,包括模型架构、工程部署和革命性研究方向[9] - 团队配置依赖核心成员间默契,是高风险的夺冠阵容组建策略[9] 长期竞争壁垒构建 - 真正总冠军之争超越人才争夺,转向数据飞轮和应用分发两大护城河[11][12] - 数据飞轮通过产品服务吸引用户产生独家数据,形成自我强化闭环[12] - 价值分配取决于对垂直行业控制权,需将AI能力深度集成到企业核心业务流程[13] 商业模式终极形态 - 天价人才成本是为争夺时间窗口占领高价值垂直领域[13] - 可持续优势依赖数据壁垒和分发网络渗透性,而非临时人才优势[14] - 公司价值需建立在自动化数据和产品体系上才能走向可持续垄断[14]
8位具身智能顶流聊起“非共识”:数据、世界模型、花钱之道
36氪· 2025-11-24 09:00
行业资金需求与投入方向 - 加速进化创始人认为100亿元资金不足以推动具身智能发展,倾向于联合更多合作伙伴共同投入[1] - 智元机器人合伙人计划用100亿元构建全球最大的自我进化、自我闭环的数据飞轮[1][54] - 星海图联合创始人计划用资金构建最大的数据引擎,实现物理世界信息的全面数字化[55] 数据策略与瓶颈解决方案 - 招商局集团AI首席科学家强调真实物理世界数据的重要性,并主张以人自身作为本体采集数据作为成本最低的预训练方案[29][30] - 银河通用创始人认为在真实数据难以采集的场景下,合成数据将发挥重要作用[2][38] - 自变量创始人主张根据具体任务选取合适数据源,采用融合数据策略,互联网数据用于预训练,仿真数据用于导航规划,真实数据用于接触操作[2][46] 世界模型的技术定位 - 银河通用创始人认为世界模型所代表的预测能力是核心,但训练数据必须来自机器人自身,而非人类行为视频[4] - 智源研究院院长认为世界模型对具身智能有作用,但不一定是必须基座,需要基于时空状态进行预测[5] - 加速进化创始人关注世界模型的预测能力,希望模型能基于需求和环境输出未来100帧的动作[18][19] 模型架构发展路径 - 招商局集团AI首席科学家认为具身智能需要完全属于自己的架构,可能转向Vision First或Vision Action First模式,而非延续VLA范式[7] - 星海图联合创始人主张建立平行于大语言模型的基础模型,更可能是Large Action Model,并强调需要闭环模型而非开环的大语言模型[8][10] - 智元机器人合伙人认为最终解决方案将是融合系统,包含VLA、世界模型和强化学习等要素[11] 当前行业挑战与突破点 - 银河通用创始人指出人形机器人数量过少是制约Action First模型发展的关键瓶颈[16] - 智源研究院院长认为统一架构模型需要超大
8位具身智能顶流聊起「非共识」:数据、世界模型、花钱之道
36氪· 2025-11-23 20:56
文章核心观点 - 国内具身智能行业顶尖从业者就技术路径、数据策略等关键问题存在显著非共识,反映出不同的战略重心和第一性原理[4][7][9] - 具身智能的发展面临数据瓶颈,100亿元资金被普遍认为不足以支撑行业突破,需用于吸引人才、构建数据飞轮和基础模型[7][67][68][69][70] - 行业普遍认为具身智能的最终形态将依赖于一个统一的基础模型架构,但当前技术路线尚未收敛,VLA范式受到反思[18][19][23][25][36] 技术路径分歧 - 世界模型被视为具身智能的核心预测能力,但其训练数据必须来自机器人自身,而非人类行为视频[14][15][16] - 有观点认为世界模型是具身智能的关键组成部分,但不一定是必须的基座,其价值在于基于时空状态进行预测[17] - 对当前主流的视觉-语言-动作模型范式提出质疑,认为其语言居中夹层的结构不符合人类操作本质,应探索视觉优先或动作优先的新架构[19][20] - 具身智能模型应是一个闭环系统,能根据世界反馈即时调整动作,这与大语言模型的开环一问一答模式有本质区别[22] - 另一种观点认为终极解决方案将是一个融合系统,包含VLA、世界模型和强化学习等要素,而非单一模型[23][24] - Transformer架构被认为具有跨模态处理的通用性,但需解决输出对齐问题,未来可能出现统一范式[27][28][35] - 长期来看,基于物理世界数据训练的具身多模态模型可能反超并吞并以虚拟世界数据为主的现有模型[40] 数据策略与瓶颈 - 数据稀缺是行业核心瓶颈,解决方案存在分歧:有主张优先采集真实物理世界数据,有强调在难以采集处使用合成数据[9][10] - 数据策略强调真实性、质量和多样性,需在真实场景而非数据厂采集,并最终通过机器人自主交互产生数据[45][46][47][48][49][50] - 视频数据因可海量获取且模拟真实世界而被视为基座模型学习的重要来源,结合真机微调和强化学习提升模型[51] - 仿真数据被强调用于解决复杂控制问题,如足式行走和灵巧手操作,可作为基础控制器启动真实世界数据飞轮[52][53][54][55][56] - 数据使用策略呈现融合趋势,根据不同任务阶段和特性选择互联网数据、仿真数据或真实数据[37][38][59] - 自动驾驶模式被引用为范例,通过C端产品大规模部署实现数据回收,是具身智能数据规模化的可行路径[59][60] 资金分配与战略重心 - 面对100亿元资金,战略重心集中于构建自我进化的数据飞轮、设计专属基础模型以及吸引全球顶尖人才[67][68][69][70] - 资金规模被评价为“不太够”,需联合行业伙伴共同推动,投资于智源研究院等机构以支持长期技术突破[7][67] - 决策的第一性原理包括相信规模定律驱动模型进化、做难而正确的事情、关注落地可行性以及创造长期真实价值[61][62][64][65]