Workflow
模块化架构
icon
搜索文档
深度解析世界模型嵌入具身系统的三大技术范式
具身智能之心· 2025-12-24 08:25
文章核心观点 - 一篇关于具身智能领域世界模型架构集成的综述文章,首次从架构集成视角将现有研究划分为三大范式,旨在解决传统反应式系统缺乏预测和泛化能力的问题 [1][3][8][13] 世界模型的价值与引入背景 - 传统具身指令跟随系统将语言、感知和动作视为分离组件,纯反应式方法面临缺乏前瞻性和泛化性差两大瓶颈 [8][13] - 世界模型源于人类认知科学,其核心思想是构建能预测未来的内部模型,为智能体带来样本效率提升、长程推理能力、安全性增强及主动规划能力 [8] 架构融合的分类框架 - 根据世界模型与策略模型之间的耦合强度,提出了一个包含两个独立维度的分类框架 [11] - **梯度流动**:策略优化目标的梯度能否直接反向传播以更新世界模型参数 [14] - **信息依赖**:策略输出动作时是否显式依赖于世界模型预测的未来状态 [14] - 基于这两个维度,将相关工作分为耦合强度由弱到强的三大范式:模块化架构、顺序架构和统一架构 [11][12] 范式一:模块化架构 - 关键词为独立、互操作、弱耦合,世界模型和策略作为两个独立单元,无梯度流动,策略不依赖未来状态 [16] - 世界模型作为世界模拟器,关注动作与状态间的因果变化,让智能体能在内部根据动作预演未来 [16] 范式二:顺序架构 - 关键词为分层、意图生成、中等耦合,先由世界模型预测未来状态,策略再基于该状态预测动作 [17] - 梯度传递分为两个阶段,世界模型作为决策生成器,核心任务是生成一个有价值的未来目标状态,从而简化后续控制问题 [17][18] 范式三:统一架构 - 关键词为端到端、联合优化、强耦合,将世界模型和策略集成到一个端到端网络中 [19] - 两者融合为统一大网络,在同一个损失目标下训练,使网络能在同一条计算路径中预测未来状态并输出合适动作,无需显式区分模拟与决策步骤 [19][20][21] 未来研究方向 - **世界模型的表征空间选择与耦合**:未来趋势是融合视觉空间与状态空间,通过统一潜变量平衡表达能力与推理效率 [23] - **结构化意图的生成与表达**:世界模型应生成可解释的未来结构,并与语言和符号推理结合,以显式刻画任务分解、物体关系与因果依赖 [23] - **指导具身智能的脆弱性**:需引入可达性判别、可行性过滤等机制以降低失效风险,并权衡解释性与最优性 [24] - **统一的世界-策略模型构建范式**:需探索如何将大规模预训练模型以最小代价转化为统一决策系统,关键难点在于状态空间对齐和表示粒度选择 [24]
智能体如何学会「想象」?深度解析世界模型嵌入具身系统的三大技术范式
机器之心· 2025-12-22 12:23
文章核心观点 - 一篇由多所顶尖高校及研究机构团队发布的综述,首次从架构集成的视角,系统性地将世界模型融入具身智能系统的现有研究划分为三大范式,并探讨了其核心优势与未来发展方向 [5][7][8] - 引入世界模型能解决传统反应式具身智能系统缺乏前瞻性和泛化性差的瓶颈,为智能体带来样本效率提升、长程推理能力、安全性增强及主动规划能力 [10][11][12] - 世界模型与策略模型的耦合强度可从梯度流动和信息依赖两个独立维度衡量,并据此形成从弱到强的模块化、顺序化、统一化三大架构范式 [15][16] - 未来研究将聚焦于表征空间的选择与融合、生成结构化意图、确保想象的可达性与物理一致性,以及探索统一的世界-策略模型构建范式 [27][28][29] 世界模型的核心价值与引入原因 - 传统端到端反应式方法面临两大瓶颈:缺乏前瞻性,无法预测未来状态以处理长程规划任务;泛化性差,难以适应未见过的环境或任务配置 [11][12] - 世界模型的思想源于人类认知科学,通过构建能预测未来的内部模型,使智能体获得“想象”能力,从而提升样本效率、长程推理能力、安全性及主动规划能力 [10][11] 三大架构融合范式 - **模块化架构**:世界模型与策略为独立、互操作的弱耦合模块,无梯度流动,策略输出不依赖未来状态;世界模型作为“世界模拟器”,让智能体能在内部根据动作预演未来,以判断动作的可行性、风险与长远收益 [15][16][20] - **顺序架构**:世界模型与策略为中等耦合,采用两阶段梯度传递;世界模型作为“决策生成器”,首先生成一个有价值的未来目标状态,将复杂任务拆分为目标生成与目标条件执行两个子问题,简化后续控制 [15][16][21][22][23] - **统一架构**:世界模型与策略融合为一个端到端的强耦合网络,在同一个损失目标下联合优化;网络在同一条计算路径中同时预测未来状态和输出动作,无需显式区分“模拟”与“决策”步骤 [15][16][24][25] 未来研究方向展望 - **表征空间选择与耦合**:需平衡视觉空间的语义丰富度与状态空间的高效紧凑,未来趋势是通过统一潜变量融合二者,为跨任务泛化奠基 [27] - **结构化意图的生成与表达**:世界模型应生成可解释的未来结构(如目标、轨迹、因果等),并与语言和符号推理结合,以显式刻画任务分解、物体关系与因果依赖 [27] - **想象对智能体脆弱性的指导**:需引入可达性判别、可行性过滤、物理一致性评估来降低想象目标超出本体能力的失效风险;同时需权衡模块化解耦带来的可解释性与终端性能最优性 [28] - **统一的世界-策略模型构建范式**:需探索如何将大规模预训练模型以最小代价转化为统一决策系统,关键难点在于状态空间对齐、表示粒度选择及避免表征偏置 [29]
大载重全地形机器人「觉物科技」完成超亿元融资,扎根新疆五年打磨出「变形金刚」 | 早起看早期
36氪· 2025-12-13 09:18
公司融资与背景 - 公司“觉物科技”于2020年在深圳成立,已完成超亿元人民币的Pre-A轮融资,由日初资本领投,安克创新及部分老股东跟投 [2] - 本轮融资资金将用于机器人技术研发、商业化落地及全球化布局的加速推进 [2] - 公司团队采用航空航天系统工程方法,在新疆严酷野外环境用五年时间打磨产品与底层技术 [2] 行业市场与痛点 - 2024年全球农业产中服务市场规模约为3000亿美元,其中植保环节规模约为700亿美元 [3] - 传统农业作业模式面临效率与可持续性的双重挑战,例如农药的粗暴使用会导致土壤板结、污染地下水并造成经济损失 [3][4] - 新疆棉田虽在亩产和滴灌技术方面领先,但现有田间管理中的农药过度使用问题突出,有种植户担忧长期影响土地生产力 [4] 产品技术与核心优势 - 公司核心产品是基于“可变形底盘+模块化载荷”的机器人平台,是全球少数可实现3吨级载重、27度持续爬坡、8小时续航的纯电全地形变形平台企业 [5] - 产品通过模块化架构,可快速重构为针对大田的“鹤出T3000”和针对果园的“骥鹿G3000”两种形态 [2] - 底盘具备自适应变形能力:轮距和轴距在1.0m-2.5m间自动调节,行走机构高度在1.2m-1.5m间调节,喷杆高度在0.3m-1.8m间调节 [6] - 采用专有行走机构旋转自适应变形技术及360°全向运动与轮边驱动技术,可实现Z型作业,避免传统农机转弯压苗问题 [6] - 公司用五年时间完成了5个大版本、30余个小版本的产品迭代,并累计进行了超过100万公里的实地测试 [5] 具体产品形态与功能 - **鹤出T3000(大田机器人)**:搭载自主研发的20米作业幅宽精准喷洒载荷,通过18个相机和111个独立控制喷头实现正反双向精准喷洒 [5] - 喷洒模式包括:“对行喷洒”(出苗阶段只喷种植行)、“靶向喷洒”(苗前期只喷杂草)、“变量喷洒”(中后期根据虫情和高度调节喷洒量) [6] - **骥鹿G3000(果园机器人)**:喷洒模块采用多关节仿形结构,喷雾最高覆盖8米,水平最多穿透10米 [6] - 骥鹿G3000搭载8个双目深度相机,能识别果实与病虫害叶片,实现双向精准喷洒,其病虫害防治率比人工提升40% [6] - 骥鹿G3000的运动平台可通过搭载不同作业模块,实现喷药、施肥、自动剪枝、覆土清园等全流程服务 [6] 商业化进展与市场拓展 - 公司产品已在东西部多个省份实地工作,并已收到数千万元人民币的订单 [7] - 海外市场需求显现,澳大利亚、加拿大的农场主和种植企业已多次联系希望引入产品 [7] - 公司已启动出海计划,目标是在2026年将“鹤出T3000”与“骥鹿G3000”推向全球市场 [8] 投资人观点 - 投资人认为农业是机器替代人力需求最紧迫、可行性最高的场景之一,公司产品在多个省份的实际应用验证了其技术与产品的可靠性与经济性 [9] - 公司机器人的运动平台、精准识别算法以及模块化、自适应设计,在复杂田间环境中表现突出,产品能力达到国际先进水平 [9] - 投资人看好公司未来向海外劳动力成本高且规模化农业发达的地区输出解决方案 [9]
上海中广云智投:模块化架构加速投资功能迭代速度
搜狐财经· 2025-12-01 10:40
行业技术变革驱动力 - 投资领域正经历由技术架构革新驱动的深刻变革,传统“巨石型”架构因功能模块高度耦合导致开发周期冗长、维护成本高昂 [1] - 模块化架构通过“功能解耦、组件复用”理念为行业注入敏捷基因,推动行业向快速响应、动态优化方向演进 [1] 模块化架构核心优势 - 将复杂系统拆解为独立功能单元,如宏观经济分析、风险评估模型、量化交易算法等核心功能进行模块化封装 [1] - 每个模块聚焦单一任务并通过标准化接口协同,形成“乐高式”组合生态,使投资者无需推翻既有框架即可快速适配新场景 [1] - 面对全球化配置需求激增时,系统可通过嵌入国际宏观经济监测模块与汇率风险对冲组件快速扩展跨境投资能力 [1] 关键技术支撑 - 统一数据接口规范确保模块无缝调用市场行情、企业财报、舆情动态等多元数据,打破信息孤岛 [2] - 分布式计算与实时处理技术使模块间数据交互效率提升数倍,支撑高频交易等时效性要求高的场景 [2] - 开源生态降低模块开发门槛,功能更新周期从传统模式数月缩短至数周甚至实现实时动态调整 [2] 市场应对能力 - 黑天鹅事件引发市场波动时,系统可快速集成极端情景模拟模块进行压力测试并自动生成风险对冲方案 [2] - 监管政策变化时,合规模块可独立升级确保全系统符合最新要求,具备“热插拔”式更新能力 [2] 行业生态重塑 - 专业机构可聚焦特定模块深度开发形成“模块供应商”角色,投资者根据需求选择模块组合构建个性化策略工厂 [3] - 该分工模式降低中小机构技术门槛,并通过市场竞争推动模块质量持续提升 [3] - 人工智能与区块链技术融合推动模块化架构向智能化、自动化演进,智能模块自主学习市场规律,区块链模块确保数据不可篡改 [3]
产业链巨变,自动驾驶赛道迎来大逃杀时刻
36氪· 2025-11-24 18:08
行业格局剧变 - 自动驾驶行业正经历技术路线与产业链条的巨变,Robotaxi赛道进入“大逃杀”阶段,先行者面临成为“先烈”的风险[8][9][24] - 行业主旋律从技术崇拜转向商业落地和效率提升,市场态度回归理性,行业进入漫长的价值验证期[8] - 外包模式正受到来自整车厂和芯片厂自研模式的严峻挑战,有被取代的趋势[7][9] 市场表现与公司动态 - 毫末智行于11月24日起停工放假,被视为行业大逃杀开始的信号[1][8][46] - 小马智行与文远知行于11月6日在港交所同日挂牌,但上市后双双破发,截至上周五股价均比上市后峰值下跌三分之一[3] - Waymo估值从巅峰时期的1750亿美元一度暴跌至300亿美元,Mobileye作为曾经的Tier 1霸主也显出破败相[22] 技术路线变革 - 自动驾驶底层架构正从模块化架构向端到端方案演化,并切换至以视觉方案为主[32][41] - 特斯拉采用的纯视觉方案仅需8个摄像头,成本远低于Waymo依赖激光雷达的多传感器方案(包含5个激光雷达和29个摄像头)[10] - 主流车企如小鹏、华为、百度等纷纷转向端到端和纯视觉方案,导致早期在激光雷达上的大量研发投入可能打水漂[35][41][43][45] 商业模式对比 - 以特斯拉、小鹏为代表的整车厂采用自研模式,在算力适配、造车成本与数据规模上具有绝对优势[10][13][16][19] - 外包模式厂商如Waymo面临高昂成本,特斯拉Robotaxi的成本据称仅为Waymo的七分之一,安全性却是其七倍[16] - 整车厂商直接采购车辆成本更低,特斯拉Model Y售价为4.50万美元,远低于Waymo使用的捷豹I-Pace的7.73万美元[13] 财务表现与研发投入 - 小马智行从2021年至2025年上半年归母净利润持续为负,累计亏损8.68亿美元,同期收入总和仅2.59亿美元,净亏损是收入的3倍多[25] - 文远知行同期累计亏损75.96亿元人民币,同期收入总和仅16.29亿元人民币,净亏损是收入的4倍多[26] - 高强度研发投入是巨亏主因,小马智行同期研发开支总和达7.84亿美元,占收入比重303%;文远知行研发开支总和达39.96亿元人民币,占收入比重245%[28][30][32][33] 未来展望与战略调整 - 英伟达联合Uber、Stellantis等计划自2027年起规模化部署约10万辆Robotaxi,成为行业潜在搅局者[22][24] - 小鹏汽车宣布2026年推出三款Robotaxi车型并启动试运营,特斯拉也在进博会展示Cybercab并计划在2025年底前将车队规模扩至1500辆[5][7][16] - Momenta的成功证明外包模式并非毫无希望,其在中国城市NOA市场占有率据称已超过60%[41][46]
Alcon(ALC) - 2025 H2 - Earnings Call Transcript
2025-08-28 10:00
财务数据和关键指标变化 - 2025财年收入达到4080万澳元 同比增长10% [9][22] - 年经常性收入(ARR)截至2025年6月30日为2850万澳元 同比增长31% [10] - 新签约总合同价值(TCV)达7380万澳元 同比增长超过100% [12][21] - 息税折旧摊销前利润(EBITDA)为510万澳元 较去年改善850万澳元 [12] - 实现正运营现金流580万澳元 净现金流490万澳元 [12][13] - 首次实现税后净利润170万澳元 较去年改善1010万澳元 [22] - 毛利率提升至88%以上 毛利润增加超过400万澳元 [23] - 运营成本降低10% [24] - 现金结余1770万澳元 营运资本约1800万澳元 [28] 各条业务线数据和关键指标变化 - 产品销售收入占比超过96% 技术服务收入占比不到4% [25] - 经常性产品收入贡献占比保持在64%的历史高位 [25] - Mya Precision平台拥有16个独特模块 包括ED模块和MyAscribe模块 [6] - 模块化架构是核心竞争优势 客户可逐步激活所需模块 [5] - 专注于患者流程管理解决方案 在该领域快速获得市场认可 [34] 各个市场数据和关键指标变化 - 英国市场收入贡献占比达63% 首次超过澳新地区 [25] - 澳新地区收入占比下降 主要因昆士兰合同结构调整影响 [10] - 新进入威尔士市场 与Halda大学健康委员会签署合同 [32] - 在南澳大利亚州获得首个Mya Precision平台客户 [31] - 目前主要运营澳大利亚 新西兰和英国三个市场 [6] 公司战略和发展方向和行业竞争 - 模块化销售策略是未来增长计划的重要组成部分 [37] - 计划扩展到新的健康垂直领域 如老年护理和社区护理 [42] - 正在评估进入新地理市场 包括加拿大 沙特阿拉伯和阿联酋 [42] - 继续寻找战略协同的并购机会 [42] - 差异化优势在于能够与客户长期合作 满足其需求和预算 [39] - 在急症护理企业医疗解决方案领域巩固了市场地位 [9] 管理层对经营环境和未来前景的评论 - 医疗保健系统目前非常关注患者流程管理 [34] - 英国NHS发布十年计划 其中第二大支柱是从模拟向数字化转变 [59] - 参考案例对医疗保健行业非常重要 客户从可信赖的合作伙伴购买解决方案 [39] - 公司处于拐点 有望加速增长轨迹 [43] - 2026财年预计将继续实现EBITDA正和运营现金流正 [41] 其他重要信息 - 董事会新增两名非执行董事 Will Smart和Andrew Way教授 [15] - 英国领导团队加强 新增三名关键任命 [17][18][19] - 合同收入达到3400万澳元 为历史最高水平 [40] - 无形资产减少360万澳元 递延收入增加220万至1500万澳元 [27][28] - 北坎布里亚合同TCV超过3900万澳元 为期十年 [35] 问答环节所有提问和回答 问题: 关于资本许可购买的结构细节 - 资本许可是预付多年许可费 如北坎布里亚合同预付十年许可费 但仍有年度支持和维护费及托管费 约200万澳元/年 [46][47] 问题: 关于销售管道情况和新合同转化时间 - 销售管道持续构建 但由于客户部署平台和展示价值 无法预测具体合同签署时间 [48][49] - 除了达到重大性标准的合同公告外 还有众多较小交易贡献收入增长 [50] 问题: 与Dartford和Gravesham NHS信托的关系更新 - 该信托需要向NHS英格兰申请资金才能进入EPR采购市场 目前尚未获得资金 也未进入市场采购 [51] 问题: 关于员工费用展望 - 预计员工数量保持稳定 但投资重点转向销售和市场营销能力 薪资成本会有适度增加 [52][53] 问题: 关于未来并购活动如何为股东创造价值 - 董事会对所有并购都评估估值 预期投资回报以及如何支持未来增长前景 [55] 问题: 2026财年毛利率扩张预期和7-8月TCV增加情况 - 毛利率随ARR比例提高而继续改善 除非销售第三方模块化产品影响利润率 [57] - 7-8月没有达到重大性标准的TCV增加 进展情况符合预期 [58] 问题: 英国市场机会规模和未来三年管道可见度 - 英国机会难以完全量化 但模块化策略提供灵活性 NHS数字化进程带来重大机会 [59][60] 问题: 2020年曼彻斯特免费提供PatientTrack的反馈和市场进入策略 - 免费试用是进入新市场的有效方式 但需要权衡时间成本 在新市场可能采用概念验证方式 [61][62][63]
Notion 最近怎么用 AI:模块化很有用!
Founder Park· 2025-07-02 20:24
Notion AI的核心架构与设计理念 - Notion AI的核心能力在于深度理解工作空间内的信息结构与内在关联,而非简单关键词搜索[1] - 公司基于模块化「块」架构构建AI系统,每个块(文本/任务/数据库)都是包含元数据和关联关系的小容器,类似乐高积木[1][8] - 这种架构带来深度结构化的上下文信息,有效降低AI幻觉并增强逻辑理解能力[1][8] 产品功能创新 - 2023年5月推出AI Meeting Notes功能,能将会议笔记无缝融入现有工作流程[1] - 正在向All-In-One AI平台转型,AI深度集成至产品核心架构而非附加功能层[1][4] - 模块化设计使产品具备快速迭代能力,通过LLM裁判系统实现持续性能评估[6] 技术实现路径 - 采用多模型匹配策略,根据任务类型(推理深度/速度/成本)分派最优模型[5][10] - 长文生成调用高级推理模型[10] - 历史查询使用长上下文窗口模型[10] - 高频低复杂度任务采用微调的高性价比模型,延迟降低50%[10] - 建立复合型AI专家团队,结合QA/提示词工程/产品思维优化模型表现[6] 结构化数据优势 - 结构化知识图谱使AI能执行复杂操作:构建项目跟踪器/跨团队汇总进展/基于真实数据推理路线图[11] - 日期等数据在Notion中具有任务关联属性,支持「逾期任务分配部门」等语义化查询[8] - 模块化架构催生全新工作流,实现模型智能分配与产品深度集成[11] 行业社群建设 - 运营超8000人的AI产品市集社群,面向从业者/开发者/创业者提供新品资讯和资源[4] - 社群提供精准曝光渠道及新品邀请码等福利[4]
“中国速度”走向世界
中国汽车报网· 2025-06-18 09:54
行业转型与效率革命 - 全球汽车产业加速向电动化、智能化转型,效率成为企业竞争力核心变量,"中国速度"成为行业标杆 [2] - 跨国企业如大众集团、日产、马瑞利等正缩短产品研发周期,马瑞利从3年压缩至12个月,大众从54个月缩短至36个月 [2][3][5] - 中国车企如比亚迪、奇瑞、零跑通过缩短海外车型研发周期和快速响应本地化需求,加速全球化进程 [2] 中国速度的全球影响 - "中国速度"体现在研发周期从传统3年以上缩短至12-18个月,被跨国车企如大众、宝马、奔驰等积极采纳 [3][4][5] - 大众集团通过与小鹏汽车合作缩短开发周期超30%,并与地平线、国轩高科协作强化技术布局 [3][4][9] - 日产将主要车型开发时间缩短至37个月,中国市场进一步压缩至24个月 [5][11] 技术驱动研发加速 - 车身结构简化、敏捷开发模式、信息技术应用推动研发提速,行业从"瀑布式开发"转向"敏捷开发" [6] - 数字孪生、虚拟仿真、模块化架构和工业互联网等技术显著缩短开发周期,AI技术提升电池等零部件研发效率 [6][8] - 汽车产品属性趋近消费电子,华为、小米等跨界企业带来快速迭代理念,智能电动车迭代周期缩短至2年 [7] 中国研发反哺全球 - 国际车企如奔驰、日产将中国研发成果反哺全球,奔驰中国研发的导航和语音控制功能已全球推广 [10][11] - 中外技术合作案例包括大众与小鹏/地平线/国轩高科、丰田与小马智行、奥迪与上汽等 [9] - 宁德时代技术授权福特,远东电池与英国Volklec合作,体现中国零部件企业技术输出 [10] 中国车企全球化布局 - 比亚迪、上汽、广汽等在泰国、巴西等多国建厂,从"产品输出"升级为"技术赋能",建立海外研发中心 [12] - 中国车企在泰国带动完整产业链形成,推动当地汽车工业向电动化、智能化转型 [13] - 中国车企全球扩张倒逼日系和欧系车企加速电动化战略,如丰田在东盟、雷诺与吉利合作等 [13]