Workflow
主动感知
icon
搜索文档
致敬发明者:空调业的“风”,为何总由海尔掀起?
新浪财经· 2025-10-29 17:24
行业演进趋势 - 空调行业近十年正经历从“机械服从”到“人性化服务”的演进 [1] - 海尔公司持续扮演行业“发明者”角色,将行业推向“主动感知”的新高度 [1] - 公司的创新路径围绕用户对“风质健康”和“风感舒适”的双重需求展开 [3] 技术突破与产品创新 - 2025年10月,海尔麦浪舒适风Pro系列上市,搭载UWB人感雷达和WiFi人感科技,实现从感知人体位置到感知呼吸的技术跨越 [1] - 该产品是行业首款可感知呼吸的空调及首款搭载UWB人感雷达的空调,标志着空调从“功能机”进化为具备“感知-决策-执行”系统的“智能体” [3][6] - 柜机UWB人感雷达实现0.3秒反应速度、0.15米感知精度、140度感知角度和8米感知距离,可完整覆盖客厅空间 [6] - 自适应送风系统实现“人近风柔,人离节能”的体验,达成节能与舒适的双赢 [9] 公司创新历程与行业贡献 - 公司在健康风领域持续创新:2015年首创自清洁空调,经过6次迭代,连续7年位居健康自清洁空调全球销量榜首;2017年推出世界首台“空净合一”智能空调;2020年首创洗空气技术 [3] - 公司在舒适风领域持续创新:2013年推出风洞式设计;2016年推出无限接近自然风的舒适风系列;最新推出呼吸感知技术 [3] - 公司四十年发展历程是空调技术进化史:1985年推出中国第一台分体式空调;1993年产出中国第一台变频空调;2023年自主研发换热器可变分流科技 [9] - 公司主导房间空调器行业34项主要国家标准中的31项,并参与IEC 60335-2-40、UL 484等国际标准制定 [10] 核心战略理念 - 公司的技术突破源于对“人机关系”的重新定义,使空调成为能理解用户状态的智能伙伴 [8] - 公司的创新逻辑是用户需求导向,其突破是开创性的、品类级的发明,持续推动行业跨越式发展 [3] - 公司价值体现在对用户真实体验的关注,让科技懂用户所需,成为用户生活的一部分 [10]
斑马智行司罗:智能座舱正经历范式重构,端到端+主动感知成破局关键
中国经济网· 2025-09-22 17:07
核心观点 - 智能汽车作为Physical AI的重要载体,正成为具身智能的压力测试场,智能座舱是继智能驾驶后对接用户体验与互联网AI生态的核心入口,已成为黄金赛道 [3] - 智能座舱的技术发展正经历从验证期、应用期到重构期的演进,行业从传统流水线架构转向端到端模型,实现交互范式的重构 [4][5] - 基于端到端架构与主动感知技术,智能座舱正从被动响应转向主动感知,并朝着成为物理空间AI生态核心枢纽的方向迈进,推动万亿级商业市场 [5] 智能汽车作为Physical AI载体的特征 - 智能汽车场景具有高复杂性,需融合语音、视觉、传感器等多模态输入,同时打通出行、办公、家庭等跨场景需求 [3] - 智能汽车场景具有高安全性,需满足毫秒级响应要求并通过ASIL-D等工业强标认证 [3] - 智能汽车场景具有高商业价值,斑马智行已与行业伙伴合作落地800多万辆车,验证了技术规模化应用的可行性 [3] 智能座舱的五层融合架构 - 芯片与算力层以英伟达、高通及崛起的国产化芯片为核心,构成算力支撑基础 [4] - 系统层由斑马智行、华为等企业主导,通过操作系统、虚拟化、安全技术等提供高效系统级服务 [4] - 大模型层融合通用大模型与车载垂直领域大模型,重点解决车内多模态处理、数据安全与隐私保护问题 [4] - 智能体层承担中枢决策功能,精准识别用户需求并调度对应服务模块 [4] - 平台服务层基于自然语言交互实现AI原生服务直达,最终完成交互范式升级 [4] - 五层架构是环环相扣的有机整体,共同支撑智能座舱的技术迭代 [4] 智能座舱技术发展节奏与范式重构 - 2024至2025年初为验证期,核心解决大模型能否上车的基础问题 [4] - 2025年进入应用期,重点推进智能体体系上车,通过智能体的组织与规划实现实际服务落地 [4] - 当前至2026年迎来重构期,行业从传统流水线架构转向端到端模型 [4] - 端到端模型可实现多模块一体化处理,已在斑马智行的实践中实现5倍人机交互速度提升,为舱驾融合与多域聚合智能闭环奠定基础 [5] 交互体验升级方向 - 智能座舱正从被动响应转向主动感知,通过视觉、听觉传感器,智能助手能主动识别场景需求 [5] - 智能座舱从听话的工具升级为贴心的伙伴 [5] - 未来的智能座舱不仅是出行工具的延伸,更会成为物理空间AI生态的核心枢纽 [5]
告别被动感知!DriveAgent-R1:主动视觉探索的混合思维高级Agent
自动驾驶之心· 2025-08-01 15:05
核心观点 - DriveAgent-R1是一款为解决长时程、高层级行为决策挑战而设计的先进自动驾驶智能体,通过混合思维和主动感知机制推动基于VLM的自动驾驶发展 [3][4] - 该智能体在SUP-AD数据集上取得SOTA性能,超越Claude Sonnet 4等顶尖多模态大模型,首帧联合准确率达61.42%,启用工具后提升至70.11% [4][27] - 创新性地提出三阶段渐进式强化学习策略和模式分组GRPO算法,将工具使用从性能干扰源转化为性能放大器,序列平均准确率提升15.9% [4][28] 技术架构 - 基于Qwen2.5-VL-3B模型构建,处理6个环视摄像头低分辨率图像、车速和导航指令,生成未来8秒驾驶意图决策 [11] - 决策由4个时间步(每步2秒)的离散元动作序列组成,包含速度和轨迹两部分 [11] - 集成视觉工具箱:高分辨率视图获取、关键区域检查、深度估计和开放词汇表3D物体检测 [19] 核心创新 - 混合思维框架:智能体根据场景复杂度在纯文本推理和工具辅助推理间自适应切换 [5][18] - 主动感知机制:配备视觉工具箱主动探查环境解决感知不确定性 [5][16] - 三阶段训练策略:双模式监督微调→强制对比模式强化学习→自适应模式选择强化学习 [17][24][25] 性能表现 - 在SUP-AD数据集上,首帧联合准确率61.42%(无工具)和70.11%(有工具),序列平均准确率38.03%和44.06% [27] - 推理质量评分7.16(无工具)和8.00(有工具),模式选择准确率达65.93% [25][27] - 消融实验显示完整三阶段策略最优,FCM-RL阶段强化单模式能力,AMS-RL阶段优化模式选择 [29] 技术验证 - 视觉工具对SOTA VLMs普遍有效,如Claude Sonnet 4联合准确率提升25.0% [27] - 未经训练的模型使用工具会导致性能暴跌42.1%,而DriveAgent-R1成功将工具转化为性能放大器 [28] - 移除图像输入后性能下降43.1%,证实决策是真正视觉驱动 [30]
自动驾驶Agent来了!DriveAgent-R1:智能思维和主动感知Agent(上海期智&理想)
自动驾驶之心· 2025-07-30 07:32
DriveAgent-R1核心创新 - 首创基于强化学习的混合思维架构,使智能体能在纯文本推理和工具辅助推理间自适应切换[12][14] - 引入主动感知机制,配备包含高分辨率视图获取、关键区域检查等功能的视觉工具箱[15][18] - 采用三阶段渐进式训练策略(DM-SFT→FCM-RL→AMS-RL),显著提升模型性能[16][19][24] - 在SUP-AD数据集上实现SOTA性能,首帧联合准确率达70.11%,超越Claude Sonnet 4等主流模型[12][26] 技术架构与性能 - 基于Qwen2.5-VL-3B模型构建,输入包含6路环视摄像头数据,输出8秒驾驶意图决策序列[11] - 创新MP-GRPO算法强化双模式能力,模式选择准确率达65.93%[24][28] - 工具使用使序列平均准确率提升15.9%,推理质量提升11.7%[26][27] - 消融实验显示完整训练策略使首帧准确率较基线提升44.8个百分点[28] 行业突破性 - 首次实现自动驾驶智能体的长时程决策能力(8秒连贯规划)[3][11] - 解决现有VLM短视决策(单步预测)和被动感知两大核心痛点[6][12] - 验证视觉工具对SOTA模型的普适增强效应(如Claude推理质量+26.1%)[26] - 建立首个评估体系量化安全性、舒适性等多维度表现[24]