行业背景与共识 - “物理AI”已成为AI的下一个主要发展方向,但行业在感知层面仍远未成熟 [1] - 传统感知能力被视为零部件问题,硬件团队需从零构建技术栈,周期长且重复 [1] - 系统化的感知能力已在消费电子领域被攻克并规模化应用,如微软Kinect和苹果FaceID [1] - 根据Grand View Research预测,AI机器人市场规模到2030年将达到1250亿美元 [7] - 麦肯锡数据显示,超过60%的工业企业缺乏自主实施机器人自动化的内部能力,包括传感器集成能力 [7] 公司概况与融资 - 创业公司Lyte由微软Kinect和苹果FaceID技术的核心缔造者创立 [1][2] - 公司旨在为AI打造端到端的感知系统 [2] - 近日,Lyte获得1.07亿美元的早期融资 [1] - 投资方包括Avigdor Willenz、Fidelity、Atreides Management、Exor Ventures、Key1 Capital和Venture Tech Alliance [1] 创始团队与技术渊源 - 联合创始人兼CEO Alexander Shpunt是3D传感公司PrimeSense联合创始人及前CTO [4] - 其团队创造了“光编码技术”,该技术催生了微软Kinect,后者在六十天内售出八百万台 [4] - 2013年PrimeSense被苹果收购,团队将核心技术演进为苹果FaceID,已应用于数十亿台设备 [4] - 团队核心成员还包括主导多代iPhone和Apple Watch Taptic Engine架构设计的CTO Arman Hajati,以及专注于MEMS的工程副总裁Yuval Gerson [6] 核心问题与解决方案 - “物理AI”发展的关键因素是对物理世界的可靠理解,机器人需在复杂动态环境中安全运行 [5] - 传统解决方案是从多家供应商拼凑感知系统,需花费数月校准、编写软件并调试故障 [7] - Lyte以垂直整合技术栈的思路,将传感硬件、定制芯片和感知软件统一到单一平台,解决结构性问题 [7] - 公司提供统一的空间智能平台LyteGalaxy,集传感器、计算单元、软件与算法于一体 [10] 核心技术:相干视觉 - 结构光技术(光编码)的局限在于仅近距离有效,且只能捕捉位置,无法捕捉速度 [7] - 传统传感器通过比较不同帧画面来理解运动,会引入延迟 [8] - Lyte开发了新技术“相干视觉”,通过发射连续信号并测量其返回信号,在同一瞬间同时捕捉位置与速度,无延迟 [9] - 该技术为感知引入了第四个维度——速度,信息由物理层直接获取,无需算法事后计算 [9] 核心产品:LyteVision - LyteVision是一个端到端的感知系统,在2026年CES上荣获机器人技术“最佳创新奖” [12] - 产品将先进的4D传感、RGB成像和运动感知能力集成到单一平台,通过一个连接提供统一的空间与视觉数据 [1][12] - 产品统一了从感知到智能的整条路径,实现传感器与芯片融合,芯片为软件定制,软件为AI计算而生 [12] - 产品经过三大集成阶段:1) 感知:集成4D相干视觉、RGB和IMU的即插即用模块;2) 融合与处理:定制芯片在硬件层面即时处理多传感器融合;3) 理解:连接传感器、芯片、软件与AI计算,整个决策闭环在毫秒间完成 [13] - LyteVision是一个仅有单个连接器的独立模块,能统一输出多个传感器数据,实时捕捉位置与速度,可即刻部署 [13] 产品优势与市场定位 - 公司将感知的复杂性内部消化,提供一个连接智能层的感知层,让“眼睛”与“大脑”直接对话 [14] - 产品让“物理AI”在感知上不再面对发展的限制因素 [15] - LyteVision能够赋能广泛的实体AI平台,包括自主移动机器人、机械臂、四足机器人、自动驾驶出租车和人形机器人 [16] - 端到端是感知系统的下一个趋势,Lyte通过软硬件结合的垂直整合技术,将复杂性内化,为客户提供简单且通用的产品 [18] - 随着物理AI崛起,AI对感知的需求从静止化、单一化向通用化、实时化发展 [17] 行业机遇 - “物理AI”尚处早期,在智能、感知、行动控制等硬件和软件层面都存在很多突破机会 [19] - 行业此前关注赋能智能硬件的AI操作系统、具身智能数据和“世界模型”等缺项,但感知层面也存在革新机会,例如Lyte所做的 [18]
苹果FaceID缔造者为“物理AI”打造端到端的感知系统,融资1.07亿美元