Workflow
视觉
icon
搜索文档
工程师来信|“我也一度认为激光雷达只是情绪价值”
36氪· 2025-06-25 09:03
特斯拉自动驾驶技术进展 - 特斯拉首批Robotaxi车队在得州奥斯汀上路,采用2025款Model Y,基于纯视觉方案(摄像头+自研AI芯片),实现"端到端"模型学习驾驶技能 [1] - 纯视觉方案被视为技术突破,国内车企小鹏也跟随该路线,将激光雷达移出核心感知架构 [1] 激光雷达市场现状 - 2023年全球车载激光雷达销量约160万台,其中中国市场占比90% [1] - 激光雷达价格从30万元以上高端车型下沉至15万元级大众市场,成本已降至1000多元 [9] - 行业主流产品线束为64线/128线/192线,测距能力达150米有效检测 [2][6] 技术路线争议 - 视觉方案存在物理局限:夜间信噪比衰减、异形障碍物识别歧义等问题持续存在 [1][4] - 激光雷达优势在于"检测即所得",是确切的物理量,能提升AEB功能成熟度 [3][7] - 视觉方案开发代价高昂,需海量数据驱动,而激光雷达可减少开发工程量 [7] 激光雷达技术演进 - SPAD(单光子雪崩二极管)将成为未来主流技术,索尼芯片方案将被华为/速腾/禾赛采用 [8] - 半导体技术进步将推动激光雷达性能提升,2025-2026年可能出现突破性产品 [8] - 线束数量持续增加,角分辨率优化,测距能力有望突破200米 [6][15] 车企应用现状 - 除特斯拉和小鹏外,多数车企仍依赖激光雷达作为辅助驾驶核心组件 [5] - 激光雷达使用呈现"强者恒强"态势,需结合视觉方案才能发挥最大效用 [7][13] - 蔚来/理想/小米等车企已配备激光雷达,形成市场竞争驱动力 [12] 成本与供应链 - 激光雷达成本持续下探,性价比优势显现,能帮助车企减少技术弯路 [9] - 供应链体系已建立,可保证产品批量一致性,售后更换成本约几千元 [10][11] 性能边界与挑战 - 量产环节实际有效测距多为80-120米,少数能达到150米 [15] - 雨雾雪天气和玻璃/水面等高反射物体会影响检测精度,算法可部分缓解但无法根除 [16] - 参数标称的200米测距需结合线束数量和角分辨率综合评估 [6]
机器人视觉语言导航进入R1时代!港大联合上海AI Lab提出全新具身智能框架
量子位· 2025-06-25 08:33
技术突破 - VLN-R1实现了将自然语言指令直接转化为第一人称视角下的连续导航动作,无需依赖离散地图,能在复杂环境中灵活感知、决策与行动,实现类人级别的具身智能导航[1] - 该技术打破了"视觉输入→文本描述→离散决策"的传统链条,直接让LVLM以第一人称视频流为"眼睛",输出连续导航动作(前进、左转、右转、停止)[5] - 在VLN-CE基准测试中,仅用20亿参数模型就超越了70亿参数模型的SFT结果,在长距离导航中仅用1万RxR样本进行RFT就超过了使用完整RxR数据训练的模型[2] 技术创新 - 采用两阶段训练框架:先通过监督微调学习正确动作序列的文本表达,再通过强化微调引入奖励机制优化决策[7] - 提出分组对比优化(GRPO)方法,通过比较多个动作方案的相对优劣来学习最优路径,不需要提前设定固定奖励规则[7] - 引入时间衰减奖励(TDR)机制,对近期动作赋予更高权重,让模型优先确保眼前动作的精准执行[8][9] 数据集与训练 - 构建了全新的VLN-Ego数据集,包含63万R2R和120万RxR训练样本,完全基于第一人称视角,摒弃全局地图等"作弊"信息[12] - 提出长短时记忆采样策略,平衡近期信息与长期记忆,确保Agent在复杂环境中既不迷失方向又能对突发情况做出反应[14] 性能表现 - 2B模型通过RFT优化后性能直逼7B模型,为资源受限场景(如家用机器人)的落地提供了可能[15] - 展现出极强的数据效率,在跨域迁移任务中仅用少量样本就超越了完整数据集训练的效果[2] 应用前景 - 该框架正在促进AI从"数字智能"向"具身认知"跨越,可应用于工厂物流机器人和家庭服务助手等领域[16] - 研究证明LVLM完全有能力成为"感知-决策-行动"闭环的控制中枢,为具身智能发展提供了新思路[16]
【私募调研记录】远望角投资调研奥比中光
证券之星· 2025-06-25 08:10
公司调研信息 - 奥比中光在机器人领域提供全技术路线3D视觉传感器和整体解决方案 应用场景包括商用服务 养老康复 家庭护理 物流配送 农业智能化等 [1] - 公司与消费级3D打印龙头创想三维合作开发消费级3D打印机和高精度手持3D扫描仪 并与佩极眼镜合作推出3D打印定制眼镜 [1] - 公司为天工机器人提供Gemini330系列深度相机 新品Gemini435Le应用于智能物流 机器人等工业自动化领域 [1] - 3D视觉传感器提升机器人智能化水平 功能包括空间扫描 骨架/手势追踪 定位导航 三维重建等 [1] 机构背景 - 深圳市远望角投资管理企业成立于2014年12月30日 核心团队由两位原公募基金经理和一位原上市公司高管组成 从业年限均超10年 [2] - 公司投研团队经验丰富 成立以来以优秀风控和稳健收益获得专业机构认可 入选多家券商 银行 FOF白名单 [2] - 公司2019年荣获中国证券报中国私募基金金牛奖三年期金牛私募管理公司 中国基金报私募基金英华奖中国私募基金成长奖和最佳产品奖 [2] - 2018年获得新浪财经第二届中国私募基金业金刺猬奖最具潜力奖 证券时报年度金长江奖年度优秀私募基金经理等行业奖项 [2]
新股探寻(影石创新、思看科技、汉朔科技、泰禾股份)
2025-06-24 23:30
新股探寻(影石创新、思看科技、汉朔科技、泰禾股 份)20250624 摘要 影石创新全景相机全球领先,市占率达 67.2%,线上线下销售均衡,线 下与苹果深度绑定。2023 年全球手持智能影像设备市场规模达 364.7 亿人民币,年增速 14.3%,全景相机市场 50.3 亿人民币,未来全景与 运动相机融合及新兴领域应用将扩大市场。 思康科技是工业级 3D 激光扫描仪龙头,国内市场占有率第一,全球第 二,与比亚迪、宝马等合作。2022-2024 年营收分别为 2.1 亿、2.7 亿、 3.3 亿元,年均增速 20%-30%,归母净利润分别为 0.8 亿、1.1 亿、 1.2 亿元,毛利率和净利润率较高,一季度收入和净利润增长均超 20%。 汉朔科技是全球第三大电子价签供应商,国内市占率约 12%,产品覆盖 50 多国,服务超 400 家客户。预计 2028 年全球电子价签市场规模达 350 亿元人民币。欧美市场渗透率高,受益于人工成本上升、通货膨胀 及商店竞争,公司与泡泡玛特合作提升市场关注度。 汉朔科技 2022-2024 年营收从 28 亿增至 44.9 亿元,年均增速超 20%,归母净利润分别为 2.1 ...
AI Lab最新InternSpatia:VLM空间推理数据集,显著提升模型能力
具身智能之心· 2025-06-24 22:09
背景与动机 - 当前视觉语言模型(VLMs)在空间推理任务中存在显著不足,如物体位置/大小比较、多视角关系理解等[3] - 现有数据集存在三大局限:场景单一性(集中于室内/室外场景)、指令格式受限(仅支持自然语言或区域掩码)、多视角监督缺失(超90%为单图推理)[3] InternSpatial数据集 - 规模与结构:包含1200万QA对(950万单视图+250万多视图),覆盖5类场景(自然场景、室内、街景、物体中心、具身导航)[3] - 指令多样性:支持19种指令格式,显著优于对比数据集[3] - 视觉格式:提供原始图/带边界框图/掩码图/编号物体图等多种形式[4] - 文本格式:包含自然语言/带<ref>标记/坐标引用等,新增246万QA对的多视角旋转角度预测任务[6] InternSpatial-Bench评估基准 - 单视图诊断:包含6,008 QA对,涵盖位置比较(1845)、大小比较(1822)、旋转估计(409)、物体计数(899)、存在性估计(1000)五类任务[7] - 多视图扩展:在VSI-Bench新增1,000个旋转角度预测QA对[7] 数据引擎设计 - 采用三阶段自动化流水线:注释生成(复用现有注释或SAM2生成掩码)、视角对齐(构建标准3D坐标系)、模板化QA生成(预定义任务模板动态填充)[9] 关键实验结果 - 空间推理性能:InternVL-Spatial-8B模型在单视图任务中位置比较提升25%,多视图任务中物体计数提升17%(68.7 vs 51.7)[9][10] - 多任务表现:在物体计数、绝对距离、物体大小等7项任务中平均得分52.3,较基线提升10.7分[10] - 指令格式鲁棒性:训练后不同格式间准确率差距从23%缩小至5%以内[12] 当前不足 - 模板局限性:自动生成的QA对难以完全复现自然语言复杂度,部分描述机械化[12] - 开放推理欠缺:集中于结构化空间关系,缺少开放式场景推理(如物体运动轨迹解释)[12]
【招商电子】舜宇光学科技:手机光学创新趋势持续,车载、XR、机器人发展动能强劲
招商电子· 2025-06-24 17:40
车载业务 - 智能驾驶快速发展驱动2025年车载镜头及摄像模组市场增长 预计全球新车单车镜头搭载量将从2024年3.5颗增至2025年超4.3颗 全球车载镜头总需求量将超过4亿颗 [1] - 公司在车载镜头领域凭借高技术、高质量、高性价比和快速反应优势 有望实现全球市占率进一步提升 车载摄像模组业务起步较晚但成长空间大 目标3-5年成为全球前三的车载视觉方案提供商 [1] - 公司拓展激光雷达、HUD、智能大灯等业务 激光雷达已有20多个量产定点 项目总金额超15亿人民币 多款智能车灯产品实现量产交付 新增多个AR-HUD PGU模组项目定点 [1] 手机业务 - 2025年全球智能手机出货量预计同比微增0.2%至11.75亿部 中国市场同比增长2.2%至2.84亿部 手机摄像头模组采购金额预计同比增长7.1% [2] - 手机光学产品创新趋势持续 小型化、OIS摄像模组、长焦类摄像模组、玻塑混合等细分赛道需求增长 公司凭借核心平台技术优势和制程能力实现产品结构改善 [2] - 北美大客户发展良好 未来北美及韩国客户的产品份额有望持续提升 打开三年维度的增长空间 [2] XR及机器人业务 - XR市场进入快车道 预计2025-2026年MR头显及智能眼镜出货均将突破1000万台 光学器件在MR/智能眼镜中BOM占比分别约40%~60%/40%~70% [3] - 公司具备XR全链路光学产品覆盖+垂直整合+规模量产能力 在交互模组、显示模块、光机、光波导等多细分领域实现单项冠军 [3] - 机器人业务由功能型向具身智能机器人迈进 定位由视觉方案提供商向系统方案提供商升级 已拿到超20亿项目订单 [3] 公司整体展望 - 手机业务受益于全球经济弱复苏及安卓高端机型光学影像创新趋势 车载业务受益于智驾平权浪潮 XR/机器人业务前瞻布局有望实现长线成长 [4] - 预计2025-2027年公司总收入及归母净利润将保持增长 对应EPS及PE估值具备吸引力 [4]
粤开市场日报-20250624
粤开证券· 2025-06-24 16:03
核心观点 - 2025年6月24日A股主要宽基指数全数上涨,沪深两市成交额放量,多数行业和概念板块上涨 [1] 市场回顾 指数涨跌情况 - 沪指涨1.15%收报3420.57点,深证成指涨1.68%收报10217.63点,创业板指涨2.30%收报2064.13点,科创50涨1.79%收报978.71点 [1] - 全市场4767只个股上涨,578只个股下跌,71只个股收平,沪深两市成交额合计14146亿元,较上个交易日放量2920亿元 [1] 行业涨跌情况 - 申万一级行业涨多跌少,电力设备、非银金融、商贸零售、汽车和机械设备行业领涨,涨幅分别为2.85%、2.68%、2.64%、2.63%和2.43%,仅石油石化和煤炭行业下跌,跌幅分别为2.10%和0.22% [1] 板块涨跌情况 - 涨幅居前概念板块为炒股软件、锂电电解液、动力电池、汽车零部件、磷酸铁锂电池、锂电池、机器人、金融科技、工业4.0、IDC、无人驾驶、新能源汽车、特斯拉、大数据、机器视觉 [2]
特斯拉Robotaxi开启服务
数说新能源· 2025-06-24 11:42
特斯拉Robotaxi服务启动 - 公司于6月22日在美国得州奥斯汀市正式推出Robotaxi服务,次日股价涨幅超10% [1] - 首批投放35辆基于量产Model Y的车辆,配备方向盘、踏板及安全员,无方向盘的Cybercab计划2026年上市 [1] - 服务范围限定奥斯汀中南部特定地理围栏区域,运营时间为每日6点至午夜,避开复杂路口以确保安全 [1] 运营模式与客户策略 - 当前仅面向受邀特斯拉用户及粉丝开放测试,需通过专属App使用服务 [2] - 采用固定收费4.2美元/次,显著低于Waymo同里程3.5美元/km的定价 [2] 未来规划与技术路线 - 计划数月内将车队扩展至1000辆,2026年底目标在美国部署超100万辆自动驾驶车辆 [3] - 采用纯视觉L4方案,基于FSD系统从L2+升级,硬件成本较激光雷达方案大幅降低 [3] - 开放车主加盟模式,允许车主通过App将闲置车辆接入Robotaxi网络以创造收益 [3] 其他行业动态 - 比亚迪加速东南亚市场布局 [7] - CATL提及储能市场增速高于动力电池领域 [9]
国内外车企智驾方案对比
2025-06-23 10:09
纪要涉及的行业和公司 - **行业**:智能驾驶行业、新能源汽车行业 - **公司**:特斯拉、华为、Momenta、小鹏汽车、理想汽车、比亚迪 纪要提到的核心观点和论据 技术路径对比 - 华为、小鹏、理想和 Momenta 处于第一梯队,能较快跟上特斯拉技术步伐,如 2022 年 10 月特斯拉推出 occupancy 技术,华为、理想和小鹏一年内跟上;2024 年 1 月特斯拉推出端到端智能驾驶系统模型,小鹏和华为半年内跟上[2] - 2025 年车企普遍希望实现类 L3 级别智能驾驶,如理想计划实现有监督智能驾驶,达城市与高速每 500 公里接管一次水平;小鹏希望年底实现类 L3 级别智能驾驶,城区每百公里接管次数小于一次;华为计划推出类似 L3 级别自动驾驶[2] - 主要厂商端到端模型参数量大多在几亿规模,下一代车端 VLA 模型参数量预计在 100 亿以内[2] - 特斯拉在北美实现完全一体式端到端,国内采用模块化方案适应交通规则[1][2][4] 具体技术方案特点 - 特斯拉:完全一体式纯视觉自动驾驶,依靠 8 个摄像头完成智能辅助驾驶,领先世界生成技术,模拟多视角镜头并主动标注语义信息[1][4][11] - 华为:伴随 ADS 4.0 推送一体式多传感器融合方案,比特斯拉复杂,基于盘古大语言模组开发世界生成技术,虚拟数据占比 30%,合成数据占总数据比重 50%[1][3][4][11] - 理想汽车:结合 VLA 与 22 亿参数量 ARM 进行场景理解及复杂情况处理,座舱设计能力强,通过中间屏幕展示虚拟模型对复杂场景理解及轨迹规划概率,预计下个月 I8 首次将 VELA 模型上车,世界生成技术中虚拟数据占比 15% - 30%,合成数据占比 20% - 40%[3][4][6][11][13] - 小鹏汽车:计划通过 G7 发布会走 VLA 加 VLM 路线,目前采用多传感器融合方式,通过改进阿里千问大语言模型进行预训练和后训练,世界生成技术中虚拟数据占比 20% - 40%,合成数据占比 20% - 40%[3][5][6][11] - 比亚迪:高级自动驾驶分天神之眼 ABC,自研天神之眼 C 跑高速 NOA,与 Mobileye 合作开发其他部分[5] 模型选择及区别 - 理想端到端加 VLN 模型使用两片 NOVONIX 芯片,VRM 模型推理速度慢,加入 VLA 模型后,下一代车载算力提升可支持其发展[6] - 理想在预训练阶段训练云端 VR 基础模型后蒸馏出 MOE 模型,小鹏通过改进阿里千问大语言模型进行预训练和后训练,理想方法利于快速部署 VLA 模型,小鹏方法难度大但潜在上限可能更高[6] 自动驾驶地图策略 - 多数企业放弃高清地图,采购介于高清地图和传统导航地图之间精度的地图[1][7] 传感器融合策略 - 特斯拉采用纯视觉路线,新版 Model Y 可能加入 4D 毫米波雷达;其他车企如小鹏采用多传感器融合路线,使用半固态激光雷达,长期震动致精度下降需算法补偿,华为表现较好[1][8] 激光雷达与摄像头方案优劣 - 激光雷达在高速场景有优势,但远距离点云密度不足判断物体类型;摄像头方案在低照度成像情景下表现优异,通过 LOFIC 技术和高分辨率摄像头,夜晚可看到 100 米外场景,提高 30% - 40%上限[9] 自研芯片降低成本 - 小鹏将在 2025 年 G7 顶配车型加入三颗 750TOPS 图灵芯片,总算力相当于三颗英伟达 Orin 芯片,每颗成本约 3,000 元,可减少 60% - 70%毛利率支付给英伟达[10] - 特斯拉目前算力 500 - 720TOPS,下一代升至 2000 多 TOPS,自研芯片成本可控[2][10] 理想汽车 2025 年市场竞争情况 - 面临增程车市场份额竞争加剧挑战,但增程车基本盘仍具竞争力,预计全年销量超 50 万台[2][13] - 下个月推出 I8 有望提高毛利率,9 月推出 I6 可能成爆款产品,新车型 ENVELA 具备智能驾驶系统差异化竞争优势[13] 小鹏新车型 G7 对股价影响 - 新车型 G7 预售价约 23.5 万元,市场反应弱,正式发售可能降价,若最终定价被接受,股价有望回升[14] 其他重要但可能被忽略的内容 - 鹰眼摄像头分辨率达 800 万像素,比过去主流 400 - 500 万有提升,可看到更多车道线及应急车道边缘[9] - 小鹏 G7 顶配车型中三颗图灵芯片,两颗用于自动驾驶,一颗用于智能座舱[10]
舜宇光学科技(02382.HK)2025年投资者日:手机升级动能不减 车载+XR打开长期成长空间
格隆汇· 2025-06-23 02:58
公司近况 - 6月19日参加了舜宇光学2025年度投资者日活动 公司分享了手机 车载 XR及机器人等领域的行业趋势及技术进展 [1] 手机光学 - 预计2025年全球智能机销量同比微增0 2% 摄像头采购金额有望同比增长7 1% [1] - 1~5月手机摄像模组/手机镜头出货量同比下降25%/5% 但预计ASP和毛利率或同增明显 [1] - 聚焦高端和质量 动态调整量价平衡 [1] - 创新方向包括可变光圈 压电云台防抖 连续变焦 模组马达一体化 玻塑混合等 [1] - 看好未来2~3年行业升规升配 公司竞争力和盈利能力增强 [1] 车载光学 - 预计2025年全球车载镜头需求量超过4亿颗 同比增速超过26% [1] - 17MP镜头预计于2026年量产 [1] - 国内外车企或将相继升级智驾 带动行业扩容 高端镜头迭代有望加深公司壁垒 [1] - 推进激光雷达小型化 经济化和快速交付 [1] - 跟进智能大灯/投影小灯应用普及并提升份额 [1] - 抓住AR-HUD渗透率提升的机遇 [1] - 增强环境感知模组的全场景性能 实现市占率提升 [1] - 第二成长曲线业务有望快速增长 [1] XR和机器视觉 - XR领域具备全链路光学产品覆盖且均处于单项领先地位 [1] - 在研的刻蚀工艺SRG光波导配合碳化硅有望达到FOV50+和>1000nits/lm [1] - 有望抢占XR窗口红利 [1] - 机器人领域已覆盖扫地机 无人机 配送机器人 割草机等多个细分市场 [1] - 发挥视觉感知模块的核心枢纽作用 从视觉传感延伸到整机共创 [1] - 有望打开更广阔的可触达空间 [1] 盈利预测与估值 - 维持2025/2026年归母净利润35 19/40 85亿元 [2] - 当前股价对应2025/2026年P/E 18 8x/16 0x [2] - 目标价99 2港币 对应2025/2026年P/E 28 7x/24 4x 较当前股价有52%涨幅 [2]