视觉

搜索文档
何小鹏的AI帝国里,没有激光雷达
21世纪经济报道· 2025-06-18 23:56
小鹏汽车技术路线 - 小鹏汽车自主研发的图灵芯片首次上车,搭载在中型SUV G7上,一颗图灵芯片的有效算力等同于三颗英伟达Orin X,整台G7的有效算力超过2200Tops [2] - 小鹏Mona M03顶配版配备两颗Orin-X芯片,算力达508TOPS [2] - 小鹏宣布将采取纯视觉方案,认为激光雷达"看不远、干扰多、帧率低、穿透性差" [2] 纯视觉技术方案 - 小鹏通过定制AI编译器、协同设计模型架构等方法,实现VLA和VLM大模型与图灵芯片的耦合 [3] - 小鹏训练了超过40万小时的视频数据,相当于AI看了3万部《流浪地球》,视频数据量将在今年增加到2亿clips [10] - 小鹏智能算力集群正向两万卡水平前进,云端集群运行效率常年保持在90%以上 [13] - 去掉激光雷达后节约了20%的感知算力,模型反应更快,视觉信息处理帧率达到业界主流激光雷达处理帧率的12倍 [13] 激光雷达技术发展 - 激光雷达成本12年间下降了400倍,禾赛已将激光雷达价格压到200美元 [3] - 激光雷达供应商通过自研关键器件并压缩成芯片实现降本,部分主机厂称禾赛激光雷达报价已降至人民币三位数 [25] - 激光雷达存在"多径效应"问题,但已有方法通过训练神经网络模型和多源数据对比来解决 [26][28] 技术路线对比 - 纯视觉方案优势:算力要求低、响应速度快、数据获取成本低 [13][22] - 激光雷达优势:测距精度高、不受光线条件限制、能识别视觉欺骗性场景 [30][31] - 视觉方案在极端天气下仍需依赖毫米波雷达 [25] 行业竞争格局 - 小鹏将纯视觉高阶智驾能力下放到13万元起的Mona Max,同时激光雷达也下探到同价位区间 [4] - 小鹏试图重新定义辅助驾驶标准,认为"算力"才是检验辅助驾驶的第一标准 [6] - 特斯拉和小鹏代表纯视觉派,而更多品牌转向激光雷达方案 [4][6] 技术争议 - 专家质疑去掉激光雷达是否能真正提升反应速度,认为占用算力的主要是大模型而非激光雷达 [18][19] - LOFIC技术最早由荣耀手机提出,工艺复杂且商用效果未达预期 [19] - 360°安全取决于传感器布置,视觉和激光雷达都可以实现 [21] 未来发展趋势 - 小鹏计划在2027年前结束纯视觉与激光雷达之争 [35] - L3及以上自动驾驶阶段,车企需证明纯视觉方案更安全 [34] - 最终衡量标准是哪种方案能更大概率防止事故发生 [36]
自动驾驶中常提的VLA是个啥?
自动驾驶之心· 2025-06-18 21:37
以下文章来源于智驾最前沿 ,作者陈云培 智驾最前沿 . 自动驾驶领域专业的技术、资讯分享全媒体平台。我们的slogan是:聚焦智能驾驶 ,紧盯行业前沿。 VLA 全称为" Vision-Language-Action ",即视觉 - 语言 - 动作模型,其核心思想是将视觉感知、语 言理解与动作决策端到端融合,在一个统一的大模型中完成从环境观察到控制指令输出的全过程。与传统 自动驾驶系统中感知、规划、控制模块化分工的思路不同, VLA 模型通过大规模数据驱动,实现了"图像 输入、指令输出"的闭环映射,有望大幅提高系统的泛化能力与场景适应性。 VLA 最早由 GoogleDeepMind 于 2023 年在机器人领域提出,旨在解决"视觉 - 语言 - 动作"三者协同 的智能体控制问题。 DeepMind 的首个 VLA 模型通过将视觉编码器与语言编码器与动作解码器结合,实 现了从摄像头图像和文本指令到物理动作的直接映射。这一技术不仅在机器人操作上取得了突破,也为智 能驾驶场景引入了全新的端到端思路。 在自动驾驶领域, 感知技术 通常由雷达、激光雷达、摄像头等多种传感器负责感知,感知结果经过目标 检测、语义分割、轨 ...
ForceVLA:通过力感知MoE增强接触丰富操作的VLA模型
具身智能之心· 2025-06-18 18:41
研究背景与问题提出 - 视觉-语言-动作(VLA)模型在机器人操作领域推动通用机器人发展,但处理接触丰富任务时存在局限性,尤其在视觉遮挡或动态不确定性情况下表现不佳[4] - 现有VLA模型依赖视觉和语言线索,忽略力传感模态,导致在插入、工具使用或装配等任务中行为脆弱或失败[4] - 不同任务阶段需要不同形式的力调制,如精细抓取、受控插入和顺应性表面接触,现有方法缺乏感知和适应动态变化的机制[4] 核心创新点 - ForceVLA框架将外部力传感作为VLA系统中的一等模态,引入FVLMoE融合模块动态集成视觉-语言嵌入与实时6轴力反馈[6] - FVLMoE模块通过门控机制计算专家子网络的动态路由权重,专门处理不同模态,实现力、视觉和语言特征的动态处理和深度集成[7][8] - ForceVLA-Data数据集包含五个接触丰富操作任务的同步视觉、本体感受和力-扭矩信号,共244条轨迹和14万个同步时间步[9][15] 方法细节 - ForceVLA基于π₀框架构建,集成视觉、语言、本体感受和6轴力反馈,通过条件流匹配模型生成动作[11] - FVLMoE模块将6轴力-扭矩数据转换为力token embedding,与视觉-语言特征连接后输入模块,通过稀疏混合专家层动态路由[12] - 数据采集使用Flexiv Rizon 7-DOF机械臂,配备Dahuan自适应夹具和两个RGB-D摄像头,通过Quest3 VR界面进行人类遥操作[15] 实验与结果 - ForceVLA在五个接触丰富操作任务上的平均成功率为60.5%,显著优于不使用力反馈的π₀-base模型(37.3%)[25] - 在黄瓜削皮任务中,ForceVLA平均削皮长度达14.12厘米,仅需7次strokes即可完成,优于To-base w/F的13.17厘米和10次strokes[19] - 在视觉遮挡场景下ForceVLA成功率高达90%,在五种挑战性实验条件下平均成功率达63.78%[20][22][25] - 消融研究显示ForceVLA通过FVLMoE模块实现的自适应融合成功率达80%,显著高于晚期融合(60%)和早期融合(55%)[23][26] - 多任务联合训练中ForceVLA平均成功率达67.5%,在插头插入任务中成功率100%,瓶子按压和白板擦拭任务达80%[27]
奥比中光预计前五月营收增长117% AI端侧应用快速发展助推业绩
证券时报网· 2025-06-18 18:33
业绩表现 - 2025年1月至5月累计实现营业收入3.63亿元左右,同比增长117.18%左右 [1] - 2025年1月至5月净利润5500万元左右,较上年同期增加8643.86万元左右 [1] - 2025年第一季度实现营业收入1.91亿元,同比增长105.63% [2] - 2025年第一季度实现净利润2431.50万元,较上年同期增加5309.57万元,实现扭亏为盈 [2] - 2025年4至5月预计实现营业收入约1.72亿元,同比增长约131.63% [2] - 2025年4至5月预计实现净利润约3068.50万元,较上年同期增加约3334.29万元 [2] 业务发展 - 专注于3D视觉感知技术研发,打造"机器人与AI视觉产业中台" [1] - 主要产品包括3D视觉传感器、消费级应用设备和工业级应用设备 [1] - 已在AIoT、生物识别、机器人、三维扫描等市场实现多项商业应用 [1] - AIoT领域业务呈现较快增长态势,2025年第一季度经营利润转正 [2] - 形成"技术迭代-量产提速-成本优化"的正向循环驱动范式 [2] - 全栈式研发能力和全领域技术路线布局为创新提供底层动力 [2] - 在具身智能机器人、AI端侧硬件升级等赛道具备先发和技术优势 [2] 行业趋势 - 3D视觉感知技术进入规模化商业应用快车道 [1] - 有望持续受益于各类AI端侧硬件及AI应用场景发展浪潮 [1] - 智能终端市场需求持续扩张 [2] - 智能制造基地产能快速提升 [2] - 技术壁垒与规模效应产生战略纵深优势 [2] 公司战略 - 依托3D视觉感知一体化科研生产能力和创新平台孵化新产品 [1] - 持续关注新兴领域与产品,探索技术结合应用场景 [3] - 围绕自研核心技术和产品在全球范围开拓潜在客户 [3] - "技术创新投入-商业成果转化"战略加速落地 [2]
首款超高性价比的事件相机ALPIX-Maloja问世,锐思智芯打造全新架构的低功耗端侧AI视觉系统基座
半导体行业观察· 2025-06-18 09:26
产品发布 - 锐思智芯推出全新事件传感器ALPIX-Maloja,搭载IN-PULSE DiADC架构,具备低功耗、低延时、低算力消耗和隐私保护特性,同时具有同类产品中最具性价比优势 [1] - 该产品适用于智慧家电、AON感知、智能硬件、实时看护等端侧视觉人工智能领域 [1] - 产品分辨率256×256,像素尺寸20μm×20μm,光学格式1/4",帧率1000fps,动态范围120dB,功耗<4mW@1000FPS [4] 技术优势 - 采用IN-PULSE DiADC架构,将感、存、算集成在单个像素单元内,实现紧凑结构、低功耗和稳定性提升 [9] - 具备纯事件相机基础优点:超低工作功耗<4mW@1000fps,支持AON应用;低照度下保持灵敏;无惧复杂光线环境;冗余数据量仅为传统图像传感器的10-20% [4][6][8] - 较大像素尺寸带来高量子效率,提升信噪比和灵敏度,降低串扰和噪声,减少对降噪算法的依赖 [9] 应用场景 - 消费电子设备:实现手势识别、位姿检测,提升人机交互体验 [12] - 康养看护设备:用于摔倒检测、位姿检测等场景,提供低侵入、高隐私保护方案 [14] - 智慧家电:实现存在感知、无触控制等功能,提供差异化解决方案 [15] - 智能硬件:为宠物设备等提供低功耗运动检测方案 [17] - 智慧商业与交通:用于人数统计等场景,具有隐私保护优势 [19] - AON感知:支持超低功耗始终在线监测系统 [20] 公司背景 - 锐思智芯是领先的融合视觉传感器研发商,基于Hybrid Vision Sensing技术开发ALPIX系列芯片 [22] - 公司为手机/消费电子、机器人/汽车、安防/端侧设备提供多模态融合视觉AI方案 [22] - 产品已开放客户送样,可通过官方渠道联系 [22]
跨界工商储!这家AI企业拟100%收购阳光优储
行家说储能· 2025-06-17 19:25
公司动态 - 泰禾智能拟以不超过5000万元收购控股股东阳光新能源全资子公司阳光优储100%股权,以拓展工商业用户侧储能业务 [1] - 本次交易为跨界收购,公司此前无工商业用户侧储能业务经验和技术人员储备,但认为对整体经营影响较小 [3] - 泰禾智能2024年实现营业收入5.64亿元(同比增长10.68%),净利润2146.96万元(同比增长89.89%) [3] - 阳光优储2024年营收1977.61万元(占泰禾智能营收3.51%),净亏损613.21万元;2025年1-3月营收1570.29万元(占比15%),净亏损2265.66万元 [5] 业务布局 - 泰禾智能当前核心业务为智能检测分选装备和智能包装装备,在光谱检测、智能算法和工业机器人自动化方面有技术积累 [3] - 阳光优储成立于2023年2月,注册资本2亿元,专注工商业用户侧储能项目投资、开发和运营 [5] - 阳光优储投资运营的工商业储能电站规模位列安徽省前列,采用阳光电源PowerTitan液冷储能系统和阳光新能源智慧能源解决方案 [5][7] - 阳光优储参与项目包括:安徽友进冠华工商业储能电站(35MW/70MWh)、安利股份用户侧储能电站(12.5MW/25MWh)、广悦化工用户侧储能电站(75MW/150MWh) [7] 技术协同 - 工商业用户侧储能正向市场化价值驱动转型,AI自动化预测电力市场变化成为趋势 [4] - 泰禾智能在工业AI视觉识别、光谱检测、智能算法方面的技术积累,可能应用于储能系统安全监控和智能运维场景 [4] - 收购后或将AI视觉识别等技术导入工商业用户侧储能电站的安全监控和智能运维 [4] 战略意图 - 阳光新能源为阳光电源旗下子公司,专注于光伏新能源项目开发,2023年12月已宣布启动分拆上市计划 [7] - 阳光新能源估值达193亿元,接近独角兽级别,此次交易可能为未来资本运作铺路 [7] - 交易完成后将签署协议规避阳光新能源旗下其他子公司的同业竞争问题 [8]
佰奥智能(300836) - 300836佰奥智能投资者关系管理信息20250617
2025-06-17 16:46
公司概况 - 昆山佰奥智能装备股份有限公司是智能制造整体解决方案供应商,专注智能组装装备及零组件研产销,提供成套解决方案,下游领域包括消费性电子、新能源汽车、火工品等 [2] 投资者关系活动信息 - 活动类别为特定对象调研和现场参观,参与单位有长城基金、中兵财富等多家机构,时间为2025年6月17日,地点为线下会议、电话及网络交流,接待人员有董事长肖朝蓬和董事朱莉华 [2] 产品优势与技术壁垒 - 智能组装生产线由标准化模块搭建,稳定性和可靠性高,机器视觉精准度高,柔性化、智能化和数字化程度高,单机互换性高,各单元网络化、总线控制 [2] - 已形成数字化工厂系统、特种机器人、含能材料智能制造等解决方案,在多领域深耕突破 [3] 订单情况 - 去年承接的订单正在有序交付,随着新生产安全法颁布,火工品及含能材料设备改造市场需求大,新业务规模关注公司公告 [4] 高危场景应用 - 新生产安全法促进公司产品业务增长,针对火工品行业研发的防爆机器人、本安型传感器获防爆合格证书并申请多项专利,可解决危险区域带电示教操作安全问题,在多行业有竞争优势 [5] 火工品和含能材料市场 - 公司从2014年开始研发火工品设备,2023年成立防爆机器人团队,产品提高工作效率 [6] - 市场开放竞争激烈,企业引进先进设备,公司产品可用于多行业,新生产安全法增加设备改造需求,促进业务增长 [7] - 技术壁垒集中在智能化设计和安全性防爆设计,研制设备实现智能化生产等,打破国外壁垒,实现国产化、数字化和智能化 [7] 人才激励与培养 - 公司为核心技术人员提供硬件条件,实施创新激励政策,吸引优秀人才,完善人力资源管理制度,2025年开展股权激励和员工持股计划 [8][9] 研发与专利情况 - 专注智能制造多领域技术研发,截止2024年末取得177项专利(发明专利85项、实用新型专利89项、外观专利3项),软件著作权登记46项,2024年被认定为国家专精特新小巨人企业 [10] - 研发的特种机器人可用于多种危险环境,有不同负载和关节类型,配套本安型传感器及防爆侦测系统,采用AI边缘计算与机器人结合技术 [11] - 防爆关节机器人和本安型传感器获防爆合格证书,“防爆重载搬运机器人”完成验证正申请证书,7款产品已获防爆合格证书 [11][12] - 公司根据市场情况正向研发,布局未来业务增长点 [12]
天准科技(688003)每日收评(06-17)
和讯财经· 2025-06-17 16:37
股价与主力成本分析 - 当日主力成本45 55元 [1] - 5日主力成本46 61元 [1] - 20日主力成本47 90元 [1] - 60日主力成本48 75元 [1] - 过去一年内涨停1次 跌停0次 [1] 北向资金动态 - 北向持股量31 83万股 占流通股0 16% [1] - 昨日净买入0 17万股 增仓比0 001% [1] - 5日增仓比0 02% 20日增仓比-0 033% [1] 技术面分析 - 短期压力位47 57元 短期支撑位46 14元 [2] - 中期压力位52 72元 中期支撑位45 45元 [2] - 股价跌破短期支撑位 短线需观望 [2] - 中期趋势不明朗 需等待主力资金方向选择 [2] 资金流向 - 主力资金净流出2489 25万元 占总成交额-21% [2] - 超大单净流出1330 32万元 大单净流出1158 93万元 [2] - 散户资金净流入5 83万元 [2] 财务数据 - 每股收益-0 168元 营业利润-0 43亿元 [2] - 销售毛利率30 439% [2] - 净利润-3239 28万元 [2] 行业板块表现 - 通用设备板块下跌0 09% [2] - 机器视觉板块上涨0 13% [2] - 边缘计算板块下跌0 06% [2] - 人工智能板块下跌0 16% [2]
从“幕后”到“台前”,乐动机器人研发开支下降营销开支涨三倍
北京商报· 2025-06-16 22:36
公司概况 - 乐动机器人成立于2017年,2024年首次量产割草机器人并赴港递交上市申请 [1] - 2022-2024年营收分别为2.34亿元、2.77亿元、4.67亿元,净亏损分别为7313.2万元、6849.1万元和5748.3万元 [1] - 2024年以视觉感知为核心的智能机器人领域全球市场份额1.6%,排名第一 [2] 财务表现 - 毛利率逐年下滑:2022年27.3%、2023年25.7%、2024年19.5% [2][9] - 销售成本占比持续上升:从2022年72.7%升至2024年80.5% [2][9] - 研发开支从2022年9670万元降至2024年9485.7万元,占总营收比例从41.4%降至20.3% [2][10] - 销售及营销开支大幅增长:2022年1391.2万元→2023年2127.2万元→2024年3142.7万元(同比+323%) [2][10] 产品结构 - 视觉感知产品(传感器+算法模组)占营收主导:2022-2024年占比分别为97.8%、99.1%、94% [3] - 传感器产品线: - 营收占比从2022年46.5%升至2024年72.9% [3] - 销量从2022年133.89万台增至2024年695.83万台 [5] - 毛利率维持在15-18.6%区间 [4] - 算法模组产品线: - 营收占比从2022年53.5%降至2024年27.1% [3] - 销量从2022年77.15万台增至2024年100.45万台 [5] - 毛利率维持在31.3-37.4%区间 [4] 新业务发展 - 割草机器人业务: - 2023年推出首代产品售出23台(营收6.3万元),2024年销量1.01万台(营收2327.2万元) [6] - 2024年毛利率33.6%(2023年为49.2%) [9] - 全球市场空间61亿元(2024年销量38.35万台) [6] - 潜在业务拓展: - 清洁机器人市场2024年规模59.8亿美元,大于割草机器人市场 [7] - 现有客户中清洁类机器人企业占比显著(如客户A贡献2022年28.3%营收) [6] 行业背景 - 视觉感知是智能机器人核心系统,激光雷达赋能85%以上智能机器人且渗透率持续提升 [3] - 传感器价格区间16-800元,算法模组价格区间70-240元 [4] - 营销模式以直销为主,2024年营销团队57人,通过展会及社交媒体开展活动 [10]
马斯克:摄像头和激光雷达不能共用!
半导体芯闻· 2025-06-16 18:13
智能驾驶技术路线之争 - 特斯拉坚持纯视觉路线,认为人工智能、数字神经网络与摄像头结合是最适配道路系统的方案[2][6] - 国内新势力如华为、理想则主张激光雷达的必要性,强调其在雨雾天气的安全性优势[6][7] - 小鹏汽车支持视觉+大模型方案,认为激光雷达在远距离探测中存在信息密度低、易受干扰等缺陷[8][9][10] 激光雷达技术局限性 - 激光雷达远距离探测时能量密度呈平方反比衰减,192线激光雷达在200米外的信息获取能力弱于800万像素摄像头[10] - 多径效应导致复杂地形下信号失真,主流激光雷达帧率不足摄像头一半,影响高速移动物体识别[10] - 近红外光波长特性使其易受雨雪雾干扰,几米内形成噪点,穿透性弱于毫米波雷达[11] 视觉方案技术优势 - 高分辨率摄像头可更有效区分远距离目标(如塑料袋与电瓶车)[10] - 摄像头帧率更高,配合大模型能减少高速场景下的识别误差[10] - 特斯拉补充麦克风用于识别紧急车辆声音,增强环境感知维度[6] 行业技术路线对比 - 华为强调激光雷达对安全性的不可替代性,认为摄像头存在致盲风险[6][7] - 小鹏指出激光雷达"看得远"是伪命题,实际应用中受物理定律限制[9][10] - 特斯拉认为多传感器冲突可能导致系统自相矛盾,纯视觉方案更符合道路设计原理[6]