视觉

搜索文档
希荻微: 希荻微关于向全资子公司增资的公告
证券之星· 2025-05-22 20:26
增资情况概述 - 公司拟以自有资金3,000万美元(约合人民币21,597.30万元)向全资子公司香港希荻微增资,增资后投资总额将从90,001,300美元增至120,001,300美元,持股比例保持100% [1][2] - 增资目的为支持智能视觉感知业务发展及满足境外子公司经营需求,2024年第四季度起音圈马达驱动芯片产品线已从贸易模式转为自主委外生产模式 [1] - 2022年12月通过香港希荻微与韩国Dongwoon Anatech合作开拓智能视觉感知业务,2023年Q2起以自有品牌布局该业务 [1] 增资标的财务数据 - 香港希荻微2024年末资产总额100,874.26万元,负债39,360.28万元,净资产61,513.98万元;2025年3月末资产降至96,535.87万元,负债降至34,846.93万元 [4] - 2024年度营业收入53,654.19万元,净亏损9,449.41万元;2025年1-3月营业收入17,924.23万元,净亏损收窄至998.46万元 [4] 业务布局与战略影响 - 公司通过境外二级子公司Halo Microelectronics International Corporation控股Zinitix,纳入合并报表范围 [1] - 2024年围绕智能视觉感知业务搭建供应链与技术团队,推动贸易模式向自产模式转换,并组建研发团队开展下一代产品预研 [1] - 增资将增强香港希荻微资本实力,促进境外子公司运营能力,符合公司战略规划与境外业务发展需求 [5] 审批程序与股权结构 - 2025年5月22日董事会审议通过增资议案,无需提交股东大会,尚需国内发改委、商务、外汇等部门备案及香港变更登记 [2] - 香港希荻微成立于2013年10月4日,主营业务为集成电路模拟芯片的物流、采购及销售,公司持有其100%股权 [3][4]
大摩分析师:关于特斯拉,这是马斯克最重要的一句话,跟小米YU 7有关
华尔街见闻· 2025-05-22 20:23
特斯拉战略方向 - 马斯克强调长期发展重点为自动驾驶和Optimus机器人[1] - 公司将在40天内在德克萨斯州奥斯汀推出完全自动驾驶的Cybercab 初期部署10辆 计划几个月内扩展到1000辆[3] - 优先在特斯拉友好州(德克萨斯 内华达 加利福尼亚 佛罗里达)部署服务 最终形成"枢纽-辐射"网络模式[3] 自动驾驶技术路线 - 特斯拉坚持"视觉优先"技术路线 认为多传感器系统容易产生混淆导致事故[4] - 马斯克指出美国缺乏联邦自动驾驶标准 呼吁制定统一国家法规[4] - 公司可能向其他汽车制造商开放FSD授权 但摩根士丹利认为其重要性已降低[4] 市场竞争格局 - 小米YU7成为特斯拉新竞争对手 外观设计高端(类似法拉利/阿斯顿马丁)但价格亲民(与丰田凯美瑞相当)[1][4][5] - 摩根士丹利质疑特斯拉是否应继续推出传统方向盘电动车 建议专注前沿技术领域[5] - 小米YU7的性价比优势给特斯拉带来市场竞争压力[4]
智能辅助驾驶竞速与暗战:自研派VS合作派,功能水平分化加剧
贝壳财经· 2025-05-22 18:37
车企自研辅助驾驶技术进展 - 理想汽车智能驾驶正式进入AI大模型时代,本次OTA更新重点围绕智能驾驶能力升级,同步更新智能空间和智能电动 [3] - 蔚来智能辅助驾驶NOP+截至3月31日已避免超350万次碰撞风险,截至2025年5月15日累计行驶里程达49.357亿公里 [3] - 奇瑞猎鹰智驾系统分为500/700/900三个级别,依托1600万全球用户每年积累超20亿公里智驾里程,生成1000万+高价值训练数据和180万+世界模型场景 [3] - 音和汽车千里浩瀚规划了H1/H3/H5/H7/H9等多层级辅助驾驶方案,吉利控股旗下极氪、领克等品牌将采用该系统 [3] - 广汽集团GSD智能驾驶辅助系统基于生成式AI端到端架构,已沉淀500万用户驾驶场景和超4000万公里L4级Robo-taxi数据 [3] 行业技术路线分化 - 比亚迪全栈自研"天神之眼"系统,与小鹏、理想等同属第一梯队车企自研阵营 [4] - 博世认为中阶智能辅助驾驶应交给供应链处理,主机厂每年投入数亿至数十亿全栈自研成本过高 [4] - 华为预计2024年将有7家车企10个品牌采用乾崑解决方案,包括长安深蓝、赛力斯问界等,预计采用华为智驾汽车超50万辆 [4] 华为合作模式分析 - 华为汽车业务有三种合作模式:零部件供应模式(如宝马、比亚迪)、HI模式(如北汽极狐、阿维塔)、智选车模式(问界、智界) [5] - 智选车模式合作深度最紧密,华为参与产品设计、营销及销售,合作车型会在华为体验中心展示 [5] - 上汽集团从"掌握灵魂"转向与华为合作尚界,但合作伙伴面临核心技术自主性质疑 [6]
纯视觉向左融合感知向右,智能辅助驾驶技术博弈升级
36氪· 2025-05-22 11:35
特斯拉纯视觉方案 - 公司坚持视觉处理方案,目标是让人人买得起安全智能的产品[1] - 即将推出基于纯AI技术的通用型全自动驾驶(FSD)解决方案,延续2016年以来的视觉优先战略,完全抛弃激光雷达[1] - 方案仅依靠摄像头和自研芯片实现L4-L5级自动驾驶,连毫米波雷达也已弃用[4] - 视觉方案搭配端到端神经网络架构,通过数十亿真实世界数据样本训练,实现多场景安全驾驶[4] - 公司认为先进技术不需要昂贵繁杂的传感器,纯视觉最贴近人类驾驶习惯,是自动驾驶的"第一性原理"[4] 激光雷达市场发展 - 全球乘用车激光雷达市场2024年同比增长68%,规模达6.92亿美元[1] - 中国激光雷达配置车型达94款,相比上一年度翻倍[1] - 激光雷达成本8年内降低99.5%,从数千美元降至200美元左右[1] - 行业认为激光雷达正从"可选功能件"进化为"必选安全件"[1] - 2024年高阶智能辅助驾驶进入20万元以内市场,激光雷达上车趋势明显[19] 技术路线对比 纯视觉方案 - 依靠摄像头捕捉RGB图像数据,通过深度学习算法提取语义特征[6] - 最大优势是硬件成本低、系统集成简单,但依赖算法处理能力[6] - 在恶劣天气和复杂光照条件下可靠性面临挑战[6] - 需要处理大量图像数据,对系统算力和能耗要求高[6] 多传感器融合方案 - 结合激光雷达、摄像头、毫米波雷达等多种传感器[8] - 激光雷达测距精度达厘米级,不受光照影响[11][12] - 摄像头提供丰富语义信息但受环境影响大[11][12] - 毫米波雷达在恶劣天气表现稳定但分辨率低[11][12] - 多传感器融合可弥补单一传感器缺陷,提升系统鲁棒性[17] 市场应用差异 - 特斯拉FSD在北美渗透率超30%,但可能低估中国路况复杂性[7] - 中国车企针对"鬼探头""加塞"等本土场景开发针对性解决方案[7] - 理想汽车CEO表示激光雷达在中国路况下可实现130公里/小时AEB功能,比纯视觉方案探测距离更远[16] - 华为、理想等企业认为L3/L4级自动驾驶必须配备激光雷达[13] 行业发展趋势 - 技术路线本质是"算法驱动"与"硬件驱动"的理念之争[16] - 特斯拉通过海量数据训练全能算法,国内车企通过硬件堆砌安全冗余[16] - 行业正从"单车智能"向"系统智能"演进,结合V2X实现协同控制[19] - 智能辅助驾驶进入规模化普及阶段,安全是行业不可逾越的底线[20]
憋了大招?雷军官宣小米 YU7 座舱新设计
搜狐财经· 2025-05-22 01:21
小米 15 周年战略新品发布会,将于明天晚上 7 点举行,届时除了有小米手机和小米平板等新品发布 外,压轴新车小米 YU7 也将正式登场。 今天,雷军就通过网络社交平台,公布了小米 YU7 全新的「宝石绿」车漆配色。 小米 YU7 上的「天际屏」并不是一块带鱼屏,而是采用了类似宝马概念车上的 PHUD 成像技术。 这条长长巨幕底部设计了多个投影装置,可以根据需要将不同的信息投影至黑色的长条区域里,相比实 体屏幕,投影的的观感可以提供更好的沉浸感和纵深感,也更加的科幻。 这个功能,有可能会是小米 YU7 的重要卖点之一。 据我所知,这种高亮绿车漆,很多时候只在传统的豪华汽车品牌的跑车上出现,例如阿斯顿·马丁、捷 豹、宾利等轿跑车型,满满的欧式英伦风。 而小米的「宝石绿」结合 YU7 的轿跑 SUV 车身设计,远远看去有一种生机勃勃的灵动感。 不仅于此,小米 YU7 的座舱还将搭载全新视觉交互系统「小米天际屏全景显示(Xiaomi Hypervision)」,并成为首发量产这一技术的车型。 从宣传视频中可以看到,在前风挡玻璃下有一条巨长显示区域,环绕在前挡风玻璃和仪表台之间,贯穿 左右 A 柱。 据悉,和此前阿维 ...
为什么生命如此多彩? | 红杉爱科学
红杉汇· 2025-05-21 23:21
生物多样性主题 - 今年国际生物多样性日主题为"万物共生 和美永续",强调人与自然和谐共生对全球生物多样性保护治理的重要性 [2] - 生物多样性构成人类生存根基,但全球物种遗传多样性正加速丧失,鸟类和哺乳动物受影响最显著 [2][10] - 地球生命色彩从灰棕主色调进化至五彩斑斓,与视觉系统进化(如三色视觉)及动植物色彩革命密切相关 [4][5] 生命色彩进化机制 - 色彩进化始于6亿年前视觉系统发展,三色视觉与寒武纪大爆发(5.41亿年前)同步出现 [4] - 植物引领首场色彩革命:彩色果实出现于3-3.77亿年前,花朵进化于1.4-2.5亿年前,被子植物(开花植物)在白垩纪(约1亿年前)推动色彩大爆发 [5] - 动物显著色彩进化始于1.4亿年后,色彩功能包括吸引配偶(孔雀)、警戒信号(毒箭蛙)等,但不同物种感知色彩存在差异(如蜜蜂可见紫外线) [5][6] 遗传多样性保护策略 - 全球研究覆盖622个物种、36个分类群,显示栖息地破坏和人类活动导致遗传多样性加速流失 [10] - 五项有效保护措施: 1) 补充种群(如新西兰南岛鸲鹟跨岛迁移提升免疫力和繁殖力) [11] 2) 种群调控(美洲红点鲑基因谱系管理) [12] 3) 生态系统恢复(草原松鸡栖息地扩展) [13] 4) 控制入侵物种(瑞典赤狐管控助北极狐恢复) [14] 5) 保护引种与再引入(金袋狸新种群六代后遗传多样性持平原始种群) [15] 公众参与途径 - 种植本地植物、保护传统农作物品种可维护农业遗传多样性 [17] - 参与自然保护组织活动及避免跨境传播外来物种有助于生态保护 [17]
奥普特(688686):2024年报及2025年一季报点评:业绩短期承压,研发高度重视
国元证券· 2025-05-21 23:16
报告公司投资评级 - 维持“增持”评级 [1] 报告的核心观点 - 奥普特2024年业绩短期承压但重视研发,2025Q1营收因产品结构优化及AI算法升级推动3C电子领域需求回暖而增长 [2] - 技术突破驱动应用深化,在锂电、3C电子、半导体和汽车领域有显著进展 [3] - 预计公司2025 - 2027年营收和归母净利润增长,维持“增持”评级 [4] 根据相关目录分别进行总结 业绩情况 - 2024年营收9.11亿元,同比 - 3.44%;归母净利1.36亿元,同比 - 29.66%;扣非净利润1.16亿元,同比 - 28.62%;毛利率63.57%,同比 - 0.66pct;净利率14.95%,同比 - 5.57pct;研发投入2.17亿元,同比增长7.28%,研发投入占比达23.81% [2] - 2025Q1营收2.68亿元,同比 + 18.09%;归母净利0.58亿元,同比 + 0.97% [2] 各领域业务进展 - 锂电领域:高精度成像技术及AI检测方案在核心工艺突破,模型与数据共享使项目实施效率提高50%,XG系列相机检测率达99.8%,覆盖头部厂商 [3] - 3C电子领域:2024年营收58,478万元,同比增长0.74%,10GigE相机成像一致性提升约10% [3] - 半导体和汽车领域:半导体行业收入5,081万元,同比增长44.08%;汽车行业收入3,210万元,同比增长89.95%,晶圆缺陷检测达亚微米级精度,芯片缺陷检测精度达0.2μm [3] 投资建议与盈利预测 - 预计2025 - 2027年营收分别为10.99/13.21/15.74亿元,归母净利润分别为1.96/2.45/2.97亿元,对应EPS为1.60/2.01/2.43元/股,对应PE估值分别为54/43/36倍 [4] 财务数据 - 2023 - 2027年营业收入分别为9.44/9.11/10.99/13.21/15.74亿元,收入同比分别为 - 17.27%、 - 3.44%、20.62%、20.17%、19.11% [6] - 归母净利润分别为1.94/1.36/1.96/2.45/2.97亿元,同比分别为 - 40.37%、 - 29.66%、43.66%、25.34%、21.00% [6] - ROE分别为6.73%、4.67%、6.35%、7.49%、8.47% [6] - 每股收益分别为1.58/1.11/1.60/2.01/2.43元 [6] - 市盈率分别为54.89/78.04/54.32/43.34/35.82倍 [6]
机器人数据仿真专家
2025-05-21 23:14
纪要涉及的行业和公司 - 行业:机器人、自动驾驶 - 公司:NV、Avia、特斯拉、国家智能网联汽车创新中心 纪要提到的核心观点和论据 仿真数据在机器人任务训练中的有效性 - 有效性取决于任务类型和仿真与真实世界差异,VLA 仿真在虚拟环境效果好,迁移到现实场景差,现阶段适合算法原型验证 [3] - 局部运动类任务从仿真迁移到现实场景可行性更强,主要依赖电机信号和本体姿态,需考虑地面摩擦力 [4] 机器人训练的数据生成方法 - 常用传感器仿真、物理交互和场景重建方法,构成完整仿真系统,但面临高逼真图像生成、物理参数模拟和数据匹配真实世界分布的挑战,多用于快速验证算法原型 [5] 仿真器在机器人训练中的应用 - 优势是电信号仿真准确,开发团队常自行开发;局限是环境交互效果差,感知层面数据分布与真实世界差异大,可迁移性取决于任务数据分布差距 [6] 通过观看视频训练自动驾驶系统和机器人 - 有效性存在争议,视频数据与实际操作数据模态不同,重建复杂且精度难保证,只能作为辅助手段 [7][8][9] 结合传统动补数据与仿真数据的方法 - 在自动驾驶感知领域使用过,效果有限,因仿真数据简单,若仿真器对物理描述发达,理论上可用假数据完成本体训练,但目前未实现 [11] 第三方仿真工具评价 - ISAC 平台功能全面但笨重不易上手,新兴轻量级智能仿真器如 Discover、RoboTone 和 RobotWars 更具优势,适合巨量数据生成需求 [12] 仿真器发展对芯片公司市场竞争力的影响 - 优秀的辅助工具链能吸引公司选择特定硬件,增强芯片公司市场地位,如 NV 推广 ESPEC 仿真器推动云上 GPU 销售 [13] 专用芯片对训练好的模型部署的影响 - 影响不大,模型可部署到不同芯片,用户根据通用性和算力选择端侧芯片 [14] 仿真平台提升仿真精度的情况 - 特殊传感器仿真已存在,但真实世界信号有随机噪声,难以完全仿真,目前传感器仿真质量参差不齐 [15] 当前主流的数据采集及训练方式 - 自动驾驶依赖真实量产数据闭环,机器人领域探索依靠仿真器,国际共建数据采集中心数据质量低,仿真数据训练的模型在真实世界泛化性差 [17] 数据和模型对齐方面的挑战 - 最大挑战是数据,硬件不统一和数量不足导致数据量少、质量差,跨本体数据无法使用,模型早期发展激进,需先模仿学习再转向 VELA 路线 [20] 跨本体之间的数据运用问题 - 存在问题,硬件自由度和尺寸差异会影响数据使用,差异大时仿真效果等同于重新训练 [21][22] 解决不同公司间零散化数据问题的方法 - 标准化硬件尺寸和旋转比例,减少差异,提高数据利用效率 [23] 工业场景中机器人学习的情况 - 采集数据成功率低,因动作轨迹含干扰信号和遥操作技术不成熟,目前精确度达 90%,有提升空间,人形机器人适合通用性任务而非精细化操作 [24][25][27] 数据采集确保未来数据有效使用的方法 - 采用解耦方式,标准化传感器并解耦本体,确保数据共用性 [28] Tesla FSD 算法框架迁移到机器人领域的情况 - 可以迁移,深度学习模型和网络结构基本不变,但数据模态、输入输出需重新定义和训练,基础设施和芯片可复用 [30] 国家智能网联汽车创新中心的数据采集方式 - 主要通过遥操方式,人员佩戴外骨骼或 VR 设备操作机器人,用惯性设备捕捉手部动作,高精度光捕设备因成本高较少使用 [31] 其他重要但可能被忽略的内容 - 完成单个舞蹈动作所需数据量少,一个模型解决一个特定动作,注重从仿真到真实世界的迁移性 [18][19] - 机器人若能通过观看视频学习任务完成逻辑,学到的是思维链能力,可通过监督训练实现 [16] - 当前阶段人形机器人无法实现边走路边拿水的动作,因运动模块感知能力不足、数据量和标准不够 [29]
思看科技(688583):3D视觉核心优势,物理AI第一步(“智”造TMT系列之三十二暨空间智能系列之二)
申万宏源证券· 2025-05-21 19:18
报告公司投资评级 - 首次覆盖,给予“买入”评级 [1][7][8][129] 报告的核心观点 - 思看科技是全球竞争力的3D扫描仪领军厂商,产品面向高端制造,3D算法、结构设计是核心优势 [7] - 公司有两大发展驱动,一是工业领域纵深、专业领域拓展,二是成为物理AI第一步、后续成为机器人的“眼睛” [7] - 预计公司25 - 27年分别实现收入4.3、5.5、7.3亿元,实现归母净利润1.6、2.1、2.7亿元,给予公司可比公司平均的25年PE 69x,对应“买入”评级 [7][8][120][129] 根据相关目录分别进行总结 高精度3D扫描仪领军厂商 - 思看科技是3D视觉数字化综合解决方案提供商,以3D扫描仪为主,核心竞争力是算法、结构设计和3D软件技术 [18] - 公司产品矩阵丰富,从2015年推出手持式三维扫描仪开始不断拓展,应用于逆向工程、3D检测、3D打印等工业场景 [19][23] - 公司业绩稳健增长,标准化能力强,经营质量高,境外收入持续高增,覆盖多行业核心客户 [40][42][45][51] - 公司管理层年轻化,学术背景深厚,创始人团队长期共同创业且为实际控制人 [54][55] 硬件是载体,算法及结构是核心 - 公司核心是成像算法和光学结构能力,形成三大核心技术集群,掌握18项核心技术,在算法及软件方面有自主研发能力 [58] - 三维识别重建技术包括快速高精度边缘计算、内置摄影测量复合扫描、多波段扫描技术,可提升扫描效率和精度 [61][66][69] - 三维立体延伸技术包括跟踪范围扩展、孔测量、自动化三维扫描技术,可全方位获取真实三维数据 [70][74][76] - 立体视觉标定技术包括多波段扫描标定和自动标定技术,可自动化完成标定及3D扫描 [81][85] 驱动一:全球竞争力,产品渗透率提升 - 纵向来看,非接触扫描式测量有望取代传统接触式测量,国产扫描仪有价格优势,思看科技国内领先、全球第二,市占率有提升空间 [86][92][94] - 横向来看,三维视觉数字化产品分工业级、专业级和商业级,公司从工业精度下沉至专业级产品优势显著、空间广阔,如在医疗领域与强脑科技合作 [95][96][97] 驱动二:物理AI第一步,长期发挥视觉算法优势 - 物理AI是机器人重要实现基础,可完成与现实世界交互、生成物理数据以供训练 [103] - 公司3D高精度扫描可构建真实物理环境,从“万物数字化”到“虚拟物理世界”逻辑一致,长期有望成为人形机器人的“眼睛” [111][114][117] 盈利预测及估值分析 - 预计公司25 - 27年分别实现收入4.3、5.5、7.3亿元,工业级产品增速维持在25%,专业级产品增速维持在100% [120][121][122] - 预计公司25 - 27年实现归母净利润1.6、2.1、2.7亿元,工业级领域25 - 27年毛利率为77%/78%/80%,专业级领域为74%/75%/76% [125][127] - 选取凌云光、奥普特、铂力特为可比公司,给予公司可比公司平均的25年PE 69x,对应“买入”评级 [128][129]
纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究
量子位· 2025-05-21 12:01
核心观点 - 剑桥、伦敦大学学院和谷歌的研究团队推出首个纯粹依靠图像进行推理的新范式——基于强化学习的视觉规划(VPRL),不再依赖语言中介 [1] - VPRL在多个视觉导航任务中准确率高达80%,性能超文本推理至少40%,首次验证视觉规划显著优于文本规划 [4][27] - 新框架利用GRPO对大型视觉模型进行后训练,性能表现远超基于文本的推理方法 [3][9] 技术框架 - VPRL分为两个阶段:策略初始化阶段通过随机游走轨迹初始化模型并最小化监督损失,强化学习优化阶段通过GRPO计算组内相对优势并最大化目标函数 [10][11][14][15] - 框架通过奖励函数评估动作有效性,奖励进展动作、零奖励非进展动作、惩罚无效动作 [16] - 选用VPFT和SFT作为基线比较,VPFT用最佳规划轨迹取代随机轨迹,SFT用文本描述取代中间视觉结果 [17] 实验设计 - 选取FrozenLake、Maze和MiniBehavior三个完全以视觉方式表达和执行的代表性任务 [19][20][21] - 采用LVM-3B作为视觉模型,Qwen 2.5VL-Instruct、Gemini 2.0 Flash和Gemini 2.5 Pro作为文本和多模态参考模型 [23] - 评估指标采用精确匹配率(EM)和进展率(PR),衡量模型生成规划轨迹的准确性和连续性 [25] 实验结果 - VPRL在三个任务中平均EM高达80.6%,远超文本基线(Gemini 2.5 Pro平均EM为43.7%) [27] - VPRL相比监督基线VPFT提升超20%,在复杂任务MiniBehavior中EM高达75.8% [28] - 随着网格尺寸增大,VPRL性能下降平缓(EM从97.6%降至82.4%),而Gemini 2.5 Pro从98.0%骤降至38.8% [31] - VPRL将无效失败率降低了24%,在FrozenLake、Maze和MiniBehavior任务中分别降至36.9%、25.1%和29.6% [32][33] 行业影响 - 首次验证纯视觉推理的可行性,推动多模态推理向更直观的图像化方向发展 [34] - 相关代码已开源,可供行业进一步研究和应用 [5] - 团队成员长期致力于视觉推理研究,曾研究通过多模态思维可视化(MVoT)生成视觉"思想" [34]