多模态感知 - 财报，业绩电话会，研报，新闻 - Reportify

多模态感知

搜索文档

荣耀CEO李健：智能体YOYO具备自进化能力

第一财经· 2025-10-15 20:22

公司产品与技术 - 荣耀CEO李健在10月15日Magic8系列新品发布会上宣布YOYO智能体具备自进化能力 [1] - 公司自研的VLA大模型MagicGUI具备多模态感知和自动化执行规划能力 [1] - 公司声称其MagicGUI大模型整体领先GPT4o [1]

自进化能力

多模态感知

自动化执行规划能力

Consumer Electronics

自进化能力

多模态感知

自动化执行规划能力

Consumer Electronics

具身智能之心近20个交流群来啦！欢迎加入

具身智能之心· 2025-09-23 12:00

文章核心观点 - 成立具身智能之心技术交流群，旨在聚集行业专业人士共同承担具身智能领域未来领导者的角色 [1] 技术交流群定位与目标 - 交流群覆盖近20个具身智能子技术方向 [1] - 目标是与成员共同承担该领域未来领导者的角色 [1] 目标成员与研究方向 - 欢迎从事人形机器人、四足机器人、机械臂等本体研究的专业人士加入 [1] - 研究方向包括视觉语言导航、大模型、视觉语言交互、强化学习、移动操作、多模态感知、仿真、数据采集等 [1] 加入方式 - 可通过添加指定微信账号并备注“加群+昵称+研究方向”的方式申请加入 [1]

多模态感知

多模态感知

2025年中国机械臂‌行业政策、产业链全景、市场规模、竞争格局及发展趋势研判：应用场景多元化，医疗等新兴领域成为发展重点[图]

产业信息网· 2025-09-05 09:12

机械臂行业相关概述 - 机械臂是一种拟人手臂、手腕和手功能的机电一体化装置，能够根据空间位姿要求移动物体或操作工具，执行多种工业任务和智能化操作 [2] - 现代机械臂集机械、电子、控制、计算机、传感器和人工智能等多学科先进技术于一体，核心价值在于替代或协助人类完成重复性、高精度或危险环境下的作业任务 [2] - 机械臂系统由驱动系统、机械结构系统、感知系统、控制系统和交互系统五大子系统构成，协同完成复杂任务 [3] - 机械臂分类方式多元，包括按驱动方式分为液压式、气动式和电动式，按运动轨迹分为点位控制和连续轨迹控制，按坐标形式分为直角坐标型、圆柱坐标型、球坐标型和关节型，其中关节型机械臂灵活性最高，是工业领域最主流形态 [5] 中国机械臂行业发展政策 - 国家出台《"十四五"机器人产业发展规划》明确2025年制造业机器人密度目标，《"机器人+"应用行动实施方案》推动机械臂在汽车、电子等20+重点领域深度落地 [6] - 《人形机器人创新发展指导意见》前瞻布局具身智能新赛道，《5G规模化应用"扬帆"行动升级方案》赋能机械臂远程操控与云边协同 [6] - 《关于优化全生命周期监管支持高端医疗器械创新发展的公告》加速手术机械臂等医疗装备审批上市 [6] - 政策组合拳从技术攻关、场景拓展、网络支撑到监管创新形成全链条赋能，构建"技术研发-场景验证-规模商用"的良性发展生态 [6] 中国机械臂行业产业链 - 上游核心零部件与基础材料涵盖精密减速器、伺服系统、控制器、传感器及钢铁、冶金等，谐波减速器、高精度伺服系统等领域国产化率显著提升，但部分高端减速器、精密传感器仍依赖进口 [8] - 中游为本体制造和系统集成，国际"四大家族"占据高端市场，埃斯顿、汇川技术等国内企业通过性价比和定制化服务加速替代 [8] - 下游应用以汽车制造25%、3C电子24%为核心，新能源、金属加工等领域需求快速增长，并向物流、医疗等新兴场景渗透 [8] - 减速器行业2024年市场规模达1448亿元同比增长44%，预计2025年将跃升至1510亿元，人形机器人量产推动需求指数级增长 [8] - 伺服系统2024年市场规模约223亿元较上年增长144%，预计2025年将突破250亿元 [10] - 智能传感器2024年市场规模达15512亿元同比增长16%，预计2025年将突破17955亿元，其中工业级多模态传感器占比超45% [10] - 下游应用市场中汽车行业占比约32%，3C电子占25%，金属加工占12%，物流占9%，医疗健康等新兴领域增速显著 [11] 中国机械臂行业发展现状分析 - 2025年上半年工业机器人产量突破3693万台同比增长356%，服务机器人产量增速达255% [11] - 2024年工业机器人市场规模达827亿元同比增长1616%，智能服务机器人市场规模857亿元增速2985%，特种机器人市场近五年年均复合增长率高达2717% [11] - 2024年中国机械臂市场规模达1934亿元同比增长376%，预计2025年将攀升至2089亿元 [12] - 技术革新是核心驱动力，大疆睿炽智能机械臂可识别超2000种零件分拣效率达1200件/小时，优傲UR20提升生产效率30%以上 [12] 中国机械臂行业竞争格局 - 行业竞争呈现"本土崛起加速、国际巨头固守高端、细分领域差异化竞争"的三元结构特征 [12] - 国际品牌如ABB、发那科、库卡、安川在汽车焊接、半导体精密装配等高端市场占据主导地位 [12] - 本土头部企业如埃斯顿、新松、汇川技术覆盖全系列产品，在SCARA机器人、重载机械臂等领域市占率超40% [12] - 腰部企业如节卡、珞石、越疆深耕协作机械臂、物流分拣、医疗手术等细分场景形成差异化优势 [12] 中国机械臂行业发展趋势分析 - AI与多模态感知技术推动机械臂从"执行工具"向"智能伙伴"跃迁，实现动态环境下的自主决策与柔性协作 [13] - 协作机械臂轻量化、模块化设计加速普及，负载<10kg并能与人类在1米范围内安全协作 [14] - 应用场景从传统工业向医疗、农业、服务等非工业领域爆发式拓展 [13] - 医疗领域手术机械臂定位精度将达005mm，农业场景果蔬采摘机械臂潜在市场规模超200亿元，服务机器人领域2030年全球出货量或突破500万台 [15] - 产业链上下游通过"硬件国产化+软件生态化+服务模式创新"构建闭环，核心部件国产化率预计2025年突破80%成本降低40% [16] - 中国机械臂企业通过并购海外品牌获取技术资源，依托"一带一路"输出智能工厂解决方案，2030年海外市场份额有望从当前15%提升至30% [16] - 中国有望在2030年占据全球30%以上市场份额，实现从"市场跟随"到"规则引领"的跨越 [13]

多模态感知

多模态感知

汉王科技(002362)：看好后续公司新品导入

新浪财经· 2025-08-28 14:37

财务表现 - 2025年上半年营收8.13亿元，同比增长13.81% [1] - 归母净亏损5672.66万元，同比扩大11.66% [1] - 第二季度营收4.27亿元，环比增长10.37% [1] - 经营活动现金流量净额-1.72亿元，同比下降90.69% [3] 业务板块表现 - 笔智能交互业务收入占比58.89%，同比增长14.85%，毛利率提升2.58个百分点 [2][3] - AI终端业务收入占比28.70%，同比增长21.78%，毛利率提升0.90个百分点 [2][3] - 多模态大数据业务收入占比10.89%，同比增长0.99%，毛利率下降1.10个百分点 [2][3] - AI读写智能本及阅读器收入同比增长约50% [2] 费用与成本结构 - 期间费用4.12亿元，同比增长12.87% [3] - 期间费用率50.66%，同比下降0.42个百分点 [3] - 利润承压主要源于新品拓展导致的研发及销售费用增加 [1][3] 新产品进展 - 绘画平板销售表现良好 [2] - 推出多模态大数据产品"智诉助理" [2] - AI柯氏音电子血压计在多平台销额排名靠前 [2] - 新一代磁容触控技术（EMC）芯片具备电容笔和电磁笔双重优势 [4] - 仿生智能狗融合多模态感知模块，支持自主充电与全天候工作，主要面向安防巡检场景 [4] 未来展望 - 预计2025-2027年营业收入22.59/29.51/38.55亿元 [5] - 智能笔芯片技术有望导入大客户 [4] - 机器狗产品预计年底实现商用化 [4] - 公司将通过供应链优化和精细化运营稳定经济效益 [3]

汉王科技(SZ:002362)

磁容触控技术（EMC）

多模态感知

智能笔芯片

仿生智能狗

磁容触控技术（EMC）

多模态感知

智能笔芯片

仿生智能狗

北京将显著提升文物研究阐释与智慧化展示水平

新华社· 2025-08-24 22:14

行业发展规划 - 北京市文物局印发《北京市文物科技创新发展规划（2025—2035年）》，提出到2035年显著提升文物研究阐释与智慧化展示水平，推动文物与科技深度融合 [1] - 北京文物工作存在科技创新能力不足、科技应用水平不高、基础设施不完善等短板，包括不可移动文物保护技术手段创新性不足、博物馆新技术应用供给不足、高层次科技人才缺乏等问题 [1] 技术应用方向 - 持续推进人工智能、大数据、虚拟现实、多模态感知等前沿技术在文博领域的创新应用 [1] - 深化物联网、人工智能技术在博物馆智能安防和文物库房智能管控中的应用 [2] - 利用VR、AR、文物知识图谱、超高清视听等技术创新博物馆展览形式和文物活化模式，增强科技感和公众体验感 [2] 数据资源建设 - 充分利用第四次全国文物普查成果，汇聚历次普查数据形成不可移动文物数据基座 [1] - 加大不可移动文物三维数据采集力度，构建古建筑数字资源库 [1] 文物保护研究 - 强化馆藏文物科技保护，重点加强丝织品、书画等脆弱易损材质的保护研究 [2] - 研发适用于木结构古建筑保护修复、保养维护的新材料新工艺 [1] 人才培养与成果转化 - 鼓励高校设立文物科技相关交叉学科，构建多层次、多领域的文物科技人才培养体系 [2] - 加大科技成果转化政策支持，形成完善的科技成果转化激励机制和一批示范项目 [2]

多模态感知

文物保护与文博

不可移动文物数据基座

多模态感知

文物保护与文博

不可移动文物数据基座

Humanoid Occupancy：首个多模态人形机器人感知系统！解决运动学干扰和遮挡问题

具身智能之心· 2025-08-21 08:03

人形机器人技术发展趋势 - 人形机器人技术正在飞速发展，各大制造商纷纷推出针对特定场景、形态各异的异构视觉感知模块 [2] - 在各种感知范式中，基于占用的表示已被广泛认为特别适合人形机器人，因为它能同时提供丰富的语义信息和三维几何信息，这对于全面理解环境至关重要 [2] - 人形机器人作为通用型和复杂性最高的机器人形态，承载着对未来机器人和人工智能的想象，目前其运动控制和自主感知都处于非常关键的突破性时刻 [6] Humanoid Occupancy感知系统核心创新 - 提出了Humanoid Occupancy，这是一个广义的多模态占用感知系统，集成了硬件与软件组件、数据采集设备以及一套专用的标注流程 [3] - 该框架采用先进的多模态融合技术，生成基于网格的占用输出，这些输出同时编码了空间占用状态和语义标签，从而为任务规划与导航等下游任务提供了全面的环境理解能力 [3] - 为应对人形机器人的独特挑战，克服了诸如运动学干扰和遮挡等问题，并确立了一套有效的传感器布局策略 [3] - 开发了首个专为人形机器人设计的全景占用数据集，为该领域未来的研究与发展提供了宝贵的基准和资源 [3] - 网络架构融合了多模态特征和时序信息，以确保感知的鲁棒性 [3] - 该系统为人形机器人提供了有效的环境感知能力，并为标准化通用视觉模块奠定了技术基础，从而为复杂现实场景中人形机器人的广泛部署铺平了道路 [3] 行业研究与应用重点 - 行业研究领域正进行持续迭代，推出了多个移动和操作算法，并提出了Humanoid Occupancy多模态感知系统，旨在推动人形机器人的智能化进展 [6] - 当前研究重点方向包括：人形机器人的运动控制、人形机器人多模态感知系统、人形机器人的自主化移动、人形机器人的操作与相关数据 [8]

多模态感知

Humanoid Occupancy（人形机器人占用感知系统）

多模态感知

Humanoid Occupancy（人形机器人占用感知系统）

自动驾驶之心项目与论文辅导来了~

自动驾驶之心· 2025-08-07 20:00

自动驾驶之心项目与论文辅导 - 项目正式推出自动驾驶领域论文辅导服务旨在解决学生在研究过程中遇到的环境配置创新点实现模型调试等疑难问题 [1] - 过往辅导成果显著部分学员成功在CVPR ICRA等顶级会议发表论文 [1] - 2024年计划扩大辅导规模目标助力更多学员冲击顶会 [1] 主要辅导方向方向1：多模态与计算机视觉 - 覆盖端到端自动驾驶 BEV感知大模型等前沿技术领域 [2][3] - 辅导老师为华为天才少年计划入选者在CVPR/ICCV/ECCV/NIPS等顶会发表论文30+篇总引用量超6000次 [3] - 学术指导经验丰富曾指导博士生在CCF-A类顶会顶刊以一作/共一身份发表7篇论文 [3] 方向2：3D视觉技术 - 聚焦图像/点云数据的3D目标检测语义分割占据预测等多任务研究 [4][5] - 辅导老师来自国内TOP2高校在ECCV CVPR等会议有多次论文发表记录 [5] 方向3：自动驾驶感知架构 - 研究领域包含OCC 世界模型 BEV等自动驾驶核心感知方案 [6] - 辅导团队参与多个主流感知方案开发成员均来自国内TOP2高校在CVPR ECCV等会议有论文发表 [6] 方向4：神经渲染与重建 - 涉及NeRF 3D Gaussian Splatting等三维重建技术 [7] - 辅导老师以第一作者发表4篇CCF-A类论文（含2篇CVPR和2篇IEEE Trans） [7] - 另有导师在CVPR ICCV ICML TPAMI等期刊会议发表多篇论文学术背景覆盖国内外顶尖高校（QS200/国内TOP100） [7] 合作方式 - 提供个性化论文辅导服务具体细节需通过指定微信号（wenyirumo）咨询 [7] - 咨询时需备注"论文辅导"以获取定向服务 [8]

多模态感知

计算机视觉

多模态感知

计算机视觉

辅助驾驶的AI进化论 - 站在能力代际跃升的历史转折点

2025-08-05 11:15

行业与公司概述 - 辅助驾驶行业正经历从L2到L3商业化落地的关键拐点，全栈自研主机厂与第三方供应商形成领先优势[1] - 特斯拉、小鹏、鸿蒙智行合作车企、理想、蔚来、小米等车企在辅助驾驶领域领先[1][5] - 第三方供应商如Momenta、云融启行占据重要地位，国内供应商如速腾聚创、禾赛科技向软硬件一体化解决方案发展[1][5] 技术研发与产品进展 - **特斯拉**：HW5.0搭载4颗4D毫米波雷达，Robotaxi试点服务在Austin启动，数据反补FSD能力提升[6][9] - **小鹏汽车**：转向纯视觉方案，通过云端大模型训练实现硬件降本，Mona M03P7+成为高性价比爆款[3][11] - **华为**：ADS 4.0支持高速L3商用，通过零部件/HI/鸿蒙智行模式划分合作紧密程度[12] - **理想汽车**：L系列全系标配激光雷达，推出端到端加VLA架构，实现从跟随到引领的变化[6][13] - **蔚来**：三年研发投入超100亿元，自研芯片上车，但商业化节奏不及预期[14][15] - **小米**：Su7预期销量超市场预期，全系标配激光雷达，本地端VLA模型预计9月OTA搭载[16][25] 传感器与算力发展 - **传感器**：激光雷达（速腾聚创、禾赛科技）、4D毫米波雷达（特斯拉、华为）、纯视觉方案（小鹏）成为主流[6][23][26] - **算力芯片**：2024年辅助驾驶域控芯片装机量达528万颗（同比+61.7%），英伟达、特斯拉、华为为前三大玩家[28] - **云端智算中心**：特斯拉达100亿Flops，国内车企约10亿Flops，通过弹性算力池支持模型迭代[27] 技术路径与模型优化 - 技术路径向数据驱动发展，VLA模型融合视觉、语言与行为模块，优化车辆决策[3][29] - 世界模型通过视频预测学习时空规律，VLM模型通过自然语言描述场景理解[30][31] - 车企展示云端模型参数规模（如小鹏750亿参数），强调数据量（真实+仿真）驱动迭代[29] 政策与商业化进展 - L2端规范化同时，多地开放L4商用化试点[8] - 理想VLA司机大模型、小鹏本地端VLA模型、鸿蒙智行L3高速NOA解决方案将于近期量产或OTA[8] 消费者感知与安全 - 关键节点：从高速NOA向城市NOA发展，华为"车位到车位"概念实现全场景连续驾驶[32] - 安全功能：AES（主动避让系统）逐步量产，特斯拉MPI达700万英里/次事故[33][34] 投资关注点 - L2到L3商业化落地节点的头部解决方案供应商、全栈自研主机厂及细分上游供应链[36] - 法规开放试点与ToC端规控完善将推动行业能力迭代升级[36] 其他重要内容 - 传统主机厂选择第三方解决方案可缩短产品周期，快速抢占市场[17] - 技术驱动型企业（华为、蔚来、小鹏）研发费用率超15%，规模效应型企业（理想、特斯拉）随销量回调[22] - 企业组织战略调整（如理想成立算力资源部门）对研发效率与商业化至关重要[21]

多模态感知

多模态感知

中国电子学会：中国人形机器人整体水平处全球第一方阵

新浪财经· 2025-08-02 21:55

科技创新 - 中国人形机器人在运动性、灵巧性等方面实现重大突破，整体水平处于全球第一方阵 [1] - 机器人大模型、智能协同控制、人机交互、多模态感知等核心技术不断突破 [1] - 通过AI控制算法的优化，国产机器人可实现毫秒级动作响应，稳定性、灵活性、连贯性持续提升 [1] 产业发展 - 中国工业机器人市场销量由2015年的7万套增长至2024年的30.2万套，连续12年成为全球最大工业机器人市场 [1] - 中国是全球第一大机器人生产国，工业机器人产量由2015年的3.3万套增长至2024年的55.6万套 [1] 应用场景 - 机器人赋能千行百业、走进千家万景，成为推动者、参与者和见证者 [1]

机器人(SZ:300024)

机器人大模型

智能协同控制

多模态感知

人形机器人

机器人大模型

智能协同控制

多模态感知

人形机器人

从技术秀到真突破：解码WAIC 2025的核心价值

36氪· 2025-08-01 11:49

技术突破 - 机器人从"机械响应"进化到"主动演绎"，能同步分析语音停顿、面部肌肉变化、手势幅度并生成复合情绪如"强颜欢笑" [7] - 傅利叶GR-3人形机器人采用柔肤软包覆材质，内置多模态感知系统和Affective Computing模型，可实时回应人类情感需求 [4] - 百度NOVA数字人技术实现10分钟克隆个体、打破内容创作边界、智能体军团协同作战三大颠覆性变革 [6] 行业应用 AI+娱乐 - 魔珐科技展示生成式AI驱动的3D数字人，可实时调整表情动作，降低视频制作成本，拥有数千款多风格角色及影视级3D场景 [11][13] - 技术应用于政法领域智能化服务窗口和沉浸式法治教育 [13] AI+教育 - 学而思"九章大模型"具备智能学习系统和拆题讲思路功能，能检测学生走神并切换生动讲解方式 [14] - AI教育平台从"教学工具"升级为拟人化"学习伙伴"，增强学习过程的人性关怀 [14] AI+医疗 - 阿里达摩院推出"平扫CT+AI"系统实现多病种筛查，蓝想数科用数字孪生提升急危重症诊疗水平，蚂蚁集团整合3600家医院资源提供全流程服务 [16] - 30余项创新成果展示包括药物研发周期优化方案和医学影像AI分析云平台 [16] 市场趋势 - 情感计算和拟人化交互市场年均增速35%，预计2026年规模超500亿美元，医疗/教育/客服领域增长最显著 [17] - AI技术正推动医疗健康服务向精准化、个性化、智能化升级 [16] 社会价值 - 《AI赋能可持续发展倡议》明确AI需助力绿色转型、医疗普惠、教育公平，中国气象局"妈祖"AI预警系统已在吉布提/蒙古国落地 [19] - 华为AI光视联动平台在南非预防铁路安全事故，体现技术对公共安全的赋能 [19]

Artificial Intelligence

多模态感知

Artificial Intelligence

百度NOVA数字人技术

傅利叶GR - 3人形机器人

Artificial Intelligence

多模态感知

Artificial Intelligence

百度NOVA数字人技术

傅利叶GR - 3人形机器人