NEO
搜索文档
最新报告 | TrendForce人形机器人产业研究--1Q26季度报告出刊
TrendForce集邦· 2026-01-16 14:24
产业阶段与核心观点 - 人形机器人产业在2026年正经历从功能探索转向商业化落地的关键质变期 [2] - 产业发展重心已从单纯的硬件研发,演进为软硬一体化的场景解决方案竞争 [2] - 2026年第一季产业呈现“迈向实务与形态变革”趋势,厂商更着眼于软硬整合后的任务执行能力 [5] 全球产业格局与厂商动态 - 欧美整机厂商如Figure AI与1X发展重心向家用场景靠拢,推出具备柔软织物覆盖或家电化特质的机器人以强化实体环境数据搜集 [3] - 中国厂商如宇树、小鹏、美的、云深处及逐际动力主打多样化形态(如轮足、多臂、半身形),旨在提升特定工业或户外场景的作业效率 [3] - 相较于追求完整人形结构,具备简易外形、能降低制造门槛且实际提供商用价值的产品正崭露头角,为产业开拓快速量产路径 [5] 供应链成本结构与关键技术 - 人形机器人供应链成本结构趋于明确:运动层(关节活动)占物料清单成本最高约55%,其次为心智层(决策处理)占23%、感测层占15%以及动力层占7% [4] - 内存规格因AI模型需求提升至32GB起步,并往64GB至128GB主流迈进 [4] - 核心致动零组件如行星滚柱螺杆成为下肢大推力需求的刚需 [4] - 电子皮肤技术从防撞感测转向多模态感知,协助指尖实现精细抓取与反射动作,以延长硬件寿命并提升作业价值 [4] 区域竞争与市场展望 - 在零组件发展上,亚洲厂商正凭借产能弹性与价格优势提升竞争力 [5] - 随着市场规模放量,预期亚洲厂商将在2026年后迎来更显著的成长 [5]
Hyundai and Boston Dynamics Push Humanoid Robots Forward
The Motley Fool· 2026-01-14 10:33
波士顿动力Atlas人形机器人发布 - 波士顿动力在CES 2026上发布了全电动人形机器人Atlas,并宣布立即开始生产 [2] - 首批机器人车队计划在未来几个月内运往现代汽车的机器人元工厂应用中心和谷歌DeepMind [2] - 现代汽车计划从2028年开始,在其全球网络中部署Atlas机器人,包括位于美国佐治亚州萨凡纳的工厂 [2] 市场反应与潜在影响 - 消息公布后,现代汽车在韩国交易所的股价在一天内上涨,投资者对其在现实场景中部署AI人形机器人的潜力感到兴奋 [3] - 若成功部署,汽车制造商可能成为人形机器人问世后的首批大赢家,丰田汽车也可能受益,因其与波士顿动力在机器人研究项目上有合作 [7] - 摩根士丹利预测,到2050年,人形机器人市场规模可能达到5万亿美元,部署数量超过10亿台,其中90%用于商业和工业用途 [13] Atlas机器人的技术特点与应用规划 - 现代汽车计划在美国工厂每年生产30,000台机器人,并设定了大规模生产Atlas型号、在工业现场大规模部署的目标 [6] - Atlas具备多项能力:具备触觉感知的人形手、先进的旋转关节、最高可举起110磅重物、可在一天内学会任务、自主操作并自动更换电池、可执行人类感到疲惫的精密任务和重复性劳动 [6] - 从2028年开始,Atlas将首先应用于已证实对安全和质量有益的过程,如零件排序,随后扩展到部件组装,最终承担涉及重复运动、重负载和其他复杂操作的任务 [7] 行业历史与挑战 - 人形机器人的近期历史中包含一些过度炒作和过早宣称改变世界的失败案例,例如软银2014年推出的Pepper机器人因机械故障和简单任务失败,到2021年已停产 [9] - 初创公司1X制造的NEO人形机器人旨在帮助处理家务,但被批评无法敲开核桃、需要2分钟折叠毛衣,且非自主运行,需由员工通过VR头显控制,被评为MIT Technology Review 2025年最差技术失败之一 [10] - 三星在2020年发布的球形机器人Ballie旨在作为家庭助手,但六年后未在CES 2026展出,公司也未宣布任何产品发布计划 [11] - 彭博社记者对CES 2026上展示的家用人形机器人持怀疑态度,但认为在工厂等受控环境中,部署会加速得更快 [12] 行业发展预期 - 摩根士丹利预测,人形机器人的采用在2030年代中期之前将相对缓慢,在2030年代末和2040年代会加速 [13] - 即使汽车制造商等成为首批从人形机器人中获利的公司,最大的回报可能仍需数年时间才能实现 [13]
1X 揭示人形机器人 AI 范式转移:NEO 开始自主学习
Globenewswire· 2026-01-13 16:18
产品技术突破 - 公司推出全新的1X世界模型 标志着人形机器人领域迈出关键性一步 该模型为NEO量身打造 能基于符合现实物理规律的视频模型 将任何指令即时转化为可执行的AI能力[2] - 1X世界模型使NEO能够融合经机器人数据精调的互联网规模视频数据来执行各类AI任务 并能应对此前从未接触过的物体和环境 打通了数字智能与物理现实之间的闭环[2] - NEO已能够从互联网规模的视频数据中学习 并将所学直接应用于物理世界 甚至能在毫无先例的情况下将任意指令转化为全新的操作 开始具备自我学习能力[3] - 用户只需向NEO发出简单的语音或文字指令 NEO便会基于当前所见生成对后续行动的可视化预判 内置的逆动力学模型再将这些预判转化为精确、可执行的动作[3] - 演示视频显示NEO能超越既有训练数据泛化 面对涉及不熟悉物体的简单指令能完成行动规划可视化并以连贯流畅方式执行 例如打包午餐盒[3] - 在数据集中毫无先例的情况下 NEO能够胜任一系列全新任务 例如抬放马桶座圈、开启推拉门、熨烫衣物、为人梳理头发[3] 技术范式与优势 - 传统人形机器人AI模型主要依赖人工操作员采集的数据 而1X世界模型赋予NEO自主采集数据并独立掌握新能力的可能 开启了真正的自主学习之门[4][5] - 该范式转变加速了通用型人形机器人的发展进程 使其能够在实践中不断学习、持续进化[5] - 人形机器人的AI功能提升长期受制于人工操作员采集机器人数据的速度 1X世界模型能够通过NEO自主采集的数据实现自我优化[6] - 由于核心采用视频模型 该世界模型还能直接受益于视频模型本身的持续进化[6] - 在家庭等动态且不可预测的环境中 1X世界模型能够像人类一样理解并应对极端不确定性 即便环境瞬息万变也能从容执行操作[7] - NEO已能在千变万化的场景中自主生成并执行动作 这在人形机器人领域属于前所未有的突破[7] 商业化进展 - NEO已在公司在线商店上架 提供棕褐色、灰色和深棕色三种颜色可选[9] - 有意成为首批NEO拥有者的客户 可按20,000美元的早鸟价购买 享受2026年优先发货权益[9] - 客户还可选择订阅模式 按每月499美元使用NEO[9] 公司背景 - 1X是美国一家领先的AI与机器人公司 专注于研发家用机器人NEO[10] - 公司的使命是通过安全、智能的人形机器人来丰富人们未来的生活[10]
机械设备行业周报:《“人工智能+制造”专项行动实施意见》发布,多家中国企业亮相CES展会-20260113
东海证券· 2026-01-13 16:16
报告行业投资评级 - 行业评级:超配 [1] 报告核心观点 - 政策驱动与展会催化下,人工智能与制造业深度融合,特别是人形机器人及具身智能领域创新活跃,产业化进程加速 [8][13][15] - 中国企业在全球人形机器人市场占据领先地位,产业链上下游在CES展会上集中展示,从整机到核心零部件均取得进展 [5][8][15] - 出口链代表公司通过全球化布局、产品创新及渠道优化展现业绩韧性,并积极培育新增长点 [20][22][28] 政策跟踪总结 - 工业和信息化部等八部门发布《“人工智能+制造”专项行动实施意见》,设定2027年发展目标 [8][13] - 目标包括:推动3-5个通用大模型在制造业深度应用,形成特色行业大模型 [13] - 目标包括:推出1000个高水平工业智能体,打造100个工业领域高质量数据集,推广500个典型应用场景 [13] - 目标包括:培育2-3家具有全球影响力的生态主导型企业,选树1000家标杆企业 [13] - 政策附件《人工智能赋能制造业重点行业转型指引》针对原材料、装备制造、消费品、电子信息、软件和信息技术服务五大行业分类施策 [13][14] 机器人行业动态总结 - 2026年CES展会上,中国具身智能机器人产业链集中参展,包括宇树科技、智元机器人等整机企业,以及兆威机电、雷赛智能、领益智造、奥比中光等供应链企业 [8][15] - 智元机器人发布由大语言模型驱动的新一代仿真平台Genie Sim 3.0,可快速生成万级场景,并计划开源上万小时仿真数据集,构建覆盖10万+场景的评估体系 [5][15][16] - 根据Omdia报告,中国品牌领跑全球人形机器人销售,其中智元AGIBOT在2025年出货量与市场份额均位列第一 [5][16] - 海外企业方面,1X Technologies在CES展示家务人形机器人NEO,售价2万美元,计划2026年起交付美国市场,并与瑞典EQT机构达成合作,计划在2026至2030年间提供最多1万台NEO用于工业场景 [6][18] - 波士顿动力在CES展示新版通用人形机器人Atlas,并宣布启动生产计划,2026年已获饱满订单,首批将发货至现代汽车和谷歌DeepMind [6][19] 出口链公司近期跟踪总结 - **巨星科技**:发布2025年业绩预告,预计归母净利润24.19亿元至27.64亿元,同比增长5.00%至20.00% [20] - **巨星科技**:2025年第四季度预计归母净利润2.64-6.09亿元,同比变动幅度为-28.40%至65.46% [20] - **巨星科技**:2025年上半年跨境电商渠道收入同比增长超过30%,电动工具业务收入达7.41亿元,同比增长56.03% [22] - **巨星科技**:通过“流浪工厂计划”应对关税影响,并依靠全球化布局及产品创新维持业绩韧性 [20][22] - **杰克科技**:2025年底聘任吴利女士为新任总裁,其在公司内具备超过20年的财务、战略、人力资源及营销等多岗位复合背景 [27] - **杰克科技**:致力于从单机制造商转向智能制造成套方案服务商,2025年发布高端品牌“艾图Aitu”并推出AI缝纫机新品 [28][29] - **杰克科技**:2025年上半年海外收入达17.85亿元,占总收入比重为53%,公司正通过深化渠道和本地化团队强化海外市场投入 [30] 行情回顾总结 - 报告期内(2026年1月5日至1月11日),沪深300指数下跌2.79%,申万机械设备行业指数上涨5.39%,跑赢大盘 [31] - 机械设备行业在31个申万一级行业中涨幅排名第10位 [31]
人形机器人展望:2026 年值得关注的方向-Humanoid Horizons What to Watch for 2026
2025-12-21 19:01
行业与公司研究纪要:人形机器人行业展望 (2026) 涉及行业与公司 * **行业**:人形机器人、具身智能、机器人行业 [1][4] * **公司**:报告广泛涉及全球人形机器人产业链公司,包括但不限于特斯拉、1X Technologies、Agility Robotics、Figure AI、Apptronik、Unitree、优必选、小米、美的集团、华为、百度、腾讯、阿里巴巴等,以及众多上游零部件供应商 [7][9][12][44][73][98] 核心观点与论据 对2026年的整体展望:热情与挑战并存 * 人形机器人领域的市场热情在进入2026年之际持续高涨,但投资者需关注更宏观的图景 [1][4] * 一个会跳舞的机器人与一个能够大规模完成有用工作的机器人之间可能存在显著差距 [1][4] * 未来一年将同时包含进展与挑战 [1][4] 2026年行业关键趋势与催化剂 * **短期炒作仍有空间**:多个关键催化剂将在2026年初推动人形机器人热度,包括特斯拉Optimus Gen 3的发布、美国现任政府潜在的支持性政策、硬件和AI的进一步技术突破,以及大型科技和AI公司可能进入机器人/具身AI领域的信号 [7] * **人形机器人自主性仍面临挑战**:人形机器人的完全自主性非常困难,如果演示未明确宣传为自主,则应假设其为远程操控 [7] * **至少一家大型科技公司或主要AI实验室将公布机器人计划**:Meta、谷歌、苹果、亚马逊、OpenAI、百度、华为等全球主要科技公司均与人形机器人领域有所关联,预计至少一家将正式宣布建造机器人的计划 [7] * **行业可能出现“洗牌”**:中国国家发改委发言人提及,包括人形机器人在内的所有新兴产业都需要平衡“速度”与潜在“泡沫”,目前该领域已有超过150家公司,但缺乏经过验证的实际应用案例 [7] * **美国新支持政策预期**:据报道,美国商务部长Howard Lutnick和特朗普政府“全力支持”加速美国机器人产业发展,明年可能考虑出台行政命令 [11] * **中国持续巩固领先地位**:“具身智能”被列为中国“十五五”规划建议中的六大重点突破产业之一,中国正利用其无可争议的制造优势在AI领域与美国竞争,几乎所有主要中国汽车和消费电子公司都以某种方式与人形机器人或AI机器人相关联,中美之间的差距正在加速扩大 [11] 市场表现与数据 * **Humanoid 100指数表现**:自2025年2月6日创立以来(经成分股增减调整),等权重Humanoid 100指数上涨25%,表现优于标普500指数、MSCI欧洲指数、MSCI台湾指数和MSCI中国指数,但逊于MSCI韩国指数 [9][63] * **中国产业链表现**:在9月强劲反弹但10/11月下跌后,该板块在12月当月迄今略有改善,截至12月17日收盘,等权重中国机器人产业链指数当月迄今上涨2%,表现优于MSCI中国指数(下跌4%) [10] * **个股表现分化**:自加入Humanoid 100名单以来,表现最佳的股票包括MP Materials(上涨122%)、英特尔(上涨93%)、Lynas Rare Earths(上涨91%)等,表现最差的包括达索系统(下跌42%)、上银科技(下跌39%)、Mobileye(下跌37%)等 [12][59][60] * **产业链分类表现**:从平均股票表现看,自加入日期起,“大脑”(半导体/软件)类股票平均上涨19%,“身体”(工业部件)类上涨1%,“集成商”(开发完整人形机器人)类下跌3% [65] 近期行业动态 * **新融资活动**: * Physical Intelligence筹集6亿美元,估值达56亿美元 [30] * Skild AI正洽谈从软银和英伟达筹集超过10亿美元,估值约140亿美元 [30] * 中国四足及人形机器人初创公司Deep Robotics筹集约7000万美元 [30] * **中国政府政策支持**:从国家到省市级政府已推出一系列政策支持人形机器人/具身AI发展,并设立了总规模约1870亿元人民币的基金为产业发展提供资本 [52][53][54] * **新合作与采用**: * 1X与EQT Ventures宣布协议,向工厂和仓库供应多达10,000台NEO人形机器人 [37] * Agility Robotics与Mercado Libre合作,在其物流中心部署Digit人形机器人 [37] * **新进入者与硬件改进**: * 特斯拉展示了改进的Optimus硬件,可实现近乎人类的跑步动作 [44] * 美的集团发布了六臂“超级人形机器人”MIRO U [44] * 德国的Agile Robots发布了工业人形机器人Agile ONE [45] * 多家新初创公司进入市场,如Sunday Robotics(家用机器人Memo)和Tangible Robotics(轮式家用机器人Eggie) [39] * **软件/AI改进**:Physical Intelligence发布了基于改进强化学习方法的视觉-语言-动作模型π*0.6,Unitree展示了人形机器人的“应用商店”概念 [49][50] 长期市场预测 * **全球采用预测**: * 到2036年,累计采用量将达到约2440万台(约占全球潜在10亿总量的2%) [101] * 到2040年,累计采用量将达到约1.379亿台(约占14%) [101] * 到2044年,累计采用量将达到约4.3亿台(约占42%) [101] * 到2050年,累计采用量将达到约10亿台 [101] * 按收入分类,到2050年,高收入国家(包括美国)将占累计采用量的29%,中高收入国家(包括中国)将占50% [103][111] * **市场规模预测**:预计到2050年,全球人形机器人市场年收入可能达到7.5万亿美元(2035年为3220亿美元,2040年为2.0万亿美元) [114] * **价格假设**: * 高收入国家:初始ASP为20万美元(2024年),预计到2050年降至约7.5万美元 [115] * 中高/中低/低收入国家:初始ASP约为5万美元(2024年),预计到2050年降至约2.1万美元 [115] 其他重要内容 * **行业热度指标**:提及“人形机器人”的公司文件和新闻/媒体报道数量自2024年以来显著增长,显示行业关注度急剧上升 [75][77] * **专利活动**:过去五年,中国在提及“人形机器人”的专利发布数量上遥遥领先(7705件),远超美国(1561件)和日本(1102件) [81] * **产品发布地理分布**:自2022年以来,全球人形机器人发布中,61%来自中国,23%来自美国/加拿大 [89][90] * **主要应用场景**:已发布的人形机器人中,57%定位为通用目的,16%为服务型,14%为工业/物流,13%为研究平台 [91] * **科技巨头参与度**:几乎所有中美主要科技巨头(如亚马逊、苹果、百度、谷歌、华为、Meta、微软、英伟达、腾讯、特斯拉)都以投资、合作或内部研发的形式深度参与人形机器人生态 [98]
阿里系 App 禁止豆包手机登录;库克被曝出现“不明原因手部颤抖”;众擎T800人形机器人一脚踹倒自家CEO | AI周报
AI前线· 2025-12-07 13:33
豆包AI手机助手引发行业生态冲突 - 豆包与中兴合作的首款“豆包助手”手机发售引发热议,阿里系多款应用(淘宝、闲鱼等)及农行、建行等手机银行App已拒绝该手机登录或触发安全提醒,游戏类App如《王者荣耀》也能监测并限制AI控制 [3] - 豆包手机助手发布声明否认可跳过认证读取用户信息,并计划对AI操作能力进行规范化调整,主要限制三类场景:App刷分刷激励、金融类应用代操作、涉及竞技排名的游戏场景 [4] - 该手机首批备货约3万台,售罄后未追加物料,二手平台售价从3699元至7999元不等,较3499元官方售价最高溢价4500元,租赁价格超600元/天,字节与中兴第二代产品已启动研发,预计2026年底出货 [5] - 360创始人周鸿祎评论称,豆包手机助手能接管手机操作,将冲垮互联网大厂基于传统流量逻辑的护城河,可能引发技术攻防战,各大App或调整页面结构限制AI,手机厂商也可能推出自家助手抗衡 [5] 人形机器人技术进展与商业化 - 众擎机器人发布T800人形机器人“大战”CEO的视频,展示其运动能力,机器人一脚将穿戴护具的CEO踹翻在地 [6][9] - 众擎T800售价18万元起,具备1.73米成人身高、75公斤自重,通过高爆发关节模组可实现450N·m峰值扭矩和瞬间关节14000W峰值功率,配备自研灵巧手,能完成重物抓握与精细操作 [9] - 特斯拉CEO马斯克转发擎天柱(Optimus)团队视频,展示人形机器人实验室跑步状态,动作流畅,团队称刷新个人纪录,特斯拉已启动试生产产线,规模更大的生产线将于2026年投产,规模化后每台成本预计控制在2万美元以内 [22] 极越汽车破产重整与资本变动 - 极越汽车(原集度汽车)启动预重整程序,CEO夏一平正主导引入新的投资方(主要来自中东),而主要发起方及投资方之一的百度寻求在此轮重整中完全退出 [10][11] - 极越破产重整面临庞大债务,据媒体报道可能高达70亿元,其两大股东吉利和百度联合解决了员工欠薪和裁员赔偿,但两者也是最大债权人,债权规模约占极越总债务的72% [11] - 百度已为极越(包括集度)投入约80亿元,最终换来总销量约1.4万辆,月均约1200辆,吉利持有集度45%股权 [11] 科技公司高层人事与治理动态 - 苹果CEO库克被曝出现不明原因手部颤抖,引发员工讨论,同时苹果近期经历高层人事震荡,人工智能主管、设计负责人、法务负责人、政府事务主管四位直接向库克汇报的高管接连离职,负责自研芯片的高级副总裁也正考虑离职 [12][13] - 新东方杭州员工发布内部信吐槽“996单休”加班文化,称每日工作时长从早9:30至晚21:30以上成为常态,该员工发布文章后账号被秒封并被移出公司架构,公司称其未按正确举报机制操作 [14] - 艾比森公司公告显示,创始人丁彦辉在董事长选举中投出唯一反对票,理由为“对董事长岗位薪酬不满意”,其2024年税前报酬总额为435.56万元,较2023年288.45万元增长约51%,公司回应称系董秘笔误,实际是董事长对公司激励机制不满 [17] 企业战略调整与业务表现 - Meta CEO扎克伯格被曝将改变元宇宙业务策略,计划明年将元宇宙团队预算削减高达30%,可能启动裁员,自2021年初重点发展元宇宙以来,其Reality Labs部门已累计亏损超700亿美元,部分资源将转向AI眼镜和可穿戴设备 [18][19] - 微软否认下调AI产品销售指标,驳斥了有关将Azure Foundry服务支出提升目标从50%下调至25%左右的报道,称其混淆了“增长目标”与“销售配额”,但报道同时披露企业客户如凯雷集团因技术问题减少了对Copilot Studio的使用 [20][21] - 佳能中山打印机工厂停产裁员,补偿方案包括“2.5N+1”经济补偿金及5个月工资的就业支援金,例如18年老员工总计可获约40万元,一名月薪5000元、工作3年的员工预计获8.25万元补偿,较法定标准翻四倍多,公司还主动为员工对接新工作并撰写推荐信 [16] 大模型与AI技术产品发布 - DeepSeek发布V3.2正式版及长思考增强版V3.2-Speciale,V3.2在公开推理基准测试中达到GPT-5水平,略低于Gemini-3.0-Pro,V3.2-Speciale在IMO、CMO、ICPC、IOI等竞赛中达到金牌水平,其中ICPC成绩达人类选手第二名 [25][26] - 英伟达发布业界首个专注于自动驾驶的开源视觉语言动作模型Alpamayo-R1,旨在构建“具身智能”基础,助力实现L4级自动驾驶 [28][29] - 理想汽车发布首款AI智能眼镜Livis,补贴后售价1699元起,整机重36克,标配蔡司镜片,典型续航18.8小时,可与理想汽车车机系统联动,实现百米内语音远程控车 [30][31][32] - 商汤科技发布并开源全新多模态模型架构NEO,推出基于该架构的2B与9B规格模型,旨在通过底层创新实现视觉与语言的统一处理 [35] - 米哈游联合创始人蔡浩宇创立的AI公司推出AI聊天软件AnuNeko,产品风格独特,旨在利用AI技术打造成类似“游戏引擎”的平台,用于生成可交互的NPC [33] - 阿里巴巴更新图片生成及编辑模型Qwen-Image,在多视角转换、多图像融合等方面取得进展,并已首发接入千问App供用户免费使用 [36][37] - 法国Mistral AI正式发布包含14B、8B、3B及Large 3版本的Mistral 3模型系列,均基于Apache 2.0协议开源 [39] - 可灵推出视频生成2.6模型,具备“音画同出”能力,可生成最长10秒带音效视频,并发布全新多模态创作工具“可灵O1” [40] 行业合作与产品动态 - 亚马逊AWS推出AI工具DevOps Agent,旨在帮助客户预测和恢复技术故障,客户可注册体验预览版,后续将收费 [38] - 埃森哲宣布与OpenAI合作,为数万名IT专业人员配备ChatGPT企业版 [40] - 汇丰银行与Mistral AI建立战略合作,以加速生成式AI在全行的应用,重点领域包括信贷流程和反洗钱检查 [40] - 代码显示,新版iPhone版ChatGPT应用可能未来接入苹果健康数据,Android测试版代码中则出现了广告功能相关引用 [40]
Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死
36氪· 2025-12-05 15:06
行业范式转移 - 行业顶尖研究者如Ilya Sutskever指出,单纯依赖扩大数据、参数和算力的Scaling Law时代已经结束,大模型的未来在于架构创新而非规模堆砌 [1] - 行业过去几年陷入“唯规模论”的路径依赖,但Transformer架构的固有局限日益凸显,仅靠堆叠算力和数据无法通往真正的通用智能 [8] - 以NEO为代表的原生多模态架构的出现,标志着行业正从模块化拼接范式向更高效、更统一的原生架构范式迁移 [26] 现有技术瓶颈 - 当前主流多模态大模型(如GPT-4V、Claude 3.5)采用模块化拼接架构,将预训练的视觉编码器通过投影层嫁接到大语言模型上,视觉与语言信息在数据层面被粗暴拉拢,而非深度融合 [3] - 模块化架构存在三大技术鸿沟:1) 效率鸿沟:训练流程复杂、成本高昂,且各阶段可能引入误差;2) 能力鸿沟:视觉编码器的固定分辨率等设计限制了对复杂图像(如长图、工程图纸)的理解;3) 融合鸿沟:视觉与语言信息未在同一语义空间进行深度融合推理,导致细粒度任务表现不佳 [6][7][8] NEO架构的核心创新 - NEO是全球首个可大规模落地的开源原生多模态架构,其设计从第一性原理出发,打造了一个视觉与语言从诞生之初就统一的模型,不再区分视觉模块和语言模块 [3][8] - 核心创新体现在三大底层技术上:1) 原生图块嵌入:通过轻量级卷积神经网络直接从像素构建连续、高保真的视觉表征,突破了主流模型的图像建模瓶颈 [11][12];2) 原生三维旋转位置编码:为时间、高度、宽度三个维度分配不同频率,精准刻画视觉细节与空间结构,并为扩展到视频和3D场景铺平道路 [14];3) 原生多头注意力:在统一注意力框架下,让文本的因果注意力与视觉的双向注意力并存,提升对图像内部空间结构的理解能力 [16] - 配套采用Pre-Buffer & Post-LLM双阶段融合训练策略,巧妙解决了在不损害语言能力前提下学习视觉知识的难题,最终模型融为一个端到端的整体 [17] 性能与效率表现 - NEO展现出极高的数据效率,仅使用3.9亿个图像文本对进行训练,数据量仅为同类顶级模型所需数据的十分之一 [5][19] - 在多项视觉理解任务评测中,NEO追平甚至超越了Qwen2-VL、InternVL3等顶级模块化旗舰模型 [5][19] - 在2B参数规模下,NEO在AI2D、DocVQA、ChartQA等关键评测中得分分别为80.1、89.9、81.2,表现亮眼 [20] - 在8B参数规模下,NEO在MMMU、MMBench、MMStar、SEED-I、POPE等多个关键基准测试中均取得高分,展现出优于其他原生VLM的综合性能 [21][22] - NEO在2B到8B的中小参数规模区间内展现出较高的推理性价比,实现了精度与效率的双重跃迁,并大幅降低了推理成本 [22][23] 潜在影响与行业意义 - NEO为多模态AI的演进指明了新路径,其原生一体化架构从底层打通了视觉与语言的语义鸿沟,天然支持任意分辨率图像和长图文交错推理,并为视频理解、3D空间感知及具身智能等更高阶场景预留了扩展接口 [24] - 商汤科技已开源基于NEO架构的2B与9B模型,此举有望推动整个开源社区向更高效统一的原生架构迁移,加速形成新一代多模态技术的事实标准 [24] - NEO在中小参数规模下的高性价比,正在打破大模型垄断高性能的固有认知,使得强大的视觉理解能力可以下沉到手机、机器人、智能汽车、AR/VR眼镜、工业边缘设备等对成本、功耗和延迟敏感的终端场景 [23][24] - NEO是“架构创新重于规模堆砌”新趋势的首个成功范例,重新定义了多模态模型的构建方式,是通往下一代普惠化、终端化、具身化AI基础设施的关键雏形 [25][26]
Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死
量子位· 2025-12-05 13:33
行业范式转移 - AI行业顶尖研究者(如Ilya Sutskever)共同指出,单纯依赖扩大模型规模(Scaling Law)的时代已结束,行业正逼近收益递减的临界点 [1][2][20] - 真正的突破需来自架构层面的根本性创新,而非对现有Transformer流水线的修修补补,下一代AI的竞争力关键在于架构的聪明程度 [3][20][21] - 全球首个可大规模落地的开源原生多模态架构NEO的诞生,被视为这一范式转移的首个成功范例 [4][21][53] NEO架构的核心创新 - 采用原生一体化设计,从第一性原理打造视觉与语言血脉相连的统一模型,不再区分视觉和语言模块,从根本上解决了模块化架构的效率、能力和融合三大鸿沟 [19][22][46] - 创新性引入原生图块嵌入技术,通过轻量级卷积神经网络直接从像素构建高保真视觉表征,突破了主流模型的图像建模瓶颈 [24][25][27] - 采用原生三维旋转位置编码,为时间、高度、宽度维度分配不同频率,精准刻画不同模态的天然结构,为扩展到视频和3D场景铺平道路 [29][30][31] - 在统一注意力框架下实现因果与双向注意力并存,极大提升了对图像内部空间结构的理解能力,支撑复杂的图文交错推理 [33][34] 性能与效率表现 - 在数据效率上表现卓越,仅使用3.9亿个图像文本对进行训练,数据量仅为同类顶级模型所需数据的十分之一 [11][39] - 在多项关键评测中,仅以2B和8B的中小参数规模,就追平甚至超越了依赖海量数据的旗舰级模块化模型 [39][40][42] - 在MMMU、MMBench、MMStar、SEED-I、POPE等多个权威基准测试中取得高分,展现出优于其他原生VLM的综合性能 [41][42] 商业化与应用前景 - 其开源策略(已开源2B与9B模型)有望推动整个开源社区从模块拼接范式向更高效统一的原生架构迁移,加速形成新一代多模态技术事实标准 [48][49] - 在中小参数规模下展现出的高推理性价比,大幅降低了多模态模型的训练与部署门槛,使得强大的视觉理解能力可下沉至手机、机器人、智能汽车、AR/VR眼镜、工业边缘设备等终端场景 [43][44][45][50] - 原生一体化的架构设计为视频理解、3D空间感知乃至具身智能等更高阶的多模态交互场景预留了清晰的扩展接口,是构建下一代通用人工智能系统的理想底座 [46][47][51]
Humanoid Global Provides Update on Agility Robotics
Globenewswire· 2025-11-27 17:00
公司动态更新 - Humanoid Global Holdings Corp 是一家专注于人形机器人和具身人工智能领域的公开上市投资发行人,其投资组合公司Agility Robotics提供了业务更新 [1] - 公司于2025年7月22日与独立第三方Global One Media Group Pte Ltd签订媒体代理协议,协议初始期限12个月,自2025年8月1日起生效,之后转为按月续签 [6] - 根据协议,公司需向Global One支付每月4000美元的固定服务费,初始3个月费用12000美元已在协议签署时预付 [6] - Global One目前持有公司333,333股普通股及333,333份认股权证,每份权证可于2027年7月24日前以每股0.35美元的价格认购一股普通股 [6] 投资组合公司进展:Agility Robotics - Agility Robotics的人形机器人Digit已在商业部署中完成超过10万次货箱搬运,在真实物流环境中展现出持续运行能力 [2] - 随着Agility Robotics扩大其系统规模并受益于不断增长的运营数据,其技术有望帮助应对制造业预计出现的劳动力短缺问题;预计到2033年,美国制造业或因技术工人短缺而空缺190万个岗位 [2] - Humanoid Global首席执行官Shahab Samimi表示,Digit的表现表明人形系统能够提供可衡量的运营价值,并认为Agility Robotics在为客户展示清晰投资回报路径方面领先于许多同行 [3] - 在制造业领域,Agility Robotics的目标是成为首批实现商业部署的人形机器人提供商之一,以捕捉市场机遇 [3] 行业市场前景 - 人形机器人行业预计代表着一个24万亿美元的全球收入机会,价值创造预计将在家用和制造业应用之间分配 [3] - 在家庭场景中,人形机器人预计将执行日常任务以提升便利性和生活质量 [4] - 行业近期完成的融资轮次反映出投资者关注度增长,例如Physical Intelligence公司近期筹集了6亿美元资金,估值达到56亿美元,投资者包括杰夫·贝索斯和Lux Capital等 [5] 投资组合公司进展:1X Technologies - 2025年10月28日,1X Technologies宣布商业推出家用机器人NEO,该机器人设计用于将实用自动化带入日常生活空间 [4] - NEO能够执行折叠衣物、整理货架、打扫房间等家务,并通过其集成的语言、音频和视觉智能系统协助安排日程和家庭管理 [4] - Humanoid Global首席执行官Shahab Samimi认为,人形机器人融入家庭环境的进程似乎比预期更快,NEO的推出反映了这一进展,表明该技术已进入家庭环境下的实际应用阶段 [5]
Brunel Q3 2025 results: Driving operational efficiency
Globenewswire· 2025-11-07 14:30
核心观点 - 公司在充满挑战的市场环境中展现出韧性 第三季度营收 毛利和基础EBIT趋势与上半年相似[4] 成本削减计划成效显著 年化运营成本降低1840万欧元[4] 通过部署数字化和AI驱动解决方案 在提升运营效率方面取得强劲进展[5] 公司正进行战略更新 为2026年恢复盈利增长奠定基础[6] 2025年第三季度业绩 - 营收为304亿欧元 同比下降10%(有机下降7%)[8] - 毛利为565亿欧元 同比下降16%(有机下降14%)[8] - 基础EBIT为119亿欧元 同比下降31%(有机下降29%)[8] - 成本削减计划使运营成本降至446亿欧元 同比下降8%(有机下降)[8] 2025年前九个月业绩 - 营收为9173亿欧元 同比下降11%(有机下降8%)[8] - 毛利为1653亿欧元 同比下降18%(有机下降15%)[8] - 基础EBIT为266亿欧元 同比下降40%(有机下降29%)[8] - 自由现金流为-137亿欧元(去年同期为正向361亿欧元)[8] 运营效率与成本控制 - 2024年和2025年启动的成本削减计划效果显著 年化运营成本同比降低1840万欧元 此外在2024年第三季度已实现410万欧元的节约[4] - 2000万欧元的成本削减计划(2024年第二季度宣布)已交付 额外的1000万欧元成本削减计划(2025年第二季度宣布)已全面实施[8] 数字化与技术创新 - 在部署先进IT平台包括AI能力方面取得强劲进展 以提升招聘绩效和速度[8] - 成功实施两大关键系统:Mid Office System(专家全生命周期管理平台)和NEO(AI驱动客户界面 简化从自动排名匹配到AI生成简历的招聘流程)[5] - 这些创新标志着公司在数字化转型道路上迈出重要一步[5] 战略定位与展望 - 公司正进行战略更新 利用其在成熟和新兴垂直领域的优势 依托杰出人才和先进技术平台[6] - 公司处于有利地位 有望在2026年再次实现盈利增长[6]