Workflow
商汤(00020)
icon
搜索文档
本周三!量子位的这件大事就要来了|MEET2026
量子位· 2025-12-08 14:07
大会概览 - MEET2026智能未来大会将于2025年12月10日在北京金茂万丽酒店举办,主题为“共生无界,智启未来” [24][37][39] - 大会是AI圈一年一度的盛宴,预计将获得数千万媒体曝光,吸引千位线下观众与超300万名在线观众 [36] - 大会将发布《2025年度AI十大趋势报告》与《2025人工智能年度榜单》两份重要文件 [35][39][47] 核心议题与亮点 - 大会设置两场高浓度对话:一场是文远知行创始人韩旭与量子位总编辑李根关于GenAI赋能自动驾驶的对话;另一场是探讨AI Agent革新千行百业进程的圆桌论坛 [7][8][13] - 议题内容覆盖大语言模型、多模态、具身智能、自动驾驶、云计算及具体应用等AI主流方向 [3] - 重点关注AI从数字世界迈向物理世界、从“思考的AI”到“行动的AI”的转变,以及Agent如何从陪聊进化为超级助理 [12][16][41][43] 嘉宾阵容 - 大会累计邀请近三十位重量级嘉宾,涵盖学术界、产业界与前沿创业一线 [17] - 学术界嘉宾包括清华大学张亚勤院士、孙茂松教授,智源研究院王仲远院长,交大高金朱宁教授等,将分享对“人工智能+”趋势、大模型发展等根本问题的深度判断 [1][17][41][45] - 产业界阵容覆盖芯片、云、模型到终端的全栈力量,包括百度、小米、商汤、蚂蚁、谷歌云、亚马逊云科技、高通、昆仑万维、潞晨科技、PPIO、中关村科金等最具代表性的企业 [1][21][41][42][43][44] - 新生创业力量如卓世科技、太初元碁、RockAI、自变量机器人、光轮智能、灵心巧手等也将亲临现场 [28][42][44][45] 议程与内容 - 上午议程聚焦宏观趋势与基础技术,包括“人工智能+趋势”、AI打造超级智能体、混合AI、Agentic AI未来等话题 [41] - 下午议程深入多模态、智能体、算力生态及行业应用,涵盖AI技术突破、基础设施、硬件创新及具身智能平台等 [43][44][45] - 会议以两场重磅发布收尾,分别是《2025人工智能年度榜单》和《2025年度AI十大趋势报告》的发布 [35][42][45] 参会价值 - 大会提供与学术界大咖、产业界领袖及高精尖企业管理层观众交流的机会 [1][31] - 参会者可获得最前瞻的观点、第一视角的实战经验与深度思考,洞悉技术路线、产品逻辑及创业机会的变化 [4][6][11] - 大会内容旨在解决AI落地真实挑战,探讨AI从理论、平台、应用到终端的完整落地路径,寻找从hype走向impact的真实路径 [33][34]
阿里系 App 禁止豆包手机登录;库克被曝出现“不明原因手部颤抖”;众擎T800人形机器人一脚踹倒自家CEO | AI周报
AI前线· 2025-12-07 13:33
豆包AI手机助手引发行业生态冲突 - 豆包与中兴合作的首款“豆包助手”手机发售引发热议,阿里系多款应用(淘宝、闲鱼等)及农行、建行等手机银行App已拒绝该手机登录或触发安全提醒,游戏类App如《王者荣耀》也能监测并限制AI控制 [3] - 豆包手机助手发布声明否认可跳过认证读取用户信息,并计划对AI操作能力进行规范化调整,主要限制三类场景:App刷分刷激励、金融类应用代操作、涉及竞技排名的游戏场景 [4] - 该手机首批备货约3万台,售罄后未追加物料,二手平台售价从3699元至7999元不等,较3499元官方售价最高溢价4500元,租赁价格超600元/天,字节与中兴第二代产品已启动研发,预计2026年底出货 [5] - 360创始人周鸿祎评论称,豆包手机助手能接管手机操作,将冲垮互联网大厂基于传统流量逻辑的护城河,可能引发技术攻防战,各大App或调整页面结构限制AI,手机厂商也可能推出自家助手抗衡 [5] 人形机器人技术进展与商业化 - 众擎机器人发布T800人形机器人“大战”CEO的视频,展示其运动能力,机器人一脚将穿戴护具的CEO踹翻在地 [6][9] - 众擎T800售价18万元起,具备1.73米成人身高、75公斤自重,通过高爆发关节模组可实现450N·m峰值扭矩和瞬间关节14000W峰值功率,配备自研灵巧手,能完成重物抓握与精细操作 [9] - 特斯拉CEO马斯克转发擎天柱(Optimus)团队视频,展示人形机器人实验室跑步状态,动作流畅,团队称刷新个人纪录,特斯拉已启动试生产产线,规模更大的生产线将于2026年投产,规模化后每台成本预计控制在2万美元以内 [22] 极越汽车破产重整与资本变动 - 极越汽车(原集度汽车)启动预重整程序,CEO夏一平正主导引入新的投资方(主要来自中东),而主要发起方及投资方之一的百度寻求在此轮重整中完全退出 [10][11] - 极越破产重整面临庞大债务,据媒体报道可能高达70亿元,其两大股东吉利和百度联合解决了员工欠薪和裁员赔偿,但两者也是最大债权人,债权规模约占极越总债务的72% [11] - 百度已为极越(包括集度)投入约80亿元,最终换来总销量约1.4万辆,月均约1200辆,吉利持有集度45%股权 [11] 科技公司高层人事与治理动态 - 苹果CEO库克被曝出现不明原因手部颤抖,引发员工讨论,同时苹果近期经历高层人事震荡,人工智能主管、设计负责人、法务负责人、政府事务主管四位直接向库克汇报的高管接连离职,负责自研芯片的高级副总裁也正考虑离职 [12][13] - 新东方杭州员工发布内部信吐槽“996单休”加班文化,称每日工作时长从早9:30至晚21:30以上成为常态,该员工发布文章后账号被秒封并被移出公司架构,公司称其未按正确举报机制操作 [14] - 艾比森公司公告显示,创始人丁彦辉在董事长选举中投出唯一反对票,理由为“对董事长岗位薪酬不满意”,其2024年税前报酬总额为435.56万元,较2023年288.45万元增长约51%,公司回应称系董秘笔误,实际是董事长对公司激励机制不满 [17] 企业战略调整与业务表现 - Meta CEO扎克伯格被曝将改变元宇宙业务策略,计划明年将元宇宙团队预算削减高达30%,可能启动裁员,自2021年初重点发展元宇宙以来,其Reality Labs部门已累计亏损超700亿美元,部分资源将转向AI眼镜和可穿戴设备 [18][19] - 微软否认下调AI产品销售指标,驳斥了有关将Azure Foundry服务支出提升目标从50%下调至25%左右的报道,称其混淆了“增长目标”与“销售配额”,但报道同时披露企业客户如凯雷集团因技术问题减少了对Copilot Studio的使用 [20][21] - 佳能中山打印机工厂停产裁员,补偿方案包括“2.5N+1”经济补偿金及5个月工资的就业支援金,例如18年老员工总计可获约40万元,一名月薪5000元、工作3年的员工预计获8.25万元补偿,较法定标准翻四倍多,公司还主动为员工对接新工作并撰写推荐信 [16] 大模型与AI技术产品发布 - DeepSeek发布V3.2正式版及长思考增强版V3.2-Speciale,V3.2在公开推理基准测试中达到GPT-5水平,略低于Gemini-3.0-Pro,V3.2-Speciale在IMO、CMO、ICPC、IOI等竞赛中达到金牌水平,其中ICPC成绩达人类选手第二名 [25][26] - 英伟达发布业界首个专注于自动驾驶的开源视觉语言动作模型Alpamayo-R1,旨在构建“具身智能”基础,助力实现L4级自动驾驶 [28][29] - 理想汽车发布首款AI智能眼镜Livis,补贴后售价1699元起,整机重36克,标配蔡司镜片,典型续航18.8小时,可与理想汽车车机系统联动,实现百米内语音远程控车 [30][31][32] - 商汤科技发布并开源全新多模态模型架构NEO,推出基于该架构的2B与9B规格模型,旨在通过底层创新实现视觉与语言的统一处理 [35] - 米哈游联合创始人蔡浩宇创立的AI公司推出AI聊天软件AnuNeko,产品风格独特,旨在利用AI技术打造成类似“游戏引擎”的平台,用于生成可交互的NPC [33] - 阿里巴巴更新图片生成及编辑模型Qwen-Image,在多视角转换、多图像融合等方面取得进展,并已首发接入千问App供用户免费使用 [36][37] - 法国Mistral AI正式发布包含14B、8B、3B及Large 3版本的Mistral 3模型系列,均基于Apache 2.0协议开源 [39] - 可灵推出视频生成2.6模型,具备“音画同出”能力,可生成最长10秒带音效视频,并发布全新多模态创作工具“可灵O1” [40] 行业合作与产品动态 - 亚马逊AWS推出AI工具DevOps Agent,旨在帮助客户预测和恢复技术故障,客户可注册体验预览版,后续将收费 [38] - 埃森哲宣布与OpenAI合作,为数万名IT专业人员配备ChatGPT企业版 [40] - 汇丰银行与Mistral AI建立战略合作,以加速生成式AI在全行的应用,重点领域包括信贷流程和反洗钱检查 [40] - 代码显示,新版iPhone版ChatGPT应用可能未来接入苹果健康数据,Android测试版代码中则出现了广告功能相关引用 [40]
下周三!量子位的这件大事就要来了|MEET2026
量子位· 2025-12-07 12:35
大会概览 - 会议名称为MEET2026智能未来大会,主题为“共生无界,智启未来”,关注AI技术如何穿透产业、学科与场景边界 [39] - 大会将于2025年12月10日在北京金茂万丽酒店举办,线下报名通道已开启 [24][37][39] - 大会是业界最具代表性的年度智能商业峰会之一,每年获数千万媒体曝光,吸引千位线下观众与超300万名在线观众 [36] 核心议题与亮点 - 大会将深入探讨生成式AI与智能体等年度最热议题,包括大语言模型、多模态、具身智能、自动驾驶、云计算等主流AI相关领域 [3][5] - 设置两场高浓度对话:一场是文远知行创始人韩旭与量子位总编辑李根关于“第一批自动驾驶创业者的第二个八年”的GenAI Talk [7][8][11] - 另一场是题为“距离AI Agent革新千行百业还有多久”的圆桌讨论,汇聚小宿科技、联汇科技、蚂蚁百宝箱等平台方、技术方与应用方嘉宾 [13][16] - 大会将发布《2025年度AI十大趋势报告》与《2025人工智能年度榜单》,前者梳理年度进展与预见趋势,后者从企业、人物、产品三大维度筛选行业领军者 [35][47] 嘉宾阵容 - 大会累计邀请近三十位重量级嘉宾,覆盖学术界、产业界与前沿创业一线 [17] - 学术界嘉宾包括清华大学张亚勤院士、孙茂松教授,智源研究院王仲远院长,交大高金朱宁教授等 [1][17] - 产业界阵容覆盖芯片、云、模型到终端的全栈力量,包括百度、小米、商汤、蚂蚁、谷歌云、亚马逊云科技、高通、昆仑万维、潞晨科技、PPIO、中关村科金等代表性企业 [1][21] - 新生力量包括卓世科技、太初元碁、RockAI、自变量机器人、光轮智能、云徙科技、灵心巧手等前沿创业公司 [28] 会议议程要点 - 上午议程包括张亚勤院士谈“人工智能+”趋势、百度王颖谈AI打造超级智能体、智源王仲远谈AI从数字世界迈向物理世界、高通谈混合AI、亚马逊云科技谈Agentic AI等 [41] - 上午议程还包括中关村科金谈企业智能体、Google Cloud谈赋能初创企业出海、交大高金朱宁教授进行AI时代的经济学思考、卓世科技谈行业大模型破局等 [42] - 上午以文远知行韩旭的GenAI Talk对话及“2025人工智能年度榜单”发布收尾 [42] - 下午议程聚焦多模态与智能体,包括昆仑万维、商汤、小米、PPIO、潞晨科技、太初元碁、RockAI、百度智能云、自变量机器人、光轮智能、灵心巧手等公司的技术分享与应用探讨 [43][44][45] - 下午压轴环节为孙茂松教授谈生成式AI前沿态势,以及“距离AI Agent革新千行百业还有多久”的前沿圆桌讨论,最后发布《2025年度AI十大趋势报告》 [45]
下周三!量子位的这件大事就要来了|MEET2026
量子位· 2025-12-06 11:21
大会核心信息 - MEET2026智能未来大会将于2025年12月10日在北京金茂万丽酒店举办,主题为“共生无界,智启未来”[24][37][39] - 大会将探讨以AI为代表的智能科技如何穿透产业、学科与场景的边界,成为驱动社会演进的核心动能[39] - 大会将发布《2025年度AI十大趋势报告》与《2025人工智能年度榜单》[35][39][47] 嘉宾阵容 - 大会累计邀请近三十位重量级嘉宾,涵盖学术界、产业界与前沿创业一线[17] - 学术界嘉宾包括清华大学智能产业研究院院长张亚勤、清华大学人工智能研究院常务副院长孙茂松、智源研究院院长王仲远、交大高金教授朱宁等[1][17][45] - 产业界阵容覆盖芯片、云、模型到终端的全栈力量,包括百度、高通、小米、蚂蚁、亚马逊云科技、谷歌云、昆仑万维、潞晨科技、PPIO、商汤、中关村科金等代表性企业[1][21][24][25][26][43][44] - 前沿创业新生力量包括卓世科技、太初元碁、RockAI、自变量机器人、光轮智能、云徙科技、灵心巧手等[28][42][44][45] 核心议题与议程亮点 - 议题内容涵盖大语言模型、多模态、具身智能、自动驾驶、云计算及具体应用等AI主流方向[3] - 设置“GenAI Talk”对话,文远知行创始人兼CEO韩旭将分享自动驾驶创业第二个八年的实战经验,探讨GenAI如何赋能自动驾驶及Robotaxi大规模商业化落地的奇点[8][11][12] - 设置“激辩Agent”前沿圆桌,汇聚小宿科技、联汇科技、蚂蚁百宝箱等平台方、技术方与应用方,探讨AI Agent革新千行百业的时间表、技术架构及落地挑战[13][16][45] - 上午议程聚焦宏观趋势与基础技术,包括“人工智能+”趋势、超级智能体、AI从数字世界迈向物理世界、混合AI、Agentic AI等议题[41] - 下午议程深入多模态、智能体与产业应用,涵盖AI技术突破、基础设施、算力生态、硬件创新、物理世界基础模型、具身智能平台等话题[43][44][45] 大会价值与产出 - 大会旨在提供最前瞻的观点,帮助从业者理解技术变化如何重塑技术路线、产品逻辑及创业机会[4][6] - 通过一线实践者的分享,勾勒从理论、平台、应用到终端的完整AI落地拼图,探寻AI从概念炒作走向实际影响的真实路径[33][34] - 发布的《2025年度AI十大趋势报告》将梳理年度AI代表进展并展望可预见的技术趋势,覆盖算法、数据、算力底座至产品解决方案及行业应用[35] - 发布的《2025人工智能年度榜单》将从企业、人物、产品/解决方案三大维度,筛选行业最具影响力、创新力与潜质的领军者代表[35][47]
业界首个!记忆张量联手商汤大装置落地国产 PD 分离集群,推理性价比达 A100 的 150%
新浪财经· 2025-12-05 20:56
核心观点 - 记忆张量与商汤大装置联合,在国产GPGPU上成功部署了业内首个以“记忆—计算—调度”一体化为核心的PD分离商用推理集群,实现了显著的性能提升和成本优势,标志着国产算力体系在大模型商业化路径上首次具备“体系级”竞争力 [1][8] 技术方案与架构创新 - 记忆张量的核心产品MemOS是业内唯一以记忆为中心、进行系统设计的基础设施,它将大模型认知结构划分为三类记忆,并形成跨时间尺度的调度链路,能精细决策计算的前移与保留 [2][9] - MemOS与PD分离技术结合,通过其调度逻辑将PD分离的收益空间最大化,使PD分离从一个性能优化技巧转变为可完整描述、度量并长期运行的新推理范式 [2][5][9] - 商汤大装置为MemOS提供了顶层系统级基础设施支撑,包括IaaS算力池、智能调度、Ignite框架的性能增强以及万象MaaS平台的统一调度策略 [2][10] - 在国产GPGPU集群上,MemOS的记忆结构被清晰映射为物理分工:P域作为“记忆工厂”批量预生成KV Cache;D域作为“实时交互前台”专注解码;跨节点KV Cache通过高带宽互联实现“即产即用” [4][12] 性能与效率成果 - 在真实C端负载下,单卡并发效率提升约20%,从25.00并发/卡提升至29.42并发/卡 [1][6][12] - 集群整体吞吐量提升超过75%,从Naive部署下的107.85 tokens/s提升到189.23 tokens/s [6][12] - 综合推理性价比达到同代NVIDIA A100的150%左右,在严格SLA与相同负载结构下,首次实现了对A100的体系级正面超越 [1][6][13] - TTFT(首字延迟)全程稳定小于2秒,KV Cache在热门场景中的命中率提升70%+,提高了预计算复用率,进一步摊薄了推理成本 [6][12] 行业意义与未来展望 - 该成果为高性能模型的大规模落地打开了全新的降本增效空间 [1][8] - 双方计划未来围绕更大规模国产GPGPU集群构建记忆驱动流水线推理底座,并持续打磨Prefill行为预测、多级记忆管理等方向,以承载伴随式AI、具身智能体等更复杂任务 [7][14] - 此次实践为国产算力体系开辟了一条从“参数计算”走向“记忆计算”、从“静态推理”走向“动态流水线”的结构性路线,国产GPGPU有机会成为下一代推理范式的定义者之一 [7][14]
国产GPU企业摩尔线程(688795.SH)上市,商汤(00020)公开回应合作细节引关注
智通财经网· 2025-12-05 17:33
公司动态 - 摩尔线程于12月5日在科创板挂牌上市,成为国内GPU“第一股”,其上市被视为国产算力产业链进一步完善的标志性事件之一 [1] - 商汤科技官方回应投资者提问,确认公司与摩尔线程多年来保持业务合作关系,其算法已完成对摩尔线程相关产品的适配 [1] - 商汤科技表示,与摩尔线程的协同将有助于提升公司产品的市场适配性 [1] 行业趋势 - AI算法企业与国产GPU厂商之间的业务协同关系正受到关注,算法与硬件的深度适配成为推动技术落地与产业协作的关键一环 [2] - 在人工智能算力需求持续增长的背景下,产业链上下游协同发展成为行业趋势 [2] - 商汤科技作为国内人工智能软件代表企业,其算法与国产GPU的适配反映出积极构建开放合作产业生态的战略导向 [2]
商汤科技贾安亚:企业AI要落地,业务目标与行业理解重于模型本身 | WISE2025商业之王大会
36氪· 2025-12-05 15:34
大会背景与基调 - 2025年WISE商业之王大会在北京举办,主题为“风景这边独好”,旨在不确定中锚定中国商业的确定性未来 [1] - 大会以“科技爽文短剧”为沉浸式体验载体,探讨AI重塑硬件、具身智能、品牌全球化及传统行业转型等核心趋势 [1] AI应用范式的宏观转变 - AI应用范式正从2023年的“智能涌现”向2025年的加速落地经历深刻变革 [3] - 国家政策大力推动“人工智能+”战略,目标在2027年实现智能终端和智能体覆盖率超过70%,其重要性堪比十年前的“互联网+” [7] - 大模型应用范式在过去两年发生显著变化,从预训练、微调转向强化学习、智能体及多智能体,对算力消耗减小,但与场景和落地价值的关联度提高 [7] 企业侧AI落地的现状与挑战 - 现实中仅有极少数企业真正兑现了AI的价值,一项针对美国企业的调研显示,只有5%的企业在落地大模型后于财务报表上看到了实际量化价值 [4][7] - 企业落地面临挑战,包括技术迭代过快导致部署易被颠覆,以及技术与自身数据、流程打通困难 [8] - 企业内部自主进行的AI落地成功率,高于外部合作伙伴帮助落地的成功率,后者不到前者的三分之一 [9] - 员工自发使用AI工具的现象普遍,使得AI在企业侧的实际应用超过了调研报告所展示的数据 [9] 企业AI成功落地的关键策略 - **驱动模式转变**:成功的关键在于从传统IT部门主导转向由业务层驱动,让一线使用者成为技术引入的决策者,以弥补IT与业务部门的需求理解鸿沟 [4][13] - **精准场景选择**:应避开对容错率要求极低的领域(如财务),聚焦于具备容错空间且能产生显著增量价值的业务环节,如供应链、人事、运营等 [4][15] - **系统化解决方案**:企业需要的不是孤立的模型,而是能够端到端解决实际业务问题、深度融合企业数据流程的完整方案 [4][19] AI技术发展趋势与价值层次 - 多模态技术成熟和软硬结合带来成本优化,AI将从生产力工具进化为系统化解决方案 [4] - AI在企业内的价值可分为三层:个人提效、团队协作效率提升、整体管理效率提升 [17] - 越偏向个人应用,越容易有标准化产品;面向企业管理层时,则更需要针对行业和企业的定制化解决方案 [19] - 企业落地对精度要求严苛,需结合多模态能力处理文本、图片、数据库等多样数据要素 [20] 商汤科技的实践与产品演进 - 商汤科技从2023年更多与头部企业合作,发展到2025年已形成标准化产品和解决方案,服务更多中小企业、学校、医院等机构 [12] - 其产品“办公小浣熊”是国内第一款数据智能体,已演进为全新的AI办公系统,计划发布3.0版本 [21] - 通过模型训练和强化学习,该产品在数据分析任务上的企业落地精度超过95%,部分垂直任务可达100%,以满足企业可用要求 [21] - 产品功能聚焦于高精度数据分析智能体和任务规划Agent,以解决企业明确目标及复杂管理任务 [21][22][23] - 公司通过引入多模态协同训练及智能体所需能力(如沙盒、规划),提升模型解决企业业务问题的准确性 [19] - 未来AI发展将通过软硬结合(如推理加速、模型架构优化、硬件优化)来降低企业落地成本 [25][26]
Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死
36氪· 2025-12-05 15:06
行业范式转移 - 行业顶尖研究者如Ilya Sutskever指出,单纯依赖扩大数据、参数和算力的Scaling Law时代已经结束,大模型的未来在于架构创新而非规模堆砌 [1] - 行业过去几年陷入“唯规模论”的路径依赖,但Transformer架构的固有局限日益凸显,仅靠堆叠算力和数据无法通往真正的通用智能 [8] - 以NEO为代表的原生多模态架构的出现,标志着行业正从模块化拼接范式向更高效、更统一的原生架构范式迁移 [26] 现有技术瓶颈 - 当前主流多模态大模型(如GPT-4V、Claude 3.5)采用模块化拼接架构,将预训练的视觉编码器通过投影层嫁接到大语言模型上,视觉与语言信息在数据层面被粗暴拉拢,而非深度融合 [3] - 模块化架构存在三大技术鸿沟:1) 效率鸿沟:训练流程复杂、成本高昂,且各阶段可能引入误差;2) 能力鸿沟:视觉编码器的固定分辨率等设计限制了对复杂图像(如长图、工程图纸)的理解;3) 融合鸿沟:视觉与语言信息未在同一语义空间进行深度融合推理,导致细粒度任务表现不佳 [6][7][8] NEO架构的核心创新 - NEO是全球首个可大规模落地的开源原生多模态架构,其设计从第一性原理出发,打造了一个视觉与语言从诞生之初就统一的模型,不再区分视觉模块和语言模块 [3][8] - 核心创新体现在三大底层技术上:1) 原生图块嵌入:通过轻量级卷积神经网络直接从像素构建连续、高保真的视觉表征,突破了主流模型的图像建模瓶颈 [11][12];2) 原生三维旋转位置编码:为时间、高度、宽度三个维度分配不同频率,精准刻画视觉细节与空间结构,并为扩展到视频和3D场景铺平道路 [14];3) 原生多头注意力:在统一注意力框架下,让文本的因果注意力与视觉的双向注意力并存,提升对图像内部空间结构的理解能力 [16] - 配套采用Pre-Buffer & Post-LLM双阶段融合训练策略,巧妙解决了在不损害语言能力前提下学习视觉知识的难题,最终模型融为一个端到端的整体 [17] 性能与效率表现 - NEO展现出极高的数据效率,仅使用3.9亿个图像文本对进行训练,数据量仅为同类顶级模型所需数据的十分之一 [5][19] - 在多项视觉理解任务评测中,NEO追平甚至超越了Qwen2-VL、InternVL3等顶级模块化旗舰模型 [5][19] - 在2B参数规模下,NEO在AI2D、DocVQA、ChartQA等关键评测中得分分别为80.1、89.9、81.2,表现亮眼 [20] - 在8B参数规模下,NEO在MMMU、MMBench、MMStar、SEED-I、POPE等多个关键基准测试中均取得高分,展现出优于其他原生VLM的综合性能 [21][22] - NEO在2B到8B的中小参数规模区间内展现出较高的推理性价比,实现了精度与效率的双重跃迁,并大幅降低了推理成本 [22][23] 潜在影响与行业意义 - NEO为多模态AI的演进指明了新路径,其原生一体化架构从底层打通了视觉与语言的语义鸿沟,天然支持任意分辨率图像和长图文交错推理,并为视频理解、3D空间感知及具身智能等更高阶场景预留了扩展接口 [24] - 商汤科技已开源基于NEO架构的2B与9B模型,此举有望推动整个开源社区向更高效统一的原生架构迁移,加速形成新一代多模态技术的事实标准 [24] - NEO在中小参数规模下的高性价比,正在打破大模型垄断高性能的固有认知,使得强大的视觉理解能力可以下沉到手机、机器人、智能汽车、AR/VR眼镜、工业边缘设备等对成本、功耗和延迟敏感的终端场景 [23][24] - NEO是“架构创新重于规模堆砌”新趋势的首个成功范例,重新定义了多模态模型的构建方式,是通往下一代普惠化、终端化、具身化AI基础设施的关键雏形 [25][26]
Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死
量子位· 2025-12-05 13:33
行业范式转移 - AI行业顶尖研究者(如Ilya Sutskever)共同指出,单纯依赖扩大模型规模(Scaling Law)的时代已结束,行业正逼近收益递减的临界点 [1][2][20] - 真正的突破需来自架构层面的根本性创新,而非对现有Transformer流水线的修修补补,下一代AI的竞争力关键在于架构的聪明程度 [3][20][21] - 全球首个可大规模落地的开源原生多模态架构NEO的诞生,被视为这一范式转移的首个成功范例 [4][21][53] NEO架构的核心创新 - 采用原生一体化设计,从第一性原理打造视觉与语言血脉相连的统一模型,不再区分视觉和语言模块,从根本上解决了模块化架构的效率、能力和融合三大鸿沟 [19][22][46] - 创新性引入原生图块嵌入技术,通过轻量级卷积神经网络直接从像素构建高保真视觉表征,突破了主流模型的图像建模瓶颈 [24][25][27] - 采用原生三维旋转位置编码,为时间、高度、宽度维度分配不同频率,精准刻画不同模态的天然结构,为扩展到视频和3D场景铺平道路 [29][30][31] - 在统一注意力框架下实现因果与双向注意力并存,极大提升了对图像内部空间结构的理解能力,支撑复杂的图文交错推理 [33][34] 性能与效率表现 - 在数据效率上表现卓越,仅使用3.9亿个图像文本对进行训练,数据量仅为同类顶级模型所需数据的十分之一 [11][39] - 在多项关键评测中,仅以2B和8B的中小参数规模,就追平甚至超越了依赖海量数据的旗舰级模块化模型 [39][40][42] - 在MMMU、MMBench、MMStar、SEED-I、POPE等多个权威基准测试中取得高分,展现出优于其他原生VLM的综合性能 [41][42] 商业化与应用前景 - 其开源策略(已开源2B与9B模型)有望推动整个开源社区从模块拼接范式向更高效统一的原生架构迁移,加速形成新一代多模态技术事实标准 [48][49] - 在中小参数规模下展现出的高推理性价比,大幅降低了多模态模型的训练与部署门槛,使得强大的视觉理解能力可下沉至手机、机器人、智能汽车、AR/VR眼镜、工业边缘设备等终端场景 [43][44][45][50] - 原生一体化的架构设计为视频理解、3D空间感知乃至具身智能等更高阶的多模态交互场景预留了清晰的扩展接口,是构建下一代通用人工智能系统的理想底座 [46][47][51]
快讯|北京落地全球首个国家人形机器人赛训基地,商汤布局具身智能,东风汽车人形机器人明年上岗,百度、中金保时捷入股无界动力
机器人大讲堂· 2025-12-05 13:02
北京落地全球首个国家人形机器人赛训基地 - 北京市于12月4日发布行动计划,明确在奥林匹克中心区建设全球首个国家人形机器人赛训基地,并同步推进相关配套工程[3] - 产业端进展提速,宇树科技、优必选等头部企业已获大批量订单,特斯拉机器人量产进程也在持续推进[3] - 机构预测,到2035年全球人形机器人年销量有望达600万台,市场规模突破1200亿美元;乐观场景下销量将超1000万台,市场规模预计达2600亿美元[3] 商汤科技推出“大晓机器人” - 商汤科技宣布推出“大晓机器人”深耕具身智能赛道,核心团队由全球顶尖AI专家组成,包括联合创始人王晓刚和澳大利亚科学院院士陶大程[5] - 该机器人将于12月18日正式亮相,并发布全球首创ACE技术范式、具身超级大脑模组A1,以及国内首个开源且实现商业应用的“开悟”世界模型3.0[5] - “开悟”世界模型3.0已适配多款国产芯片并开放API,模组A1采用纯视觉无图技术实现自主导航,旨在通过技术开源与生态合作,推动机器狗在安防、巡检等场景快速落地[5] 百度、中金保时捷入股无界动力 - 通用具身智能机器人公司无界动力完成工商变更,新增股东包括百度旗下三亚百川致新私募股权基金和中金保时捷创投等,公司注册资本从10万元增至约14.2万元[7] - 无界动力成立于2025年3月,法定代表人为前地平线高管张玉峰,业务涵盖智能机器人研发销售、人工智能软硬件开发等领域,聚焦机器人“通用大脑”与“操作智能”研发[7] - 该公司此前已完成3亿元首轮融资,红杉中国、高瓴创投等参与投资,此次百度、中金保时捷的入局进一步凸显资本对具身智能赛道的看好[7] IDC首发布具身智能机器人创新报告 - IDC于2025年12月3日首次发布《IDC Innovators: 具身智能机器人创新者》报告,预测随着AI模型、感知及计算技术突破,具身智能机器人应用将快速扩展[9] - 报告预测,到2030年,具身智能机器人占整体机器人用户支出市场的比例将超过30%,成为推动机器人通用化、自主化发展的核心动力[9] - 入选该报告的创新者需具备技术或模式创新、年收入低于1亿美元等条件,微亿智造、远舢智能等四家企业入选,覆盖工业、物流、工业检测等场景[9] 东风汽车人形机器人明年上岗 - 东风汽车研发的两款人形机器人“小东”与机器人二号亮相,标志着车企布局具身智能赛道进入实质落地阶段[12] - “小东”搭载国产DF30车规级芯片及多模态大模型,擅长语音交互,未来将入驻4S店承担导购服务[12] - 机器人二号联合华科大团队研发,聚焦工业场景,本月启动产线实训,明年正式上岗负责搬料、巡检等任务[12]