商汤(00020)
搜索文档
21对话|商汤科技林达华:具身智能需数字空间与物理空间连接
21世纪经济报道· 2025-07-28 16:10
AI技术演进趋势 - 大型语言模型(LLM)已从单一语言模型迈向多模态融合阶段,这是通向通用人工智能(AGI)的必经之路[2] - 2025年下半年或将迎来多模态模型的全面普及,国内厂商正加速布局[2] - 原生多模态架构如Gemini模型已实现图像、视频信息在预训练过程的深度融合,形成更深层次跨模态建模能力[6] 多模态技术发展 - 未来多模态需从理解层面延伸到思考层面,实现逻辑思维与形象思维的结合[6] - 经过融合训练的多模态模型在纯语言任务上表现可超越单一语言模型,商汤日日新6.0已取消单独语言模型[6] - 语言模型是通向AGI的切入点,但最终需具备多模态能力才能完成对世界的完整理解和建模[4][5] 具身智能发展 - 具身智能被视为AGI终极形态,商汤已发布"悟能"具身智能平台正式入局[3] - 当前多模态模型空间感知能力不足,成为具身智能落地的关键障碍[8][10] - 具身智能数据获取存在物理瓶颈,需借助互联网多模态数据构建基座模型弥补真机数据不足[10] Agent技术应用 - 2025年被视为Agent技术"元年",其发展与大模型能力提升密切相关[7] - 通用Agent在复杂场景中仍存在差距,需围绕具体场景迭代并结合行业知识[7] - Agent的可靠性和成功率是价值落地的核心指标,无效Agent会增加用户负担[7] AGI实现路径 - AGI需突破推理能力从狭窄领域向广泛生活生产场景的泛化[8] - 当前技术需解决多模态模型空间理解能力不足的问题,该能力对具身智能至关重要[8] - 智能需走出数字空间实现与物理世界的连接,这是AGI的关键特征[10]
商汤近13个月3度配股募资共72.82亿港元 去年亏43亿
中国经济网· 2025-07-28 14:42
商汤集团配售新股 - 公司于2025年7月23日与认购人订立协议,以每股1.50港元配售1,666,667,000股新股,总代价25亿港元,认购人总部位于香港及阿布扎比,由Infini Capital Global全资拥有 [1] - 2024年12月17日完成配售1,865,000,000股,每股1.50港元,占配售前已发行B类股份5.40%,所得款项净额27.87亿港元 [2] - 2024年6月27日完成配售1,673,446,000股,每股1.20港元,占配售前已发行B类股份6.45%,所得款项净额19.95亿港元 [3] - 三次配售合计募资72.82亿港元 [3] 商汤集团财务表现 - 2024年收入37.72亿元人民币,同比增长10.8%,年度亏损净额43.07亿元人民币,同比缩窄33.7% [3] - 2020-2024年收入趋势:34.46亿→47.00亿→38.09亿→34.06亿→37.72亿元人民币,2024年毛利16.20亿元 [4] - 2020-2024年持续经营业务年度亏损:121.58亿→171.77亿→60.93亿→64.95亿→43.07亿元人民币,亏损幅度呈收窄趋势 [4] - 2024年归属于本公司权益持有人的亏损42.78亿元人民币,非控股权益亏损0.28亿元 [4] 股权结构变动 - 2024年12月配售完成后,新股占扩大后已发行B类股份5.12%,总股份5.04% [2] - 2024年6月配售完成后,新股占扩大后已发行B类股份6.06%,总股份4.76% [3]
对话商汤联创林达华:多模态是AGI的必经之路,是不可缺少的部分
新浪科技· 2025-07-28 12:24
公司动态 - 商汤科技在2025世界人工智能大会期间发布"悟能"具身智能平台 该平台以具身世界模型为核心引擎 依托商汤大装置提供端侧和云侧算力支持 能为机器人 智能设备提供感知 视觉导航及多模态交互能力 [1] - 商汤科技联合创始人表示 多模态是AGI的必经之路 公司在计算机视觉领域积累多年 拥有多模态模型和AI技术 并与硬件公司有广泛合作 在智能驾驶过程中积累了模型应用和控制技术体系 [1] - 公司旗下拥有元萝卜机器人及绝影等机器人及智驾业务 同时通过国香资本重点投资具身智能赛道 被投企业包括银河通用 众擎机器人 钛虎机器人 鹿明机器人等 [1] 行业趋势 - 具身智能市场正在快速成长 商汤科技希望从商业角度捕捉这一机会 公司认为其多模态大脑与具身智能相结合 在世界模型上的积累将形成重要竞争优势 [1] - 具身智能领域近期融资活跃 商汤投资的银河通用获得宁德时代参投的11亿元新一轮融资 众擎机器人完成近10亿元融资 [1]
硬核「吵」了30分钟:这场大模型圆桌,把AI行业的分歧说透了
机器之心· 2025-07-28 12:24
大模型技术演进与发展之路 核心观点 - 大模型技术从预训练为主转向强化学习主导的范式转变 [10][17][19] - 行业面临Transformer架构局限性、数据枯竭、开源闭源博弈等核心挑战 [31][41][59] - Agent应用爆发与基础模型研发需双轨并行 [53][54][55] 训练范式转变 - OpenAI从GPT-4o的预训练主导转向o1的强化学习后训练,提出测试时间扩展新维度 [13][14][15] - 强化学习可解决行为克隆难以建立目标导向推理能力的问题,但需突破自然语言反馈限制 [21][22][23] - 预训练仍是强化学习冷启动的基础,但需解决奖励机制和算力效率挑战 [25][26][27] 模型架构演进 - Transformer面临O(n²)扩展性、显存占用和长期记忆三大瓶颈 [31] - 优化路径包括RoPE位置编码、分组查询注意力等改进,以及Mamba等非Transformer架构探索 [33][34] - 智能体时代可能推动RNN架构回归,需建模无限上下文能力 [37][38] 数据供给挑战 - 高质量语料预计2028年耗尽,合成数据被Anthropic/OpenAI等广泛应用但存在迭代崩溃风险 [41][42][43] - 英伟达提出物理仿真生成边缘案例,需建立真实世界验证闭环 [44][45] - 行业数据未充分挖掘,应建立非敏感数据共享机制提升预训练质量 [46][48][51] 商业化落地路径 - 2025年Agent产品成爆点(如OpenAI Operator、智谱AutoGLM),但基础模型研发仍持续 [53][54] - 大模型当前相当于自动驾驶L3阶段,距AGI仍有差距 [55] - 金融等领域落地需突破大规模数据处理等技术瓶颈 [56][57] 开源生态影响 - DeepSeek等开源模型性能逼近闭源,冲击传统GPU/闭源产业链 [60][61] - 开源推动资源合理配置并形成行业压力,但需解决分叉滥用问题 [63][64][67] - 英伟达支持开源算力引擎,未来可能走向混合模式 [65][66]
WAIC 2025上海开幕,“绝影开悟”世界模型升级亮相
中国汽车报网· 2025-07-28 10:45
公司动态 - 商汤绝影在2025世界人工智能大会上展示全新升级的"绝影开悟"世界模型,该模型是行业首个已量产、可交互的生成式世界模型产品平台 [1] - 公司发布业内最大规模的生成式驾驶数据集"WorldSim-Drive",持续赋能辅助驾驶行业 [1] - 商汤绝影与上汽集团旗下智己汽车深度合作,已打通Cut-in、碰撞等场景的数据生成链路,未来将共同打造数据工厂加速辅助驾驶系统落地 [4] - 公司正式发布辅助驾驶领域首个生成式世界模型产品平台,面向B/C端用户开放试用,基于"绝影开悟"世界模型构建 [4] 技术突破 - "绝影开悟"世界模型具备强大的物理规律理解与场景控制生成能力,是业内首个应用于真值训练数据生产的世界模型 [4] - 公司20%的数据通过世界模型生产,生产效率很高 [4] - 商汤绝影展示虚实融合的数据范式,以人、物体、场景为核心生成时空一致的第一视角和第三视角数据,赋能具身智能领域 [3] - 公司技术可生成千万级场景数据,打造实时交互训练场,同时构建具身智能的数据引擎 [3] 行业影响 - 商汤绝影深度参与上海自动驾驶实训场建设,以世界模型的数据生成和仿真测试能力赋能实训场 [3] - 公司在WAIC 2025展台提供世界模型实时交互体验,观众可通过简洁界面生成场景视频体验领先数据集性能 [7] - 商汤绝影CEO表示世界模型将AI创造力转化为生产力,搭建AI从数字世界通往物理世界的桥梁 [3]
商汤科技20250727
2025-07-28 09:42
纪要涉及的行业和公司 - **行业**:人工智能行业,涵盖大模型技术、机器人、金融、教育、航空等多个领域 - **公司**:商汤科技、英伟达、质谱公司、小米、金山办公、华为升腾、值得买科技、第四范式、科大讯飞、银河通用、库帕斯科技 纪要提到的核心观点和论据 大模型技术发展 - **技术范式转变**:大模型技术从预训练为主、监督学习为辅的范式逐渐转移到强化学习范式,提升了推理能力,但也带来幻觉、冗长思考等挑战[22] - **未来发展方向**:一是扩展当前范式以接受自然语言反馈,实现测试时群体交互;二是向自主在线代理方向发展,实现真正意义上的自主智能体[25] - **架构创新**:传统Transformer架构在算法向RL迁移时遇到阻碍,未来可能重新考虑RN类架构设计[28] 数据问题 - **数据枯竭**:互联网数据逐渐枯竭,需寻找新的数据来源和方法,以实现人工智能尤其是AGI方向上的进一步突破[30] - **数据不足解决方法**:使用物理模拟生成模拟场景训练模型,但需建立反馈机制,结合真实世界的基准测试和验证[31] - **行业数据重要性**:行业内有大量未被利用的数据,可通过行业场景大模型进行预训练激发出来[33] 人工智能可持续发展 - **挑战**:数据中心能耗巨大,预计到2030年全球数据中心将占总用电量的8%,推理阶段能耗可能成为主要来源[2][8] - **能效提升方法**:从基础设施、云、大模型以及应用层多层面优化,通过软件、硬件和制造工艺创新提升能效,也可进行能源优化[9] - **赋能可持续发展**:人工智能能够显著减少重工业碳排放,帮助工厂节能减排,推动整体能源消耗平衡并最终减少碳排放[11] 行业应用与商业化 - **金融领域**:大规模人工智能技术落地面临数据质量、安全和资源利用等挑战,需优化资源配置和改进数据处理方法[38] - **商汤科技成果**:通过SenseNova大模型及研发体系,推动高效率、低成本、规模化的AI创新和落地,在多模态技术、机器人、自动驾驶等领域有诸多应用[41] - **生产力转化**:实现从生产力工具到实际生产力的转化需要多模态融合分析和自动化处理,小浣熊产品是典型例子[49] - **人机交互**:大语言模型的发展推动人机交互进入新范式,AI从辅助角色转变为主动执行任务,人类进行监督和指导[51] 国际合作与发展 - **中印合作**:中印两国在人工智能领域的合作涵盖政府、工业、大学等多个层面,有助于解决AI治理核心问题,促进本地创新[17] - **中国举措**:中国通过开源贡献、提出愿景方案、建设合作中心等举措,推动全球人工智能发展[81] 其他重要但是可能被忽略的内容 - **香港国际机场应用**:香港国际机场在2020 - 2025年期间逐步引入多种人工智能应用,如自动化行李分拣系统、自主巡逻车等,以应对运营效率、安全等挑战[72] - **智能体发展**:智能体已成为大模型应用的重要关注点,其产业链逐渐形成,在多个领域得到广泛应用[78] - **具身智能**:2025年具身智能发展取得进展,但进入各行各业和家庭还需解决数据问题,合成数据与真实数据结合是有效策略[82] - **AI发展影响**:AI发展对人类工作、生活及独特性提出挑战,科学家应提前思考,确保具身智能与人类关系安全[89]
【立方早知道】美欧达成新贸易协议/人工智能大利好!京东、腾讯等放大招/河南“专精特新”专板来了
搜狐财经· 2025-07-28 08:20
资本市场与监管动态 - 中国资本市场学会成立 设立7个专业委员会 中国证监会主席吴清当选会长 [1] - 中国证监会召开2025年年中工作会议 部署系统党建及改革发展重点任务 [14][15] - *ST苏吴因财务造假可能被强制退市 2020-2023年虚增营收利润 [31] - *ST万方、太原重工、*ST沐邦因信披违规被证监会立案调查 [32][33][34] 人工智能与科技产业 - 2025世界人工智能大会吸引800家企业参展 展出3000余款产品 150台人形机器人创国内最大规模展示 [4] - 腾讯开源"混元3D世界模型" 网易推出矿山级具身智能模型"灵掘" 京东升级"JoyAI"大模型矩阵 [4] - 中国政府倡议成立世界人工智能合作组织 总部拟设上海 [19] 贸易与宏观经济 - 美欧达成新贸易协议 欧盟对美投资增加6000亿美元 采购7500亿美元能源产品 维持钢铝关税现状 [8] - 美国商务部长确认8月1日不再延长加征关税期限 此前威胁对欧盟征收30%关税 [10] - 上半年全国规上工业企业利润下降1.8% 私营企业利润增长1.7% 外资企业增长2.5% [16] 产业政策与扶持 - 河南省推出"专精特新"专板 提供融资及上市培育服务 [6] - 国家下达第三批690亿元国债资金支持消费品以旧换新 [17] - 十部门出台农产品消费促进方案 推动人工淀粉、菌体蛋白等新食品配料研发 [20][21] - 农药行业启动"正风治卷"三年行动 目标2027年底遏制低价无序竞争 [23] 上市公司动态 - 首创证券拟发行H股赴港上市 当前A股市值559.8亿元 [25] - 玲珑轮胎H股发行备案材料获证监会接收 [27][28] - 金桥信息拟定增募资6.33亿元 用于AI研发及智慧空间升级 [29] - 紫金矿业副总裁拟减持25.03万股 ST路通股东计划减持3%股份 [37] - 瑞贝卡上半年净利润增长15.31%至937.59万元 [38] - 老铺黄金上半年净利预增279%-288%至22.3-22.8亿元 [39] - 同洲电子扭亏为盈 净利润同比增662%至2.03亿元 [40]
WAIC2025前沿聚焦(3):商汤日日新6.5重塑AI生产力
海通国际证券· 2025-07-28 07:33
行业投资评级 - 报告未明确提及对商汤科技或AI行业的投资评级 [1][2][3][4][5] 核心观点 - 商汤科技CEO徐立系统回顾AI技术发展的三大阶段:视觉AI爆发、自然语言处理、多模态和生成式AI时代 [1][2] - 当前AI发展核心命题是"智能从哪里来",从依赖人工标注数据转向多模态数据融合 [2][13] - 多模态思维链通过结合视觉感知与自然语言处理,显著提升AI推理能力和现实世界理解力 [2][13] 技术突破 - 日日新SenseNova 6.5模型实现"多模态长思维链"构造能力,80%通过自动化数据飞轮生成 [3][14] - 新模型预训练数据量增加20%,推理吞吐量提升35%,推理成本降至原先30%,综合性价比提升3倍以上 [3][14] - 模型能模拟人类复杂问题解决路径(如识别图中球员需多步骤分析),自动调用图像检测等外部工具 [3][14] 商业化创新 - 突破"工具陷阱":从生产力工具转向直接产出结果的生产力,用户为结果付费而非过程 [4][15] - "小浣熊"智能助手实现端到端复杂任务处理:解析混合Excel/PDF/视频截图,生成结构化PPT/文档 [4][15] - 行业专属版本覆盖金融、教育等领域,定位为可独立完成任务的"数字员工" [1][12] 战略布局 - 推出"悟能"具身智能平台,整合视觉感知、导航和智能交互能力赋能机器人产业 [5][16] - 平台特点:端侧芯片实时识别复杂场景,适配自动驾驶技术实现机器人精准导航 [5][16] - 推动机器人从"交互工具"升级为"交互伙伴",具备任务理解、内容生成和幽默互动能力 [5][16]
上海逐步完善“AI+数学”融合发展生态
中国证券报· 2025-07-28 05:07
人工智能与数学融合 - 2025世界人工智能大会(WAIC 2025)举办"人工智能的数学边界与基础重构"高端论坛,展示AI大模型在数学推理领域的突破性进展,上海人工智能实验室的Intern-IMO系统通过自然语言推理完成几何构型分析与归纳证明,商汤科技"日日新"大模型通过变量代换将复杂恒等式化归为统一三角形式 [1] - 当大模型参数突破万亿时,传统调参方法陷入瓶颈,模型的泛化能力、安全性、能耗控制等核心问题需要数学理论的系统性支撑,同时AI对数学的反哺效应显著,"AI for Math"模式正在改写数学研究范式 [1] - 丘成桐教授团队联合欧洲、日本数学家精选几何与代数交叉难题考验AI深层推理能力,采用"人类出题-机器作答"模式引导AI聚焦核心难点,避免技术算力无效消耗 [2] 上海在AI与数学融合中的优势 - 上海拥有全国领先的算力基础设施如华为384超节点真机等尖端设备,为大规模数学建模与AI训练提供强大支撑,张江人工智能岛聚集数百家中外AI企业形成完整生态链 [4] - 复旦大学、上海交通大学等高校数学学科排名全国前列,拥有多个国家重点实验室,在微分几何、组合数学等方向研究实力雄厚,形成"AI产业集群+顶尖数学学科"双重优势 [4] - 上海通过四大举措完善"AI+数学"融合发展生态:推动高校开设交叉学科培养复合型人才、建设"数学智能创新平台"开放资源、设立"数学智能创新基金"支持前沿探索、推广"数学建模+AI优化"解决方案 [4][5] 学术研究与技术突破 - 中国科学院院士徐宗本提出通过算子簇公共不动点理论设计深度架构,实验证明大模型存在"冗余阈值"为模型优化提供数学依据 [3] - 西班牙国家研究委员会研究员郑凡与上海人工智能实验室合作展示AI对复杂几何题的分步拆解能力,复旦大学印佳教授与商汤团队呈现AI对学生错误解答的批改过程 [3] - 上海科技大学蔡明亮教授指出大模型在概率递推问题中展现逻辑链完整性,但在需要"反直觉"构造的场景仍显不足 [3] 国际合作与实验室建设 - Hitchin–Ngo实验室(聚焦代数几何与数学物理)与Fefferman实验室(深耕流体力学与纳维-斯托克斯方程)落地上海普陀区,标志着全球数学与AI融合研究的重心向中国倾斜 [2] - 上海市委常委、副市长陈杰强调数学与AI深度融合是强化科创策源功能的关键抓手,上海正加快建设具有世界影响力的科技创新中心 [3]
能讲PPT、懂指令!商汤“悟能”平台让机器人“玩转”现实世界|聚焦世界人工智能大会
国际金融报· 2025-07-28 03:20
AI演进路径 - AI发展已实现从感知智能到生成式智能的跨越,下一阶段突破取决于AI能否主动探索并交互现实世界 [1] - 人类智能源于与物理世界的持续互动,而机器智能长期受制于人类知识供给的有限性 [3] - 当前自然语言数据或将于2027至2028年耗尽,视觉数据虽丰富但难以有效提炼知识 [3] 技术发展历程 - 2011年至2012年,以CNN、ResNet为代表的深度学习算法推动感知AI爆发式发展,但依赖人工标注数据,泛化能力受限 [3] - 2017至2018年,Transformer架构兴起使AI具备从自然语言中提取知识的能力 [3] - GPT-3处理的文本量相当于人类十万年的创作积累,自然语言的高知识密度赋予模型强大泛化与通用能力 [3] 数据与算力挑战 - 视觉数据产生速度远落后于算力增长速度,导致模型数据需求出现"倒挂" [3] - 机器人及具身智能的潜在瓶颈是对高质量交互数据的巨大需求 [3] - 真实环境交互成本极高,传统模拟器解决方案存在"模拟与现实差距"问题 [4] 商汤科技解决方案 - 推出"开悟"世界模型,考虑时间、空间一致性,为AI训练提供高质量模拟数据 [4] - 发布"悟能"具身智能平台,以具身世界模型为核心引擎,提供端侧和云侧算力支持 [6] - "悟能"平台可赋能机器人等终端硬件,实现感知理解能力并支持嵌入端侧芯片 [6] 具身智能应用场景 - 具身世界模型可生成多视角视频,确保时间与空间一致性,实现真实世界交互 [8] - 能构建面向人、物、场的4D真实世界,根据简单提示词自主生成位姿、动作骨架和指令 [8] - 现场展示搭载具身世界引擎的人形机器人,具备自然语言交互、自动翻页及问题回答能力 [6]