Workflow
商汤(00020)
icon
搜索文档
重构人机交互新生态,“AI+硬件”破壁日常生活圈
新华日报· 2025-07-30 07:27
智能硬件产品加速涌现 - 消费级AI硬件成为AI融入日常生活的首批载体 形态多样的智能硬件产品在2025世界人工智能大会上集中展示 包括智能眼镜 AI玩具 智能办公设备等 [1] - 互联网大厂纷纷推出智能硬件 创业团队探索适老化 情感陪伴等垂直领域 [1] 智能眼镜市场竞争加剧 - 智能眼镜厂商集中亮相 成为展会新宠儿 包括XREAL Rokid Halliday等品牌 [2] - XREAL推出最新旗舰产品XREAL One Pro 搭载全球首款自研XPrism光学引擎 实现57°超广视场角和3毫秒超低延迟 [2] - Rokid Glasses实现滚动提词功能 可自动识别阅读位置 [3] - Halliday推出首款隐形显示智能眼镜 支持配处方镜片 机身重量28.5克 续航12小时 [3] - 国内大厂纷纷入场 小米推出1999元AI眼镜 阿里巴巴发布夸克AI眼镜 整合高德地图 淘宝 支付宝等应用生态 [3] AI陪伴机器人创新发展 - 商汤科技推出AI陪伴机器人"Fuzozo芙崽" 搭载数字人方案 实现高度拟真表情动作和视觉理解能力 [4] - 产品通过摄像头识别手势和物体 实现"所见即所言"的智能反馈 增强交互临场感与情感连接 [4] - Looi桌面机器人采用分体式设计 智能手机吸附底座后屏幕化身机器人眼睛 能感知用户情绪与环境并作出反应 [5] - 产品具备自主移动能力 可灵巧避障并感知桌面边缘 同时向开发者提供创意工具和软件开发工具包 [5] 办公与教育场景落地应用 - 出门问问推出新一代Agentic AI智能硬件TicNote产品矩阵 设备厚度约两张交通卡 内置Shadow AI系统实现语音转写 内容提炼 思维导图生成等功能 [6] - 产品适用于会议记录 采访 课堂学习 医生问诊等多种场景 [6] - 网易有道展示国内首款AI原生学习硬件AI答疑笔SpaceOne 融合DeepSeek-R1推理模型与教育大模型"子曰" 能分步拆解解题过程 [6] - 家长端可设置答案可见度 防止学生依赖标准答案 [6] 行业发展面临挑战 - 前端侧大模型受限于算力和能耗 性能尚难完全释放 [7] - 部分AI功能存在用户用不上 用不顺的问题 [7] - 如何推动AI技术与硬件产业深度融合 打造具备持续进化能力的下一代智能设备成为行业核心命题 [7]
WAIC|商汤首席科学家林达华:多模态是通向AGI的必经之路
中国经营报· 2025-07-29 22:57
人工智能发展趋势 - 人工智能的终极目标是构建能够与真实世界自主交互的真实智能 [1] - 大模型演进趋势是从语言模型向多模态能力发展 这是实现AGI的关键路径 [1] - 多模态模型已从简单嫁接发展到融合理解 并进一步延伸到思考层面 [1] 多模态模型技术进展 - 多模态模型在纯语言任务中表现优于纯语言模型 单独语言模型已无必要 [2] - 公司在"日日新"6.0前打通融合训练流程 发现预训练中段融合效率最高 [2] - "日日新"6.5实现融合思考能力 通过图文交错生成新图形启发思考 [2] - 公司是国内最早开展多模态融合且技术成熟的企业 起步早于同业 [2] AI技术变革机会 - 通用AI模型具有自主性强、通用性高的特点 能完成复杂工作 [3] - AI将重塑软件构建方式 使普通人无需专业语言就能开发软件 [3] - AI将改变办公模式 提升办公效率 变革生产力 [3] - 未来交互将无处不在 智能硬件能像伙伴一样贴心回应需求 [4] 具身智能布局 - 公司进军具身智能领域是为了实现数字与物理空间的连接 这是到达AGI的重要一步 [5] - 公司在计算机视觉和多模态模型领域的技术积累为具身智能提供了基础 [5] - 世界模型结合多模态基座积累与端到端闭环反馈 已成功应用于自动驾驶模块训练 [6] - 具身智能市场快速成长 公司希望凭借技术优势占据市场重要位置 [6] 研发与商业平衡 - 公司强调研发要与最终商业愿景对齐 通过商业落地校正科研方向 [6] - 基础模型投入需支撑业务 形成关键闭环逻辑 [6] - 具身智能和基础模型并非完全分割资源 额外投入相对可控 [6]
辅助驾驶有效数据难采集?首个已量产、可交互世界模型来了
南方都市报· 2025-07-29 21:59
端到端自动驾驶的挑战 - 自动驾驶系统需要采集海量数据 特斯拉拥有700万台量产车进行数据回流[2] - 需覆盖各种高风险场景数据 但人类驾驶行为中仅有极少部分数据对训练有价值[2] - 存在概率性问题且特定场景难以复现 导致模型训练存在数据瓶颈[2] 世界模型的技术突破 - 推出行业首个量产可交互的"绝影开悟"世界模型 配合生成式驾驶数据集WorldSim-Drive[4] - 基于单张A100 GPU每日生成数据相当于10台真实车或100台路测车 相当于500台量产车采集能力[4] - 当前20%数据通过世界模型生产 可生成千万级场景数据并打造实时交互训练场[4] 4D重建与场景编辑能力 - 具备1km²真实世界高精度重建能力 提供多视角空间数据[7] - 支持对视频内容进行任意编辑 包括移除/增加车辆 改变车辆类型 控制刹车转向等操作[7] - 通过API开放给客户实现要素自定义 生成多模态摄像头数据并实现精准可控[7] 具身智能的数据挑战 - 头部机器人企业年出货量仅四位数 真实数据采集有限[5] - 99%具身智能训练数据需来源于合成数据[5] - 视觉数据产生速度落后于算力增长 导致模型数据需求出现倒挂现象[5] 智能层次与规则定义 - 智能层次从感知到行为再到规则定义 需在交互中产生新智能[9] - 重要是为机器人定义价值观与文化 在规则允许范围内产生规则[9] - 通过自上而下约束方式确保智能体在既定框架内演进[9]
7月29日晚间新闻精选
快讯· 2025-07-29 21:46
具身智能与机器人布局 - 美的、京东、腾讯、商汤等公司展示具身智能和人形机器人布局 AI大脑软硬件需进一步提升 [1] AI硬件升级与PCB需求 - AI硬件升级引爆高端PCB需求 全球仅少数厂商具备稳定量产能力 技术壁垒导致产能短期难以填补需求真空 [2] 大模型一体机市场前景 - 大模型一体机标准化研讨会即将召开 中国大模型一体机需求爆发 有望开启千亿级市场 [3] 智能眼镜产品动态 - Meta研发主力产品线包含两款与雷朋联名的第三代智能眼镜 产品将提前至9月发布 [4] 公司业务与股份变动 - 赛微电子:国家集成电路基金累计减持1.06%公司股份 [5] - 南方路机:公司专注于工程搅拌领域 主营业务未发生变化 [5] - 方邦股份:上半年可剥铜产品销售收入占公司同期主营业务收入比例不足0.3% [5] - 西藏旅游:未与雅鲁藏布江下游水电工程相关单位开展业务合作 [5] - 北方稀土:包钢股份中标雅鲁藏布江稀土合金钢材项目属实 [5] - 力源科技:实控人沈万中因犯违规披露重要信息罪被判处有期徒刑一年 [5] - 药明康德:拟将回购股份价格上限调整为不超114.15元/股 [5]
商汤科技徐立:世界模型和具身AI结合将开启AI发展的下一个阶段
经济观察网· 2025-07-29 19:25
产品发布 - 商汤科技于7月27日发布「悟能」具身智能平台 该平台整合方舟视觉感知、大装置和日日新大模型技术 以"开悟"世界模型为核心引擎 [1] - 平台依托商汤大装置提供端侧和云侧算力支持 为机器人和智能设备赋予感知、视觉导航及多模态交互能力 [1] 技术战略 - 公司认为世界模型与具身AI结合将开启AI发展新阶段 实现从"工具"向"人"的跃迁 加速AGI时代进程 [1] - 平台旨在帮助具身智能企业实现与现实世界交互的目标 [1]
商汤科技林达华:具身智能需数字空间与物理空间连接
21世纪经济报道· 2025-07-29 19:25
多模态AI发展趋势 - 大型语言模型正从单一模态向多模态融合演进 这是通向通用人工智能的必经之路[1] - 原生多模态架构如Gemini模型实现图像视频信息在预训练过程中的深度融合 形成更深层次跨模态建模能力[4] - 多模态模型在纯语言任务上表现已超越单一语言模型 国内厂商预计2025年下半年全面普及多模态架构[1][5] 技术突破方向 - 需将多模态融合从理解层面延伸至思考层面 结合逻辑思维与形象思维实现真正智能[4] - 推理能力需从单领域(如奥赛、编程)泛化至广泛生产生活场景 达到人类自由推理水平[7] - 空间感知能力是当前多模态模型明显短板 国际顶尖模型无法解决儿童可轻易完成的积木拼接等空间问题[7] 具身智能发展现状 - 具身智能被视为通用人工智能终极形态 商汤科技在2025世界人工智能大会正式发布"悟能"具身智能平台[2] - 数据获取存在物理瓶颈 机器人真机操作数据量远低于互联网数字数据 需借助互联网视频等多模态数据构建基座模型[8] - 空间感知能力缺失可能成为具身智能落地的关键障碍[2][7] Agent技术应用 - Agent作为大模型能力落地的关键技术载体 2025年被视为"元年"并迎来爆发[6] - 通用Agent在复杂实际场景中仍存在较大差距 需结合具体场景和行业知识进行迭代开发[6] - 实际落地中可靠性和成功率至关重要 若无法有效解决问题则无法体现价值[6]
研报掘金|中泰证券:首予商汤“增持”评级 指其大模型能力处于第一梯队
格隆汇· 2025-07-29 19:17
投资评级与覆盖 - 中泰证券首次覆盖商汤并予以增持评级 [1] - 公司底层技术积累丰厚且大模型能力处于第一梯队 具有稀缺性 [1] - 亏损业务线正陆续实现拆分融资且主业生成式AI增长良好 [1] 财务表现与增长预期 - 预计2025至2027年总营业收入分别为48.72亿 62.79亿及80.93亿元 [1] - 预计营业收入按年增长各29% [1] 技术优势与竞争壁垒 - 公司利用生成式AI底层技术优势依托四大行业解决方案打造差异化竞争壁垒 [1] - SenseCore大装置实现高效率 低成本 规模化的新型人工智能基础设施 [1] - 算力实现全国联网的统一调度 覆盖从数据标注到模型部署的全链路批量化过程 [1]
发布“悟能”具身智能平台,商汤让机器人像人一样和现实世界交互
格隆汇· 2025-07-29 18:58
产品发布 - 商汤科技在WAIC 2025大模型论坛上发布「悟能」具身智能平台 [2] - 平台以商汤具身世界模型为核心引擎 依托商汤大装置提供端侧和云侧算力支持 [2] - 平台可为机器人及智能设备提供感知 视觉导航及多模态交互能力 [2] 技术能力 - 平台支持嵌入端侧芯片 具有强大的场景适配性 [2] - 具身世界模型能生成多视角视频并确保时间一致性和空间一致性 [4] - 模型可构建面向人 物 场的4D真实世界 仅需简单提示词即可自主生成位姿 动作骨架和指令 [4] 应用展示 - 现场展示搭载具身世界引擎的人形机器人 具备自动翻页 问答及阶段性小结功能 [2] - 技术可实现"在真实街道场景中玩极品飞车"的交互体验 [4] - 平台旨在帮助具身智能企业实现与现实世界交互的梦想 [6] 赋能范围 - 平台可赋能机器人等各种终端硬件 实现对世界万物的感知理解能力 [2]
2025世界人工智能大会这些新品最值得关注!一文看懂→
第一财经· 2025-07-29 18:47
机器人成为WAIC2025主角 - 机器人首次成为世界人工智能大会主角 几乎所有主要人形机器人公司如智元、宇树科技、银河通用、灵初均设展台展示进展[2][3] - 机器人硬件形态变化不大 仍以双足人形和轮式人形为主 但软件出现范式变化 从遥控进化到自主行走[3] - 腾讯已投入机器人领域7年 比现有多数人形机器人公司更久 成为今年领域最大变量[3] 具身智能模型突破 - 智元发布行业内首个面向真实世界双臂机器人的世界模型Genie Envisioner 整合预测-控制-评估环节 使机器人能预演动作后操作[9][11] - 生数科技与清华大学联合发布全球首个基于视频模型的具身基座模型Vidar 实现视频理解能力向物理决策能力迁移[12] - 商汤科技发布"悟能"具身智能平台 核心是世界模型 使机器人能理解三维空间与时序 生成动作方案完成任务[13] - 腾讯发布并开源混元3D世界模型1.0 可根据文本或图片在几分钟内生成360度3D场景 支持导出标准化3D Mesh资产[15][16] 大模型公司动态 - 大模型公司在WAIC2025相对低调 因上半年刚完成追赶DeepSeek的模型发布 MiniMax发布类DeepSeek R1的推理模型M1 月之暗面发布类DeepSeek V3的模型K2[5] - MiniMax称M1在Artificial Analysis开源模型榜单排名第二 月之暗面称K2在LMArena榜单综合表现超过DeepSeek R1成为第一[8] - 大模型公司竞争焦点转向争夺专业开发者注意力而非C端用户[8] AI应用产品进展 - 阿里巴巴公布首款自研AI眼镜研发进展 产品融合通义千问大模型和夸克AI能力 支持高德导航、淘宝比价等功能 预计年内发布[14] - 阶跃星辰发布新一代多模态推理模型Step 3 针对国产芯片优化 计划7月31日面向全球开源 公司今年收入目标10亿元人民币[17] - 千里科技联手阶跃星辰、吉利汽车发布智能座舱Agent OS预览版 具备自然语言交互和长短期记忆能力[18] - 快手可灵上线"灵动画布"功能 支持多人实时协作创作 用户数量已达4500万[19] 行业专家观点 - 星动纪元CEO陈建宇认为人形机器人大规模商业化在今明两年 规模化生产标准线为万台级别[21] - 宇树科技推出3.99万元人形机器人面向拳击文娱场景 星动纪元专注于工业方向全尺寸机器人[21] - 智元机器人姚卯青指出机器人需要高精度执行器、多维度传感器融合和高自由度本体构型[21][22] - 前腾讯技术负责人刘威认为世界模型需具备模拟预测探索能力 与多模态模型在交互方式和输出序列长度存在差异[23] - 亚马逊陈曦强调真实环境自主运行采集的数据最具价值[24] - UC Berkeley教授Sergey Levine提出将强化学习融入VLA模型可提升鲁棒性与性能[25] AI投资与商业化 - 2025年上半年中国AI投资热度大幅提升 融资额同比增加45.3% 投资事件数同比增加59.9% 财务投资人占比58.6%[34] - 光源资本郑烜乐指出创业公司机会在于成为"船"而非"礁石" 通过专业数据循环和场景理解建立壁垒[34] - 九合创投王啸认为AI应用需要闭环数据形成独立机会 编程数据过于公开难以建立壁垒[35] - 云启资本陈昱指出视频领域和SaaS重做是确定机会 通用型AI应用面临基模公司下场竞争和token成本挑战[36] - 蓝驰创投曹巍表示国内大B生意需要复合能力 工具类小B生意更市场化 AI应用国内市场生存艰难[40] - 无问芯穹汪玉指出AI 2.0时代token成为核心生产要素 端侧算力需求与现有能力存在10倍差距[42]
具身智能平台让机器人看懂、会动、能交互
新华社· 2025-07-29 18:36
行业动态 - 2025世界人工智能大会展览持续至7月29日 人形机器人作为具身智能的典型应用形态成为市场热点 [2] - 商汤科技在展会期间首次发布"悟能"具身智能平台 该平台帮助机器人实现看懂、会动、能交互三大核心能力 [2] - 平台为机器人厂商提供面向人、物、场真实世界的机器人"训练场" 显著提升机器人智能化水平 [2] 产品技术 - 商汤科技展台机器人讲解员具备实时PPT讲解功能 可同步回答观众问题并自如控制身体动作配合展示 [2] - "悟能"平台通过具身智能技术实现机器人动作与交互的协同控制 体现公司在人工智能领域的深度布局 [2]