日日新V6.5多模态推理大模型 - 财报，业绩电话会，研报，新闻 - Reportify

日日新V6.5多模态推理大模型

搜索文档

具身智能迎来实力派！十年多模态打底，世界模型开路，商汤「悟能」来了

量子位· 2025-07-27 19:57

商汤科技具身智能平台发布 - 公司在WAIC 2025论坛正式发布「悟能」具身智能平台标志着其入局具身智能领域[1][2] - 该平台是公司从感知视觉、多模态走向物理世界交互的必然结果依托超过十年的行业落地经验积累[13] - 平台架构包含感知、决策与行动等多个层次支持自动驾驶、机器人等具身场景的功能实现[27] 日日新V6.5多模态模型 - 新模型独创图文交错思维链使图像以本体形式参与推理跨模态精度显著提升[4][6] - 在MathVista等数据集上超越Gemini 2.5 Pro 如MathVista得分83.1 vs Gemini的80.9[8][9] - 相比6.0版本性能提升6.99% 推理成本降至30% 性价比提升5倍[10] 开悟世界模型技术特点 - 包含10万3D资产支持多视角视频生成最多11个摄像头角度并保持150秒时空一致性[16] - 支持参数化编辑可一键变换天气、光照等环境要素[20] - 同时处理人、物、场信息构建4D真实世界融合第一与第三视角[21][23][25] 具身智能商业化路径 - 采取"软硬协同"路线已与人形机器人、物流搬运等厂商达成合作预装模型[29] - 通过硬件销售积累视觉、语音和操作数据形成正向数据飞轮[30] - 验证"通用大脑+场景闭环"双轮路径多模态大模型与垂直应用相互促进[39] 行业痛点解决方案 - 通过虚拟环境合成99%数据配合1%真机样本解决数据稀缺问题[32][33] - 同步生成并标定第一和第三视角数据确保时空一致性缩短仿真与现实落差[35] - 感知层多传感输入决策层LLM+世界模型协同行动层端到端控制形成闭环[34]

商汤(HK:00020)

悟能具身智能平台

日日新V6.5多模态推理大模型

悟能具身智能平台

日日新V6.5多模态推理大模型