Workflow
商汤(00020)
icon
搜索文档
商汤科技大模型综合商务部执行总监李星冶:生成式AI如何赋能品牌出海? | 36氪2025出海大会
36氪· 2025-07-30 14:19
大会概况 - 2025出海大会于7月25日在杭州举办 聚焦全球化与出海领域 涵盖消费、科技、电商、金融、新能源等热门行业 [1] - 大会设立主会场及分会场 包含10余主题演讲和5场圆桌对话 发布East Forward 2025出海全球化创新名册 [1] 数字人直播技术 - 数字人直播实现接近真人互动效果 支持实时响应评论区问题 无需副播或助理控场 [4] - 数字人可快速适配多场景直播 仅需录入产品关键词即可生成脚本 支持全平台投放 [4] - 数字人支持复刻明星或KOL风格 实现多平台同步开播和低成本规模化运营 [5] AIGC内容生成 - AIGC实现端到端全流程赋能 输入产品描述可生成4K精度广告视频及多画风图文素材 [6] - 技术支持电商穿搭图快速换模特 在合规前提下无需重复拍摄 大幅降低真人拍摄成本 [6] - AIGC全链路整合从内容生成到控评 相比传统模式降低50%以上运营成本 [7] AR技术应用 - AR技术支持虚拟试装试戴 覆盖彩妆、配饰等刚性品类 与中免、汉高等品牌达成合作 [8] - AR智能体覆盖电商导购、供应链管理及智能家居场景 为世界500强企业提供仓库智能规划 [8] - AR技术实现舆论智能管理 实时抓取全网负面评论并生成回应话术 与多家4A公司合作 [9] 技术合作与支持 - 商汤科技为全球首家上市纯AI企业 聚焦垂直行业工具开发 技术接入亚马逊、微软等海外云平台 [3][10] - 公司算法持续快速迭代 与微博、美团等平台达成战略合作 提供数字人技术及全场景解决方案 [4][10]
商汤发布「日日新V6.5」大模型,多模态能力大幅提升,让AI从“生产力工具”进阶“生产力”
财经网· 2025-07-30 13:40
多模态AI技术突破 - 多模态信息感知与处理是AGI核心要求及从语言模型迈向AGI的必由之路[1] - 多模态智能演进将驱动AI下一阶段发展 涵盖感知 推理及交互[1] - 商汤科技发布日日新SenseNova V6 5大模型体系 实现多模态基座大模型突破性升级[1] 日日新V6 5技术升级 - 实现三大突破性升级:强推理能力比肩Gemini 2 5 Pro和Claude 4-sonnet 性价比提升3倍以上 智能体支持端到端场景落地[3] - 多模态推理与交互性能大幅提升 超越Gemini 2 5 Flash和GPT-4o 成为国内首个实现图文交错思维的商业级大模型[4] - 采用改进的多模态融合架构 视觉编码器显著变轻 视觉表征在早期与语言对齐 预训练吞吐量提升20%以上 强化学习效率提升40% 推理吞吐量提升35%以上[5] 商汤小浣熊智能体升级 - 基于日日新V6 5多模态数据分析能力全面升级 可处理多模态复杂输入并实现专业可视化输出[6] - 在客户场景测试中达到Claude 4 Opus水平 大幅领先OpenAI o3 时序计算 数据匹配 数理计算和异常检测准确率接近100%[6] - 能够解析含合并单元格 缺失值 子表格及内嵌图表的复杂Excel表格 并生成完整分析报告[10] 实际应用场景 - 支持从截图提取表格信息并导出可编辑Excel表格 实现多模态全流程处理[10] - 教育版覆盖500+院校 10余种教育场景 25万+师生 帮助学生提升学习效率15-30% 降低学业焦虑发生率40% 课堂参与度提高2 1倍 资源错配率降低30% 心理健康干预及时性提升50%[13] - 金融版提供知识助手 智能问数及多模态智能理赔解决方案 构建人机协同智能决策新范式[14] - 产品矩阵累计服务用户数量超1000万[15] 行业意义 - AI凭借多模态融合能力突破逐步触达AGI边界 向类人标准靠近[1] - 实现从生产力工具到生产力的跨越 推动AI完成从工具到人的跃迁[3][6]
智通港股沽空统计|7月30日
智通财经网· 2025-07-30 08:25
沽空比率排行 - 京东健康-R(86618)沽空比率为100 00% 位居第一 偏离值为45 78% [1][2] - 恒生银行-R(80011)沽空比率为88 44% 位居第二 偏离值为48 82% [1][2] - 商汤-WR(80020)沽空比率为76 25% 位居第三 偏离值为22 96% [1][2] - 联想集团-R(80992)沽空比率为63 51% 偏离值为12 91% [2] - 深圳高速公路股份(00548)沽空比率为53 29% 偏离值为28 21% [2] 沽空金额排行 - 小米集团-W(01810)沽空金额为22 09亿元 位居第一 沽空比率为16 41% [1][2] - 腾讯控股(00700)沽空金额为9 55亿元 位居第二 沽空比率为10 29% [1][2] - 药明康德(02359)沽空金额为6 98亿元 位居第三 沽空比率为23 11% [1][2] - 比亚迪股份(01211)沽空金额为6 30亿元 沽空比率为23 17% [2] - 建设银行(00939)沽空金额为6 05亿元 沽空比率为20 43% [2] 沽空偏离值排行 - 恒生银行-R(80011)偏离值为48 82% 位居第一 沽空比率为88 44% [1][2] - 京东健康-R(86618)偏离值为45 78% 位居第二 沽空比率为100 00% [1][2] - 统一企业中国(00220)偏离值为33 70% 位居第三 沽空比率为43 86% [1][2] - 深圳高速公路股份(00548)偏离值为28 21% 沽空比率为53 29% [2] - 再鼎医药(09688)偏离值为24 46% 沽空比率为39 60% [2] 其他个股数据 - 中国电力(02380)沽空金额为3090 70万元 沽空比率为35 93% 偏离值为20 71% [3] - 港铁公司(00066)沽空金额为6683 78万元 沽空比率为51 83% [2] - 中国移动-R(80941)沽空金额为260 54万元 沽空比率为50 38% [2]
重构人机交互新生态,“AI+硬件”破壁日常生活圈
新华日报· 2025-07-30 07:27
智能硬件产品加速涌现 - 消费级AI硬件成为AI融入日常生活的首批载体 形态多样的智能硬件产品在2025世界人工智能大会上集中展示 包括智能眼镜 AI玩具 智能办公设备等 [1] - 互联网大厂纷纷推出智能硬件 创业团队探索适老化 情感陪伴等垂直领域 [1] 智能眼镜市场竞争加剧 - 智能眼镜厂商集中亮相 成为展会新宠儿 包括XREAL Rokid Halliday等品牌 [2] - XREAL推出最新旗舰产品XREAL One Pro 搭载全球首款自研XPrism光学引擎 实现57°超广视场角和3毫秒超低延迟 [2] - Rokid Glasses实现滚动提词功能 可自动识别阅读位置 [3] - Halliday推出首款隐形显示智能眼镜 支持配处方镜片 机身重量28.5克 续航12小时 [3] - 国内大厂纷纷入场 小米推出1999元AI眼镜 阿里巴巴发布夸克AI眼镜 整合高德地图 淘宝 支付宝等应用生态 [3] AI陪伴机器人创新发展 - 商汤科技推出AI陪伴机器人"Fuzozo芙崽" 搭载数字人方案 实现高度拟真表情动作和视觉理解能力 [4] - 产品通过摄像头识别手势和物体 实现"所见即所言"的智能反馈 增强交互临场感与情感连接 [4] - Looi桌面机器人采用分体式设计 智能手机吸附底座后屏幕化身机器人眼睛 能感知用户情绪与环境并作出反应 [5] - 产品具备自主移动能力 可灵巧避障并感知桌面边缘 同时向开发者提供创意工具和软件开发工具包 [5] 办公与教育场景落地应用 - 出门问问推出新一代Agentic AI智能硬件TicNote产品矩阵 设备厚度约两张交通卡 内置Shadow AI系统实现语音转写 内容提炼 思维导图生成等功能 [6] - 产品适用于会议记录 采访 课堂学习 医生问诊等多种场景 [6] - 网易有道展示国内首款AI原生学习硬件AI答疑笔SpaceOne 融合DeepSeek-R1推理模型与教育大模型"子曰" 能分步拆解解题过程 [6] - 家长端可设置答案可见度 防止学生依赖标准答案 [6] 行业发展面临挑战 - 前端侧大模型受限于算力和能耗 性能尚难完全释放 [7] - 部分AI功能存在用户用不上 用不顺的问题 [7] - 如何推动AI技术与硬件产业深度融合 打造具备持续进化能力的下一代智能设备成为行业核心命题 [7]
WAIC|商汤首席科学家林达华:多模态是通向AGI的必经之路
中国经营报· 2025-07-29 22:57
人工智能发展趋势 - 人工智能的终极目标是构建能够与真实世界自主交互的真实智能 [1] - 大模型演进趋势是从语言模型向多模态能力发展 这是实现AGI的关键路径 [1] - 多模态模型已从简单嫁接发展到融合理解 并进一步延伸到思考层面 [1] 多模态模型技术进展 - 多模态模型在纯语言任务中表现优于纯语言模型 单独语言模型已无必要 [2] - 公司在"日日新"6.0前打通融合训练流程 发现预训练中段融合效率最高 [2] - "日日新"6.5实现融合思考能力 通过图文交错生成新图形启发思考 [2] - 公司是国内最早开展多模态融合且技术成熟的企业 起步早于同业 [2] AI技术变革机会 - 通用AI模型具有自主性强、通用性高的特点 能完成复杂工作 [3] - AI将重塑软件构建方式 使普通人无需专业语言就能开发软件 [3] - AI将改变办公模式 提升办公效率 变革生产力 [3] - 未来交互将无处不在 智能硬件能像伙伴一样贴心回应需求 [4] 具身智能布局 - 公司进军具身智能领域是为了实现数字与物理空间的连接 这是到达AGI的重要一步 [5] - 公司在计算机视觉和多模态模型领域的技术积累为具身智能提供了基础 [5] - 世界模型结合多模态基座积累与端到端闭环反馈 已成功应用于自动驾驶模块训练 [6] - 具身智能市场快速成长 公司希望凭借技术优势占据市场重要位置 [6] 研发与商业平衡 - 公司强调研发要与最终商业愿景对齐 通过商业落地校正科研方向 [6] - 基础模型投入需支撑业务 形成关键闭环逻辑 [6] - 具身智能和基础模型并非完全分割资源 额外投入相对可控 [6]
辅助驾驶有效数据难采集?首个已量产、可交互世界模型来了
南方都市报· 2025-07-29 21:59
端到端自动驾驶的挑战 - 自动驾驶系统需要采集海量数据 特斯拉拥有700万台量产车进行数据回流[2] - 需覆盖各种高风险场景数据 但人类驾驶行为中仅有极少部分数据对训练有价值[2] - 存在概率性问题且特定场景难以复现 导致模型训练存在数据瓶颈[2] 世界模型的技术突破 - 推出行业首个量产可交互的"绝影开悟"世界模型 配合生成式驾驶数据集WorldSim-Drive[4] - 基于单张A100 GPU每日生成数据相当于10台真实车或100台路测车 相当于500台量产车采集能力[4] - 当前20%数据通过世界模型生产 可生成千万级场景数据并打造实时交互训练场[4] 4D重建与场景编辑能力 - 具备1km²真实世界高精度重建能力 提供多视角空间数据[7] - 支持对视频内容进行任意编辑 包括移除/增加车辆 改变车辆类型 控制刹车转向等操作[7] - 通过API开放给客户实现要素自定义 生成多模态摄像头数据并实现精准可控[7] 具身智能的数据挑战 - 头部机器人企业年出货量仅四位数 真实数据采集有限[5] - 99%具身智能训练数据需来源于合成数据[5] - 视觉数据产生速度落后于算力增长 导致模型数据需求出现倒挂现象[5] 智能层次与规则定义 - 智能层次从感知到行为再到规则定义 需在交互中产生新智能[9] - 重要是为机器人定义价值观与文化 在规则允许范围内产生规则[9] - 通过自上而下约束方式确保智能体在既定框架内演进[9]
7月29日晚间新闻精选
快讯· 2025-07-29 21:46
具身智能与机器人布局 - 美的、京东、腾讯、商汤等公司展示具身智能和人形机器人布局 AI大脑软硬件需进一步提升 [1] AI硬件升级与PCB需求 - AI硬件升级引爆高端PCB需求 全球仅少数厂商具备稳定量产能力 技术壁垒导致产能短期难以填补需求真空 [2] 大模型一体机市场前景 - 大模型一体机标准化研讨会即将召开 中国大模型一体机需求爆发 有望开启千亿级市场 [3] 智能眼镜产品动态 - Meta研发主力产品线包含两款与雷朋联名的第三代智能眼镜 产品将提前至9月发布 [4] 公司业务与股份变动 - 赛微电子:国家集成电路基金累计减持1.06%公司股份 [5] - 南方路机:公司专注于工程搅拌领域 主营业务未发生变化 [5] - 方邦股份:上半年可剥铜产品销售收入占公司同期主营业务收入比例不足0.3% [5] - 西藏旅游:未与雅鲁藏布江下游水电工程相关单位开展业务合作 [5] - 北方稀土:包钢股份中标雅鲁藏布江稀土合金钢材项目属实 [5] - 力源科技:实控人沈万中因犯违规披露重要信息罪被判处有期徒刑一年 [5] - 药明康德:拟将回购股份价格上限调整为不超114.15元/股 [5]
商汤首度发布“悟能”具身智能平台
证券时报网· 2025-07-29 20:47
产品发布 - 公司正式发布"悟能"具身智能平台 以"开悟"世界模型为核心引擎 依托商汤大装置提供端侧和云侧算力支援 [1] - 平台可为机器人、智能设备赋予感知、视觉导航及多模态交互能力 推动智能终端向更高层次自主化与智能化演进 [1] - 平台可广泛适配包括汽车、机器人在内的各类终端 实现空间层面的现实世界互动 [1] 技术能力 - 感知能力基于商汤方舟在视觉AI领域十余年积累 能为终端硬件赋予万物识别与理解能力 支持端侧芯片实现端侧推理 [2] - 导航能力依托商汤绝影纯视觉端到端智能辅助驾驶方案 可泛化适配至机器人等设备 实现精准路径规划与导航 [2] - 交互能力基于"日日新"大模型技术 赋能机器人具备有温度、有深度、长记忆、超稳定等交互能力亮点 [2] 战略愿景 - 世界模型和具身AI结合将开启AI发展下一阶段 完成由"工具"向"人"的跃迁 加速迈向AGI时代 [1] - 平台旨在帮助各类具身智能企业完成和现实世界交互的梦想 [1] 生态合作 - 公司联合华为、库帕思、海光、寒武纪等十余家国产生态伙伴共同发布"商汤大装置算力Mall" [2] - 算力Mall提供灵活自主的国产算力选择与组合 致力于构建"面向未来的算力超级市场" [3] - 该举措可大幅降低AI应用门槛 加速大模型行业落地 打破国外技术壁垒 推动中国AI产业自主可控生态建设 [3]
商汤科技徐立:世界模型和具身AI结合将开启AI发展的下一个阶段
经济观察网· 2025-07-29 19:25
产品发布 - 商汤科技于7月27日发布「悟能」具身智能平台 该平台整合方舟视觉感知、大装置和日日新大模型技术 以"开悟"世界模型为核心引擎 [1] - 平台依托商汤大装置提供端侧和云侧算力支持 为机器人和智能设备赋予感知、视觉导航及多模态交互能力 [1] 技术战略 - 公司认为世界模型与具身AI结合将开启AI发展新阶段 实现从"工具"向"人"的跃迁 加速AGI时代进程 [1] - 平台旨在帮助具身智能企业实现与现实世界交互的目标 [1]
商汤科技林达华:具身智能需数字空间与物理空间连接
21世纪经济报道· 2025-07-29 19:25
多模态AI发展趋势 - 大型语言模型正从单一模态向多模态融合演进 这是通向通用人工智能的必经之路[1] - 原生多模态架构如Gemini模型实现图像视频信息在预训练过程中的深度融合 形成更深层次跨模态建模能力[4] - 多模态模型在纯语言任务上表现已超越单一语言模型 国内厂商预计2025年下半年全面普及多模态架构[1][5] 技术突破方向 - 需将多模态融合从理解层面延伸至思考层面 结合逻辑思维与形象思维实现真正智能[4] - 推理能力需从单领域(如奥赛、编程)泛化至广泛生产生活场景 达到人类自由推理水平[7] - 空间感知能力是当前多模态模型明显短板 国际顶尖模型无法解决儿童可轻易完成的积木拼接等空间问题[7] 具身智能发展现状 - 具身智能被视为通用人工智能终极形态 商汤科技在2025世界人工智能大会正式发布"悟能"具身智能平台[2] - 数据获取存在物理瓶颈 机器人真机操作数据量远低于互联网数字数据 需借助互联网视频等多模态数据构建基座模型[8] - 空间感知能力缺失可能成为具身智能落地的关键障碍[2][7] Agent技术应用 - Agent作为大模型能力落地的关键技术载体 2025年被视为"元年"并迎来爆发[6] - 通用Agent在复杂实际场景中仍存在较大差距 需结合具体场景和行业知识进行迭代开发[6] - 实际落地中可靠性和成功率至关重要 若无法有效解决问题则无法体现价值[6]