多模态AI技术突破 - 多模态信息感知与处理是AGI核心要求及从语言模型迈向AGI的必由之路[1] - 多模态智能演进将驱动AI下一阶段发展 涵盖感知 推理及交互[1] - 商汤科技发布日日新SenseNova V6 5大模型体系 实现多模态基座大模型突破性升级[1] 日日新V6 5技术升级 - 实现三大突破性升级:强推理能力比肩Gemini 2 5 Pro和Claude 4-sonnet 性价比提升3倍以上 智能体支持端到端场景落地[3] - 多模态推理与交互性能大幅提升 超越Gemini 2 5 Flash和GPT-4o 成为国内首个实现图文交错思维的商业级大模型[4] - 采用改进的多模态融合架构 视觉编码器显著变轻 视觉表征在早期与语言对齐 预训练吞吐量提升20%以上 强化学习效率提升40% 推理吞吐量提升35%以上[5] 商汤小浣熊智能体升级 - 基于日日新V6 5多模态数据分析能力全面升级 可处理多模态复杂输入并实现专业可视化输出[6] - 在客户场景测试中达到Claude 4 Opus水平 大幅领先OpenAI o3 时序计算 数据匹配 数理计算和异常检测准确率接近100%[6] - 能够解析含合并单元格 缺失值 子表格及内嵌图表的复杂Excel表格 并生成完整分析报告[10] 实际应用场景 - 支持从截图提取表格信息并导出可编辑Excel表格 实现多模态全流程处理[10] - 教育版覆盖500+院校 10余种教育场景 25万+师生 帮助学生提升学习效率15-30% 降低学业焦虑发生率40% 课堂参与度提高2 1倍 资源错配率降低30% 心理健康干预及时性提升50%[13] - 金融版提供知识助手 智能问数及多模态智能理赔解决方案 构建人机协同智能决策新范式[14] - 产品矩阵累计服务用户数量超1000万[15] 行业意义 - AI凭借多模态融合能力突破逐步触达AGI边界 向类人标准靠近[1] - 实现从生产力工具到生产力的跨越 推动AI完成从工具到人的跃迁[3][6]
商汤发布「日日新V6.5」大模型,多模态能力大幅提升,让AI从“生产力工具”进阶“生产力”