商汤科技李星冶:多模态大模型“所见即所得”让人机交互更顺畅
人工智能技术演进 - 人工智能从1.0时代(计算机视觉技术为主)向2.0时代(多模态交互技术为主)转型 [1] - 公司在大模型技术兴起后推动多模态交互创新,整合视频、图像、语音等多种模态实现实时互动 [1] - 技术应用理念为"所见即所得",改变传统文字指令识别模式 [1] 多模态交互技术应用 - 在教育领域开发"所见即所得"交互设备,实时感知手写解题过程并识别错误,支持指读绘本转化为互动故事 [2] - 已与10所左右学校合作打造智能校园助手,处理课程安排、成绩查询等功能 [2] - 在仓库租赁场景中,算法分析行业数据辅助BD销售并生成租约管理方案 [2] - 与知名运营商合作打造高效智能客服,在智能家居领域提供家庭互动功能 [2] 技术展示案例 - 现场展示通过绘制"太乙真人"卡通形象唤起语音并实现实时互动的场景 [1] - 多模态大模型优势在于通过视觉等多维度信息提升人机交互流畅度 [2]