看展，AI讲解员做“搭子”

文章核心观点 - 字节跳动旗下AI工具“豆包”作为官方AI讲解员应用于上海浦东美术馆的国际艺术大展，通过实时视频通话与视觉识别技术，提供个性化、互动式的观展体验，标志着AI技术在文化教育领域的深度应用与商业化落地 [6][7][8] AI技术应用与产品特性 - AI讲解员通过手机视频通话功能实现，可实时识别展品并解答观众个性化问题，甚至能委婉纠正观众的知识性错误 [6] - 该功能基于豆包C1.8视觉语言模型，具备图像推理、多帧视频分析和自然对话理解能力，提供精准稳定的人性化导览 [10] - 2025年5月，豆包上线基于视觉推理模型的视频通话功能，支持实时视频问答与联网搜索，为美术馆场景应用积累了技术经验 [10] - 技术核心是Seed1.8模型，在视频感知与理解领域处于国际第一梯队，能实时跟随观众视角移动，实现连续自然的人机互动，突破了传统“拍图-提问”的断点式交互 [10] 行业影响与用户体验变革 - AI讲解员极大丰富了观众看展体验，使艺术呈现“千人千面”，解决了传统展签、二维码信息有限以及人工导览知识广度不足的问题 [7] - 技术变革重塑了观展路径与思维方式，观众可依据自身兴趣定制专属观展路径，打破美术馆设定的固定路线，增强了“沉浸式”看展的趣味性 [11][12] - AI讲解员让美育资源突破时空限制，展览的物理空间对内容呈现的制约得以缓解 [7] - 公司认为AI与用户的交互本质是对话体验，AI讲解员旨在通过启发式对话和共情提问，帮助观众从“看见”艺术到“理解”艺术 [8] 技术实施挑战与解决方案 - 确保内容准确性是最大挑战，模型需攻克三大核心难题：区分外观高度相似的展品、解读小众稀缺文物资料、在观众移动时保持稳定识别 [9] - 以伊朗15世纪牡丹纹盘与中国明代青花牡丹纹盘为例，AI必须能精准识别文物间细微的纹饰与工艺差异 [9] - 多角度拍摄、画面抖动、遮挡、光线变化以及观众口语化连续提问，对AI的上下文理解和空间感知能力提出高要求 [9] - 对于卢浮宫特展等互联网公开信息稀少的藏品，AI无法依赖网络搜索，必须依靠与美术馆深度合作的专属数据库才能准确解读 [9] 市场定位与生态合作 - 此次合作是字节跳动旗下豆包与陆家嘴集团、浦东美术馆的跨界合作，豆包成为两大国际大展的官方AI讲解员 [7] - 公司表示，真人讲解员与AI讲解员的需求将共存，真人面对面交流的互动感是AI无法替代的，人工服务可向更聚焦、专业、精良的方向发展 [12] - 科技与文化的跨界合作正在重塑文化传播的生态 [12]