看展,AI讲解员做“搭子”
人民日报海外版·2026-02-11 06:52

文章核心观点 - 字节跳动旗下AI工具“豆包”作为官方AI讲解员应用于上海浦东美术馆的国际艺术大展,通过实时视频通话与视觉识别技术,提供个性化、互动式的观展体验,标志着AI技术在文化教育领域的深度应用与商业化落地 [6][7][8] AI技术应用与产品特性 - AI讲解员通过手机视频通话功能实现,可实时识别展品并解答观众个性化问题,甚至能委婉纠正观众的知识性错误 [6] - 该功能基于豆包C1.8视觉语言模型,具备图像推理、多帧视频分析和自然对话理解能力,提供精准稳定的人性化导览 [10] - 2025年5月,豆包上线基于视觉推理模型的视频通话功能,支持实时视频问答与联网搜索,为美术馆场景应用积累了技术经验 [10] - 技术核心是Seed1.8模型,在视频感知与理解领域处于国际第一梯队,能实时跟随观众视角移动,实现连续自然的人机互动,突破了传统“拍图-提问”的断点式交互 [10] 行业影响与用户体验变革 - AI讲解员极大丰富了观众看展体验,使艺术呈现“千人千面”,解决了传统展签、二维码信息有限以及人工导览知识广度不足的问题 [7] - 技术变革重塑了观展路径与思维方式,观众可依据自身兴趣定制专属观展路径,打破美术馆设定的固定路线,增强了“沉浸式”看展的趣味性 [11][12] - AI讲解员让美育资源突破时空限制,展览的物理空间对内容呈现的制约得以缓解 [7] - 公司认为AI与用户的交互本质是对话体验,AI讲解员旨在通过启发式对话和共情提问,帮助观众从“看见”艺术到“理解”艺术 [8] 技术实施挑战与解决方案 - 确保内容准确性是最大挑战,模型需攻克三大核心难题:区分外观高度相似的展品、解读小众稀缺文物资料、在观众移动时保持稳定识别 [9] - 以伊朗15世纪牡丹纹盘与中国明代青花牡丹纹盘为例,AI必须能精准识别文物间细微的纹饰与工艺差异 [9] - 多角度拍摄、画面抖动、遮挡、光线变化以及观众口语化连续提问,对AI的上下文理解和空间感知能力提出高要求 [9] - 对于卢浮宫特展等互联网公开信息稀少的藏品,AI无法依赖网络搜索,必须依靠与美术馆深度合作的专属数据库才能准确解读 [9] 市场定位与生态合作 - 此次合作是字节跳动旗下豆包与陆家嘴集团、浦东美术馆的跨界合作,豆包成为两大国际大展的官方AI讲解员 [7] - 公司表示,真人讲解员与AI讲解员的需求将共存,真人面对面交流的互动感是AI无法替代的,人工服务可向更聚焦、专业、精良的方向发展 [12] - 科技与文化的跨界合作正在重塑文化传播的生态 [12]

看展,AI讲解员做“搭子” - Reportify