Workflow
方言传承
icon
搜索文档
AI要说正宗杭州话 紧急招募“老杭州”
杭州日报· 2026-02-13 11:32
项目概述 - 由浙江大学文学院、阿里巴巴AI Data团队牵头,浙大城市学院杭州语言服务协同创新研究中心协办的“杭州方言系统化采集工程”正在进行中[1] - 项目旨在通过系统化采集,为AI学习正宗杭州话提供数据支撑,最终目标是打造杭州话AI模型[1][2] - 项目的深层含义是借助高科技进行杭州方言的传承和保护,防止其传承危机[3] 技术挑战与方案 - AI学习杭州话存在技术难度,主要源于杭州话(吴语太湖片杭州小片)的语言特殊性,包括保留了古汉语的清浊音、入声,拥有7个声调,且在连读时会发生“再变调”[2] - 若无大量地道市民录音数据支撑,AI说杭州话将不标准(“洋泾浜”)[2] - 解决方案是向公众征集语音数据,要求参与者自幼大部分时间生活在杭州老城区,能说自然、地道的杭州话[2] - 参与者通过手机录制朗读指定杭州话文本的语音,录音时长自由(从10分钟到几小时),其地道发音将被永久保存至高质量数据库[3] - 对参与录音的志愿者,项目将支付一定报酬[3] 项目执行细节 - 方言采集主要针对杭州老城区及西湖周边龙井、梅家坞一带的方言,余杭、萧山、彭埠、转塘等地方言暂不纳入[3] - 自2月13日起,市民可通过手机登录网站报名并完成小测试,测试内容为评估杭州话是否地道,例如能否流利说出“我清个老早爬起来,望横河桥嗰把儿里走过去”这样的句子[3] - 杭州话AI模型的发布速度取决于参与录音的人数和语料的丰富程度[3] 应用前景与愿景 - 未来发布的杭州话AI模型可以生成大段的杭州话文本及语音,应用于公共服务、学术研究、杭州话学习等多种场景[3] - 项目的愿景是利用现代科技,为杭州话留下一份真实、完整、鲜活的“数字声音档案”,让乡音在人工智能时代能被听见、被读懂、被传递[4]