Workflow
语言数据
icon
搜索文档
推动中文作为数据要素赋能中国—东盟合作
第一财经· 2025-12-29 21:18
文章核心观点 - 中文应被视为数字经济领域一项可被采集、标注、计算、训练、交易与增值的数据要素 其多重价值对于赋能中国—东盟自贸区3.0版建设至关重要 [1] 理解中文的多重价值 - 发挥中文的区域通用语交际价值 在中国—东盟合作中积极推动中文的“区域通用语”地位 形成高质量的“中文—东盟各国多语种资源库” 以降低沟通成本、提升效率并减少争议 [2] - 挖掘中文的数据要素经济价值 在以大语言模型为代表的人工智能浪潮中 大规模高质量的中文垂直语料是关键 具备产业化巨大潜力 可形成一系列可交易的数据资产与产品 [3] - 重视中文的文明互鉴的公共价值 在中国—东盟合作框架下 应重视以中文为载体的文明互鉴 包括推广“中文+职业技能”培训 推动中文网络文学、短视频和影视剧出海 以及加强多语种公共服务供给 [4] 用好中文的多重价值 - 完善相关制度设计 将“中文数据要素”纳入自贸区数字经济重点工程与数据要素市场建设规划 明确语言数据的资产属性与合规流通路径 建立数据要素目录与分级分类规则 [5] - 做好智力和人才支撑 推动国内高校、行业组织与东盟各国科研机构合作建设“中文—东盟多语种知识基础设施” 并培养“多语种职业复合型人才” [6] - 释放各类企业活力 利用“东盟签证”及自贸区“边境后”等特殊政策 引入国际企业投资语言数据“软联通”行业 强化企业合作 发展语言数据标注、多语大模型微调等 形成可对外输出的数字服务 [7] - 创设多语使用与中文学习社会环境 线上线下多场景强化国际公共服务能力 建设“面向东南亚的中文数字内容出口基地” 并打造“国际中文教育+自贸区应用场景”体系 [8]