Workflow
“中国经验”构建多语言大模型,帮助小语种国家融入世界

行业挑战与机遇 - 全球主流大模型对低资源语言支持严重不足 数字化语料稀缺导致小语种国家面临AI边缘化风险[1] - 塞尔维亚语在通用模型中token占比不足0.1% 远低于斯洛文尼亚语等语言[3] - 匈牙利语具有复杂词缀组合及自由语序特性 为大语言模型的token划分和长距离依赖建模带来独特挑战[7] 技术发展现状 - 科大讯飞星火X1模型支持语言从去年10月81种扩展至今年7月130多种[5] - 星火大模型X1在阿语 德语 法语 韩语 日语等重点语种整体效果超过GPT-4.1[5] - 星火语音合成大模型支持55个语种语音合成 效果业内领先[5] 战略合作与解决方案 - 国际合作成为解决多语言支持问题的重要路径[5] - 匈牙利PULI模型家族与中国AI同行合作 实现从训练 语料建设到实际应用的完整闭环[7] - 通过构建人工智能公共服务平台 实现算力高效调度和开发者生态建设[7] 产业发展痛点 - 中国智算产业面临算力迭代过快 实际可用算力不足 存量算力使用效率偏低等挑战[7] - 需要在算力 算法 数据三要素基础上引入应用 生态形成五要素集合的解决思路[7]