Workflow
通义千问模型Qwen3(千问3)
icon
搜索文档
访清华孙茂松:中国“强音”推大模型开源,全球大模型文化正在扭转
环球网资讯· 2025-04-30 16:51
中国大模型开源浪潮 - 中国科技公司在大模型领域掀起开源浪潮,向全球发出"强音",技术获得国际认可并扭转全球大模型文化 [1] - DeepSeek和通义千问系列开源产品推动国际大模型开源路线,突破技术垄断,促进技术平权,提升AI普惠性 [1] - 阿里通义已开源200余个模型,全球下载量超3亿次,衍生模型数超10万个,超越美国Llama成为全球第一开源模型 [2] 技术性能与国际认可 - 在国际学术研究中,许多论文基于千问模型,同等尺寸下千问小模型性能优于LLaMA [1] - 以DeepSeek、Qwen为代表的中国开源模型实现参数权重、推理逻辑和工具链条全开源,打开AI商用新局面 [2] - DeepSeek在人工智能反馈强化学习方面是开源大模型中走得最远的,将人类反馈变为人工智能反馈 [2] 小模型的价值与意义 - 小模型可降低应用成本,拓展普及度,同时帮助高校科研机构应对资源约束的研究挑战 [2] - 大模型发展越好,越能衍生优秀小模型,而小模型研究也能为大模型发展提供重要启发 [2] AI for Science前沿领域 - AI for Science成为重要突破口,大模型对复杂系统的处理能力远超传统方法 [3] - AI for Science定位为启发人类科研工作者,弥补人类思考不足或成百倍、千倍提高效率 [3] 未来发展挑战 - 中国AI领域在并驾齐驱后将面临更高层次能力考验,需提出更深刻学术思想和根本性解决方案 [4] - 需在保持技术创新的同时,注重"从0到1"原创性思想的培育和激发 [4]