Workflow
2025年第18期(总899期):开源大模型DeepSeek实现三个“首
Seek .Seek .(US:SKLTY) 搜狐财经·2025-06-07 16:35

DeepSeek:全球开源AI大模型的新标杆 - AI大模型开源需满足代码完整、模型参数公开、训练数据透明三大核心标准,较传统软件开源更复杂 [1][13] - 多数大模型厂商走纯闭源或"半开源"路线,如OpenAI的GPT-4、Meta的Llama 3仅部分开源且附带商用限制 [1][13] - DeepSeek以全栈开源和宽松协议树立新典范:开放代码、权重、文档下载,公开GPRO训练算法等技术细节,采用无商用限制的MIT许可 [1][14] DeepSeek的三大突破性"首次" 技术路径革新 - DeepSeek-R1通过纯强化学习(RL)训练证明"小而美"路径的可行性,打破依赖"Scaling Law"的"唯资源论"定式 [2][17] - 推理成本与定价显著低于国际主流模型,为资源有限的国家提供低成本高效能技术方案 [2][17] 应用爆发 - 应用程序18天下载量达1600万次,日活突破3000万的速度创行业纪录 [3][18] - 引发《自然》期刊等国际媒体高度关注,被视为非美国公司践行开源初心的标杆 [3][18] 生态重构 - 吸引全球软硬件厂商适配,构建"模型—芯片—系统"一体化生态:国内十余家芯片厂商、华为/荣耀等手机厂商完成接入,美国AMD、亚马逊、Apple等企业开展合作 [4][20] - 美国红杉资本设立2亿美元专项基金用于投资DeepSeek技术生态项目 [20] 推动AI普惠化平权化的发展建议 技术协同创新 - 依托GitHub、Hugging Face等开源平台,鼓励企业与科研机构基于DeepSeek等开源成果开展二次开发 [5][21] 行业应用落地 - 推动开源大模型与各行业场景结合,发展垂类模型并构建高质量数据集 [6][21] 全民素养培育 - 通过线上平台开展大模型通识教育,推动企业与高校合作建设开发平台 [7][22] 结语 - DeepSeek的"低成本、高性能、全开放"特性重塑行业竞争格局,为全球AI普惠化、平权化提供可行路径 [8][12]