开源模型生态

搜索文档
心言集团高级算法工程师在Qwen 3发布之际再谈开源模型的生态价值
搜狐财经· 2025-05-07 03:02
4月29日,阿里新一代的大模型 Qwen 3发布。以 DeepSeek+Qwen 的中国开源组合,正在以中国开源生态"双子星"之势,取代过去 Llama 为主,Mistral 为 辅的开源生态。 Qwen 3 发布后,Founder Park采访了不同行业的 AI 创业公司代表,就开源闭源如何选择、模型的微调、模型能力瓶颈,以及大模型创业 的坑等方面进行了访问。心言集团开源布道师、高级算法工程师"左右"在接受采访的过程中,从心言集团的实践视角剖析了中国开源模型的崛起路径,并 分享了自己在开源生态赋能下的业务探索与技术思考。 以下为采访实录: 开源、闭源模型如何选择? 左右:从我们目前的业务角度看,绝大部分(可能 90% 以上)需要使用我们自己微调(fine-tuned)的模型,因此主要是本地化部署后供线上使用。同 时,对于某些特定任务,比如数据构造、数据蒸馏,或者需要利用特定大模型(如 GPT、豆包、Qwen)的能力时,我们会直接调用它们的 API。 本地部署的主要是基于 Qwen 的微调模型,根据不同的业务入口,我们会使用不同量级的模型。常用的是 7B、32B 和 72B 这几个版本。此外,我们还有 一些具 ...