Qwen 3发布,Founder Park围绕开源模型的生态价值采访心言集团高级算法工程师左右
中国产业经济信息网·2025-04-30 17:07
4月29日,阿里新一代的大模型Qwen3发布。以DeepSeek+Qwen的中国开源组合,正在以中国开源生态"双 子星"之势,取代过去Llama为主,Mistral为辅的开源生态。Qwen3发布后,Founder Park采访了不同行业 的AI创业公司代表,就开源闭源如何选择、模型的微调、模型能力瓶颈,以及大模型创业的坑等方面进行 了访问。心言集团开源布道师、高级算法工程师"左右"在接受采访的过程中,从心言集团的实践视角剖析 了中国开源模型的崛起路径,并分享了自己在开源生态赋能下的业务探索与技术思考。 以下为采访实录: 开源、闭源模型如何选择? 左右:从我们目前的业务角度看,绝大部分(可能90%以上)需要使用我们自己微调(fine-tuned)的模型,因 此主要是本地化部署后供线上使用。同时,对于某些特定任务,比如数据构造、数据蒸馏,或者需要利用 特定大模型(如GPT、豆包、Qwen)的能力时,我们会直接调用它们的API。 本地部署的主要是基于Qwen的微调模型,根据不同的业务入口,我们会使用不同量级的模型。常用的是 7B、32B和72B这几个版本。此外,我们还有一些具身智能的业务,考虑到用户隐私和多模态处理 ...