AI开源生态

搜索文档
盘古大模型与通义千问,谁抄袭了谁?
阿尔法工场研究院· 2025-07-08 20:22
技术争议核心 - 华为盘古3.5与阿里通义千问1.5-7B模型的"指纹"相关性得分高达0.927,远高于其他主流模型间普遍低于0.1的得分 [14][15][16] - 华为回应称盘古与通义在词表和配置文件存在不同,但技术专家认为这不足以证明底层模型结构和参数不相似 [19][20] - 争议涉及AI开源生态中"复用"与"抄袭"的模糊界限,尤其在Apache 2.0开源协议下如何界定参数相似度的合规性 [28][29] 行业背景与竞争格局 - 大模型研发成本极高,华为单次有效训练成本达1200万美元,行业普遍采用基于优秀开源模型的二次开发模式 [25][26] - 阿里通义系列凭借全尺寸全功能特点在to B市场占据优势,已服务超9万家企业,80%中国科技企业使用阿里云 [27][37] - 华为将盘古模型植入HarmonyOS 4,作为其"软硬芯云"全栈生态的关键环节,尤其在国产昇腾算力上的标杆应用 [32][33] 技术生态现状 - 阿里通义模型家族已推出至少228个模型,覆盖0.5B至72B多种参数规模及文本/图像/语音/视频全模态 [44][45] - Hugging Face榜单显示排名前十的开源模型曾全部基于通义千问二次开发,反映其开源生态影响力 [26] - 行业面临技术发展快于规则制定的矛盾,需建立模型溯源标准、透明化机制以促进健康生态 [52][53][54]
开源AI开发生态大洗牌:低代码平台逆袭,传统LLM框架日渐式微
量子位· 2025-05-28 15:28
大模型开源生态全景分析 核心观点 - 大模型开发生态被描述为"现实世界的黑客松",呈现快速迭代和公开协作特征 [2][3][11] - 蚂蚁发布涵盖19个技术领域、135个项目的开源生态全景图,采用OpenRank指标筛选影响力项目(月均值>10)[5][6] - 当前生态存在三大主导赛道:模型训练框架、高效推理引擎、低代码应用开发框架 [10] 技术领域分布 - **模型训练层**:PyTorch以927 OpenRank位列所有项目第一,占据绝对统治地位 [8][14][31] - **推理服务层**:vLLM(OpenRank 615)和SGlang(269)增速显著,分别位列同比增长第一和第三 [14] - **应用框架层**:Dify(473 OpenRank)和RAGFlow(208)为代表的中国低代码平台崛起,替代传统框架LangChain [17][18] 关键数据指标 - Top 20项目数据: - PyTorch:89.6k Stars,2,143社区规模 [8] - vLLM:46.4k Stars,3,161开发者协作量 [8] - Dify:95.4k Stars,3,243社区规模(TypeScript技术栈)[8] - Ollama:139.3k Stars,创2023年6月后最快增长记录 [8] 生态演进七大趋势 1. **应用开发范式**:低代码工具(如Dify)通过可视化工作流降低门槛,取代传统Agent框架 [17][18][19] 2. **协议标准化**:MCP、A2A等协议争夺智能体通信标准主导权,头部企业通过协议层构建护城河 [22][24] 3. **技术扩散速度**:小团队3-5人可快速推出开源项目并出圈,项目周期显著缩短 [25][37] 4. **基础设施层**:向量存储技术回归理性,PyTorch持续垄断训练生态 [27][31] 5. **多模态融合**:大数据与AI生态整合尚未完成 [27] 6. **推理服务混战**:vLLM等新兴引擎挑战传统方案 [14][27] 7. **开发者策略**:从单点工具转向生态控制权,或深耕场景提升用户体验 [30][34][35] 行业影响 - 中国项目表现突出:Dify和RAGFlow在应用框架层进入全球第一梯队 [14][17] - 企业级需求驱动:安全管控和低代码成为应用框架成功关键要素 [18] - 竞争加剧:技术普及化导致开发者需通过差异化(如协议创新或体验优化)建立优势 [28][29] 研究价值 - 全景图量化分析135个项目,揭示技术扩散与生态位分布规律 [39][40] - 为开发者提供技术选型参考,特别是低代码平台和推理引擎领域 [41] - 反映底层规律:简化复杂性、提升效率始终是开发者核心价值导向 [38][43]