Workflow
从社区数据看大模型开发生态的全景与趋势
2024-12-05 14:10

报告行业投资评级 未提及 报告的核心观点 大模型开发范式正在形成,行业参与者可关注趋势项目和新生态位做判断,做项目的人应利用好生态位或与中心生态位互动,有余力可创造新生态位;大模型正在重新定义软件,为开源世界带来改变 [61][64] 根据相关目录分别进行总结 案例:热点到数据 - 社区行为数据只反映部分社区关系,不全面、不充分,不能作为对项目「好坏」的公平评价,仅作参考 [10] - 从GitHub可获取项目活动数据、彼此关联信息,项目间可能存在依赖性、竞争性/可替换性、上下游(合作)等生态关系,但不必然 [11] - 以不同项目为出发点引入的项目不同,但PyTorch、llama.cpp、huggingface/transformers等热点项目易被引入;Kubernetes等项目未被引入,推测因其API稳定无需社区互动、计算与AI生态圈开发者有隔阂等 [24] - 开发者有扎堆现象,如中国开发者易与中国开发者互动;部分常用项目互动少,如大部分Nvidia项目 [24] 全景:社区关系网 - 全景图前置定义从开发阶段、供应链、运维、运行阶段等不同视角或线索,分析大模型生态中的变化点,包括围绕预训练模型、GPU的项目变化,服务中心转变,开发和应用流程智能化等 [28] - AI生态中的生态位包括开发应用/任务基础设施、资源供给基础设施等,涉及传统在线应用系统、智能应用系统、模型训练等多个方面 [30][32][60] - 可能的架构断言包括模型运行时可能与应用运行时并列,大模型供应链、CI和测试领域可能有更多变化 [33] 热点:项目与趋势 - 展示传统机器学习框架(BVLC/caffe、keras-team/keras等)、大规模分布式计算引擎(apache/spark、dask/dask等)、推理部署服务引擎(huggingface/text-generation-inference、vllm-project/vilm等)、AI应用编排类框架(langchain-ai/langchain、Significant-Gravitas/AutoGPT等)、传统IDE与AI交互式开发工具(JetBrains/intellij-community、spyder-ide/spyder等)的十年发展趋势 [37][40][45][50][55] 架构与全景图 - 再次提及AI生态中的生态位,指出PyTorch和vLLM最火,其他项目也各有机会 [60] - 对于进入AI生态的参与者,可类比20年前的LAMP,做应用或平台、基础设施本身;要关注趋势项目和新生态位,做项目利用好生态位或与中心互动,有余力创造新生态位 [61]