Workflow
2025年Deepseek在药企研发领域的本地化部署和应用场景
智慧芽·2025-04-01 14:55

报告行业投资评级 未提及 报告的核心观点 报告围绕Deepseek在药企研发领域的本地化部署和应用场景展开,介绍了Deepseek大模型的优势、在药企的部署方式及多种应用场景,还提及智慧芽生物医药的产品矩阵和服务 [7][9][92] 根据相关目录分别进行总结 大模型的发展阶段和Deepseek - Deepseek进入推理模型阶段,跻身全球第一梯队,核心技术突破使推理能力跃升,能精准处理和高效执行复杂推理任务,覆盖多模态场景应用,综合性能跃居全球第一梯队,技术指标与国际顶尖水平对标,且具有开源、低成本、国产化的加分项 [7] - Deepseek-R1版以低成本和开源特性打破头部企业垄断局面,API定价仅为行业均价的1/10,推动中小型企业低成本接入AI,重新定义了芯片和算力对大模型的影响,有在软件系统中调用官方API、模型微调、直接使用三种使用方式 [9] Deepseek-R1在药企的本地化部署 - 介绍了DeepSeek-R1不同版本对应的基础模型及下载平台,如DeepSeek-R1-Distill-Qwen-1.5B对应Qwen2.5-Math-1.5B,可从HuggingFace和ModelScope下载 [11] - 个人部署可使用Ollma框架,但多用户并发场景下性能衰减明显;企业部署推荐用Transformers快速验证模型能力,用vLLM框架借助PagedAttention技术实现24倍于Transformers的吞吐量,针对不同企业场景提供不同方案;还有KTransformers、Unsloth等低成本动态量化模型部署方案,但暂不成熟;vLLM部署简单适合中小型企业,大型企业可用配置复杂的TensorRT框架 [12] - 部署Deepseek R1满血版模型通常需1200G左右显存,要双节点8卡H100服务器(总成本约260万 - 320万),INT4半精度下至少需490G显存,要单节点8卡H100服务器;多数低成本高性能部署方案采用牺牲推理速度策略,用CPU + GPU混合推理降低GPU负载,但整体推理速度慢 [13] - 列举了不同Deepseek-R1部署方案的测试场景、硬件配置、资源占用和对话效果等信息,如KTransformer单并发测试在志强3代CPU + 4090GPU + DDR4内存配置下对话效果为4tokens/s [14] 芽仔与Deepseek-R1对接 - 分子设计场景中,可询问阳性药与靶蛋白的结合模式,智能体agent可一键式生成分子动力学模拟图,自主设计的新分子能通过智能体agent快速完成分子对接过程,还给出了从PDB数据库下载靶蛋白结构进行模拟分析的具体步骤 [28][36][38] - 推荐临床一期剂量场景,以药物HW - 1为例,根据其在不同动物中的暴露量及与AMG510的对比情况,参考智慧芽数据库和AMG510一期临床剂量给出参考剂量 [40] - 预测代谢产物场景,参考奥希替尼的结构,根据智慧芽数据库信息推测伏美替尼metID的结果 [52] - 预测临床前毒理试验模型和剂量场景,以药物HW - 2为例,根据其在不同动物中的暴露量及药效情况,结合智慧芽数据库情报信息给出临床前毒理试验的模型和推荐剂量 [62] - 介绍问问题的技巧,包括角色、背景、指令和补充信息,如告诉芽仔生物医药角色有利于其理解需求,提供必要上下文信息让其更准确执行任务等 [71] AI融入智慧芽生物医药产品 - AI提效专利工作,包括用专利号/技术文本做新颖性检索、由AI进行FTO和无效分析的特征比对、检索策略自动生成、专利交底书助手等 [83] - AI释放Eureka的创新潜力,如AI分析专利创新点、进行研发情报等搜索、完成技术问答和简单检索 [87] 关于智慧芽生物医药 智慧芽生物医药构建了由Synapse新药情报库、Bio生物序列数据库、Chemical化学结构数据库和Hiro - LS芽仔生物医药四大核心产品组成的综合SaaS产品矩阵,提供数据服务串联各维度数据组成综合数据服务平台,为生物医药全产业链提供全生命周期数据服务,运用大数据和人工智能技术,结合专家洞察和审核,实现产业链数据高效集成和精准处理,建立全球实时数据更新机制 [92]