DEEPSEEK R1 - 财报，业绩电话会，研报，新闻

DEEPSEEK R1

搜索文档

36氪· 2025-05-14 16:34

AI模型私有化部署趋势 - AI产品经理倾向于私有化部署AI模型以实现功能个性化设计和保障数据安全[1] - 不同模型参数差异导致硬件需求不同例如DeepSeek模型需要理论700GB显存最低要求512GB显存[1] - 国内政策法规限制使部分AI模型难以通过备案审核面向国内用户需选择国产模型[2] 模型选择标准与资源平台 - 模型参数越小则显存需求越低需根据应用场景选择开源模型[2] - LLM rankings模型榜单提供各类模型排名可结合Hugging Face平台获取开源模型[3][5] - 不同模型榜单关注点各异包括开源模型、聊天能力、推理能力测评等[7] 主流模型榜单平台比较 - Chatbot Arena平台基于人类投票评估通用聊天机器人覆盖多场景且支持免费使用模型[8] - Hugging Face Open LLM Leaderboard专注开源大模型排名提供跨基准平均得分[8] - Scale AI Leaderboards评估前沿LLM在私人测试中的表现包括多模态考试排名[8] - Vellum AI LLM Leaderboard以图表呈现最新公共基准性能支持模型对比[8] - Artificial Analysis平台对比各厂商API速度、价格等指标对API调用具参考价值[8] - Convex LLM Leaderboard专注代码生成能力评估包括正确性、效率等维度[8] 国内主流开源模型部署 - 阿里通义Qwen3.0支持多模态和视觉应用参数规模小于DeepSeek 显存占用较少[10] - DeepSeek提供V3和R1双模型 V3为混合专家系统架构全能型模型 R1侧重深度推理[11] - 行业专用模型包括百川（医疗）、智普（金融）、腾讯混元（视频生成）等[12] - 移动端部署推荐微软BitNet b1.58模型支持CPU运行100B参数能耗大幅下降[13] 国际开源模型应用 - Llama 4支持多模态数据融合处理1000万token上下文在医学科学领域潜力显著[14] - LTX-Video支持文本生成视频 Parakeet TDT 0.6B V2支持文本转语音[15] - Stable Diffusion v1-4支持文字生成图像 Whisper支持语音转文字[17] - fastvlm为苹果视觉模型支持物体识别与语言调用[18] 多模型协作与行业挑战 - 模型按输出类型分为文本/图片/视频/语音生成需根据数据类型选择[20] - 数字人等产品需多模型协作（如ASR+TTS+DeepSeek）但非端到端模型导致响应延迟[20] - AI产品经理需熟悉英文并研读开源模型文档学习门槛持续提升[20]