Workflow
实测Perplexity Pro平替模型,免费开源仅4B
量子位·2025-08-15 12:21

产品定位与核心特性 - 开源模型Jan-v1仅4B大小但声称能平替Perplexity Pro [1] - 完全免费且支持本地部署 [2] - 基于Qwen3-4B-Thinking微调 针对推理和工具使用优化 [5] - 官方宣称SimpleQA准确率达91% 本地性能优于Perplexity Pro [3][9] 技术能力表现 - SimpleQA准确率高达91.1% 展现强事实性问答能力 [9] - 支持256k上下文长度 长文本分析接近Qwen-4B水平 [21][25] - 具备检索增强生成能力 可动态结合网络检索生成可溯源答案 [18][19] - 工具调用能力仍有提升空间 测试显示需进一步优化 [25][28] 应用场景与部署 - 专用于网络搜索和深度研究场景 [5][12] - 支持在Jan/llama.cpp/vLLM环境中运行 [8] - 最低仅需2.3GB存储空间(GGUF版本) [29][30] - 入门级NVIDIA GTX 1650显卡即可本地部署 [20] 市场反馈与生态 - 获得Qwen官方转发推文支持 [6] - 网络评价总体积极 但部分用户要求更详细技术报告 [33][34] - 提供四种量化版本 大小从2.3GB到4.0GB不等 [30]