Jan

搜索文档
4B Qwen3逆袭671B DeepSeek!字节DAPO微调方法这么猛的吗
量子位· 2025-06-16 14:59
Jan-nano模型表现 - 最新模型Jan-nano在智能体任务上超过671B的最新版DeepSeek-V3 0528 [1] - 在SimpleQA基准上获得80.7分 [1] - 目前取得最高分80.7%,下一个版本目标是85% [4] - 在正确的提示词下可以进行深度研究 [6] - 从搜索结果中有效获取相关信息 [6] - 针对MCP协议优化,可无缝集成各种MCP服务器调用工具 [6] Jan-nano技术细节 - 在Qwen3-4B上使用字节&清华开源的DAPO强化学习微调方法 [8] - 团队将很快发布详细的技术报告 [10] Menlo Research背景 - 专注于AI和机器人技术的开放研发实验室 [11] - 主要目标为构建机器人的"大脑" [11] - 创始人为Daniel Ong与Nicole Zhu [12] - Nicole Zhu在斯坦福读人机交互硕士期间休学创业,此前在谷歌做过高级工程师 [12] - 坚持用户拥有原则,产品都是开源的 [14] - 设计为离线运行或自托管 [14] Jan产品信息 - 核心产品是Jan,可以100%离线运行的开源AI助手应用 [16] - 定位为ChatGPT的替代品 [17] - 推出数月后在没有风险投资支持下超过百万次下载 [17] - 长远愿景是成为"自驱动计算机" [19] - 规划中的能力包括将用户指令转化为直接行动、跨应用程序工作、学习用户特定工作模式、自主完成重复性任务 [21] 其他动态 - 在新加坡Echelon展会上展出一款人形机器人 [20]