文章核心观点 - DeepXiv 是一个专为 AI 智能体设计的科技文献基础设施,其核心目标是将开放科技文献从“人类可读”升级为“智能体可用”,通过提供数据接口与技能系统,使论文搜索、阅读、追踪和调研变成可调用、可编排、可自动化的能力,从而为自动化科研(Autonomous Research)筑牢核心基础设施底座 [2][3][12] DeepXiv 的定位与目标 - DeepXiv 不是简单地将论文网站搬到命令行,而是将科技文献本身转化为智能体可以直接消费的数据接口与技能系统 [3] - 项目由智源研究院联合高校与社区开发者共同研发,现已开源并免费开放使用 [4] - 其目标是打通海量开放论文与智能体之间的衔接壁垒,解决当前基于搜索引擎和图形界面的基础设施与智能体工作方式不符、制约效率的核心痛点 [7][8][9] 核心能力一:数据接入 - 提供对智能体友好的数据格式接入,如 JSON / Markdown,使论文数据直接可读可用,智能体无需从复杂的 PDF 或 HTML 中提取信息 [14] - 提供面向智能体优化的数据组织方式,包括:预览(Preview) 功能快速获取论文核心信息以低成本判断相关性;分块(Chunking) 功能按结构或语义切分论文以支持局部精读;渐进披露(Progressive Disclosure) 功能按需展开内容,避免一次性灌入全文 [15] - 这些设计旨在降低 token 消耗、提升检索与阅读效率,并支持复杂多步科研任务 [15] - 已覆盖全量 ArXiv 数据并保持每日增量更新,正在快速扩展至 PubMed Central (PMC)、ACM、各类 *Rxiv 以及 Semantic Scholar 等源,目标是建立覆盖超过 2 亿篇 开放科技文献的统一智能体接入层,并以一致的服务方式对外提供 [17][18] 核心能力二:一站式能力集成 - 自建专属论文搜索引擎,提供优化的检索结果和可配置的搜索模式 [20] - 超越简单检索,提供更丰富的技能,包括:问答能力,可提取和理解文献信息(如核心贡献、实验设置);热点追踪,了解特定主题每日/每周/每月的热点论文;深度调研,应对复杂问题(如过去三年某领域的代表性工作) [20] - 技能包持续扩展,智能体可通过内置 Skills 及命令行 --help 机制灵活调用 [20] - 提供深度调研 Agent,可将搜索、筛选、渐进式阅读、信息提取与归纳整理串联成完整链路,直接承接高层科研任务,用户也可将 DeepXiv 封装成 Skills 注入任意智能体 [23] 核心能力三:丰富的接入形式 - CLI(命令行) 是核心形态,智能体可通过命令行无缝接入全部能力,并通过编排脚本实现复杂工作流 [25] - 提供 MCP(Model Context Protocol) 接入能力,可将 DeepXiv 嵌入各类智能体开发框架,使“科技文献利用”成为智能体标准工具 [26] - 提供 Python SDK,供开发者深度定制工作流,灵活集成于高度定制化的科研智能体 [27] - 基于 DeepXiv,开发者可快速封装面向具体科研任务的定制化 Skills,例如自动追踪新论文、筛选带开源代码的工作、批量抽取实验结果、生成基线表格等,为日常科研工作流提供可快速复用、可持续扩展的能力底座 [27] 实战演示与价值体现 - 通过一个“整理最近 1 个月 agent memory 相关论文”的典型任务,展示了 DeepXiv 如何将能力串联成完整工作流 [29][30] - 工作流分为四步:1) 按主题与时间范围搜索候选论文;2) 用 --brief 命令进行低成本筛选,预览标题、时间、TL;DR、关键词、GitHub 链接等核心信息;3) 对筛选出的相关论文,先查看结构 (--head),再定点读取关键章节(如实验部分);4) 自动提取信息并整理成结构化的 Markdown 基线表格交付物 [32][33][34][35][37][38] - 该演示表明 DeepXiv 的服务是结构化的(无需网页解析)、低成本的(无需通读全文)、渐进式的(仅展开关键章节),其输出是可保存、可复用、可扩展的研究中间产物,真正将论文变成了智能体可以调用、筛选、阅读、分析、交付的一等对象 [41][42][43]
智源ArXiv CLI重磅开源!2亿+开放论文,即将化身科研智能体的技能包
AI前线·2026-04-09 11:19