科研人福音!一键生成PPT和科研绘图,北大开源Paper2Any,全流程可编辑
机器之心·2026-01-04 16:05

产品核心定位与突破 - 产品旨在解决内容生产中将文字逻辑转化为可视化演示材料的痛点,提供从阅读资料、理解逻辑到生成图像、输出可编辑文件的自动化内容视觉化工作流,重塑准备演示文稿的方式 [2][3] - 核心突破在于打破了当前AI绘图工具在科研与办公场景下的致命缺陷,即生成的图片是“死”的、不可编辑,转而提供独立、分层、可操作的图文块,实现了从逻辑到结构化元素的映射 [4][8] 核心功能全景 - Paper2Figure:支持多模态输入(PDF、文本、草图截图),实现智能科研绘图,将草图转化为精图,自动生成模型架构图、技术路线图、实验数据图等,并输出可编辑的SVG和PPTX文件 [10][12] - Paper2PPT:对文档进行深度语义分析,提取背景、方法论、关键图表,实现文章结构化解析与PPT自动生成,支持中英文,并解决大模型生成PPT的字体怪异及表达僵硬问题 [11][13][15] - PDF2PPT:利用MinerU与SAM模型对PDF版面进行高精度解析,将静态PDF还原为可编辑的PPTX,集成Gemini Nano模型进行图像内补,实现“去字留影”,最大程度还原原始底图视觉效果 [15][17] - PPTPolish:提供交互式PPT美化功能,自动分析页面并生成美化提示词,用户可逐页修改提示词来微调美化方向,提升排版的专业感 [18] 产品性能与特色 - 支持生成超过40页的超长PPT,满足综述或深度主题演示需求 [15] - 在PPT智能生成方面,与Gemini 3 Pro、NotebookLM等工具相比,其生成的PPT在结构化图表生成能力、中文文字表达与字体呈现自然度、可读性与排版布局上更具优势 [47][49] - 提供本地部署网页版两种使用方式,网页版支持拖拽上传与实时进度展示,新用户可免费注册体验 [54][56] 技术基础与未来发展 - 产品基于北京大学DCAI课题组的自动化数据治理Agent框架DataFlow-Agent开发 [2] - 未来计划扩展支持Paper2Rebuttal(论文返修)、Paper2Idea(创新点生成)和Paper2Poster(文章海报生成)等更多多模态功能 [58]

科研人福音!一键生成PPT和科研绘图,北大开源Paper2Any,全流程可编辑 - Reportify