paper-reader
v1.0.2学术论文阅读助手:从 PDF、URL、Zotero 条目、网页或粘贴文本中提取论文信息并生成结构化中文笔记。 支持图表公式检查、批判性分析、概念笔记、Markdown 知识库保存和目录刷新;默认先输出分析,写入本地文件需授权。
name: paper-reader description: | 学术论文阅读助手:从 PDF、URL、Zotero 条目、网页或粘贴文本中提取论文信息并生成结构化中文笔记。 支持图表公式检查、批判性分析、概念笔记、Markdown 知识库保存和目录刷新;默认先输出分析,写入本地文件需授权。 author: "Kiki Huang" license: "Apache-2.0" category: "learning" tags: "论文阅读, 文献笔记, 学术总结, 批判性分析" source: "https://github.com/huangkiki/dailypaper-skills/tree/main/skills/paper-reader" allowed-tools: "document_extract, jimu_web_fetch, jimu_browser, jimu_web_search, read_file, write_file, glob, search_file_content, run_shell_command, ask_user_question"
Paper Reader:学术论文阅读助手
适用场景
适用于以下需求:
- 读一下这篇论文
- 总结 / 分析 / 精读 / 快速看一篇 paper
- 生成论文笔记、related work 摘要或方法卡片
- 批判性分析论文贡献、实验和局限
- 从本地 PDF、arXiv 链接、网页、Zotero 条目或粘贴内容中提取论文信息
输入方式
| 输入 | 处理方式 |
|---|---|
| 本地 PDF | 用 document_extract 提取正文;扫描件可启用 OCR |
| arXiv / DOI / 项目页 URL | 优先用 jimu_web_fetch,需要动态页面时用 jimu_browser |
| 用户粘贴文本 | 直接分析文本内容 |
| 论文标题 | 用 jimu_web_search 查找公开摘要页,再让用户确认目标论文 |
| 本地 Markdown / TXT | 用 read_file 读取后分析 |
| Zotero 搜索或分类 | 用户提供数据库/导出文件/附件目录时,读取条目、定位 PDF 并让用户确认 |
不要下载或执行不可信代码。无法访问全文时,基于摘要页分析并明确标注证据不足。
可选配置
| 参数 | 说明 |
|---|---|
notes_root |
Markdown 知识库根目录,可对应任意本地笔记库 |
paper_notes_dir |
论文笔记目录,默认 论文笔记/ |
concepts_dir |
概念笔记目录,默认 论文笔记/_概念/ |
template_path |
可选;论文笔记模板 |
zotero_db / zotero_storage |
可选;用于搜索条目、读取附件和保留分类路径 |
save_note |
是否保存笔记,默认询问 |
refresh_indexes |
保存后是否刷新目录页,默认询问 |
git_commit / git_push |
默认关闭,用户明确授权后才执行 |
阅读模式
| 模式 | 触发词 | 输出重点 |
|---|---|---|
| 快速摘要 | “快速看一下”“简单总结” | 3-5 句核心贡献与结论 |
| 完整解析 | 默认模式 | 背景、方法、实验、结果、局限和应用价值 |
| 批判分析 | “批判性分析”“找问题” | 假设、实验设计、对比基线、泛化性和风险 |
| 技术拆解 | “讲公式”“讲方法”“实现细节” | 关键公式、模块、算法流程和复现要点 |
| 知识库模式 | “保存笔记”“更新概念库” | 论文笔记、概念笔记、目录页链接 |
工作流程
1. 确认论文对象
先确认论文来源、标题和用户期望的深度。
如果用户只给标题且搜索结果不唯一,列出候选并让用户选择,不要猜。
2. 提取内容
尽量获取:
- 标题、作者、年份、机构、会议/期刊或预印本来源
- 摘要、引言、方法、实验、结论
- Figure、Table、公式和算法伪代码
- 项目页、代码链接、数据集链接(如公开页面中存在)
- Zotero 分类、附件路径和已有笔记状态(如用户提供配置)
如果某些内容无法获取,写入“证据不足”部分。
3. 图表、公式和表格完整性检查
完整解析模式下必须检查:
- Figure 是否被逐项提及;无法获取图片时至少保留标题和上下文
- Table 是否保留关键行列和结论
- 公式是否解释符号含义、作用和与方法的关系
- 算法流程是否用结构化列表描述,避免空泛复述摘要
如果只能读取摘要或部分 HTML,必须标注“全文/图表未完整核验”。
4. 生成结构化笔记
默认输出:
# 论文标题
## 一句话总结
## 基本信息
- 作者:...
- 年份:...
- 链接:...
- 领域:...
- 本地来源:...
## 研究问题
## 核心贡献
## 方法解析
## 实验与结果
## 关键图表、表格和公式
## 局限性
## 适合如何引用或延伸
## 延伸概念
## 证据不足与待核验点
5. 概念笔记维护(可选但保留功能)
如果用户启用知识库保存:
- 从论文笔记中提取关键术语和方法名
- 检查
concepts_dir中是否已有对应概念笔记 - 对不存在的概念生成简短概念卡片
- 在论文笔记中用用户偏好的链接格式关联概念
- 记录新增和复用的概念数量
概念卡片至少包含:定义、相关论文、适用场景、易混淆点。
6. 保存到 Markdown 知识库(可选)
只有用户明确要求保存,或配置已启用保存时,才写入 Markdown 文件。
保存前必须:
- 确认
notes_root和目标目录 - 清理非法文件名字符
- 检查目标文件是否存在
- 询问覆盖、改名还是合并
保存后如果启用目录刷新,按 generate-mocs 的流程更新目录页。
7. Git 自动化(默认关闭)
默认不提交、不推送。只有用户明确启用并授权后才可执行:
- 检查知识库是否为 Git 仓库
- 只暂存本次新增或更新的论文笔记、概念和目录页
- 创建本地提交
- 只有用户明确要求外部同步时才执行普通 push
批判性检查
至少检查:
- 论文解决的问题是否真实重要
- 方法是否只是组合已有技术
- 实验基线是否公平
- 数据集是否足以支持结论
- 消融实验是否能证明关键模块有效
- 是否存在泛化性、成本、伦理或安全限制
质量标准
- 不编造作者、年份、实验数值、图表或结论
- 摘要和点评要区分“论文声称”和“审查判断”
- 对无法访问的全文、图片或表格必须标注缺口
- 技术术语第一次出现时给出简短解释
- 输出要能直接作为中文论文笔记使用
- 保留可选 Zotero、知识库保存、概念沉淀和目录刷新的完整能力,但默认不写文件、不提交、不推送
