daily-papers
v1.0.2每日论文推荐流水线:围绕指定时间范围和研究方向收集公开论文动态,完成候选整理、去重、评分和中文推荐。 保留抓取、筛选、点评、重点论文笔记、概念沉淀和目录刷新能力;默认只输出 Markdown,写入知识库需用户配置或授权。
name: daily-papers description: | 每日论文推荐流水线:围绕指定时间范围和研究方向收集公开论文动态,完成候选整理、去重、评分和中文推荐。 保留抓取、筛选、点评、重点论文笔记、概念沉淀和目录刷新能力;默认只输出 Markdown,写入知识库需用户配置或授权。 author: "Kiki Huang" license: "Apache-2.0" category: "learning" tags: "论文推荐, 学术检索, arXiv, 文献筛选" source: "https://github.com/huangkiki/dailypaper-skills/tree/main/skills/daily-papers" allowed-tools: "jimu_web_search, jimu_web_fetch, jimu_browser, document_extract, read_file, write_file, run_shell_command, ask_user_question"
Daily Papers:每日论文推荐流水线
适用场景
适用于以下需求:
- 今日论文推荐
- 最近 3 天 / 过去一周论文推荐
- 帮我看看某个方向最近有什么新论文
- 按研究方向筛选 arXiv、论文榜单或公开论文动态
- 生成每日论文推荐清单,并可选生成重点论文笔记
- 将推荐和笔记保存到 Markdown 知识库,并刷新目录页
输入与配置
优先从用户表达、当前对话和可选配置文件中提取:
| 参数 | 说明 |
|---|---|
time_range |
时间范围,默认最近 1 天;可为 3 天、7 天或用户指定范围 |
topics |
关注方向,如 VLA、扩散策略、多模态、机器人、强化学习等 |
negative_topics |
不想看的方向,可选 |
max_candidates |
候选论文数,默认 30 |
max_recommendations |
推荐展示数,默认 10 |
notes_root |
可选;Markdown 知识库根目录 |
daily_dir |
可选;每日推荐文件目录,默认 DailyPapers/ |
paper_notes_dir |
可选;论文笔记目录,默认 论文笔记/ |
concepts_dir |
可选;概念笔记目录,默认 论文笔记/_概念/ |
zotero_db / zotero_storage |
可选;用于结合已有文献库去重、定位 PDF 和分类 |
auto_generate_notes |
可选;是否为“必读”论文生成完整笔记,默认询问 |
auto_refresh_indexes |
可选;保存笔记后是否刷新目录页,默认询问 |
git_commit / git_push |
可选;默认关闭,只有用户明确启用并授权后才执行 |
如果用户没有给研究方向,先按对话上下文推断;推断不可靠时询问。
工作流程
1. 明确检索范围
把用户说法归一化:
- “今日论文推荐”“每日论文” → 最近 1 天
- “最近 3 天论文”“过去 3 天” → 最近 3 天
- “这周论文”“过去一周” → 最近 7 天
- 明确日期范围 → 按用户范围
2. 收集候选论文
优先使用公开网页和搜索结果:
- arXiv 新论文、搜索页或论文摘要页
- Hugging Face Papers / Daily Papers 等公开榜单
- 会议、实验室、项目主页或作者发布页
- 用户指定的论文列表、URL 或文本
- 可选:读取 Zotero 分类或检索结果,用于补充本地已有文献和附件位置
只使用公开可访问内容。遇到登录墙、付费墙或页面不可访问时,记录缺口,不伪造信息。
3. 去重与元数据整理
每篇候选至少整理:
- 标题
- 作者或机构(能获取则写)
- 链接
- 发布时间或版本时间
- 摘要要点
- 相关方向标签
- 代码 / 项目页 / 数据集链接(如公开页面存在)
- 本地文献库匹配状态(如用户提供了 Zotero 配置)
去重优先使用 arXiv ID、DOI、标题规范化结果;结合历史推荐文件时,要避免重复推荐同一篇论文。
4. 评分与分级
从四个维度打分:
| 维度 | 说明 |
|---|---|
| 相关性 | 是否匹配用户关注方向 |
| 创新性 | 是否提出新方法、新数据、新任务或新结论 |
| 可信度 | 是否有实验、消融、代码/项目页、清晰数据来源 |
| 阅读价值 | 是否值得用户进一步精读或收藏 |
输出分为:
- 必读:高度相关且有明显价值
- 值得看:相关但需要进一步确认
- 可跳过:弱相关、重复或证据不足
5. 生成每日推荐文件
默认输出中文 Markdown:
# 论文推荐(YYYY-MM-DD)
## 总结
- 时间范围:...
- 关注方向:...
- 候选数量:...
- 推荐结论:...
## 必读
### 1. 论文标题
- 链接:...
- 方向:...
- 一句话价值:...
- 推荐理由:...
- 注意事项:...
## 值得看
...
## 可跳过
...
## 证据不足与未获取来源
...
如果用户配置了 notes_root 或明确要求保存,写入 daily_dir/YYYY-MM-DD-论文推荐.md;否则只在对话中输出。
6. 生成重点论文笔记(可选但保留功能)
对“必读”论文,用户确认或配置允许时,按 paper-reader 的完整阅读流程生成笔记:
- 提取标题、作者、年份、摘要、方法、实验、图表、公式和局限
- 输出结构化中文笔记
- 保存到
paper_notes_dir中合适的分类目录 - 首次出现的重要术语生成或更新概念笔记
- 在每日推荐文件中回填笔记链接
如果没有全文,只基于摘要页生成轻量笔记并标注“全文未核验”。
7. 刷新目录页(可选但保留功能)
保存推荐或论文笔记后,如果用户允许,按 generate-mocs 的目录生成流程刷新:
- 每日推荐目录
- 论文笔记目录
- 概念笔记目录
- 高连接笔记与孤立笔记列表
8. Git 自动化(默认关闭)
默认不提交、不推送。只有用户明确启用并授权后才可执行:
- 检查
notes_root是否是 Git 仓库 - 只暂存本次新增或更新的推荐、笔记、概念和目录文件
- 创建本地提交
- 只有用户明确要求外部同步时才执行普通 push
不要强制推送、不要全量暂存、不要提交无关文件。
质量标准
- 不编造论文、作者、实验结果或链接
- 推荐理由必须来自标题、摘要、项目页或公开元数据
- 对证据不足的候选要标注“不确定”
- 中文点评要直接,避免空泛夸赞
- 保存本地笔记前必须确认目录和覆盖策略
- 可选功能不能默认破坏用户文件;但用户提供配置后应保留完整论文流水线能力
