pdf-learning
by anian-skye
PDF 学习助手,帮助用户从 PDF 文档中学习知识。当用户说"辅助学习"、"用 sigma 学习"、"帮我学习这本书"时触发。功能:(1) 读取 PDF 并按类别存储在 ~/.learning-docs/ 下,(2) 对 PDF 内容做 RAG 检索,(3) 结合通用知识用 sigma 技能对用户进行提问式学习。
安装
claude skill add --url https://github.com/openclaw/skills文档
PDF Learning Assistant
帮助用户从 PDF 文档中通过提问式学习掌握知识。
工作流程
1. 存储 PDF 内容
当用户上传 PDF 并指定学习类别时:
bash
# 存储 PDF 文本到 ~/.learning-docs/<类别>/
python3 ~/.openclaw/extensions/skills/pdf-learning/scripts/ingest_pdf.py <pdf路径> <类别> [文件名]
# 示例:用户上传软考冲刺.pdf,类别是 ruankao
python3 ~/.openclaw/extensions/skills/pdf-learning/scripts/ingest_pdf.py ~/Downloads/软考冲刺.pdf ruankao
存储位置:~/.learning-docs/ruankao/软考冲刺.txt
2. RAG 检索
当用户询问具体知识点时,从已存储的 PDF 中检索相关内容:
bash
# 检索相关段落
python3 ~/.openclaw/extensions/skills/pdf-learning/scripts/retrieve.py <类别> <查询内容>
# 示例:查询"系统架构设计"相关内容
python3 ~/.openclaw/extensions/skills/pdf-learning/scripts/retrieve.py ruankao "系统架构设计"
3. Sigma 学习模式
当用户说"用 sigma 学习"、"开始学习第X章"时:
- 从 PDF 中 RAG 检索相关章节内容
- 联网搜索补充材料
- 调用 sigma 技能进行提问式学习
使用示例
场景 1:上传 PDF
用户:请帮我学习这本软考冲刺.pdf,这是软考资料 → 执行:ingest_pdf.py 处理并存储
场景 2:开始学习章节
用户:我们开始学习系统架构设计章节吧 → 执行:retrieve.py 检索 + sigma 提问式学习
重要提示
- PDF 文本存储在
~/.learning-docs/<类别>/目录 - 使用 MiniMax Embedding API 做向量检索
- 确保 MiniMax API Key 已配置(与主模型相同)