PDF学习助手
pdf-learning
by anian-skye
PDF 学习助手,帮助用户从 PDF 文档中学习知识。当用户说"辅助学习"、"用 sigma 学习"、"帮我学习这本书"时触发。功能:(1) 读取 PDF 并按类别存储在 ~/.learning-docs/ 下,(2) 对 PDF 内容做 RAG 检索,(3) 结合通用知识用 sigma 技能对用户进行提问式学习。
安装
claude skill add --url https://github.com/openclaw/skills文档
PDF Learning Assistant
帮助用户从 PDF 文档中通过提问式学习掌握知识。
工作流程
1. 存储 PDF 内容
当用户上传 PDF 并指定学习类别时:
# 存储 PDF 文本到 ~/.learning-docs/<类别>/
python3 ~/.openclaw/extensions/skills/pdf-learning/scripts/ingest_pdf.py <pdf路径> <类别> [文件名]
# 示例:用户上传软考冲刺.pdf,类别是 ruankao
python3 ~/.openclaw/extensions/skills/pdf-learning/scripts/ingest_pdf.py ~/Downloads/软考冲刺.pdf ruankao
存储位置:~/.learning-docs/ruankao/软考冲刺.txt
2. RAG 检索
当用户询问具体知识点时,从已存储的 PDF 中检索相关内容:
# 检索相关段落
python3 ~/.openclaw/extensions/skills/pdf-learning/scripts/retrieve.py <类别> <查询内容>
# 示例:查询"系统架构设计"相关内容
python3 ~/.openclaw/extensions/skills/pdf-learning/scripts/retrieve.py ruankao "系统架构设计"
3. Sigma 学习模式
当用户说"用 sigma 学习"、"开始学习第X章"时:
- 从 PDF 中 RAG 检索相关章节内容
- 联网搜索补充材料
- 调用 sigma 技能进行提问式学习
使用示例
场景 1:上传 PDF
用户:请帮我学习这本软考冲刺.pdf,这是软考资料 → 执行:ingest_pdf.py 处理并存储
场景 2:开始学习章节
用户:我们开始学习系统架构设计章节吧 → 执行:retrieve.py 检索 + sigma 提问式学习
重要提示
- PDF 文本存储在
~/.learning-docs/<类别>/目录 - 使用 MiniMax Embedding API 做向量检索
- 确保 MiniMax API Key 已配置(与主模型相同)
相关 Skills
技能工坊
by anthropics
覆盖 Skill 从创建到迭代优化全流程:起草能力、补测试提示、跑评测与基准方差分析,并持续改写内容和描述,提升效果与触发准确率。
✎ 技能工坊把技能从创建、迭代到评测串成闭环,方差分析加描述优化,特别适合把触发准确率打磨得更稳。
表格处理
by anthropics
围绕 .xlsx、.xlsm、.csv、.tsv 做读写、修复、清洗、格式整理、公式计算与格式转换,适合修改现有表格、生成新报表或把杂乱数据整理成交付级电子表格。
✎ 做 Excel/CSV 相关任务很省心,能直接读写、修复、清洗和格式转换,尤其擅长把乱七八糟的表格整理成交付级文件。
Word文档
by anthropics
覆盖Word/.docx文档的创建、读取、编辑与重排,适合生成报告、备忘录、信函和模板,也能处理目录、页眉页脚、页码、图片替换、查找替换、修订批注及内容提取整理。
✎ 搞定 .docx 的创建、改写与精排版,目录、批量替换、批注修订和图片更新都能自动化,做正式文档尤其省心。
相关 MCP 服务
文件系统
编辑精选by Anthropic
Filesystem 是 MCP 官方参考服务器,让 LLM 安全读写本地文件系统。
✎ 这个服务器解决了让 Claude 直接操作本地文件的痛点,比如自动整理文档或生成代码文件。适合需要自动化文件处理的开发者,但注意它只是参考实现,生产环境需自行加固安全。
by wonderwhy-er
Desktop Commander 是让 AI 直接执行终端命令、管理文件和进程的 MCP 服务器。
✎ 这工具解决了 AI 无法直接操作本地环境的痛点,适合需要自动化脚本调试或文件批量处理的开发者。它能让你用自然语言指挥终端,但权限控制需谨慎,毕竟让 AI 执行 rm -rf 可不是闹着玩的。
EdgarTools
编辑精选by dgunning
EdgarTools 是无需 API 密钥即可解析 SEC EDGAR 财报的开源 Python 库。
✎ 这个工具解决了金融数据获取的痛点——直接让 AI 读取结构化财报,比如让 Claude 分析苹果的 10-K 文件。适合量化分析师或金融开发者快速构建数据管道。但注意,它依赖 SEC 网站稳定性,高峰期可能延迟。