content-batch-processor
by careytian-ai
批量内容处理工具,支持文本格式化、摘要生成、关键词提取、多语言翻译等批量操作。
安装
claude skill add --url https://github.com/openclaw/skills必需命令行工具
readwritepdfimage文档
批量内容处理工具 v1.0.0
高效处理大量文本内容,支持多种批处理操作。
功能特性
1. 文本格式化
- Markdown 格式转换
- HTML 清理
- 统一换行符
- 移除多余空格
2. 内容摘要
- 单文档摘要
- 多文档合并摘要
- 可定制摘要长度
3. 关键词提取
- 自动提取关键词
- 词频分析
- 主题识别
4. 批量转换
- 文件格式转换(TXT ↔ MD ↔ HTML)
- 编码转换
- 批量重命名
5. 内容分析
- 字数统计
- 可读性评分
- 语言检测
快速使用示例
// 批量格式化多个文件
const files = ['doc1.md', 'doc2.md', 'doc3.md']
files.forEach(f => {
const content = read({path: f})
const formatted = formatMarkdown(content)
write({path: f, content: formatted})
})
// 批量生成摘要
const documents = ['report1.pdf', 'report2.pdf', 'report3.pdf']
const summaries = documents.map(doc =>
pdf({pdf: doc, prompt: "生成 200 字摘要"})
)
// 批量提取关键词
const articles = readDirectory('./articles')
articles.forEach(article => {
const keywords = extractKeywords(article.content, 10)
console.log(`${article.name}: ${keywords.join(', ')}`)
})
// 批量翻译
const texts = ['文本 1', '文本 2', '文本 3']
const translated = texts.map(text =>
translate(text, {from: 'zh', to: 'en'})
)
// 批量重命名文件
const files = getFiles('./downloads')
files.forEach((file, index) => {
const newName = `document_${String(index+1).padStart(3, '0')}.md`
rename(file.path, `./organized/${newName}`)
})
批处理模式
模式 1:顺序处理
// 适合小批量任务
const results = []
for (const item of items) {
results.push(process(item))
}
模式 2:并行处理
// 适合大批量任务
const results = await Promise.all(
items.map(item => process(item))
)
模式 3:流式处理
// 适合超大文件
const stream = createReadStream('large-file.txt')
stream.on('data', chunk => {
process(chunk)
})
使用场景
- 内容创作 - 批量格式化文章、生成摘要
- 研究分析 - 批量处理论文、提取关键词
- 数据清洗 - 批量清理文本数据
- 文档管理 - 批量重命名、分类整理
- 多语言处理 - 批量翻译文档
性能优化建议
- 小批量(<10 个文件):顺序处理
- 中批量(10-100 个文件):并行处理(5-10 并发)
- 大批量(>100 个文件):分批处理 + 进度保存
相关文件
CHANGELOG.md- 版本历史examples/- 使用示例templates/- 处理模板
许可证
MIT-0 - 自由使用、修改和分发
相关 Skills
内部沟通
by anthropics
按公司常用模板和语气快速起草内部沟通内容,覆盖 3P 更新、状态报告、领导汇报、项目进展、事故复盘、FAQ 与 newsletter,适合需要统一格式的团队沟通场景。
✎ 按公司偏好的模板快速产出状态汇报、领导更新和 FAQ,既省去反复改稿,也让内部沟通更统一、更专业。
主题工厂
by anthropics
给幻灯片、文档、报告和 HTML 落地页快速套用专业配色与字体主题,内置 10 套预设风格并支持现场生成新主题,适合统一品牌或内容视觉。
✎ 主题工厂能帮你把幻灯片、文档到落地页快速统一视觉风格,内置 10 套主题,还能按需即时生成新主题。
文档共著
by anthropics
围绕文档、提案、技术规格、决策记录等写作任务,按上下文收集、结构迭代、读者测试三步协作共创,减少信息遗漏,写出更清晰、经得起他人阅读的内容。
✎ 写文档、方案或技术规格时容易思路散、信息漏,它用结构化共著流程帮你高效传递上下文、反复打磨内容,还能从读者视角做验证。
相关 MCP 服务
by nirholas
免费的加密新闻聚合 MCP,汇集 Bitcoin、Ethereum、DeFi、Solana 与 altcoins 资讯源。
by ProfessionalWiki
让 Large Language Model 客户端无缝连接任意 MediaWiki 站点,可创建、更新、搜索页面,并通过 OAuth 2.0 安全管理内容。
by transloadit
借助 86+ 个云端 media processing robots,处理视频、音频、图像和文档。