拆分

split

by BytesAgain

Data splitting techniques and strategies reference — partitioning datasets, string splitting, file splitting, and ML train/test splits. Use when dividing data, chunking files, or designing data partitioning strategies.

4.2k效率与工作流未扫描2026年3月23日

安装

claude skill add --url github.com/openclaw/skills/tree/main/skills/bytesagain1/split

文档

Split — Data Splitting Reference

Quick-reference skill for data splitting techniques, partitioning strategies, and practical patterns.

When to Use

  • Splitting strings by delimiters, patterns, or fixed widths
  • Partitioning datasets for ML training/validation/test
  • Dividing large files into manageable chunks
  • Database sharding and horizontal partitioning
  • Understanding split strategies for distributed systems

Commands

intro

bash
scripts/script.sh intro

Overview of data splitting — concepts, common use cases, and terminology.

string

bash
scripts/script.sh string

String splitting techniques — delimiters, regex, fixed-width, tokenization.

file

bash
scripts/script.sh file

File splitting methods — by size, lines, patterns, and round-robin.

dataset

bash
scripts/script.sh dataset

ML dataset splitting — train/val/test, stratified, time-series, k-fold.

database

bash
scripts/script.sh database

Database partitioning — horizontal, vertical, hash, range, and list.

strategies

bash
scripts/script.sh strategies

Splitting strategies for distributed systems — consistent hashing, sharding keys.

examples

bash
scripts/script.sh examples

Practical split examples across languages and tools.

pitfalls

bash
scripts/script.sh pitfalls

Common pitfalls and best practices when splitting data.

help

bash
scripts/script.sh help

version

bash
scripts/script.sh version

Configuration

VariableDescription
SPLIT_DIRData directory (default: ~/.split/)

Powered by BytesAgain | bytesagain.com | hello@bytesagain.com

相关 Skills

PPT处理

by anthropics

Universal
热门

处理 .pptx 全流程:创建演示文稿、提取和解析幻灯片内容、批量修改现有文件,支持模板套用、合并拆分、备注评论与版式调整。

涉及PPTX的创建、解析、修改到合并拆分都能一站搞定,连备注、模板和评论也能处理,做演示文稿特别省心。

效率与工作流
未扫描119.1k

技能工坊

by anthropics

Universal
热门

覆盖 Skill 从创建到迭代优化全流程:起草能力、补测试提示、跑评测与基准方差分析,并持续改写内容和描述,提升效果与触发准确率。

技能工坊把技能从创建、迭代到评测串成闭环,方差分析加描述优化,特别适合把触发准确率打磨得更稳。

效率与工作流
未扫描119.1k

Word文档

by anthropics

Universal
热门

覆盖Word/.docx文档的创建、读取、编辑与重排,适合生成报告、备忘录、信函和模板,也能处理目录、页眉页脚、页码、图片替换、查找替换、修订批注及内容提取整理。

搞定 .docx 的创建、改写与精排版,目录、批量替换、批注修订和图片更新都能自动化,做正式文档尤其省心。

效率与工作流
未扫描119.1k

相关 MCP 服务

文件系统

编辑精选

by Anthropic

热门

Filesystem 是 MCP 官方参考服务器,让 LLM 安全读写本地文件系统。

这个服务器解决了让 Claude 直接操作本地文件的痛点,比如自动整理文档或生成代码文件。适合需要自动化文件处理的开发者,但注意它只是参考实现,生产环境需自行加固安全。

效率与工作流
83.9k

by wonderwhy-er

热门

Desktop Commander 是让 AI 直接执行终端命令、管理文件和进程的 MCP 服务器。

这工具解决了 AI 无法直接操作本地环境的痛点,适合需要自动化脚本调试或文件批量处理的开发者。它能让你用自然语言指挥终端,但权限控制需谨慎,毕竟让 AI 执行 rm -rf 可不是闹着玩的。

效率与工作流
5.9k

EdgarTools

编辑精选

by dgunning

热门

EdgarTools 是无需 API 密钥即可解析 SEC EDGAR 财报的开源 Python 库。

这个工具解决了金融数据获取的痛点——直接让 AI 读取结构化财报,比如让 Claude 分析苹果的 10-K 文件。适合量化分析师或金融开发者快速构建数据管道。但注意,它依赖 SEC 网站稳定性,高峰期可能延迟。

效率与工作流
2.0k

评论