什么是 ClawPage?
将任意网页提取并结构化为干净的 JSON 输出,便于采集与处理;免费额度为每天 10 次。
README
ClawPage MCP Server
MCP server for the ClawPage web extraction API. Extract and structure any web page into clean JSON.
Install
npx clawpage-mcp
Or with Streamable HTTP transport (for ChatGPT, remote agents):
npx clawpage-mcp --http
Tools
| Tool | Description |
|---|---|
register | Create account, get API key (cpk_ prefix) with 10 free extractions/day |
extract_url | Extract any URL into structured JSON (text, tables, prices, contacts, hours, ratings) |
account_info | Check remaining free extractions and USDC balance |
add_wallet | Associate wallet address for prepaid USDC deposits |
deposit | Credit balance from on-chain USDC transfer |
Quick Start
- Use the
registertool with your email to get an API key - Use
extract_urlwith the API key and any URL - Get back structured JSON with text, tables, prices, contacts, hours, ratings, dates, links, and images
Authentication
Three options:
- API Key (recommended): Register for free, get 10 extractions/day
- Prepaid USDC: Deposit USDC on Base for $0.01/extraction
- x402: Anonymous on-chain micropayment, no account needed
Cache hits are always free (24h TTL).
Transport
- stdio (default): For Claude Desktop, Cursor, and local MCP clients
- Streamable HTTP (
--http): For ChatGPT, browser-based agents, and remote connections. Listens on port 8080 (override withMCP_PORTenv var)
Claude Desktop Config
{
"mcpServers": {
"clawpage": {
"command": "npx",
"args": ["clawpage-mcp"]
}
}
}
API
Base URL: https://api.clawpage.xyz
See SKILL.md for full API documentation.
License
MIT
常见问题
ClawPage 是什么?
将任意网页提取并结构化为干净的 JSON 输出,便于采集与处理;免费额度为每天 10 次。
相关 Skills
股票投研框架
by alondai
股票投研9点分析框架,覆盖基本面/财务/竞品/估值/宏观/情绪等维度
SEO审计工具
by amdf01-debug
智能浏览器
by ayakolin
A fast Rust-based headless browser automation CLI with Node.js fallback that enables AI agents to navigate, click, type, and snapshot pages via structured commands. (Chinese localized version)
相关 MCP Server
网页抓取
编辑精选by Anthropic
Fetch 是 MCP 官方参考服务器,让 AI 能抓取网页并转为 Markdown 格式。
✎ 这个服务器解决了 AI 直接处理网页内容时格式混乱的问题,适合需要让 Claude 分析在线文档或新闻的开发者。不过作为参考实现,它缺乏生产级的安全配置,你得自己处理反爬虫和隐私风险。
Brave 搜索
编辑精选by Anthropic
Brave Search 是让 Claude 直接调用 Brave 搜索 API 获取实时网络信息的 MCP 服务器。
✎ 如果你想让 AI 助手帮你搜索最新资讯或技术文档,这个工具能绕过传统搜索的限制,直接返回结构化数据。特别适合需要实时信息的开发者,比如查 API 更新或竞品动态。不过它依赖 Brave 的 API 配额,高频使用可能受限。
Puppeteer 浏览器控制
编辑精选by Anthropic
Puppeteer 是让 Claude 自动操作浏览器进行网页抓取和测试的 MCP 服务器。
✎ 这个服务器解决了手动编写 Puppeteer 脚本的繁琐问题,适合需要自动化网页交互的开发者,比如抓取动态内容或做端到端测试。不过,作为参考实现,它可能缺少生产级的安全防护,建议在可控环境中使用。