ArXiv Scout
搜索与获取by shawnnygoh
可直接从 arXiv 搜索和获取学术论文,支持高级查询、PDF 全文提取、摘要与综述生成、对比分析,以及引用追踪和研究趋势发现。
什么是 ArXiv Scout?
可直接从 arXiv 搜索和获取学术论文,支持高级查询、PDF 全文提取、摘要与综述生成、对比分析,以及引用追踪和研究趋势发现。
核心功能 (8 个工具)
arxiv_search_papersSearch arXiv for papers using advanced query syntax.
arxiv_get_paperFetch complete metadata for a specific arXiv paper.
arxiv_get_papers_batchRetrieve metadata for multiple papers in a single call.
arxiv_download_and_extractExtract full text from a paper's PDF.
arxiv_get_referencesList the papers that this paper cites.
arxiv_get_citationsList newer papers that have cited this paper.
arxiv_list_categoriesBrowse the arXiv category taxonomy.
arxiv_cache_statsView internal cache hit rates and sizes.
README
arXiv Scout
A Model Context Protocol server for searching, retrieving, and analyzing papers from arXiv.org with citation data from Semantic Scholar.
No API key required.
Tools
| Tool | Description |
|---|---|
arxiv_search_papers | Search with full query syntax, semantic categories, date filtering, pagination |
arxiv_get_paper | Get metadata by arXiv ID or URL |
arxiv_get_papers_batch | Fetch up to 20 papers in one call |
arxiv_download_and_extract | PDF → text with section detection, header stripping, page ranges |
arxiv_get_references | Outbound references via Semantic Scholar (PDF fallback) |
arxiv_get_citations | Inbound citations via Semantic Scholar |
arxiv_list_categories | Browse taxonomy with semantic lookup ("machine learning" → cs.LG) |
arxiv_cache_stats | Cache hit rates and sizes |
Prompts
| Prompt | Description |
|---|---|
summarize_paper | Guided structured summary (problem, methods, results, limitations) |
compare_papers | Side-by-side comparison of 2–5 papers |
literature_review | Search a topic and synthesize a review |
Resources
| URI | Description |
|---|---|
arxiv://categories | Complete arXiv category taxonomy |
arxiv://help/query-syntax | Query syntax reference |
arxiv://server/info | Server capabilities |
Installation
Smithery (hosted)
No local installation needed:
npx -y @smithery/cli@latest run @shawnnygoh/arxiv-scout
Local
uv pip install arxiv-scout
Or from source:
git clone https://github.com/shawnnygoh/arxiv-scout.git
cd arxiv-scout
uv sync
Usage
Claude Desktop
{
"mcpServers": {
"arxiv": {
"command": "uvx",
"args": ["arxiv-scout"]
}
}
}
VS Code
{
"servers": {
"arxiv": {
"command": "uvx",
"args": ["arxiv-scout"]
}
}
}
Cursor
{
"mcpServers": {
"arxiv": {
"url": "https://server.smithery.ai/@shawnnygoh/arxiv-scout/mcp"
}
}
}
Claude Code
# Manual installation
claude mcp add --transport http arxiv https://server.smithery.ai/@shawnnygoh/arxiv-scout/mcp
# Using Smithery CLI
npx -y @smithery/cli@latest mcp add shawnnygoh/arxiv-scout --client claude-code
Configuration
| Variable | Default | Description |
|---|---|---|
PORT | 8000 | Server port |
HOST | 0.0.0.0 | Bind address |
SEMANTIC_SCHOLAR_API_KEY | (none) | Optional — higher S2 rate limits |
Development
git clone https://github.com/shawnnygoh/arxiv-scout.git
cd arxiv-scout
uv sync --dev
# Unit tests (no network)
uv run pytest
# Include integration tests (hits real APIs)
uv run pytest -m integration
# Test with MCP Inspector
uv run arxiv-scout &
npx @modelcontextprotocol/inspector
# Transport: Streamable HTTP → http://localhost:8000/mcp
License
MIT
常见问题
ArXiv Scout 是什么?
可直接从 arXiv 搜索和获取学术论文,支持高级查询、PDF 全文提取、摘要与综述生成、对比分析,以及引用追踪和研究趋势发现。
ArXiv Scout 提供哪些工具?
提供 8 个工具,包括 arxiv_search_papers、arxiv_get_paper、arxiv_get_papers_batch 等。
相关 MCP Server
Puppeteer 浏览器控制
编辑精选by Anthropic
Puppeteer 是让 Claude 自动操作浏览器进行网页抓取和测试的 MCP 服务器。
✎ 这个服务器解决了手动编写 Puppeteer 脚本的繁琐问题,适合需要自动化网页交互的开发者,比如抓取动态内容或做端到端测试。不过,作为参考实现,它可能缺少生产级的安全防护,建议在可控环境中使用。
网页抓取
编辑精选by Anthropic
Fetch 是 MCP 官方参考服务器,让 AI 能抓取网页并转为 Markdown 格式。
✎ 这个服务器解决了 AI 直接处理网页内容时格式混乱的问题,适合需要让 Claude 分析在线文档或新闻的开发者。不过作为参考实现,它缺乏生产级的安全配置,你得自己处理反爬虫和隐私风险。
Brave 搜索
编辑精选by Anthropic
Brave Search 是让 Claude 直接调用 Brave 搜索 API 获取实时网络信息的 MCP 服务器。
✎ 如果你想让 AI 助手帮你搜索最新资讯或技术文档,这个工具能绕过传统搜索的限制,直接返回结构化数据。特别适合需要实时信息的开发者,比如查 API 更新或竞品动态。不过它依赖 Brave 的 API 配额,高频使用可能受限。