百度搜索
baidu-search
by chaoking
使用 baidusearch 库进行百度搜索,并支持解析搜索结果网页内容。Use when: (1) 用户需要进行百度搜索获取信息,(2) 需要检索中文网页内容,(3) 需要获取搜索结果标题、摘要和链接,(4) 需要解析百度搜到的网页内容。触发词:百度搜索、baidu search、搜索百度、用百度查、抓取网页、解析网页。
安装
claude skill add --url https://github.com/openclaw/skills文档
Baidu Search
使用 baidusearch 库进行百度搜索,并支持解析搜索结果网页内容。
Quick Start
1. 百度搜索
from baidusearch.baidusearch import search
# 基础搜索(默认返回10条结果)
results = search('搜索关键词')
# 指定返回结果数量
results = search('搜索关键词', num_results=20)
返回结果格式:
[
{
'title': '结果标题',
'abstract': '结果摘要',
'url': '结果链接',
'rank': 1
},
...
]
2. 解析网页内容
from scripts.fetch_url import fetch_url
# 获取并解析网页内容
content = fetch_url('http://example.com/article')
print(content['title'])
print(content['text'])
3. 搜索并解析完整流程
from baidusearch.baidusearch import search
from scripts.fetch_url import fetch_url
# 第一步:搜索
results = search('南京江宁龙虾政策', num_results=5)
# 第二步:解析第一条结果的网页内容
if results:
first_url = results[0]['url']
content = fetch_url(first_url)
print(f"标题: {content['title']}")
print(f"正文: {content['text'][:500]}...")
命令行使用
搜索:
python3 scripts/baidu_search.py "搜索关键词" --num 10
解析网页:
python3 scripts/fetch_url.py "http://example.com"
python3 scripts/fetch_url.py "http://example.com" --max-chars 2000
搜索并解析(完整流程):
python3 scripts/search_and_fetch.py "搜索关键词" --num 5
Workflow
-
安装依赖: 确保已安装所需库
bashpip3 install --user baidusearch requests beautifulsoup4 lxml -
执行搜索: 使用 baidusearch 获取搜索结果
-
解析网页: 使用 fetch_url 解析搜索结果中的网页内容
-
注意事项:
- 建议每次搜索间隔 15 秒以上
- 频繁使用可能导致 IP 被百度封禁
- 遇到 503 错误请等待 1 分钟后重试
- 部分网站可能有反爬机制,解析可能失败
Resources
scripts/
baidu_search.py- 百度搜索脚本,支持命令行参数调用fetch_url.py- 网页内容抓取和解析脚本search_and_fetch.py- 搜索并自动解析网页内容的完整流程脚本
相关 MCP 服务
网页抓取
编辑精选by Anthropic
Fetch 是 MCP 官方参考服务器,让 AI 能抓取网页并转为 Markdown 格式。
✎ 这个服务器解决了 AI 直接处理网页内容时格式混乱的问题,适合需要让 Claude 分析在线文档或新闻的开发者。不过作为参考实现,它缺乏生产级的安全配置,你得自己处理反爬虫和隐私风险。
Puppeteer 浏览器控制
编辑精选by Anthropic
Puppeteer 是让 Claude 自动操作浏览器进行网页抓取和测试的 MCP 服务器。
✎ 这个服务器解决了手动编写 Puppeteer 脚本的繁琐问题,适合需要自动化网页交互的开发者,比如抓取动态内容或做端到端测试。不过,作为参考实现,它可能缺少生产级的安全防护,建议在可控环境中使用。
Brave 搜索
编辑精选by Anthropic
Brave Search 是让 Claude 直接调用 Brave 搜索 API 获取实时网络信息的 MCP 服务器。
✎ 如果你想让 AI 助手帮你搜索最新资讯或技术文档,这个工具能绕过传统搜索的限制,直接返回结构化数据。特别适合需要实时信息的开发者,比如查 API 更新或竞品动态。不过它依赖 Brave 的 API 配额,高频使用可能受限。