百度搜索

baidu-search

by chaoking

使用 baidusearch 库进行百度搜索,并支持解析搜索结果网页内容。Use when: (1) 用户需要进行百度搜索获取信息,(2) 需要检索中文网页内容,(3) 需要获取搜索结果标题、摘要和链接,(4) 需要解析百度搜到的网页内容。触发词:百度搜索、baidu search、搜索百度、用百度查、抓取网页、解析网页。

4.5k搜索与获取未扫描2026年3月30日

安装

claude skill add --url https://github.com/openclaw/skills

文档

Baidu Search

使用 baidusearch 库进行百度搜索,并支持解析搜索结果网页内容。

Quick Start

1. 百度搜索

python
from baidusearch.baidusearch import search

# 基础搜索(默认返回10条结果)
results = search('搜索关键词')

# 指定返回结果数量
results = search('搜索关键词', num_results=20)

返回结果格式:

python
[
    {
        'title': '结果标题',
        'abstract': '结果摘要',
        'url': '结果链接',
        'rank': 1
    },
    ...
]

2. 解析网页内容

python
from scripts.fetch_url import fetch_url

# 获取并解析网页内容
content = fetch_url('http://example.com/article')
print(content['title'])
print(content['text'])

3. 搜索并解析完整流程

python
from baidusearch.baidusearch import search
from scripts.fetch_url import fetch_url

# 第一步:搜索
results = search('南京江宁龙虾政策', num_results=5)

# 第二步:解析第一条结果的网页内容
if results:
    first_url = results[0]['url']
    content = fetch_url(first_url)
    print(f"标题: {content['title']}")
    print(f"正文: {content['text'][:500]}...")

命令行使用

搜索:

bash
python3 scripts/baidu_search.py "搜索关键词" --num 10

解析网页:

bash
python3 scripts/fetch_url.py "http://example.com"
python3 scripts/fetch_url.py "http://example.com" --max-chars 2000

搜索并解析(完整流程):

bash
python3 scripts/search_and_fetch.py "搜索关键词" --num 5

Workflow

  1. 安装依赖: 确保已安装所需库

    bash
    pip3 install --user baidusearch requests beautifulsoup4 lxml
    
  2. 执行搜索: 使用 baidusearch 获取搜索结果

  3. 解析网页: 使用 fetch_url 解析搜索结果中的网页内容

  4. 注意事项:

    • 建议每次搜索间隔 15 秒以上
    • 频繁使用可能导致 IP 被百度封禁
    • 遇到 503 错误请等待 1 分钟后重试
    • 部分网站可能有反爬机制,解析可能失败

Resources

scripts/

  • baidu_search.py - 百度搜索脚本,支持命令行参数调用
  • fetch_url.py - 网页内容抓取和解析脚本
  • search_and_fetch.py - 搜索并自动解析网页内容的完整流程脚本

相关 Skills

谷歌视频工具

by bwbernardweston18

热门

>

搜索与获取
未扫描4.5k
热门

股票投研9点分析框架,覆盖基本面/财务/竞品/估值/宏观/情绪等维度

搜索与获取
未扫描4.5k

SEO审计工具

by amdf01-debug

热门

搜索与获取
未扫描4.5k

相关 MCP 服务

网页抓取

编辑精选

by Anthropic

热门

Fetch 是 MCP 官方参考服务器,让 AI 能抓取网页并转为 Markdown 格式。

这个服务器解决了 AI 直接处理网页内容时格式混乱的问题,适合需要让 Claude 分析在线文档或新闻的开发者。不过作为参考实现,它缺乏生产级的安全配置,你得自己处理反爬虫和隐私风险。

搜索与获取
86.6k

by Anthropic

热门

Puppeteer 是让 Claude 自动操作浏览器进行网页抓取和测试的 MCP 服务器。

这个服务器解决了手动编写 Puppeteer 脚本的繁琐问题,适合需要自动化网页交互的开发者,比如抓取动态内容或做端到端测试。不过,作为参考实现,它可能缺少生产级的安全防护,建议在可控环境中使用。

搜索与获取
86.6k

Brave 搜索

编辑精选

by Anthropic

热门

Brave Search 是让 Claude 直接调用 Brave 搜索 API 获取实时网络信息的 MCP 服务器。

如果你想让 AI 助手帮你搜索最新资讯或技术文档,这个工具能绕过传统搜索的限制,直接返回结构化数据。特别适合需要实时信息的开发者,比如查 API 更新或竞品动态。不过它依赖 Brave 的 API 配额,高频使用可能受限。

搜索与获取
86.6k

评论