微信文章抓取器

wechat-article-fetcher

by alienhub

|

3.9k内容与创意未扫描2026年3月23日

安装

claude skill add --url github.com/openclaw/skills/tree/main/skills/alienhub/wechat-article-skill

文档

微信公众号文章获取

识别公众号链接

公众号文章链接特征:

  • 域名: mp.weixin.qq.com
  • 路径: /s/ 开头
  • 示例: https://mp.weixin.qq.com/s/abc123def456

获取文章内容的方法

⚠️ 微信服务器会检测请求头,必须携带正常浏览器的 User-Agent,否则返回 403。

Agent 调用顺序(重要)

  1. 优先使用 get_content.py 脚本 —— 稳定、无头、输出直接供模型消费。
  2. 仅在脚本失败时改用 browser 工具 —— 脚本 stderr 会输出「建议 Agent 改用 browser 工具」等提示,此时再考虑浏览器。

方法一:get_content.py 脚本(首选)

本地 CLI,urllib + certifi + 真实 UA,自带重试(最多 3 次)。失败时 stderr 提示是否改用 browser。

bash
# 安装依赖(首次)
pip install -r requirements.txt

# 调用
python scripts/get_content.py --url "https://mp.weixin.qq.com/s/xxx"
  • 成功:正文输出到 stdout。
  • 失败:stderr 输出原因及「建议 Agent 改用 browser 工具」。

方法二: browser 工具(脚本失败时的回退)

仅在脚本返回非 0 且 stderr 建议改用 browser 时使用:

python
browser(action="navigate", url="用户发送的链接")
browser(action="snapshot")

内容提取要点

公众号页面结构:

  • 文章正文在 #page-content 元素中
  • 标题通常在 #activity-nameh1 标签
  • 作者信息在 .account_nickname 或类似元素
  • 发布时间需要从页面元数据提取

处理流程

  1. 识别链接 → 检测到 mp.weixin.qq.com/s/ 链接
  2. 获取内容 → 调用 get_content.py --url <链接>
  3. 成功 → 正文在 stdout,直接供模型消费
  4. 失败 → 检查 stderr,若建议改用 browser,再用 browser 工具重试

注意事项

  • 公众号文章可能需要登录才能完整抓取
  • 部分文章有访问时间限制
  • 图片可能需要单独处理(使用微信图床域名)
  • 必须使用正常浏览器的 User-Agent

相关 Skills

内部沟通

by anthropics

Universal
热门

按公司常用模板和语气快速起草内部沟通内容,覆盖 3P 更新、状态报告、领导汇报、项目进展、事故复盘、FAQ 与 newsletter,适合需要统一格式的团队沟通场景。

按公司偏好的模板快速产出状态汇报、领导更新和 FAQ,既省去反复改稿,也让内部沟通更统一、更专业。

内容与创意
未扫描111.8k

主题工厂

by anthropics

Universal
热门

给幻灯片、文档、报告和 HTML 落地页快速套用专业配色与字体主题,内置 10 套预设风格并支持现场生成新主题,适合统一品牌或内容视觉。

主题工厂能帮你把幻灯片、文档到落地页快速统一视觉风格,内置 10 套主题,还能按需即时生成新主题。

内容与创意
未扫描111.8k

文档共著

by anthropics

Universal
热门

围绕文档、提案、技术规格、决策记录等写作任务,按上下文收集、结构迭代、读者测试三步协作共创,减少信息遗漏,写出更清晰、经得起他人阅读的内容。

写文档、方案或技术规格时容易思路散、信息漏,它用结构化共著流程帮你高效传递上下文、反复打磨内容,还能从读者视角做验证。

内容与创意
未扫描111.8k

相关 MCP 服务

热门

免费的加密新闻聚合 MCP,汇集 Bitcoin、Ethereum、DeFi、Solana 与 altcoins 资讯源。

内容与创意
130

by ProfessionalWiki

让 Large Language Model 客户端无缝连接任意 MediaWiki 站点,可创建、更新、搜索页面,并通过 OAuth 2.0 安全管理内容。

内容与创意16 个工具
72

借助 86+ 个云端 media processing robots,处理视频、音频、图像和文档。

内容与创意
71

评论