WxProbe,一款自研的公众号敏感信息收集工具

低价海外云服务器,香港/美国免备案服务器仅需8.8起

此工具的灵感主要是源于一次北京红队金融项目,在公众号这块的信息收集实验比较少,要手动一个一个公众号去翻,特意写的一个工具

这个工具主要用于敏感信息收集工具,专注于微信公众号文章批量获取与 AI 智能分析。

通过 Token 登录微信公众平台,批量抓取指定公众号发布的历史文章,利用 DeepSeek AI 识别手机号、身份证、邮箱、车牌号、密码等等敏感信息。以及公司关联信息,公司注册资金、统一信用代码,法定代表人,股东结构等等信息(AI生成的结果,仅供参考)

注:此工具仅限于学习使用,请勿用于非法用途,若造成不良后果,与工具开发者以及泷羽Sec安全团队无关,请自行承担相应的法律责任,此工具禁止逆向源码,一旦发现,后果自负,若需要源码二开,可以自行联系工具作者一次性买断(白菜价)。

技术架构

WxProbe
├── WeChatLogin          # Token + Cookie 登录管理
├── ArticleFetcher       # 文章列表获取 + 正文抓取
│   ├── scrapling        # headless 隐身模式(反爬)
│   └── requests         # 保底方案
├── SensitiveInfoAnalyzer
│   ├── _regex_scan      # 正则快速扫描(手机号/身份证/邮箱/IP等)
│   └── analyze_single   # DeepSeek AI 深度分析
├── WechatSogouAPI       # 搜狗微信搜索(可选)
└── ShadowEyeApp (UI)
    ├── 公众号情报 Tab
    ├── 搜狗搜索 Tab
    ├── URL 抓取 Tab
    └── 设置 / 导出
模块 功能
🔐 公众号情报 Token 一键登录 → 搜索公众号 → 多页爬取文章 → AI 分析 → 导出报告
🔎 搜狗搜索 无需登录,直接搜索微信文章 → 一键抓取 → AI 分析敏感信息
📎 URL 抓取 粘贴微信文章链接(单条/批量),抓取正文并用 AI 分析
🤖 AI 分析 DeepSeek + 正则双引擎:手机号、身份证、邮箱、IP、银行卡、密钥等

使用教程

打开微信公众平台扫码登录

image-20260509143934747

登录后复制token

image-20260509182545104

复制cookie

image-20260509180735598

复制到这上面来

image-20260509182431402

输入之后就能登录成功

image-20260509182617642

尝试搜索公众号

image-20260509182646331

默认是五页选择自己要爬取的公众号后点击爬取

image-20260509182719211

刚开始是没有敏感信息的,需要手动点击是否进行AI分析,这里使用的AI是deepseek

image-20260509182835739

需要在系统设置,设置自己的apikey和模型名称

image-20260513172540921

AI分析完成后,可以在敏感信息中看到常见的手机号、身份证号、姓名、邮箱、地址、IP地址、银行卡号、网站链接/域名、密码/密钥/Token、组织机构代码、车牌号、QQ/微信号、其他PII等等,对于公司信息会调出企业工商信息,比如(注册资金,实缴资本、统一社会信用代码、注册时间等等工商信息,以及公司结构)这对于公众号这块的信息来讲是非常的有用的

image-20260513194050156

中国债卷尝试

image-20260513194139812

image-20260513194315066

若您对结果不满意,可以导出功能,自行对数据进行分析

image-20260509183800370

2、信息收集部分,本工具已绕过搜狗反爬功能,您可以通过搜狗搜索引擎,搜索到微信公众号相关文章,利用AI进行敏感信息分析,和前面一样比如邮箱、手机号等等信息,为了稳定请不要频繁点击某一个功能,耐心等待工具执行(若数据量较大可能要等待10分钟、一小时),在此期间可以双击某一个文章查看文章详情

注意:对于搜狗搜索引擎,单个文章建议请抓取一次即可,不要重复抓取,否则极易促发反爬。

image-20260511215052744

image-20260513152316128

3、若您已经拥有了一定数量的公众号相关的URL,则可以使用URL抓取功能

image-20260513152525644

例如

https://mp.weixin.qq.com/s/caVRY62bhNZm5Ri81oqUwg

https://mp.weixin.qq.com/s/hcB1m6tmDFfx9PA7rNzOZA

注意:对于某号文章爬取,可全面绕过,稳定爬取,无需担心被拦截,但需要确保你已成功登录

image-20260513154540630

image-20260513155756422

工具获取方式,扫描下方二维码加入freebuf知识大陆即可获取,仅需79

此时加入,可获取香港免备案服务器一个月使用权(配置:4核心 4GB 硬盘:40G 带宽:10Mbps 峰值 流量:无流量限制),限时到2026年6月1日之前,之后不再赠送

注:服务器使用需要实名,介意的话可以忽略赠品

海报 (1)

常见问题

Q: 搜狗搜索提示验证码拦截? 先执行一次搜索(让系统建立 session),搜索成功后 session 会缓存,后续抓取会复用该 session。

Q: URL 抓取按钮一直”分析中”? 需要先在「公众号情报」tab 完成登录。如果已登录仍卡住,可能是网络问题,2 分钟超时后会自动恢复。

Q: 分析结果为空或”未获取到正文”? scrapling 可能被反爬。程序会自动降级到 requests + BeautifulSoup 保底方案。如仍失败,检查文章链接是否有效。

THE END
喜欢就关注一下咱们公众号吧
点赞35 分享