前言
渗透测试第一步是收集信息,找到和漏洞匹配的目标肯定美滋滋,那我们就先采集大量的域名然后再筛选。于是就有了这个项目。
先看下目前成果。

一个月的采集结果,只要服务器配置高一点,三个月至少能采集过亿的域名。
项目原理
利用python3异步asyncio+aiohttp 高并发采集网站内页链接+外链
内链采集写入link表中间,没有采集过的内链 mark=0,采集过的内链标识 mark=1。外链写入domain表中,没有采集过的mark=0,采集过的mark=1。
if 'http' in tag_a["href"] and domain not in tag_a["href"] and "." in tag_a["href"] :
out_change = parse.ur

本文介绍了使用Python的asyncio和aiohttp库进行高并发域名采集的项目,通过异步框架采集网站内页链接和外链,详细讨论了在实现过程中遇到的坑,包括MySQL连接池的处理、递归采集的优化和内存管理。作者分享了一个月采集过亿域名的成果,并提供域名数据库和程序的购买信息。
1011

被折叠的 条评论
为什么被折叠?



