Skip to content

kaka2436/scrap

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

这是一个简单的爬虫
作用是爬去百度贴吧指定贴吧第一页中所有帖子里第一页上的所有图片
使用时只需要将starturl改为指定贴吧的地址即可
本程序中没有设置爬取延时,可能会被百度封IP
如果需要加上延时,只需要将30行及46行的#time.sleep(delay)解注释即可
调整延时时间,只需要修改12行delay的值即可,单位为秒

刚开始学习爬虫,写的代码很烂
欢迎大家交流讨论提出指正和建议
联系方式:[email protected]

About

作为学习爬虫的仓库,存放爬虫学习期间练习的代码

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages