基于Python实现的爬虫源码(1)

开发板推荐:天空星STM32F407VET6开发板

超高性价比 STM32主控 | 超高主频 | 一板兼容百芯 | 比赛神器 | 沉金彩色丝印

# -*- coding: utf-8 -*-

import string,urllib2
import os

import shutil


#os.rmdir("baidu_file")
path = os.getcwd()

#os.removedirs(path + '//baidu_file')

#shutil.copytree(ResDir,DesDir)#拷贝

Dir = path + '//baidu_file'
#如果有这个文件夹先删除
if os.path.exists(Dir) == True :
	shutil.rmtree(Dir)#删除文件夹
	

os.mkdir("baidu_file")#新建文件夹
os.chdir("baidu_file")#改变当前目录


def baidu(url,start_page,end_page):
	for i in range(start_page,end_page + 1):
		sName = string.zfill(i,5) + ".html"
		f = open(sName,'w+')
		m = urllib2.urlopen(url+str(i)).read()
		f.write(m)#将字符串写入文件,没有返回值。
		f.close()


print("请输入贴吧地址")
bdurl = "http://tieba.baidu.com/p/2296017831?pn="
start_page = 1;
end_page = 5

baidu(bdurl,start_page,end_page)

开发板推荐:天空星STM32F407VET6开发板

超高性价比 STM32主控 | 超高主频 | 一板兼容百芯 | 比赛神器 | 沉金彩色丝印

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值