python爬虫之抓取网页中的图片到本地

最新推荐文章于 2025-09-17 07:59:10 发布

原创

最新推荐文章于 2025-09-17 07:59:10 发布 · 1.5w 阅读

收录于

当前文章被以下社区和专栏收录：

本文介绍了作者学习Python爬虫的过程，通过教程掌握了如何抓取网页中的图片并将其保存到本地的技能。主要步骤包括解析HTML找到图片URL，然后下载并保存图片。

最近开始学习python，python的爬虫诱惑力实在太强。今天看着网上的教程，也学会了这样一个小功能

主要步骤是：

1.抓取网页

2.获取图片地址

3.抓取图片内容并保存到本地

下面是关键代码：

import urllib.request
req=urllib.request.urlopen('http://www.imooc.com/course/list')
buf=req.read()
//显示从网页上抓取到的内容
buf
//通过正则表达式获取图片地址
import re
//本人用的是python3.5，直接用findall会出错，因此需要下面一句对buf进行编码
buf=buf.decode('UTF-8')
listurl=re.findall(r'src=.+\.jpg',buf)
listurl=re.findall(r'http:.+\.jpg',buf)//显示图片的网址
listurl
//将图片