Python urllib2报错"UnicodeDecodeError: 'utf8' codec can't decode byte 0xa1"

最新推荐文章于 2024-03-11 20:15:01 发布

原创最新推荐文章于 2024-03-11 20:15:01 发布 · 6.1k 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#python #urllib2 #乱码

收录于

Python 专栏收录该内容

3 篇文章

订阅专栏

本文介绍使用Python的urllib2库抓取网页时遇到的中文乱码问题及解决方法。通过调整字符集设置，成功将乱码转换为正确的中文内容。

开发板推荐：天空星STM32F407VET6开发板

超高性价比 STM32主控 | 超高主频 | 一板兼容百芯 | 比赛神器 | 沉金彩色丝印

点击查看

用python的urllib2抓取web页面时发现中文显示的乱码：

import urllib2

#获取手机号的归属地
url = "http://www.ip138.com:8080/search.asp?action=mobile&mobile=1380013"
request = urllib2.Request(url)
request.add_header('User-Agent', 'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36')

response = urllib2.urlopen(request).read()
print response

返回结果有乱码？解码：