解决办法:
在文件前加
import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')
url = 'http://comment.bilibili.com/34568185.xml'
r = requests.get(url)
print(r.content.decode('utf-8'))
r.content返回的是bytes
r.text 返回的是bytes解码后的字符串,自动解码就可能解错
本文介绍了一种解决从Bilibili抓取弹幕XML文件时遇到的编码错误的方法。通过在Python脚本开头引入sys和io模块,并设置stdout编码为utf-8,确保了正确读取和打印内容。文章详细解释了requests库中r.content和r.text的区别,帮助读者理解如何避免自动解码可能导致的错误。
138

被折叠的 条评论
为什么被折叠?



