在处理为微博文本的csv文件读取时报错,报错提示为:

原始代码为:

报错的意思大概时,utf-8 无法解码,在位置0处有非法字符。
在utf-8编码文件中bom在文件头部,占用三个字节,用来标示该文件属于utf-8编码,现在已经有很多软件识别bom头,但是还有些不能识别bom头,所以读取的时候就会出现报错。
解决方案:
用Notepad++软件把需要读取的文件打开,点击上方工具栏里的“编码”,将文件“ 转为UTF-8 无BOM格式编码 ”,再保存文件就解决了。
本文介绍了解决在读取CSV文件时遇到的UTF-8编码错误的方法。主要原因是文件头部存在BOM标记,导致某些软件无法正确解析。通过使用Notepad++将文件转换为UTF-8无BOM格式即可解决问题。
Python3.8
Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本
在处理为微博文本的csv文件读取时报错,报错提示为:

原始代码为:

报错的意思大概时,utf-8 无法解码,在位置0处有非法字符。
在utf-8编码文件中bom在文件头部,占用三个字节,用来标示该文件属于utf-8编码,现在已经有很多软件识别bom头,但是还有些不能识别bom头,所以读取的时候就会出现报错。
解决方案:
用Notepad++软件把需要读取的文件打开,点击上方工具栏里的“编码”,将文件“ 转为UTF-8 无BOM格式编码 ”,再保存文件就解决了。
您可能感兴趣的与本文相关的镜像
Python3.8
Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本
2702
425
883
593

被折叠的 条评论
为什么被折叠?