C#自动获取指定文本文件的编码格式Encoding以及BOM (Byte Order Mark字节顺序标记)

本文介绍了如何使用C#来检测文本文件的编码格式,包括通过字节顺序标记(BOM)识别UTF-8、UTF-16和UTF-32等编码,并提供了不依赖BOM的UTF-8编码判断方法。示例代码详细展示了如何读取文件并进行编码判断。

我们在读写文本文件(如.txt,.csv,.log等)过程中,如果指定的文本文件编码格式不正常,读写就会出现乱码现象。

这里自动获取编码格式

BOM【字节顺序标记】

BOM(Byte Order Mark),字节顺序标记,出现在文本文件头部,Unicode编码标准中用于标识文件是采用哪种格式的编码。

不同编码的字节顺序标记的表示

编码

表示 (十六进制)

表示 (十进制)

UTF-8

EF BB BF

239 187 191

UTF-16(大端序)

FE FF

254 255

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

斯内科

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值