先说结论
中文字符截取,使用
char_length(str)来获取字符串长度
截取方法:left(str, char_length(str) - 2)
问题复现
我的需求是,需要把数据库中的脏数据,最后两个中文字符删掉

第一个想法就是通过 sql 语句进行截断,所以测试了 LEFT(str, length) 方法
感觉通过 left 可以完美解决我的问题。

然后,实际找了一条数据去做测试,但是却没法删掉最后的社区两个汉字

通过查询尝试和查询资料,才发现是 length 方法的问题,换成 char_length 即可

原因分析
left 方法 在截取 中文字符 “测试社区” 时, length 方法是按照字节为单位,一个汉字在 utf8 下三个字节,在 GBK 下两个字节
String str = "测试社区";
// 实际判断后, str 长度是 4
// left(str, length(str) - 2) length 在 utf8 编码下,长度为 12 字节
String sub = str.subString(0, 12 - 2);
// 所以 sub 还是 "测试社区";
本文探讨了在SQL中使用LEFT函数截取包含中文字符的字符串时遇到的问题。通常,length方法计算的是字节长度,而非字符长度,导致在UTF-8编码下,对于中文字符的截取不准确。解决方案是使用char_length函数代替length,因为它以字符为单位计算长度。通过案例分析,解释了为何`left(str, length(str) - 2)`无法正确删除最后两个中文字符,并提出了正确的截取方法`left(str, char_length(str) - 2)`。
366

被折叠的 条评论
为什么被折叠?



