由于weka的默认字符集编码是Cp1252,所以如果你导入的数据中有中文字符,就会出现乱码的情况,所以需要weka的RunWeka.ini文件
将cp1252替换成你的数据对应的字符集编码,比如utf-8,cp936(简体中文),cp950(繁体中文)。这样就能正常显示中文了。
转自:http://blog.csdn.net/hitzhang/archive/2009/11/03/4762544.aspx
本文介绍了解决Weka处理中文数据时出现乱码的方法,通过修改RunWeka.ini文件中的字符集编码为如utf-8、cp936等,使中文数据能够正确显示。
由于weka的默认字符集编码是Cp1252,所以如果你导入的数据中有中文字符,就会出现乱码的情况,所以需要weka的RunWeka.ini文件
将cp1252替换成你的数据对应的字符集编码,比如utf-8,cp936(简体中文),cp950(繁体中文)。这样就能正常显示中文了。
转自:http://blog.csdn.net/hitzhang/archive/2009/11/03/4762544.aspx
1万+
2万+

被折叠的 条评论
为什么被折叠?