missing_count[i] = str(X_train_incomplete[i]).count("nan")
需要将数组先转化为字符串,然后统计元素为“nan”的个数。
如果是DataFrame格式,可以用自带的函数进行统计。
这也是为什么做不完备数据操作的时候很多代码都是用pandas.DataFrame来处理的。
本文介绍了一种统计数据集中缺失值的方法,通过将数组转换为字符串并计算nan出现的次数来实现。对于DataFrame格式的数据,可以利用内置函数简化这一过程。
missing_count[i] = str(X_train_incomplete[i]).count("nan")
需要将数组先转化为字符串,然后统计元素为“nan”的个数。
如果是DataFrame格式,可以用自带的函数进行统计。
这也是为什么做不完备数据操作的时候很多代码都是用pandas.DataFrame来处理的。
2888

被折叠的 条评论
为什么被折叠?