数据挖掘,就是从数据中学习到规律,再将学习到的规律对未知的数据进行预测。但是我们最开始获取的数据其中绝大多数是“有毛病”的,不利于后期进行分析,所以我们在分析前需要进行数据的预处理。sklearn.preprocessing包提供了几个常用的函数和转换类,用它们将一个原始的特征向量转化为一个更适于数据分析的表示形式。一般来说,学习算法收益于数据集的标准形式。如果数据中存在异常点,稳健的数据规范或转换是更适合的。 本实训的目的是掌握好sklearn中的数据预处理方法。
第1关:标准化

第2关:非线性转换

第3关:归一化

第4关:离散值编码

第5关:生成多项式特征

第6关:估算缺失值

本文旨在介绍如何使用sklearn库进行数据预处理,包括标准化、非线性转换、归一化、离散值编码、生成多项式特征及估算缺失值等关键操作。通过这些方法,可以将原始数据转化为适合分析的形式,提高学习算法的效果。
8732

被折叠的 条评论
为什么被折叠?



