多数情况下,需要对数据集进行归一化处理,再对数据进行分析
#首先,引入两个库 ,numpy,sklearn
from sklearn.preprocessing import MinMaxScaler
import numpy as np
#将csv文件导入矩阵当中
my_matrix = np.loadtxt(open("xxxx.csv"),delimiter=",",skiprows=0)
#将数据集进行归一化处理
scaler = MinMaxScaler( )
scaler.fit(my_matrix)
scaler.data_max_
my_matrix_normorlize=scaler.transform(my_matrix)
#最后的my_matrix_normorlize 实现了归一化my_matrix_normorlize
完整未解释代码:
from sklearn.preprocessing import MinMaxScaler
import numpy as np
my_matrix = np.loadtxt(open("xxxx.csv"),delimiter=",",skiprows=0)
scaler = MinMaxScaler( )
scaler.fit(my_matrix)
scaler.data_max_
my_matrix_normorlize=scaler.transform(my_matrix)
本文介绍了在Python中对数据集进行归一化处理的重要性,并提供了相关代码,将数据转换到0-1之间,以备后续分析使用。
7052

被折叠的 条评论
为什么被折叠?



