数据处理中的归一化、标准化总结

什么是归一化、标准化

归一化,由名字就可以看出来,是把数据映射到 (0,1)范围内的值。

百度百科上面的学术说法是:“归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为标量。”简单点说,就是把有单位的数值,变成无单位的标量,以便可以进行对比。

而标准化也是如此。在维基百科的定义中,归一化和标准化同属于特征缩放。附上两个维基百科的连接:

特征缩放:https://en.wikipedia.org/wiki/Feature_scaling

标准化:https://en.wikipedia.org/wiki/Normalization_(statistics)

下方为转载内容

(转载连接见顶部标题下方)

python中的使用

最后,对于python中,则可以直接引入相对应的库来对数据进行处理,numpy,sklearn。

sklearn 中数据处理相关用法:https://scikit-learn.org/stable/modules/preprocessing.html#normalization

赞 (0)