Udacity 数据分析进阶课程笔记L40:特征缩放

  1. 通过衣服尺码的例子,介绍一种使用特征缩放的简单情况
  2. 一种简单的特征缩放公式(归一化)和实现


    归一化特征缩放公式
# Python code
def featureScaling(arr):
    scale = max(arr) - min(arr)
    res = []
    for elem in arr:
        res.append( float(elem - min(arr))/scale )

    return res
  1. sklearn中的Min-Max Scalar特征缩放器
# 课程中与此例不同,直接使用了 fit_trasform() 函数
>>> from sklearn.preprocessing import MinMaxScaler
>>>
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler(copy=True, feature_range=(0, 1))
>>> print(scaler.data_max_)
[  1.  18.]
>>> print(scaler.transform(data))
[[ 0.    0.  ]
 [ 0.25  0.25]
 [ 0.5   0.5 ]
 [ 1.    1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[ 1.5  0. ]]
  1. 哪些算法的结果会收到特征缩放的影响?
    image.png
  2. 特征缩放迷你项目。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容