A:归一化(也叫归一化):是指数值减去平均值,然后除以标准差。在一些实际问题中,我们得到的样本数据都是多维的,即一个样本由多个特征来表征。比如在预测房价的问题中,影响房价的因素(特征)包括房屋面积、卧室数量等。显然,这些特征的维度和大小是不同的。在预测房价时,如果直接使用原始数据值,那么它们对房价的影响是不同的,通过标准化,不同的特征可以有相同的尺度。
A:也叫标准差标准化,这种方法给出原始数据的均值和标准差来标准化数据。处理后的数据符合标准正态分布,即平均值为0,标准差为1,其转换函数为:x=x ,其中为所有样本数据的平均值,为所有样本数据的标准差。
A:举个例子,假设A的值在-986到917之间,A的最大绝对值是986。为了使用十进制标准化,我们将每个值除以1000(即j=3),这样-986就被标准化为-0.986。注意标准化会改变原始数据,所以需要保存所用标准化方法的参数,以便统一标准化后续数据。
答案:z得分标准化法适用于属性A的最大值和最小值未知,或者存在超出取值范围的异常值的情况。其中:zij为标准化变量值;西吉是实际变量值。3.反转指示器前的符号。