矩陣標準化的目的是,通過標準化處理,得到均值為0,標準差為1的服從標準正態分布的數據。(相對一維數據來說,也就是相對矩陣的每一列,數據的每一個維度)矩陣標準化方法是樣本數據減去均值然后除以標準差。
1)、方便處理數據。在一些實際問題中,我們得到的樣本數據都是多個維度的,即一個樣本是用多個特征來表征的。比如在預測房價的問題中,影響房價的因素有房子面積、臥室數量等,我們得到的樣本數據就是有關房子面積與臥室數量的一些樣本點,這里的樣本點對又被稱為特征向量。很顯然,這些特征的量綱和數值的量級都是不一樣的,在預測房價時,如果直接使用原始的數據值,那么他們對房價的影響程度將是不一樣的,而通過標準化處理,可以使得不同的`特征具有相同的Scale。這樣,在使用梯度下降法學習參數的時候,不同特征對參數的影響程度就一樣了。
簡而言之,當原始數據不同維度上的特征的尺度(單位)不一致時,需要標準化步驟對數據矩陣進行預處理。
2)、加快收斂速度。大部分數據矩陣歸一化后收斂速度會加快。
3)、提升精度。
4)、防止梯度爆炸。