-
正規化とは、データをある基準に沿って変換し、尺度を統一すること。
- 例えば「変数によって値の変動する範囲が違っていて扱いづらいから、全部
[0, 1]
の範囲に変換しよう」 - スケーリングと呼んでもよい
- 例えば「変数によって値の変動する範囲が違っていて扱いづらいから、全部
-
どういう基準を用いるのかは「正規化」という言葉には定義されていない
- なので、誤解を避けたければ「データが
[0, 1]
の範囲に収まるように正規化」と基準を明記するのがよい
- なので、誤解を避けたければ「データが
-
英語で言えばnormalize。なにをnormalとするかがマチマチなのである
-
業界によってはローカルルールで「正規化とだけ言った時には~って基準での正規化だ」ってのがある
- 「ベクトルの正規化」と言ったら多くの分野で「長さを1にすること」 Normalized Vector — from Wolfram MathWorld
- 「関係の正規化」と言ったら関係をnormal formにすること see 関係の正規化 - Wikipedia
-
色々ある正規化の方法の中で、特に「平均0、分散1になるように正規化」する行為のことを「標準化」と呼ぶ
-
これは平均0、分散1の正規分布を「標準正規分布(standard normal distribution)」と呼ぶから
-
standardizeという表現は例えば以下の記事で使われている。
- Standardized Score — from Wolfram MathWorld: スコアから平均を引いて標準偏差で割ったもの
- Standardized Moment — from Wolfram MathWorld 値から平均を引いて標準偏差で割ったもののモーメント