正規化
せいきか
名詞動詞-サ変
標準
normalization
作例 · 標準
データベースの効率を上げるために、テーブルを正規化する必要がある。
幻辭AI · gemini-3-flash-preview
機械学習のモデルを学習させる前に、入力データを正規化した。
幻辭AI · gemini-3-flash-preview
異なるスケールの指標を比較するために、値を0から1の範囲で正規化した。
幻辭AI · gemini-3-flash-preview
ウィキペディア曖昧さ回避
正規化(せいきか、英語: normalization)とは、データなどを一定の規則に基づいて変形し、利用しやすくすること。言い換えると、正規形でないものを正規形(比較・演算などの操作のために望ましい性質を持った一定の形)に変形することをいう。多くの場合、規格化と訳しても同義である。 用語「正規化」は、非常に多くの分野で使われていて、分野によって意味も大きく異なるので、頻度が高い分野についてそれぞれ個別に説明する。
ベクトル
数量
- 数量を代表値で割るなどして無次元量化し、互いに比較できるようにすることを、正規化という。
- 正規化した結果は単位系によらない。したがって、正規化することによって、たとえば身長と体重など、次元が異なりそのままでは比較できない数量が比較できる。次元が同じでも、夏と冬の1日の気温変化のように、条件が異なるデータも正規化によって比較しやすくなる。
- 正規化は特に多変量解析の前処理として行われ、この用途の正規化を特徴軸の正規化という。
- 正規化の方法には様々なものがあり、次の2つが基本的である。
- 二乗平均平方根が 1 になるよう、線形変換(比例変換)をする。
- 平均が 0、分散が 1 になるよう、アフィン変換をする。
- どちらが適しているかは、どのようなデータをどのような解析のために正規化するかによる。多変量解析には2.が用いられる。
- 用途によっては、同じように比例変換やアフィン変換をするのでも、最大値が 1、最小値が 0(または −1)となるように正規化をすることもある。また、べき乗して歪度を 0 にする、あらかじめ与えられた分布に一致させるなど、もっと強い正規化が用いられることもある。
パターン認識
確率密度関数の正規化定数
- 関数を台で定積分した逆数を正規化定数 (normalizing constant) という。確率密度関数は台で定積分した値が 1 でなければならない。関数に正規化定数を掛けることによって、(確率密度関数の他の要件も満たせば)確率密度関数が作れる。
- 例えば、次の関数と台があったときに、
- p
- (
- x
- )
- =
- e
- −
- x
- 2
- /
- 2
- ,
- x
- ∈
- (
- −
- ∞
- ,
- ∞
- )
- {\displaystyle p(x)=e^{-x^{2}/2},\quad x\in (-\infty ,\infty )}
- 台の範囲で定積分すると次式の値になる。
- ∫
- −
- ∞
- ∞
- p
- (
- x
- )
- d
- x
- =
- ∫
- −
- ∞
- ∞
- e
- −
- x
- 2
- /
- 2
- d
- x
- =
- 2
- π
- ,
- {\displaystyle \int _{-\infty }^{\infty }p(x)\,dx=\int _{-\infty }^{\infty }e^{-x^{2}/2}\,dx={\sqrt {2\pi \,}},}
- この値の逆数
- 1
- 2
- π
- {\displaystyle {\frac {1}{\sqrt {2\pi \,}}}}
- が正規化定数である。
出典: 正規化 — ウィキペディア / CC BY-SA 4.0