Featured image of post 正規分布の公式の意味

正規分布の公式の意味

目次

1.概要

  • 統計でよくみる正規分布の式
  • 平均値の周りにランダムに分布するという式
  • その意味を分解して説明する

f(x)=12πσ2exp((xμ)22σ2)(<x<) f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp \left(-\frac{(x - \mu)^2} {2\sigma^2} \right) \hspace{20px} (-\infty < x < \infty)

2.正規分布の条件

正規分布の目的(条件)は次の4つ。

  1. ピークが1つ
  2. ピークを中心に左右対称
  3. 指数関数の速さで0に漸近
  4. 面積は1

3.条件の内訳

3.1.ピークが1つ

  • 平均値 μ\mu を中心にした分布であり、データが最も集中している場所を示す
  • つまり、平行移動すればOK

3.2.ピークを中心に左右対称

  • 正と負で対象にしたいので、二乗すればOK
  • つまり、(xμ)2(x - \mu)^2

3.3.指数関数の速さで0に漸近

  • ゼロに漸近なので、1x\frac{1}{x}
  • 2の条件を適用すると、1x2\frac{1}{x^2}
  • ただし、x=0 => エラーになってしまうので、1x2+1\frac{1}{x^2+1}
  • ただし、リアルの分布は端になるほど急にしなければいけない
    • 例) サイコロをn回振った時の分布だと(16)n(\frac{1}{6})^nで、反比例の傾きだと弱い
      • 1x\frac{1}{x}でも1x2\frac{1}{x^2}でも逆数は遅い
      • (1a)x(\frac{1}{a})^xのような指数の方が早い
      • aaは関数のパラメーター
    • サイコロのように試行=指数関数的に作用する
  • (1a)n=an(\frac{1}{a})^n = a^{-n}になる
  • それらを加味すると次になる
    • 1e(xμ)2=e(xμ)2\frac{1}{e^{(x-\mu)^2}} = e^{-(x - \mu)^2}
      • (xμ)(x - \mu)だけずらすのは、1の条件のため
      • (xμ)2(x - \mu)^2乗するのは、2の条件のため
      • a(xμ)2a^{-(x - \mu)^2}乗するのは、3の条件のため

原型としては、次となる。

1a(xμ)2=a(xμ)2 \frac{1}{a^{(x-\mu)^2}} = a^{-(x - \mu)^2}

3.4.面積は1

  • 面積を面積で割れば1となるので、それを利用するため面積の式を求める
  • 面積は次の式となる

f(x)=1a(xμ)2=a(xμ)2s=+f(x)dx f(x) = \frac{1}{a^{(x-\mu)^2}} = a^{-(x - \mu)^2} \\ s = \int_{-\infty}^{+\infty} f(x) dx

  • 単純化するために
    • 定数のμ\muは一旦無視する
    • aはある定数とする
  • 積分するため、底をaからeに書き直す
  • 目的関数はf(x)

f(x)=ax2a=elogaf(x)=e(loga)x2f(x)=eloga×x2A=logaf(x)=eA×x2f(x)=ax2=eAx2=eloga×x2 f(x) = a^{-x^2} \\ a = e^{\log a} \\ f(x) = e^{(\log a)^{-x^2}} \\ f(x) = e^{\log a \times -x^2} \\ A = \log a \\ f(x) = e^{A \times -x^2} \\ f(x) = a^{-x^2} = e^{-A x^2} = e^{- \log a \times x^2} \\

最後の行はを積分すると、下のようになる。

f(x)=eAx2dx=πA \int f(x) = \int_{-\infty}^{\infty}e^{-Ax^2}dx=\sqrt{\dfrac{\pi}{A}}

下にガウス積分の公式を示す。

eax2dx=πa \int_{-\infty}^{\infty}e^{-ax^2}dx=\sqrt{\dfrac{\pi}{a}}

この面積を逆数にして、もともとの関数にかければ結果が1になるので、下のようになる。

AπeAx2 \sqrt{\frac{A}{\pi}} e^{-A x^2}

最後条件1を満たすために、平行移動(BB)の定数を入れると次になる。

f(x)=AπeA(xB)2 f(x) = \sqrt{\frac{A}{\pi}} e^{-A (x -B)^2}

  • 条件1, 2, 3, 4を満たした、正規分布の原型の式が完成する
  • この原型の変数AとBを調整する方法は次
    • 5. ヒストグラムから計算された平均と分散と、この原型の式から計算された平均と分散が一致すること。
  • という条件5を満たすAとBを探す

3.4.1.Bのパラメータ

Bの方は単純に平均を当てればOK。

3.4.2.Aのパラメータ

  • Aの方は単純から計算すればいい
  • Bは既にμ\muとしてわかっている
    • NOTE: f(x)f(x)は確率が戻り値
  • 分散は次を満たせばいい

var=σ2=V(X)=(xB)2f(x)dx var = \sigma^2 = V(X) = \int (x - B)^2 f(x) dx \\

Bは定数で面積に影響がないので、0と置くと以下になる。

var=σ2=x2f(x)dxvar=σ2=x2AπeAx2dx var = \sigma^2 = \int x^2 f(x) dx \\ var = \sigma^2 = \int x^2 \sqrt{\frac{A}{\pi}} e^{-A x^2} dx \\

係数を前に出すと次になる。

var=σ2=Aπx2eAx2dx var = \sigma^2 = \sqrt{\frac{A}{\pi}} \int x^2 e^{-A x^2} dx

次のガウス積分の公式に当てはめられる。

x2neax2dx=(2n1)!!2nanπa \int_{-\infty}^{\infty} x^{2n}e^{-ax^2}dx =\dfrac{(2n-1)!!}{2^na^n}\sqrt{\dfrac{\pi}{a}}

今回はn=1なので次になる。

x2eax2dx=12aπa \int_{-\infty}^{\infty}x^2e^{-ax^2}dx=\dfrac{1}{2a}\sqrt{\dfrac{\pi}{a}}

つまり、次となる。

var=Aπ12AπA var = \sqrt{\frac{A}{\pi}} \frac{1}{2A} \sqrt{\frac{\pi}{A}}

よって以下となる。

var=σ2=V(X)=12A var = \sigma^2 = V(X) = \frac{1}{2A}

  • 結果は分散=12A\frac{1}{2A}
  • つまり、12A\frac{1}{2A}AAに逆12σ2\frac{1}{2 \sigma^2}を仕込めば、
  • 結果はvar=σ2var = \sigma^2になる
  • つまり、A=12σ2A=\frac{1}{2 \sigma^2}となる

3.5.4つの条件のまとめ

これらの定数AとBを正規分布の原型に当てはめると、完成する。

A=12σ2,  B=μf(x)=AπeA(xB)2f(x)=12πσ2exp((xμ)22σ2) A = \frac{1}{2 \sigma^2}, \; B = \mu \\ f(x) = \sqrt{\frac{A}{\pi}} e^{-A (x -B)^2} \\ f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp \left(-\frac{(x - \mu)^2} {2\sigma^2} \right) \hspace{20px}

3.6.正規分布の変曲点について

  • 上のf(x)f(x)を二回微分した関数の傾きが0になるところを求めるとf(x)=0f''(x)=0
  • x=μ±σx = \mu \pm \sigma となる
  • つまり、傾きが凸から凹に変わる傾き=0の点がμ±σ\mu \pm \sigmaということ
  • また、正規標準分布の場合は平均は1、SDは1になるので、1の地点で凹凸の変曲点となる

4.まとめ

正規分布の式は、次のように導かれる。

  • 分散 σ2\sigma^2 と平均 μ\mu を用いて、データの分布の広がりと中心を調整する
  • 式内の exp((xμ)22σ2)\exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right) 部分は、データが平均から離れるほど値が小さくなることを示しており、分布が急速に0に近づくことを表す
  • 分布の全体の面積を1に保つため、12πσ2\frac{1}{\sqrt{2\pi \sigma^2}} で正規化される

5.参考文献

Built with Hugo
テーマ StackJimmy によって設計されています。