1.概要
- 統計でよくみる正規分布の式
- 平均値の周りにランダムに分布するという式
- その意味を分解して説明する
f(x)=2πσ21exp(−2σ2(x−μ)2)(−∞<x<∞)
2.正規分布の条件
正規分布の目的(条件)は次の4つ。
- ピークが1つ
- ピークを中心に左右対称
- 指数関数の速さで0に漸近
- 面積は1
3.条件の内訳
3.1.ピークが1つ
- 平均値 μ を中心にした分布であり、データが最も集中している場所を示す
- つまり、平行移動すればOK
3.2.ピークを中心に左右対称
- 正と負で対象にしたいので、二乗すればOK
- つまり、(x−μ)2
3.3.指数関数の速さで0に漸近
- ゼロに漸近なので、x1で
- 2の条件を適用すると、x21
- ただし、x=0 => エラーになってしまうので、x2+11
- ただし、リアルの分布は端になるほど急にしなければいけない
- 例) サイコロをn回振った時の分布だと(61)nで、反比例の傾きだと弱い
- x1でもx21でも逆数は遅い
- (a1)xのような指数の方が早い
- aは関数のパラメーター
- サイコロのように試行=指数関数的に作用する
- (a1)n=a−nになる
- それらを加味すると次になる
- e(x−μ)21=e−(x−μ)2
- (x−μ)だけずらすのは、1の条件のため
- (x−μ)2乗するのは、2の条件のため
- a−(x−μ)2乗するのは、3の条件のため
原型としては、次となる。
a(x−μ)21=a−(x−μ)2
3.4.面積は1
- 面積を面積で割れば1となるので、それを利用するため面積の式を求める
- 面積は次の式となる
f(x)=a(x−μ)21=a−(x−μ)2s=∫−∞+∞f(x)dx
- 単純化するために
- 積分するため、底をaからeに書き直す
- 目的関数はf(x)
f(x)=a−x2a=elogaf(x)=e(loga)−x2f(x)=eloga×−x2A=logaf(x)=eA×−x2f(x)=a−x2=e−Ax2=e−loga×x2
最後の行はを積分すると、下のようになる。
∫f(x)=∫−∞∞e−Ax2dx=Aπ
下にガウス積分の公式を示す。
∫−∞∞e−ax2dx=aπ
この面積を逆数にして、もともとの関数にかければ結果が1になるので、下のようになる。
πAe−Ax2
最後条件1を満たすために、平行移動(B)の定数を入れると次になる。
f(x)=πAe−A(x−B)2
- 条件1, 2, 3, 4を満たした、正規分布の原型の式が完成する
- この原型の変数AとBを調整する方法は次
5. ヒストグラムから計算された平均と分散と、この原型の式から計算された平均と分散が一致すること。
- という条件5を満たすAとBを探す
3.4.1.Bのパラメータ
Bの方は単純に平均を当てればOK。
3.4.2.Aのパラメータ
- Aの方は単純から計算すればいい
- Bは既にμとしてわかっている
- NOTE: f(x)は確率が戻り値
- 分散は次を満たせばいい
var=σ2=V(X)=∫(x−B)2f(x)dx
Bは定数で面積に影響がないので、0と置くと以下になる。
var=σ2=∫x2f(x)dxvar=σ2=∫x2πAe−Ax2dx
係数を前に出すと次になる。
var=σ2=πA∫x2e−Ax2dx
次のガウス積分の公式に当てはめられる。
∫−∞∞x2ne−ax2dx=2nan(2n−1)!!aπ
今回はn=1なので次になる。
∫−∞∞x2e−ax2dx=2a1aπ
つまり、次となる。
var=πA2A1Aπ
よって以下となる。
var=σ2=V(X)=2A1
- 結果は分散=2A1
- つまり、2A1のAに逆2σ21を仕込めば、
- 結果はvar=σ2になる
- つまり、A=2σ21となる
3.5.4つの条件のまとめ
これらの定数AとBを正規分布の原型に当てはめると、完成する。
A=2σ21,B=μf(x)=πAe−A(x−B)2f(x)=2πσ21exp(−2σ2(x−μ)2)
3.6.正規分布の変曲点について
- 上のf(x)を二回微分した関数の傾きが0になるところを求めるとf′′(x)=0
- x=μ±σ となる
- つまり、傾きが凸から凹に変わる傾き=0の点がμ±σということ
- また、正規標準分布の場合は平均は1、SDは1になるので、1の地点で凹凸の変曲点となる
4.まとめ
正規分布の式は、次のように導かれる。
- 分散 σ2 と平均 μ を用いて、データの分布の広がりと中心を調整する
- 式内の exp(−2σ2(x−μ)2) 部分は、データが平均から離れるほど値が小さくなることを示しており、分布が急速に0に近づくことを表す
- 分布の全体の面積を1に保つため、2πσ21 で正規化される
5.参考文献