確率

FrontPage

概要

  • 確率を直感的に考えていると、式変形が哲学的になりがち
  • 「解説はこう書いてあるが、俺はこう考える」みたいなのを避けましょう

心構え

  • 確率論ではパラレルワールドがいっぱいあるような状況を想定して、それぞれの世界での結果をまとめるという気持ちでいる
    • 具体的な計算に置いては、パラレルワールドを面積1の正方形で表現する感じで考察する
  • 確率密度関数はインクのにじみ

変数変換

  • Z=g(X)Z=g(X)とする。確率密度関数fX(x)f_X(x)は知っているとして、fZ(z)f_Z(z)を求めたい。
    • fZ(z)=1det(Z/X)fX(g1(z))\displaystyle f_Z(z) = \frac{1}{\det(\partial Z / \partial X)} f_X(g^{-1}(z))
    • Z=2XZ=2Xを想定すれば簡単で、要するにZの空間では範囲が広くなった分だけ確率密度関数が薄まる

正規分布

  • Z\bf{Z}をn次元標準正規分布とする。
    • これを変数変換して、N(μ,V)N(\mu, V)を構成したい
  • X=RDZ+μX=RDZ+\muなる変換を噛ませばいける
    • V[X]=RDZDtRt=RD2RtV[X] = RDZD^t R^t = RD^2R^tである(R, Dが揺らがないため、多次元の分散の公式から。また、V[Z]=IV[Z] = I
    • ここで、V=RD2RtV=RD^2R^tなる、直交行列Rと対角行列Dを探してきたい。
    • これは簡単で、RtVR=D2R^t V R = D^2なるR, Dを探すのは、固有値と固有ベクトルそのままである。
    • XXの等高線を図示するためには、col(R,i)col(R, i)方向にDiiD_{ii}の長さの主軸を持つ楕円を描けば良い。

擬似乱数

  • 一様分布を加工する
  • F(y)F(y)を確率変数Yの累積分布関数とする。ここで、Y=F1(X)Y=F^{-1}(X)が計算できる場合は、XXに[0, 1)上の一様分布をぶっこむとYYの擬似乱数が得られる
  • 正規分布はBox-Mullerで生成しましょう
    • X1,X2X_1, X_2を[0, 1)上の一様分布として、2logX1cos(2πX2)\sqrt{-2 \log X_1} \cos(2 \pi X_2), 2logX1sin(2πX2)\sqrt{-2 \log X_1} \sin(2 \pi X_2)は二次元標準正規分布に従う

いろんな不等式

  • Starlingの公式
  • Jensenの不等式
    • 先に下に凸関数をかますと下がる
  • Gibbsの不等式
    • KLは正
  • Markovの不等式
    • P(Xc)E[X]/cP(X \ge c) \le E[X] / c
    • 当たり前(s=P(Xc)s = P(X \ge c)とすると、その時点でE[X]scE[X] \ge sc
  • Chebyshevの不等式
    • Markovから言える。P(Yμaσ)a2P(|Y-\mu| \ge a \sigma) \le a^{-2}(期待値からaaだけかけ離れた値が出る確率の低さはa2以下a^{-2}以下
    • 正規分布に限らず、任意の分布について言えているのがすごいね
  • Chernoff限界
  • Minkowskiの不等式
    • E[X+Yp]1/pE[Xp]1/p+E[Yp]1/pE[|X+Y|^p]^{1/p} \le E[|X|^p]^{1/p} + E[|Y|^p]^{1/p} (これは任意ノルムの三角不等式に対応している)
  • Hoelderの不等式
    • E[XY]E[Xq]1/qE[Yq]1/qE[|XY|] \le E[|X|^q]^{1/q} E[|Y|^q]^{1/q} (これは任意ノルムのシュワルツの不等式に対応している)

いろんな収束

  • 概収束

    • これが満たされていると個々の世界線ω\omegaに縛られた人間でも収束を直接感じることができる。
  • 確率収束

    • パラレルワールドを横断しても、どの時間についても収束している
  • 二次平均収束

    • E(XnX2)0E(|X_n-X|^2) \rightarrow 0ならば必ず確率収束する
  • 法則収束

    • 確率分布に着目した収束
  • 成り立つもの

    • 概収束->確率収束
    • 二次平均収束->確率収束
    • 確率収束->法則収束

特性関数

  • 特性関数は、確率密度関数のフーリエ変換らしきものになっている

KLと大偏差原理

  • 確率ttで表になるコインをnn回投げて、表の割合がssになるような確率は、nn \rightarrow \inftyの時どれくらいの速度で下がるか?
  • 結論、logP(表がs)nD(pq)+o(n)\log P(表がs割) \approx -nD(p||q) + o(n)
    • ただしppが確率ttで表になる二項分布で、qqが確率ssで表になる二項分布
    • このことで面白いのは、t=0.1t=0.1s=0.2s=0.2を区別するより、t=0.5t=0.5t=0.6を区別するほうが圧倒的に難しいということt=0.6を区別するほうが圧倒的に難しいということ

測度論

  • 確率は面積。 神視点:完全に確定した面積の問題→面積の答え 人視点:不確定に揺らぐ確率の問題→確率の答え Ωは1x1の正方形だと思っとくとよい 確率変数は、Ω上の3次元に突き出る関数だと思うと良い。 確率の話は、「おれはこう考える」の水かけ論になりがちである(モンティ・ホール問題)。結局、人の世界で考えると、妙に哲学的な話や錯覚に陥り、ただの式変形もまままならない。

最終更新: 2020-01-01