🪴 Quartz 4.0

Search

❯

確率の積分

確率の積分

Dec 01, 2023, 3 min read

Information-Geometric Optimizationを読んでいて、確率Pについて $\int f (x) P (x) d x$ という書き方と $\int f (x) P (d x)$ という書き方が混在していてどういうことか戸惑った。

Footnote 1をみて納得したので、理解の確認のためにも解説を書いておく

Throughout the text we do not distinguish a probability distribution 𝑃, seen as a measure, and its density with respect to some unspecified reference measure d𝑥, and so will write indifferently 𝑃(d𝑥) or 𝑃(𝑥)d𝑥. The measure-theoretic viewpoint allows for a unified treatment of the discrete and continuous case.

離散的な確率Pでは、例えば「サイコロの目が1になる確率は1/6」のように、点xに対してP(x)=1/6が対応している。なのでこの場合のPはxの取りうる範囲をXとするなら $X \to R$ だ。

一方で連続的な確率、例えば正規分布N(m, 1)に従う確率変数Aの場合「Aが平均mに一致する確率」は0だ。「Aがa以上b以下の範囲に入る確率」というように範囲(Xの部分集合)に対して値が定まる。正規分布というと以下の式が有名だが

$f (x) = \frac{1}{2 π σ ^{2}} exp (- \frac{( x - μ ) ^{2}}{2 σ ^{2}})$ これは「確率密度関数」であって、この関数の値ではなく、ある範囲について積分したものが確率になる。
$P (a \leq A \leq b) = \int_{a}^{b} f (x) d x$ つまりこの場合のPはXの部分集合から実数への関数 $2^{X} \to R$ だ。単に $2^{X} \to R$ というだけではなく他にも色々と都合の良い性質があるので、それらをまとめて「[測度]」と呼ぶ。 see 測度論 - Wikipedia

この式ではaとbを明記している

$P (a \leq A \leq b) = \int_{a}^{b} f (x) d x$ 明記しなければこうなる
$P (d x) = \int f (x) d x$

ある関数g(x)があって、それを確率分布Pの元での期待値を計算したい場合、離散だったら

$\sum_{x \in X} P (x) g (x)$ 連続だったら
$\int f (x) g (x) d x$ となるわけだが、IGOの論文での記法ではこれを両方とも特に区別せず
$\int P (d x) g (x)$ と書いたり
$\int P (x) g (x) d x$ と書いたりしますよ、ということ。

Graph View

Backlinks

No backlinks found

Created with Quartz v4.1.1, © 2023

GitHub
Discord Community