同時分布と周辺分布
確率統計(数学B)(教科書範囲) ★★
同時分布と周辺分布について扱います.
多次元の確率分布の話になりますが,高校数学では基本的に確率変数 $X$ と $Y$ の2次元の確率が対象です.
同時分布と周辺分布
データの分析では途中から2変量の関係(共分散と相関係数)を扱っていきました.
確率でも,これから確率変数 $X$ と $Y$ 等の2変量の関係について扱っていきます.しかし,高校の検定教科書では確率変数の共分散 ${\rm Cov}(X,Y)$ や相関係数 $\rho$ の記載はありません.
同時分布と周辺分布
2つの確率変数 $X$,$Y$ について,$P(X=x_{i},Y=y_{j})=p_{ij}$ ( $1\leqq i \leqq n$,$1\leqq j \leqq m$ )を同時確率関数という.以下のように表にすることができる.
| $X$ $Y$ | $y_1$ | $y_{2}$ | $\cdots$ | $y_{m}$ | 計 |
| $x_1$ | $p_{11}$ | $p_{12}$ | $\cdots$ | $p_{1m}$ | $p_1$ |
| $x_2$ | $p_{21}$ | $p_{22}$ | $\cdots$ | $p_{2m}$ | $p_2$ |
| $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ |
| $x_n$ | $p_{n1}$ | $p_{n2}$ | $\cdots$ | $p_{nm}$ | $p_n$ |
| 計 | $q_1$ | $q_2$ | $\cdots$ | $q_m$ | $1$ |
この対応を $X$ と $Y$ の同時分布(または結合分布)(joint distribution)という.
$\displaystyle P(X=x_{i})=\sum_{j=1}^{m}p_{ij}=p_{i}$
$\displaystyle P(Y=y_{j})=\sum_{i=1}^{n}p_{ij}=q_{j}$
と定義したとき
| $X$ | $x_1$ | $x_{2}$ | $\cdots$ | $x_{n}$ | 計 |
| $P$ | $p_1$ | $p_{2}$ | $\cdots$ | $p_{n}$ | $1$ |
| $Y$ | $y_1$ | $y_{2}$ | $\cdots$ | $y_{m}$ | 計 |
| $P$ | $q_1$ | $q_{2}$ | $\cdots$ | $q_{m}$ | $1$ |
$X$ と $Y$ のそれぞれの確率分布を周辺分布という.
$X$ と $Y$ のそれぞれの実現値に対しての確率をまとめたものが同時分布で,$X$ と $Y$ のそれぞれに注目したものが周辺分布です.
同時分布とは,$X$ と $Y$ の2次元の確率分布です.$X$ と $Y$ にどういう関係があるかを探るのが今後の焦点になります.
例題と練習問題
例題
例題
$11$,$12$,$21$,$32$ と書いた $4$ 枚のカードがある.これらをよく切って $1$ 枚を取り出すとき,十の位の数字を $X$,一の位の数字を $Y$ とする.$X$ と $Y$ の同時分布を求めよ.
解答
| $X$ $Y$ | $1$ | $2$ | 計 |
| $1$ | $\dfrac{1}{4}$ | $\dfrac{1}{4}$ | $\dfrac{1}{2}$ |
| $2$ | $\dfrac{1}{4}$ | $0$ | $\dfrac{1}{4}$ |
| $3$ | $0$ | $\dfrac{1}{4}$ | $\dfrac{1}{4}$ |
| 計 | $\dfrac{1}{2}$ | $\dfrac{1}{2}$ | $1$ |
※ ちなみに $X$ と $Y$ の周辺分布はそれぞれ
| $X$ | $1$ | $2$ | $3$ | 計 |
| $P$ | $\dfrac{1}{2}$ | $\dfrac{1}{4}$ | $\dfrac{1}{4}$ | $1$ |
| $Y$ | $1$ | $2$ | 計 |
| $P$ | $\dfrac{1}{2}$ | $\dfrac{1}{2}$ | $1$ |
となります.
練習問題
練習
赤球 $3$ 個,白球 $2$ 個,黒球 $1$ 個,合計 $6$ 個が入っている袋から $1$ 個の球を取り出し元に戻すことを $3$ 回繰り返す.赤球が $X$ 回,白球が $Y$ 回出たとすると,$X$ と $Y$ の同時分布を求めよ.また,$X$ と $Y$ の周辺分布もそれぞれ求めよ.
練習の解答
$P(X=i,Y=j)$
$=\dfrac{3!}{i!j!(3-i-j)!}\left(\dfrac{3}{6}\right)^{i}\left(\dfrac{2}{6}\right)^{j}\left(\dfrac{1}{6}\right)^{3-i-j}$
となるので,同時分布は
| $X$ $Y$ | $0$ | $1$ | $2$ | $3$ | 計 |
| $0$ | $\dfrac{1}{216}$ | $\dfrac{6}{216}$ | $\dfrac{12}{216}$ | $\dfrac{8}{216}$ | $\dfrac{27}{216}$ |
| $1$ | $\dfrac{9}{216}$ | $\dfrac{36}{216}$ | $\dfrac{36}{216}$ | $0$ | $\dfrac{81}{216}$ |
| $2$ | $\dfrac{27}{216}$ | $\dfrac{54}{216}$ | $0$ | $0$ | $\dfrac{81}{216}$ |
| $3$ | $\dfrac{27}{216}$ | $0$ | $0$ | $0$ | $\dfrac{27}{216}$ |
| 計 | $\dfrac{64}{216}$ | $\dfrac{96}{216}$ | $\dfrac{48}{216}$ | $\dfrac{8}{216}$ | $1$ |
周辺分布は
| $X$ | $0$ | $1$ | $2$ | $3$ | 計 |
| $P$ | $\dfrac{27}{216}$ | $\dfrac{81}{216}$ | $\dfrac{81}{216}$ | $\dfrac{27}{216}$ | $1$ |
| $Y$ | $0$ | $1$ | $2$ | $3$ | 計 |
| $P$ | $\dfrac{64}{216}$ | $\dfrac{96}{216}$ | $\dfrac{48}{216}$ | $\dfrac{8}{216}$ | $1$ |
※ 今回の同時分布は多項分布と呼ばれます.$X$,$Y$ はそれぞれ二項分布 $B\left(3,\dfrac{3}{6}\right)$,二項分布 $B\left(3,\dfrac{2}{6}\right)$ に従います.
