情報理論 第3回 条件付き確率とエントロピー
条件付き確率
2つの事象系があって、一方の事象系の結果が確定すると、もう一方の事象系の事象が起こる確率が変わることがある。このような変化した確率のことを
条件付き確率
とよぶ。また、この場合は2つの事象系に
相関がある
という。
例:サイコロを1回投げ、出た目から以下の事象系を作る。
事象系
X
:
x
s
(1~3(
s
mall)の目が出た),
x
b
(4~6(
b
ig)の目が出た)
事象系
Y
:
y
e
(偶数(
e
ven)の目が出た),
y
o
(奇数(
o
dd)の目が出た)
この場合、それぞれの事象系は
X
=
x
s
x
b
p
s
p
b
=
x
s
x
b
1
2
1
2
Y
=
y
e
y
o
p
e
p
o
=
y
e
y
o
1
2
1
2
となる (ここで
p
s
と
p
b
はそれぞれ
X
の結果が
x
s
,
x
b
になる確率、
p
e
と
p
o
はそれぞれ
Y
の結果が
y
e
,
y
o
になる確率を表わす)。
しかし、もし事象系
X
の結果が
x
s
、つまり出た目が1~3だったことが確定していれば結果は3通りに限定されるので、偶数(2)である確率は
1
3
, 奇数(1か3)である確率は
2
3
になる。事象系としての書き方は次のようになる。
Y
x
s
=
y
e
|
x
s
y
o
|
x
s
1
3
2
3
左辺:事象系を表わす文字のあとに「確定しているもの」をカッコに入れて書く
右辺の上の行:事象を表わす文字のあとに縦棒と「確定しているもの」を書く
練習問題1
成人男性2人、成人女性3人、未成年男性4人、未成年女性1人からなるグループから無作為に1人を選び、その結果から以下の事象系を作る。それらを行列の形で記述せよ。
事象系
X
:
x
m
(男性(
m
ale)を選んだ),
x
f
(女性(
f
emale)を選んだ)
事象系
Y
:
y
a
(成人(
a
dult)を選んだ),
y
c
(未成年(
c
hild)を選んだ)
練習問題2
練習問題1の試行で
事象系
X
の結果が
x
m
であることがわかっているときの
Y
の事象系 (つまり
Y
x
m
)
事象系
X
の結果が
x
f
であることがわかっているときの
Y
の事象系 (つまり
Y
x
f
)
を記述せよ。
※ このような問題では、次のような表を描いてみるとわかりやすい。
Y
x
m
を考えるときは「m(男)」の列だけ、
Y
x
f
を考えるときは「f(女)」の列だけを考えればよい。
m(男)
f(女)
計
a(成)
2
3
5
c(未)
4
1
5
計
6
4
条件付きエントロピー
相関のある事象系では、一方の事象系の結果が確定すると、もう一方の事象系の確率が変わるので、エントロピーの値も変わる。今回の初めの例で、「
x
s
が確定している場合の
Y
のエントロピー」は
H
(
Y
|
x
s
)
のように書く。
書き方のルール
縦棒の左が考慮する事象系
縦棒の右が確定済みの結果
実際の値は、そのときの事象系が
Y
x
s
=
y
e
|
x
s
y
o
|
x
s
1
3
2
3
であることから、
H
(
Y
|
x
s
)
=
-
1
3
log
1
3
-
2
3
log
2
3
=
0.91
となる (計算は前回の練習問題2と同じ)。
一方、
x
b
が確定している場合、つまり4~6の目が出たことがわかっている場合は、偶数は4と6の2通り、奇数は5だけなので、
Y
の事象系は
Y
x
b
=
y
e
|
x
b
y
o
|
x
b
2
3
1
3
となる。これに対するエントロピーは
H
(
Y
|
x
b
)
=
-
2
3
log
2
3
-
1
3
log
1
3
=
0.91
で、
H
(
Y
|
x
s
)
と同じ値になる。
ここまででわかっていること
記号
値
意味
p
s
1
2
X
の結果が
x
s
になる確率
H
(
Y
|
x
s
)
0.91
X
の結果が
x
s
であることが確定している場合の
Y
のエントロピー
p
b
1
2
X
の結果が
x
b
になる確率
H
(
Y
|
x
b
)
0.91
X
の結果が
x
b
であることが確定している場合の
Y
のエントロピー
を使えば「
X
の結果が確定している場合の
Y
のエントロピー」
H
(
Y
|
X
)
を求めることができる。
H
(
Y
|
X
)
=
p
s
×
H
(
Y
|
x
s
)
+
p
b
×
H
(
Y
|
x
b
)
=
1
2
×
0.91
+
1
2
×
0.91
=
0.91
ここで平均の求め方のルール「『その事象が起こる確率』×『具体的な値』をすべての事象について足し上げる」をエントロピーに使った。
H
(
Y
|
X
)
のように、「一方の事象がの結果が確定しているときの、もう一方の事象のエントロピー」のことを
条件付きエントロピー
という。
書き方のルールとしては、縦棒の左が考慮中の事象系、縦棒の右が「確定済み」のもの。
H
(
Y
|
X
)
→
X
の結果が確定している場合の
Y
のエントロピー
H
(
X
|
Y
)
→
Y
の結果が確定している場合の
X
のエントロピー
単純な
Y
のエントロピー、つまり
X
の結果が確定していない場合の
Y
のエントロピーは
H
(
Y
)
=
-
1
2
log
1
2
-
1
2
log
1
2
=
1
になる。
一方、
H
(
Y
|
X
)
の値は0.91で、これよりも小さい。
エントロピーの定義は「未確定のことがどれだけあるか」なので、「
X
の結果が確定したことで
Y
についても未確定のことが少し減った」と解釈できる。
練習問題3
練習問題1, 2のケースで、事象系
X
の結果が
x
m
であることがわかっているときの
Y
のエントロピーを求めよ。
練習問題4
練習問題1, 2のケースで、事象系
X
の結果が
x
f
であることがわかっているときの
Y
のエントロピーを求めよ。
練習問題5
練習問題3, 4の結果から、事象系
X
の結果がわかっているときの
Y
のエントロピーを求めよ。
※ 練習問題3~5はいずれも左辺もきちんと書くこと。また結果は四捨五入して小数第二位までにすること。