a~hの8文字を扱えるように例1, 例2を拡張した符号を考え、情報源事象系が
\(
X=
\begin{bmatrix}
x_a & x_b & x_c & x_d & x_e & x_f & x_g & x_h \cr
1-7p & p & p & p & p & p & p & p
\end{bmatrix}
\)
|
である場合の例1(拡張)、例2(拡張)の平均符号長を求めよ。また、例2(拡張)の方が例1(拡張)よりも効率が良くなる条件を記述せよ。
例1を拡張したものではすべての符号語の長さが3なので、平均符号長は
\(L=3\) となる。
一方、例2を拡張したものではa~hに対応する符号語の長さは1~8になるので、平均符号長は
\(\begin{eqnarray}
L&=&1\times(1-7p)+(2+3+4+5+6+7+8)\times p\\
&=&1-7p+35p\\
&=&1+28p
\end{eqnarray}\)
|
となる。これが例1の平均符号長 3 よりも小さくなる条件は
\(\begin{eqnarray}
1+28p&&\lt3\\
28p&&\lt2\\
p&&\lt\frac{1}{14}
\end{eqnarray}\)
つまり、
\(p\) が \(\frac{1}{14}\) より小さければよい。
書く必要はないが、拡張版の例1, 例2の符号は以下のようになる。
シンボル | 符号語 |
a | 000 |
b | 001 |
c | 010 |
d | 011 |
e | 100 |
f | 101 |
g | 110 |
h | 111 |
|
シンボル | 符号語 |
a | 1 |
b | 01 |
c | 001 |
d | 0001 |
e | 00001 |
f | 000001 |
g | 0000001 |
h | 00000001 |
|