シンボルが a, i, u, e だけの場合に情報源事象系が
\(
X=
\begin{bmatrix}
x_a & x_i & x_u & x_e \\
0.25 & 0.25 & 0.25 & 0.25
\end{bmatrix}
\)
のとき、表4の符号での平均符号長を求めよ。また、表3と表4の符号のどちらが効率が良いか述べよ。
表4の符号では \(l_a=1, l_i=2, l_u=l_e=3\) であることを使って、
\(
\begin{eqnarray}
L&&=\displaystyle \sum_n p_nl_n\\
&&=0.25\times1+0.25\times2+0.25\times3+0.25\times3\\
&&=0.25\times(1+2+3+3)\\
&&=2.25
\end{eqnarray}
\)
なので、平均符号長は
2.25ビット になる。
一方、表3の符号では計算するまでもなく平均符号長は2ビットで上の計算結果より小さい。よってこの情報源事象系では
表3の符号の方が効率が良い。
1行目の総和のカウンタ用の変数は何でもよいが、2番目のシンボル「i」との重複を避けるためここでは \(n\) にしてある。