データ圧縮の方式として著名な Huffman 符号を用いて、入力“ABABACA”を符号化したものはどれか。ただし、“A”、“B”、“C”、“D”の4種類の文字しか現れず、発生確率は、“A”が80%、“B”が4%、“C”が15%、“D”が1%とする。
@ 00010001001000
A 0100100110
B 010001000100
C 011001100100
D 100110011011
C
Huffman符号は最も出現数の高い文字から順に
0 10 110 1110 ・・・ と符号化し、
最も出現率の低い文字の最終ビットは1、
次に出現率の低い文字の最終ビットを0として符号化する。
出現文字が6文字であれば
0 10 110 1110 11110 11111である。
問題は4文字で、出現率が多い順に
A:0
C:10
B:110
D:111 として変換する。
従って、
ABABACA = 011001100100
T−15 | 目次 | T−17 |