データ圧縮方式として著名な Huffman符号を用いて“A”、“B”、“C”の3種類の文字しか現れない文字列“ABABACA”を Huffman符号にしたものは次のうちどれか。
@ 01010110
A 10101001
B 0100110110
C 0100100110
D 001010001010001011001
C
ハフマン符号は、出現頻度の高い文字には短いビット列を、出現頻度の低い文字には長いビット列を割り当てることで全体のデータ量を圧縮する方法である。
0、10、110、1110、11110、11111のように
最も出現頻度の高い文字には0を、
次に出現頻度の高い文字には10を、
最も出現頻度の低い文字にはオール1を割り当てる。
問題は“A”が一番出現頻度が高いので 0 を
次に“B”が出現頻度が高いので 10 を
“C”には 11 を割り当てる。
従って、ABABACA は 0100100110 と符号化される。
T−4 | 目次 | T−6 |