本文へスキップ

技術士試験(情報工学部門)・情報技術者試験。ファーストマクロ。


Since 2016.4.19

令和6年度 技術士第一次試験問題【専門科目】

V−3

情報源記号 A、B、C、D、Eをそれぞれ 0.12、0.3、0.05、0.45、0.08の確率で発生する無記憶5元情報源に対する2元ハフマン符号として、最も適切なものはどれか。ただし、例えばAを100と符号化することをA→100と書くことにする。

@ A→100、B→11、C→1010、D→0、E→1011

A A→100、B→00、C→1110、D→0、E→1011

B A→100、B→110、C→111、D00、E→01

C A→110、B→101、C→111、D→000、E→100

D A→110、B→1110、C→0、D→1111、E→10


類題

H19 W-8


正解

@


解説

ハフマン符号は出現率の多い文字から順に
0、10、110、1110、 ・・・、と符号化し、
最後の2文字は 11・・・10、と 11・・・11
で表し、データ量を圧縮する。

この考え方では、
D:0
B:10
A:110
C:1110
E:1111
となる。

0と1を入れ替えて
D:1
B:01
A:001
C:0001
E:0000
でも可能である。

これをさらに応用して
D:0
B:11
A:100
C:1010
E:1011
としても A〜Eを一意に表すとことができ、データの圧縮も可能である。

@ 正しい。平均ビット長は
1×0.45 + 2×0.3 + 3×0.12 + 4×0.08 + 4×0.05 = 1.93である。

A 例えば、000のビット列の場合、BD なのか DB なのか DDD なのか区別できない。

B 2×0.45 + 3×0.3 + 3×0.12 + 3×0.08 + 2×0.05 = 2.5で@より長くなる。

C ビット列が同じであり、ハフマン符号化ではない。

D 発生確率の一番高いDに4ビット割り当てると圧縮率が悪くなる。

V−2 目次 V−4