令和元年　技術士第一次試験問題(再)　Ⅲ

令和元年度　技術士第一次試験問題(再)【専門科目】

大規模データの分散処理技術であるHadoopに関する次の記述のうち、最も適切なものはどれか。

①　Hadoopで使用する分散ファイルシステムHDFSは、大きなファイルへのシーケンシャルアクセスに適している。

②　Hadoopの処理系であるMapReduceの性能向上は、サーバ1台あたりの処理能力を向上させるスケールアップを前提としている。

③　MapReduceのマスターサーバをNameNodeと呼び、HDFSのマスターサーバを DataNodeと呼ぶ。

④　処理するデータは事前に定義された構造に従って正規化されている必要がある。

⑤　リレーショナルデータベース管理システム (RDBMS) に比較してレスポンスタイムが小さいため、オンライン処理に適している。

①

①　正しい。Hadoopは、大規模なデータを分散処理するためのオープンソースのソフトウェアライブラリである。
なお、HDFSは Hadoop Distributed File System の略である。

②　MapReduceの性能向上は、サーバ1台あたりの処理能力を向上させるスケールアップを前提としていない。サーバの台数を増やして負荷分散することによって、サーバ群としての処理能力を向上させるスケールアウトを前提としている。

③　Hadoopはマスタースレーブ型の構成であり、マスターの役割をするのが、NameNode、マスター機の制御下で動作するスレーブの役割をするのが、複数のDataNodeである。

④　データは正規化されている必要はない。そもそもHadoopはデータの更新ができない。

⑤　Hadoopはオンライン処理には適していない。バッチ処理である。