本文へスキップ

技術士試験(情報工学部門)・情報技術者試験。ファーストマクロ。


Since 2016.4.19

令和元年度 技術士第一次試験問題(再)【専門科目】

V−9

大規模データの分散処理技術であるHadoopに関する次の記述のうち、最も適切なものはどれか。

@ Hadoopで使用する分散ファイルシステムHDFSは、大きなファイルへのシーケンシャルアクセスに適している。

A Hadoopの処理系であるMapReduceの性能向上は、サーバ1台あたりの処理能力を 向上させるスケールアップを前提としている。

B MapReduceのマスターサーバをNameNodeと呼び、HDFSのマスターサーバを DataNodeと呼ぶ。

C 処理するデータは事前に定義された構造に従って正規化されている必要がある。

D リレーショナルデータベース管理システム (RDBMS) に比較してレスポンスタイムが小さいため、オンライン処理に適している。


正解

@


解説

@ 正しい。Hadoopは、大規模なデータを分散処理するためのオープンソースのソフトウェアライブラリである。
なお、HDFSは Hadoop Distributed File System の略である。

A MapReduceの性能向上は、サーバ1台あたりの処理能力を 向上させるスケールアップを前提としていない。サーバの台数を増やして負荷分散することによって、サーバ群としての処理能力を向上させるスケールアウトを前提としている。

B Hadoopはマスタースレーブ型の構成であり、マスターの役割をするのが、NameNode、マスター機の制御下で動作するスレーブの役割をするのが、複数のDataNodeである。

C データは正規化されている必要はない。そもそもHadoopはデータの更新ができない。

D Hadoopはオンライン処理には適していない。バッチ処理である。

V−8 目次 V−10