大規模データの分散処理技術であるHadoopに関する次の記述のうち、最も適切なものはどれか。
@ Hadoopで使用する分散ファイルシステムHDFSは、大きなファイルへのシーケンシャルアクセスに適している。
A Hadoopの処理系であるMapReduceの性能向上は、サーバ1台あたりの処理能力を 向上させるスケールアップを前提としている。
B MapReduceのマスターサーバをNameNodeと呼び、HDFSのマスターサーバを DataNodeと呼ぶ。
C 処理するデータは事前に定義された構造に従って正規化されている必要がある。
D リレーショナルデータベース管理システム (RDBMS) に比較してレスポンスタイムが小さいため、オンライン処理に適している。
@
@ 正しい。Hadoopは、大規模なデータを分散処理するためのオープンソースのソフトウェアライブラリである。
なお、HDFSは Hadoop Distributed File System の略である。
A MapReduceの性能向上は、サーバ1台あたりの処理能力を 向上させるスケールアップを前提としていない。サーバの台数を増やして負荷分散することによって、サーバ群としての処理能力を向上させるスケールアウトを前提としている。
B Hadoopはマスタースレーブ型の構成であり、マスターの役割をするのが、NameNode、マスター機の制御下で動作するスレーブの役割をするのが、複数のDataNodeである。
C データは正規化されている必要はない。そもそもHadoopはデータの更新ができない。
D Hadoopはオンライン処理には適していない。バッチ処理である。
V−8 | 目次 | V−10 |