多数のサーバで構成された大規模な分散ファイルシステム機能を提供し、MapReduceによる大規模データの分散処理を実現するOSSはどれか。
ア Apache Hadoop
イ Apache Kafka
ウ Apache Spark
エ Apache Storm
ア
ア 正しい。Hadoopは、大規模なデータを分散処理するためのオープンソースのソフトウェアライブラリである。
MapReduceは、Map処理 (入力データの読み込みと情報抽出) とReduce処理 (抽出情報の整理と主力) の2段階で大規模データの分散処理を行うプログラミングモデルである。
イ Kafkaは、分散メッセージングシステムを実現するOSSである。
ウ Sparkは、大規模データを高速に分散処理するオープンソースのフレームワークである。
エ Stormは、リアルタイムに発生する大規模データを高速に分散処理するオープンソースのフレームワークである。異常検出や不正検出などに適している。
問19 | 目次 | 問21 |