Hadoopは、多数のコンピュータを束ねて極めて大きな処理ができるオープンソースソフトウェアです。MapReduceというJavaフレームワークでプログラミングできるほか、標準入出力が使えるHadoopStreaming、フロー記述環境Pig、SQL風インターフェイスであるHiveなど多彩な環境を備えています。また、行指向DBのHBaseやログコレクタのFluentdの基盤としても利用できるなど、Hadoopには高い汎用性があります。第2版である本書では、実システムで多く利用されているCloudera社のCDH4ディストリビューションを軸に、システムの拡張や監視、メンテナンス方法など、より現場での利用を意識した最新のノウハウをまとめました。Hadoopを導入してその効果を得るためのいろいろな情報をまとめた一冊です。