ビッグデータの分散処理技術の定番、Hadoop解説の決定版
テラバイト、ペタバイトクラスの膨大なデータが流通する現代。ビッグデータの処理は、機械学習やAI技術など、データサイエンスの重要な一要素となっています。
Hadoopは、大量のデータを複数のマシンに分散して処理できる、オープンソースのフレームワーク。Javaをベースに書かれ、ビッグデータ処理の代表的なミドルウェアとして人気を誇っています。Hadoopの特徴は、サーバーを追加して容量や処理性能を向上させることが簡単なことや、非定型データをとりあえず格納しておいて後で扱い方を定義できるなど処理が柔軟なこと、専用のハードウェアや特別なスペックが不要なことです。
こうしたHadoopの使い方を基本から解説したのが本書。表紙が象のため、「象本」と呼ばれ親しまれています。今回の第3版では、Hadoop 0.22系、2.x系の記述を大幅に加筆。次世代Hadoopの特徴であるYARNやMapReduce 2について詳しく書かれています。
原題 |
Hadoop: The Definitive Guide, 3rd Edition |
著者 |
Tom White |
翻訳者 |
Sky株式会社 玉川 竜司他 |
定価 |
¥ 5,280 |
発行形態 |
単行本(ソフトカバー) |
発行日 |
2013-07-26 |
発行所 |
オライリー・ジャパン |
発行元 |
オーム社 |
判型 |
23×18 |
ページ数 |
736 ページ |
ISBNコード(13桁) |
9784873116297 |