Hadoop上でSQLライクな操作ができるHiveの解説書
ApacheのHadoopは、大量のデータを複数のコンピュータに分散させて高速に処理することができる、オープンソースのソフトウェアフレームワークです。ペタバイト級のデータの処理を可能にしています。このHadoopのエコシステム(コンポーネントの組み合わせ)は便利に使えますが、既存のSQLを基盤とするリレーショナルデータベースからデータを移行する時、どのようにするかが問題でした。Hiveは、Hadoop上で、SQLライクな操作でクエリを扱えるシステムです。HiveのHQLという問合せ言語は、SQLの構文に似ているため、Hiveを簡単に使うことができます。
本書では、Hiveの基本から実践的な使い方までをまとめて解説する一冊。インストールから、環境設定に始まり、データ型とファイルフォーマット、データの操作やクエリ、インデックスの生成やスキーマの設計、開発までを詳しく解説してくれます。ビッグデータやHadoopを扱うことになったエンジニアには最適な入門書です。
原題 |
Programming Hive |
著者 |
Edward Capriolo |
|
Dean Wampler |
|
Jason Rutherglen |
翻訳者 |
Sky株式会社 玉川 竜司 |
定価 |
¥ 4,180 |
発行形態 |
単行本(ソフトカバー) |
発行日 |
2013-06-15 |
発行所 |
オライリー・ジャパン |
発行元 |
オーム社 |
判型 |
23×18 |
ページ数 |
424 ページ |
ISBNコード(13桁) |
9784873116174 |