蔵書紹介プログラミング Hive

蔵書紹介イメージ

プログラミング Hive

Hadoop上でSQLライクな操作ができるHiveの解説書

ApacheのHadoopは、大量のデータを複数のコンピュータに分散させて高速に処理することができる、オープンソースのソフトウェアフレームワークです。ペタバイト級のデータの処理を可能にしています。このHadoopのエコシステム(コンポーネントの組み合わせ)は便利に使えますが、既存のSQLを基盤とするリレーショナルデータベースからデータを移行する時、どのようにするかが問題でした。Hiveは、Hadoop上で、SQLライクな操作でクエリを扱えるシステムです。HiveのHQLという問合せ言語は、SQLの構文に似ているため、Hiveを簡単に使うことができます。
本書では、Hiveの基本から実践的な使い方までをまとめて解説する一冊。インストールから、環境設定に始まり、データ型とファイルフォーマット、データの操作やクエリ、インデックスの生成やスキーマの設計、開発までを詳しく解説してくれます。ビッグデータやHadoopを扱うことになったエンジニアには最適な入門書です。

原題 Programming Hive
著者 Edward Capriolo
Dean Wampler
Jason Rutherglen
翻訳者 Sky株式会社 玉川 竜司
定価 ¥ 4,180
発行形態 単行本(ソフトカバー)
発行日 2013-06-15
発行所 オライリー・ジャパン
発行元 オーム社
判型 23×18
ページ数 424 ページ
ISBNコード(13桁) 9784873116174
 一覧へ戻る