蔵書紹介バッドデータハンドブック

蔵書紹介イメージ

バッドデータハンドブック ―データにまつわる問題への19の処方箋

汚いデータをどう処理すればいいのか、19人が実務体験から語る

「欠損値」や「不正なレコード」「おかしなファイル形式」。現場で膨大なデータを扱っていると、こうしたバッドデータによく出会います。しかし、バッドデータはもっと多岐にわたります。スプレッドシートに大量に納められた分析に不便なデータ、現実と一致しないデータ、アクセスしにくいデータ、内部にあるべきなのに外部にある、削除しているはずなのにまだあるなど、さまざまなデータが、データ処理を行うエンジニアたちを日々悩ませています。本書では、19人のデータ専門家に執筆を依頼し、そうしたバッドデータのどんな問題が待ち受けているのか、どう対処すればいいのかを豊富な実務体験から語ってもらいます。膨大なデータを扱うエンジニアが読めば、きっと「あるある」、「こうすればよかったのか」の連続。ビッグデータ時代のデータサイエンティストにとって必携の一冊となっています。

原題 Bad Data Handbook
著者 Q.Ethan McCallum
監訳者 磯 蘭水
翻訳者 笹井 崇司
定価 ¥ 3,080
発行形態 単行本(ソフトカバー)
発行日 2013-09-26
発行所 オライリー・ジャパン
発行元 オーム社
判型 A5判
ページ数 310 ページ
ISBNコード(13桁) 9784873116402
 一覧へ戻る