汚いデータをどう処理すればいいのか、19人が実務体験から語る
「欠損値」や「不正なレコード」「おかしなファイル形式」。現場で膨大なデータを扱っていると、こうしたバッドデータによく出会います。しかし、バッドデータはもっと多岐にわたります。スプレッドシートに大量に納められた分析に不便なデータ、現実と一致しないデータ、アクセスしにくいデータ、内部にあるべきなのに外部にある、削除しているはずなのにまだあるなど、さまざまなデータが、データ処理を行うエンジニアたちを日々悩ませています。本書では、19人のデータ専門家に執筆を依頼し、そうしたバッドデータのどんな問題が待ち受けているのか、どう対処すればいいのかを豊富な実務体験から語ってもらいます。膨大なデータを扱うエンジニアが読めば、きっと「あるある」、「こうすればよかったのか」の連続。ビッグデータ時代のデータサイエンティストにとって必携の一冊となっています。
原題 |
Bad Data Handbook |
著者 |
Q.Ethan McCallum |
監訳者 |
磯 蘭水 |
翻訳者 |
笹井 崇司 |
定価 |
¥ 3,080 |
発行形態 |
単行本(ソフトカバー) |
発行日 |
2013-09-26 |
発行所 |
オライリー・ジャパン |
発行元 |
オーム社 |
判型 |
A5判 |
ページ数 |
310 ページ |
ISBNコード(13桁) |
9784873116402 |