大規模データの分散処理を行うHadoopの管理と運用を解説
大規模なデータの分散処理を行うオープンソースのフレームワークとして2006年に開発されたHadoop。Javaで書かれており、ペタバイト級のデータを処理できるとして、高い人気を集めています。本書は、Hadoopの管理と運用を解説した一冊。Hadoopクラスタを日々動かし続け、性能を発揮させるためのノウハウがまとめられています。本書ではHadoopクラスタの計画から始まり、インストールと設定、リソース管理、クラスタのメンテナンス、トラブルシューティングやモニタリング、バックアップとリカバリの実際が詳しく書かれてます。日本語版ではClouderaの川崎達夫氏と小林大輔氏による「Cloudera Manager」、「Hue」、「高可用性ネームノードのアーキテクチャと動作詳細」についての記事も追加。ビッグデータを扱うデータサイエンティストはぜひ手に取ってみたい本です。
| 原題 |
Hadoop Operations |
| 著者 |
Eric Sammer |
| 翻訳者 |
Sky株式会社 玉川 竜司 |
| 定価 |
¥ 3,520 |
| 発行形態 |
単行本(ソフトカバー) |
| 発行日 |
2013-11-27 |
| 発行所 |
オライリー・ジャパン |
| 発行元 |
オーム社 |
| 判型 |
23×18 |
| ページ数 |
352 ページ |
| ISBNコード(13桁) |
9784873116525 |