Hadoop
Hadoopの導入から基本的なシステムの解説、サンプルコードなどが書いてあった。javaやlinuxの知識がある程度あれば読むには困らない。と思う。
試しにシステムを構築して実行するまではこれでいける。
私が買ったのは第二版でHadoopを前提にしたPig、Hiveなど
にも触れてくれているのでかなりお得な一冊でした。
私が読んだのは第二版だけれでもすでに第三版が出版され大幅加筆されているとか。
Hadoop 第3版
Hadoop MapReduce デザインパターン
読み終えて、いや途中から内容が高度すぎて今はついていけなかった。。。この本を完全に理解するには数学、統計学の知識が必要な為、勉強して読み直さないとならない。
単純な集計処理であればこの本を読まずとも前述の本で間に合うと思うが、
高度で専門的な統計業務をするのであればこっちの本の内容が助けになりそう。
Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理
Hadoopに限らず大規模データ分散処理システムは設計、構築、運用も非常にコストがかかる
ものなので今のところ読むに留まる内容であった。
0 件のコメント :
コメントを投稿