ちょっと前にHadoop0.21が出たので、WindowsXPにインストールしてみた。
シェル類がhadoop・hdfs・mapredに分かれたせい(だと思う)で、Cygwin対応が不十分でシェルを修正しないと実行できない箇所があった。まぁそのうち直されるだろう^^;
で、単独環境でWordCountを実行するところまでやってみた。
なんかJobのインスタンス生成方法が変わって、Clusterというクラスを使うようになったみたい。単純にnewすればとりあえず動いたけど、これでいいんかな??
それから、MapReduce関連(InputFormat・OutputFormat)で、今まで旧API(mapredパッケージ)にしか無かったクラスが、いよいよ新API(mapreduceパッケージ)に入ってきたようだ!
(サンプルも全部mapreduceを使うように書き直されたようだ)
これらはプログラミングに直接影響するので、どんなクラスがあるのか、今後要調査^^