AZAREA-Cluster Framework 0.9.0の現時点でのTipsを書いてみた。
(ついでに、思い付くポイントでAsakusa Frameworkと比較してみた)
ところで、AZAREAはフローを別々に定義して1つのアプリケーションにまとめることが出来る。(AsakusaFWがBatch DSLで複数のFlowをまとめるような感じ)
1つの入力から4種類の集計を行うサンプルが落ちたのは フロー1つに処理をまとめ過ぎた所為かもしれないと思ったので、フローは分けた上でアプリケーションで1つにまとめてみた。
しかし、アプリケーション内のフローをまとめてMapReduceジョブにするようで、(それはそれで最適化としてはよく出来ていると思うけれども)結果は同じになった。
結局のところ、AZAREAもAsakusaFWも“大規模で複雑な基幹バッチを対象にしている”と謳っているが、「大規模」「複雑」の指している内容が違うのかもしれない。
4種類の集計程度でも実際に動かしてみるとAZAREAアプリは落ちたりするんで、現時点のAZAREAは大規模なアプリケーションには実用的でないような気がする。
ただ、GUIでフローを描けるのは面白いので、小規模なMapReduceアプリを作りたいんだったらAZAREAは便利だと思う。(WordCountは今までで一番早く作ることが出来たし(たぶん15分くらいで作れるw))
(※あくまで個人の意見です。何か見逃しがあるような気がするので、他の人の検証結果も聞いてみたいなぁ)