Asakusa Frameworkのアーキタイプの概要を書いてみた。
Asakusa Framework0.4を試してみようと思ったらまずインストールする必要がある(当然w)が、Mavenとかを事前にインストールしなきゃならない。
まぁMavenの使い方を知らなくても色々なサイトに説明があるから調べられなくはないし、Jinrikishaを使えばMavenとかもインストールしてくれるので気にしなくて大丈夫。
しかし、どの方法でインストールするにせよ、途中で訊かれる「Asakusa Frameworkのアーキタイプ」については、Asakusa Frameworkを知ってないと選択できない。
自分も初めてAsakusaFWをインストールした時はどれを選べばいいのか迷ったし^^;
という訳で、試しに触ってみたい・初めて使ってみるという人へのアドバイスとしては、
・基本的にはWindGate
・RDBもローカルファイルも扱わない(HDFS上のファイルだけ扱う)と分かっているならDirect I/O
かな。
(バージョンについては、選択肢の中に出てくる最も新しいもの、ただし「SNAPSHOT」が付いていないやつが良いでしょう)
WindGateアーキタイプは、実はDirect I/Oの機能もそのまま含んでいる(というか、Direct I/Oが中核機能)。
したがって、WindGateアーキタイプを選んでDirect I/Oの機能しか使わないということも可能。(両方の機能を使うことも可能。DMDLのアノテーションをモデル毎に変えればいいだけ)
逆にDirect I/Oアーキタイプを選んで後からWindGateの機能を使いたいとなった場合は、色々設定を変更しなきゃいけなくて面倒。
だったら最初からWindGateを選んどきゃいーじゃん、という話w
最初の頃、自分はWindGateとDirect I/Oでのファイルの扱い方の違いが分からなかった^^;
開発環境(自分のマシン上のEclipseのJUnit(AsakusaFWのテストドライバー))でAsakusaアプリを実行してみる分には、DMDLのアノテーションの記述方法やファイルのImporter/Exporterの記述方法の違いくらいしか無いんだもん。
テストドライバーはデフォルト状態でもちゃんと動くように出来ているから、「ローカルにテスト用のファイルが作られて読み書きしてるなー」という認識でしかなかったorz
本番環境(Hadoopクラスター)を意識して、初めて本当の違いが分かる。
この辺りはAsakusa Framework-RDBMS連携方法の資料が参考になるかも?w #ステマ