NTTがベンチャー企業のPFI(プリファードインフラストラクチャー)と共同開発したビッグデータ解析用ソフトウェアで、2011年10月に誰もが利用できるオープンソースとして公開されています。
ツイッターの「つぶやき」すべてを監視し分類・整理する機能があります。このソフトウェアには以下のような特徴があるようです。
(1)蓄積されたビッグデータをバッチ処理でなく逐次処理しながらリアルタイムに解析する点
(2)分散処理により高価なスーパーコンピュータを利用する必要がなくしかも機械学習できるようにしている点
ビッグデータ解析ソフトとして、オープンソースの「Hadoop(※)」が知られていますが、上記の特徴はHadoopとの違いになっているようです。
※ 大規模データの分散処理(注:無共有型)を支えるソフトウェアフレームワークで、Javaで記述されています。
NTTでは、2014年1月より、グループ会社のNTTソフトウェアを通じてJubatusの商用サポート体制を提供しているようです。ビッグデータ解析の応用事例を広げて行こうとしています。
関連サイトに、例えば、http://research.preferred.jp/2011/10/jubatus/があります。