Hadoop Forum 2011で、きいてきた内容まとめ その3
(以下、お話の内容まとめ)
Clouderaの戦略
ミッション:
企業での大量なボリュームのデータからビジネス価値を引き出して有効化する
Hadoopのディストリビューター:CDH
保守費をもらってエンタープライズのサポート
NTTデータがパートナーになってる
生い立ち
・Googleの論文でる
・ダグ・カッティング Yahoo
Hadoopを立ち上げ、MapReduce
・2008年クラウディラできる
すべての主要業界とパートナーをリード
eBay,Disny,バンクオブアメリカとか
エコシステム
マイクロストラテジーなど
国防、諜報機関トップ5のうち3機関
エンタープライズでのHadoop
・すべての主要な伝統的データ管理領域での強い浸透
・組織がますます多くのユースケースでHadoopwo利用とあわせて
クラスタは成長しています。
・Clouderaは急速に成長
2つのコアとなるユースケース
・高度な分析
・データ処理
Hadoopの応用
1.金融資産のリスクの正確なモデリング
2.顧客取得原価と回転売買の分析
3.ユーザー行動に基づく商品やコンテンツのレコメンデーション
4.嗜好ベースのターゲティング広告
5.営業の視点での取引分析
6.ネットワークトラフィックデータのキャプチャと分析によるデバイス間の最適な帯域管理
7.ネットワーク行動でのリアルタイム犯罪科学行動分析による脅威の発見と対策
8.資金洗浄や詐欺の証拠を得るための金融取引のモニタリング
9.利用者の振る舞いをもとにした最適な検索結果の提供
10.データ調査と実験
レコメンデーションの例
・行動分析を利用した検索の最適化
・コンテンツの最適化
ネットワーク最適化
・VoIPのネットワークを分析:事前予防
新しいデータ管理モデル
・DBもETLも全部入れる
ユーザーの導入視点
2つの視点で
・Linuxの視点から
・DWHの視点から
オープンソースの価値
・ベンダロックイン排除
・コミュニティ開発
・リッチエコシステム
なぜcloudera
Apache Hadoopとともに最も早い成功への道を達成することができる
管理ツール
CDH
エンタープライズグレードHadoopの提供
・導入に必要なすべてのコンポーネントを含んでいる
・パッケージ化済み、パッチ適用済み、実績証明済み、統合済み
間違ってたり、勘違いしてたらごめん。