DB Tech Showcase 東京2014つづき、11/13の
Apache Cassandraに注目
IoT,Bigdata,NoSQLのパスワードに振り回されるな!
承認とってない3社、大手企業が大規模運営するホンモノの実力
講師:datastax(でーたすたっくす)の原沢さん
をきいてきたので、めもめも
C*のマーク
DataStaxとは
・Apache Cassandraのディストリビューター
→LinuxとRedHatの関係
→Datastaxのエンタープライズエディションがある
・
Amazon DynamoDB 分散ハッシュテーブル
Google ビッグテーブル
→FaceBookがCassandraを作って、自分たちは使わなかった
オープンソースに寄贈
Datastaxがエンタープライズ向けに
Cassandraはオープンソース
チェアー:サポートが必要→会社を作った
セキュリティ:けるべろすとかを組み込んだ
インメモリDB,
分析 SparkSQL
全文検索 そらーが入ってる!!
(事例:承認をとってないので省略)
Apache CassandraはIoT向けデータベース
→日本では
今、データセントリック
リレーショナルとNoSQL
NoSQL=Not Only SQL?
Database!=RDBMS
or
Post Relational
でしょ?
オペレーショナルDB VS 分析DB
(OLTPとデータウェアハウス)
→ORACLE ひとつ:難しい
Hadoop、MapReduce:分析DB
2003,2004 Google MapReduce論文
→DBは7年くらいたつと、使えるようになる
新しいものNoSQL
キーバリューの考え方
The 451 Group.com
RelationalにするかNoSQLにするか
IoT:データがどんどん出てくる
→リレーショナルもってない
リレーショナルでやらないほうがいいモデル
センサー
ゲーム
新しく出てくるデータがリレーショナルでない→NoSQL
→非正規化で入れる
→RDB:インデックスをUPDATE
フュージョンIOのSSE INSERTは1ミリ秒かからない
→ってことは何回も書いちゃえば、
RDBで作ったほうがいいケース
作らないほうがいいケース
Cassandraの特徴
・パフォーマンスはリニアに拡張
・アーキテクチャ(完全な分散+KVS)
マスタースレーブという考え方がない
3台分くらいコピー
3つ壊れたら:データがある限り、検索が可能
→バージョンが違っても動く
ローリングアップグレードできる
・コミットログに書いているだけ
・柔軟なNoSQLデータモデル
・CQL(Cassandra Query Language)
Twitter Cassanrajapan