2010/8/19の第10回Cassandra勉強会
には参加できなかったので(苦笑)、一人遅れて(さびしく)Ust(cassandra-study-10th)を見てみたので、その感想など。
しかしこうやって後からでも勉強会の内容が見られるのはUstのおかげ。ありがたい(笑)
まずは『CassandraとHBaseの比較して入門するNoSQL』。
・おー、@yutuki_rさんの声、かっこいいなw
・KVSはキーと値のみであり、CassandraやHBaseはKVSとは言わない。そうだよねー、自分も改めなきゃ(苦笑)
・列指向DBでは、行キーからカラム・タイムスタンプまでを全部合わせて“キー”。
・@yutuki_rさんが「CAP原理」派だったかw
・HBaseのRS(RegionServer)は分断して少数派になったと判断したら自分で停止する。複数分断したら全員が少数派と判断して全滅する^^;
・CassandraのHintedHandOffは、本来データを保持すべきノードが応答しない時にデータを預かる。HintedHandOffがあるので、クラスターが分断されまくって1ノードになったとしても稼動する。
・回復時のマージで不整合が発生する可能性がある→Cassandra0.7のVectorClockで回避できるかも
HBaseとCassandraの比較図は@yutuki_rさんの得意技だ(笑) この図は良い図だよね。今回自分が認識したのは、
・HBaseは自動分散、Cassandraは手動分散
・CAS操作:Cassandraは0.7から可能
・Cassandraは結果整合性であり、古いデータを返す事がある(クラスターの台数が少なくてもけっこう発生する。これに対しては、「古いデータが返ってきたこと無いよ」という質問も)。
・Cassandraもネットワークによっては応答が遅い。以前の勉強会では10秒くらいかかったこともあると報告されていた。
・HBaseは5ノード以上でないと安定しない(アプリにとって過剰なハードウェアになる可能性がある)。
・HBaseは構成要素が多い(HMaster・RegionServer・ZooKeeper・HDFS)のでクラスターを作るのが大変。
・最も苦手とする機能を作ってみる→地雷原を見つけられる→勉強会の発表のネタが増える
…自分も障害対応は格好のホームページのネタだと思う(爆)
スライドもGoogleグループのCassandra勉強会で公開されているらしいが、このグループには入ってないんだよな~。うーむ^^;
#てーか、Googleのアカウントってどうしてたかな(爆)
次はLucandra(ルサンドラ)とSolandra。
Lucene(ルシーン)のJavaベースの検索エンジンのインデックスをCassandraで管理する。専用のPartitionerを使う。
いろんな種類の検索インデックスを作るので、単純なKVSでなく、Cassandraのような列指向DBの方が向いているということかな?
Solandra
Solr(ソーラー)…Luceneベース
Solandra…Lucandraベース
おっと、togetherもあったのか。→第10回Cassandra勉強会 #cassandrajp #casstudy10th
後で見なければ!