『HADOOP HACKS』のHBaseの章を読んでいると、HFileOutputFormatの使い方が載っていた。
それで、先日@ueshinさんから教えていただいたTableOutputFormatの危険性について思い出したので、メモ。
自分はTableOutputFormatしか使ったことが無いが(しかもサンプルレベルのみ)、TableOutputFormatはいわゆるロールバックが出来ないから危険ということらしい。
HFileOutputFormatを使ってHFileを作り、それをHBaseへバルクロードした方がいいそうだ。
HFileOutputFormatの使い方やバルクロードの方法は『HADOOP HACKS』に載っているぞw
(Windows7マシンに切り替えてからHBaseの環境を作っていないので、自分では試してない^^;)
※コメント投稿者のブログIDはブログ作成者のみに通知されます