Hadoop APIを使ってシーケンスファイルを直接読み書きするのを試した。
(自分のHadoop本体に関する最後の更新日が2010年8月だから、ほぼ一年ぶりの更新か。ちょっと意外。まぁ勉強の対象がHBaseとかScalaに移ったからなぁ…と思ったらHBaseも最終更新が2010年8月か^^;)
要するにHiveのSerDeで作ったシーケンスファイルの中身を確認する為に読み込んでみたかったということだが。
まずは書き込みでキーをNullWritableにしたもんだから、Hiveのファイルを読み込もうとしてBytesWritableだったのに気付いてちょっとあせった^^;
しかしどういうクラスを扱うか決め打ちしていいなら、非常にシンプルに扱えるなぁ。
※コメント投稿者のブログIDはブログ作成者のみに通知されます