SqoopでOracle用の拡張を行うOraOop(現在の正式名称は「Quest Data connector for Oracle and Hadoop」らしいが、長いのでOraOopって呼んじゃう)だが、なんだかいけてない…。
よく分からない制約が多いし、エラーメッセージも同じようなのばっかりで、原因が分かりづらい。(Sqoop全般がそうだけどね(苦笑))
それはまだ原因が分かれば何とかなるけど、TIMESTAMPやDATE型のカラムを、パース用Javaソース(Writable)ではStringで扱うってのはどーなの?
Oracle専用の仕組みでデフォルト版Sqoopより高速化されていることを期待しているのに、もし遅くなってたら、意味無いよ?
テーブル名やユーザー名に小文字が使えるという程度では、(大文字にすれば回避できるんだし、)あまり有意義でないなぁ…。
TIMESTAMP型をStringで扱うのとTimestampで扱うのを比較してみたが、やはりTimestampで扱う方が速かった…。