100000x1500 のデータフレームの,2列目の数値データによりソートしたデータファイルを作る。
R だと,以下のスクリプトで 220 秒ほどかかる。
df = read.csv("test.csv")
write.csv(df[order(df[,2]),], file="test1.csv", row.names=FALSE)
AWK, sort を組み合わせると 20 秒ほどで終わる。
awk -F "," '{print $2, $0}' test.csv | sort -ns | awk '{print $2}' > test2.csv