意味からすると「膨大なデータ」ということですが、その定義はまだ固まっていないようです。
単に、データ量が大きいということではなく利用価値があるものをビッグデータと呼ぶようです。専門家の間では、「企業の経営や事業、人々の生活に役立つ知恵を導きだすためのデータ」というような解釈が定着しつつあるようです。
米大手調査会社のIDC(International Data Corporation)は、以下の3つの条件のうちいずれかひとつが満たされるとビッグデータと言えると提唱しているようです。
(1) 100テラ(注: テラは10の12乗)バイト以上の規模で収集・蓄積されたデータ
IDCの試算では、2012年のデータ量は全世界で2.8ゼタバイト(注:ゼタは10の21乗。ギガ→テラ→ペタ→エクサ→ゼタ→ヨタと3乗ずつ増えます。)で、2020年には40ゼタバイトに増加するとのことです。
(2) 高速に収集・処理されたデータ
交通事故時のデータ収集のように瞬時に収集して分析されるようなものもビッグデータの要因と位置付けられています。
(3) 毎年1.6倍以上のペースで増え続けるデータ
新たな情報が急速に増えていくことも利用価値を高めることからビッグデータの要因として位置づけられています。
ビッグデータが注目されるようになったのは、収集されるデータ量が増えたということだけでなく、それらを処理・蓄積できるIT(情報技術)が手ごろな価格で整いつつあることが要因となっているようです。