良く目にするようになって久しい「ビッグデータ」だが、データの収集目的・収集方法、そして活用の仕方は未だ道半ばである企業は多い。その中で重要なのがDS(Data Science/Data Scientist)だと考える。
一方で、様々なデータ視覚化ツールも登場しており、一般のビジネス・パーソンがデータ・ウェアハウスに格納された膨大な非構造化データおよび構造化データの分析が可能となってきている。だが、データの分析だけで現行ビジネスの収益向上、課題解決、あるいは新規ビジネスの創出は難しい。
DS(Data Science)を実現するためには、まずは社内のニーズ(目的)とウォンツ(手段)をクリアにする必要がある。一般的に、社内で最初に聞く言葉は「○○のデータが欲しいが対応できないか」だが、これは「ウォンツ=手段」であり、何でそのデータが必要か、という「ニーズ=目的」が語られないケースがある。また実際にデータを有効活用する為には、データ量(Volume)、多様性(Variety)、信頼性(Veracity)、速度/頻度(Velocity)が重要だ。各データについて、これらが分かるよう「見える化」を進める必要がある。これによりデータの意味を理解している担当者に質問しなくても客観的なデータ活用が可能となる。
次に重要なのがDS(Data Scientist)の育成である。必要なスキルは以下三点だと考える;
① ITスキル :教育は比較的容易
② 分析スキル :教育は比較的容易
③ 業務スキル :教育は困難
DS(Data Science)で解決したいビジネス課題は「営業」「物流」「人事」「生産管理」「調達」「顧客満足」など多岐に渡る為、専門的な業務知識が必要となる。業務全般を理解して業務スキルを習得するには時間も費用も必要となる。一方、各部署(以下、現場)は上記③の業務スキル(各部署で業務上必要な範囲に限定)は十分
だが、①と②は十分でないケースが一般的だ。故に現場で利用可能となるよう不足するスキルを補う仕組み、即ち標準化が必要となる。同時にDS(Data Scientist)と現場ユーザを育成することになる。育成方法は試行錯誤が必要だが、社内データの見える化のレベルに左右されるだろう。双方が機能する目途が立てば改めて以下段階で活用を進めればよいと考える。
Phase1 : 現場を理解してニーズ・ウォンツを収集する(現場に出向いて自ら業務を行い、現場のキーマンを把握)
Phase2 : 全社レベルでコンセプトを策定・明確にし、全社合意を得る
Phase3 : 具体的な対応範囲を確定させ、各論ベースで社内合意を得る。この際に、現場との合意が不可欠
Phase4 : 実際にモデル開発して、PDCAを構築して運用内容を確認する。重要なのは現場のキーマンが
参画して開発と現場の理解に齟齬が生じないことである(これは一般的なシステム開発と同じ考え)
ただ私見だが上記Phase2はかなりハードルが高い為、「Phase1⇒Phase3⇒Phase4」を実現して、「Small Start Small Success」を実現して効果を見極めながら全社レベルのプロジェクトに成長させていく方が初期投資を抑えて知見を蓄積できると考え実際に着手している最中である。
以上