データベースはビジネスに使える状態か？分析の前提となる「定義」の重要性。

〇前回の記事では、企業に「データドリブン」の文化を醸成するためには、ビジネスの目的を定義した上で、その目的から逆算してデータを分析していくことが重要と説明しました。今回は、分析対象となるデータの扱いについて整理します。

（出所：123RF）

そのデータは使える状態になっているのか？

ビジネスの現場を見ていると、多くの会社から「使えるデータがない」という悩みの声が聞こえてきます。その言葉の意味を掘り下げて聞いてみると、実は「データが使える状態になっていない」場合が少なくありません。

見込み客の情報を蓄積したデータベースを例に考えます。このデータベースは、見込み客ごとにデータ（レコード）があり、「会社名」という項目には、見込み客が所属する会社名を登録しています。

ここで別のレコードの会社名にそれぞれ、「株式会社日経BP」と「日経BP株式会社」と入力されている場合があったとします。人が見ると同一の会社のように推測できますが、システム上はデータが異なるため別の会社として扱ってしまいます。これでは効果的な分析どころか、会社名単位での整理もできません。

「役職名」という項目は、さらに複雑です。いわゆる“課長クラス”でも、会社ごとに「課長」「マネージャー」「リーダー」というように呼び方が異なるからです。アンケートなどで自分の役職を聞かれたとき、多くの人は名刺にある役職をそのまま答えるでしょう。

役職欄にデータが何も入力されておらず、空欄になっている場合もあるでしょう。これはその人に役職がないことを意味しますが、その人が本来の役職を記入しなかった（記入し忘れた）可能性もあります。

このように、集めたデータをそのままデータベースに登録するとどうなるでしょう。分析する側で想定する「あるべき役職の分布」と「データベース内の役職の分布」に大きな差が出ます（図）。これでは、役職ごとに顧客を絞り込むなどのデータ分析に活用できません。

図●顧客が自分の肩書きをそのまま役職に入力した場合の「データベース内の役職の分布」は、データを分析する側で想定していた「あるべき役職の分布」と大きく異なる（データは事例を元に筆者が作成したもので事実ではない）

図1、顧客が自分の肩書きをそのまま役職に入力した場合の「データベース内の役職の分布」は、データを分析する側で想定していた「あるべき役職の分布」と大きく異なる（データは事例を元に筆者が作成したもので事実ではない）。

そのために必要になるのが、「データクレンジング」という作業です。クレンジング（Cleansing）は「浄化する」という意味で、データクレンジングとは「データの誤りや重複を補正し、使える状態にする（正規化する）」ことを意味します。この作業はデータ件数が大きいほど膨大となり、たいへんな労力を必要とする場合があります。

私たちはよく、企業からデータクレンジングについて相談を受けます。その際に直面するのは、「データを正規化する前に、本来できているべき『データの定義』ができていない」という問題です。

上記の役職のケースでいえば、データクレンジングはデータが定義できていないと進められません。下で細かく説明します。

分類する側が決める「あるべき役職」はどう表記するのか（“課長クラス”は「課長」なのか「マネージャー」なのか）…データの定義
どの役職にどのデータ（顧客の入力した結果）を割り当てるのか（「部長代理」は「部長」なのか「課長」なのか、「主任」や「リーダー」は「課長」なのか「一般社員」なのか、空欄だった場合は全て「一般社員」でいいのか）…データのクレンジング

つまりデータの定義とは、人によって判断が異なることを個別にルール化することです。そのルールを全てのデータに当てはめることが、データクレンジングとなります。

データの定義が全社レベルに波及する例も。

自社でルール決めが必要なものは、さらに苦労を強いられます。例えば顧客に提案する判断材料となる「ニーズ」という項目があります。この項目が特定の条件を満たしている顧客を抽出して、アプローチをかけるといった場合に使います。

しかし顧客ニーズの体系化はたいへん難しいことです。「どのような情報を見て“潜在ニーズあり”とするか」など、誰もが納得する体系化することは容易ではありません。この定義や登録の際の判断が不十分だと、“潜在ニーズあり”となった顧客にも、ばらつきが生じてしまいます。

データクレンジングの過程で発生する判定作業を減らす手段の1つとして、「プルダウン選択肢の作成」が考えられます。選択肢をカテゴライズしておき、データを入力する人（社内の担当者など）を手助けするために、画面に表示される選択肢から最適なものを選べるようにすることです。ユーザーがデータを入力する際に、あらかじめ定義したプルダウンメニューから最も近いものを選べるようにする方法もあります。しかしこれが完成するまでには、多方面との調整が必要になります。

私はかつて参画したプロジェクトで、製品グループをカテゴライズする作業の中断を余儀なくされた経験があります。カテゴライズの前に「事業ドメインを全社的に再定義する」という話が入り、全社方針とすり合わせをするはずが、進まなくなってしまったのです。

製品グループは恒常的ではなく、市場の変化に合わせて見直すこともあります。マーケティング担当の一部門の意向だけでなく、全社レベルで決めておくべき項目といえます。

このように自社にとって重要なデータを定義し、体系化していく作業には根気が要ります。だからこそ「ビジネスに影響を与える重要な情報は何か」という仮説を立て、範囲を絞り込んでから取りかかるのが定石となります。

その際には、ただ「データ」そのものを見るのではなく、ビジネス感覚を持った上でデータを扱うという素養が必要となります。各ビジネス現場での事象に対して「どのようなデータがあれば判断がつくか」を日ごろから考えておく必要があります。その素養は一朝一夕で身につくものではありません。「データドリブン」の企業文化を目指すのであれば、組織内に少しずつ定着させていくことも重要になるでしょう。

複数のデータベースを連携させるために。

さらに「定義を決めて終わり」ではありません。定義を一貫して運用する意識も重要です。せっかく定義をしても、「アンケートのたびに異なる選択肢を使っている」ようでは、データベースに蓄積されるデータが分析しづらいものになります。

データを定義した後で、運用ルールやその管理監督体制（ガバナンス）を整えることが、データドリブンを企業内に定着させるキモとなります。この工程を踏まない限り、データベースは活用できる状態になりません。

近年では、組織内で複数のデータベースを連携させることが増えています。マーケティングに関連では、マーケティングオートメーション（MA）とCRM（顧客関係管理）/SFA（営業支援システム）の連携があります。これらは「CRM連携」と呼ばれます。

マーケティング部門はMAで、営業部門はCRM/SFAで、それぞれ顧客データベースを持って別々に管理している場合、同一の顧客を扱うためには、相互にデータをやり取りする必要があります。そのためには、複数のデータベース間で事前に整合性をとっておく必要があるのです。

特に意識すべきは、「データ項目」と「その値」の2つです。データベースに近い言葉で表現するなら「フィールド」と、その「フィールドに入るデータの中身」のことです。

例えば複数のデータベースで、顧客の所属先を意味するフィールドが「企業名」と「会社名」というように異なっている場合、同一のデータと見なしてよいのか判断が必要になります。

データの中身に関しては、個々のデータベースに登録されたままでは整合性がとれない可能性があるため、複数のデータベースを意識したクレンジングをしてデータを正規化する必要があります。正規化した後は「プルダウン選択肢」を用意するなどして、新規にデータが入力される際のばらつきをなくす対応も必要になります。

データ活用は「プロファイリング」から。

データベースがようやく活用できる状態となった後は、そのデータベースの中で重要な情報やデータを洗い出す作業に移ります。この作業を一般に「プロファイリング」と呼びます。

企業のマーケティング活動では、見込み客データベースから有望な見込み客を抽出していきます。そのためには、どのような条件を満たしていれば有望といえるかを明確にする（プロファイリングする）ことで、その後の活用を効率的にします。

例えば、過去に商品を購入した顧客のデータを分析して、これらの顧客に当てはまる条件を導きます。そして、その条件を満たす顧客をデータベースの中から抽出して「有望な見込み客」としてアプローチする、といった手順となります。

これまで私は、まず分析するのではなく、仮説を立ててそれに沿った分析が重要であると述べてきました。データについても「事前に重要な仮説を立てる」逆算的な思考が重要になります。

そのためにもデータを定義し、そのとおりに運用をしないと、「使えるデータ」は決して蓄積されていきません。「データを使える状態にする」には、非常に多くの作業が必要になることを意識すべきでしょう。

gooブログはじめました！

データベースはビジネスに使える状態か？分析の前提となる「定義」の重要性。

そのデータは使える状態になっているのか？

最近の「〝たぬきの「スマホ・パソコン」ワールド〟」カテゴリーもっと見る

裏読みスマホ料金。

ソフト開発の要、必修アルゴリズム10選。②

PDFの「困った」「使いにくい」を解決。①

Android スマホ快適設定のツボ。

OS入りモニターという新発想、LGの新製品を試す。

Microsoft 365 徹底活用術。①

gooブログはじめました！

充電器の正しい選び方。①

佐野正弘が斬る！ニュースなアプリの裏側。

あなたが知らない iPhone。

iPhoneの「Clips」で撮影中の動画にリアルタイムで字幕付け。

先読みジャーナル。

Wi-Fiルーターの電波出力を下げる機能、あえて使う意味はあるか！

Excelで円グラフのデータラベル、値に単位の「億円」を表示する裏ワザ。

やってはいけないPCの危険行為。②

安価なWindowsタブレットをLinux化、iPad風おしゃれタブレットに。

外国語のWebサイトを丸ごと翻訳、iPhoneの「Safari」が備える便利機能。

gooブログはじめました！

データベースはビジネスに使える状態か？ 分析の前提となる「定義」の重要性。

そのデータは使える状態になっているのか？

最近の「〝 たぬき の 「 スマホ ・ パソコン 」 ワールド 〟」カテゴリーもっと見る

裏読み スマホ 料金。

ソフト開発の要、必修アルゴリズム10選。②

PDFの「困った」「使いにくい」を解決。①

Android スマホ 快適設定 の ツボ。

OS入りモニターという新発想、LGの新製品を試す。

Microsoft 365 徹底活用術。①

gooブログはじめました！

充電器 の 正しい 選び方。①

佐野正弘 が 斬る！ ニュース な アプリ の 裏側。

あなた が 知らない iPhone。

iPhoneの「Clips」で 撮影中の動画にリアルタイムで 字幕付け。

先読み ジャーナル。

Wi-Fiルーターの電波出力を下げる機能、あえて使う意味はあるか！

Excelで円グラフのデータラベル、値に単位の「億円」を表示する裏ワザ。

やってはいけないPCの危険行為。②

安価なWindowsタブレットをLinux化、iPad風おしゃれタブレットに。

外国語のWebサイトを丸ごと翻訳、iPhoneの「Safari」が備える便利機能。

データベースはビジネスに使える状態か？分析の前提となる「定義」の重要性。

最近の「〝たぬきの「スマホ・パソコン」ワールド〟」カテゴリーもっと見る

裏読みスマホ料金。

Android スマホ快適設定のツボ。

充電器の正しい選び方。①

佐野正弘が斬る！ニュースなアプリの裏側。

あなたが知らない iPhone。

iPhoneの「Clips」で撮影中の動画にリアルタイムで字幕付け。

先読みジャーナル。