Entrance for Studies in Finance

Research on Big Data

企業はインターネットを さまざまに利用した。
 自社ウェッブサイトの利用(メッセージの配信 会員サイトの創設)
 広告の配信
  グーグル ヤフー 検索結果連動
  ユーチューブ(グーグル) 動画広告
  電子商取引サイト 利用者の購買履歴を活用した広告配信
   アマゾンドットコム イーベイなど
 広告の自動配信
 利用者の閲覧・購買状況に応じて効果的に関連広告を自動配信するもの
 ⇔ 検索連動型広告search advatising
  SNSを利用した販促。登録者に対して新商品情報 割引クーポン。
   フェイスブック(交流サイト 最大手)

そしてこのインターネット上で生み出される膨大な情報(ビッグデータ)の活用が話題になっている。分析では経済物理学 行動心理学などの知見の応用が有効だとされている。その情報の例。

商品購買履歴 電子チラシ閲覧情報 SNS ブログ上の評判
気温など天候の変化(気温 湿度 降雨量 河川の水位など)
天候 販売動向 消費者の購買履歴 機器稼働データ
顧客の属性 販売履歴 電力の使用状況 電力データ
スマホ 電力メータ 位置情報 さまざま画像情報 会計情報 メール 映像 写真 公共データ
店舗内での消費者の行動(例 画像情報 何を何回見たか どう行動したか 店頭行動) 従来の販売時情報と組み合わせて分析
SNSの書き込み(つぶやき→ 関心を示す) 各種センサーが発するデータなど 

ここで個人情報の保護との関係が問題になる。なぜならルールがあいまいな面があるから。個人の過去情報の除外 本人の了解をとり後からでも拒否できる仕組み必要と指摘されている。個人情報かどうかあいまいな領域が存在することも知られている。一般に個人情報として氏名 住所 顔写真など があり、その目的外利用は本人の同意必要 第三者への提供は本人の同意必要とされている。しかし匿名化(例 住所都道府県 年齢誕生年まで)の加工によって利用できるという考え方もある。準個人情報には端末ID GPS位置データなどがあり、ルールははっきりしない。非個人情報については 利用提供に制限ないと考えられている。個人情報保護法(2003)

ビッグデータとは新聞の朝刊数十万年分に相当する数百テラバイト以上のデータ群を指す。(テラは1兆バイト)。様々な機器がネットに接続されて情報の爆発的な増加が生じている。2020年には2010年の40倍の40兆ギガバイトのデータ通信量になる。同時にコンピュター処理の高速度化と大容量化によって、膨大な情報の収集分析(ビッグデータ分析)が可能になった。結果として管理(例 社会インフラの管理 事故防止 改修コスト削減)や制御(車や空調の自動運転システム)が効率化されるという(IoT:internet of things, IoE:internet of everything)。ビッグデータとは何か(総務省 2014情報通信白書) ビッグデータとは何か? なぜ注目する必要があるのか(インテル)
ヤフー月間5000万人年75億語の検索ワード 顧客情報 取引履歴(日時 場所) 利用履歴 ウェッブ閲覧履歴 ソーシャルメディアへの書き込み情報
行動履歴 社員のメール履歴 営業日報 鉄道の乗車記録 車 位置情報 速度データなど 特定の単語の検索数 検索ワード コールセンターの音声情報 設備機械、業務機器のセンサー情報 

情報には構造化データ 顧客データ POSデータなど従来のデータと非構造化データ ブログの文字 映像 電子書籍の活字などがあり。後者が爆発的に増えている:背景にはさまざまな情報通信機器が整備されたことがある。

プライベートクラウド 特定の企業専用に構築したもの
パブリッククラウド 不特定多数が共同利用するもの
 ビッグデータの活用事例 2014情報通信白書

モバイルシフト:IT端末の主役がパソコンからスマホ、タブレットに移行する現象に伴うIT端末の急増も情報急増の背景
タブレットの高機能化によりPCとの差は縮小の方向
次の焦点は身に着けて利用するウエラブルコンピューターとのこと

ネットにつながることで行動の情報化のスピードが加速したとされる
   2003 パソコン 携帯
   2010 スマホ 家電
   2015 家庭 車
   2020 あらゆる機器
2012年世界の流通情報量は2.7ゼタバイト(ゼタは1兆の10億倍)
2020年には35ゼタバイト(IDCの推計)
    
2013年の国内スマホ市場 1兆5300億円
2013年の国内PC市場 1兆5800億円 2014年にはスマホがPCを抜く。
背景には文書や画像のクラウド化(ネット上のサーバーに文書や画像を置くこと)

ビッグデータのビジネスでの応用ではコンビニでビッグデータの解析は先行したとされる。もとは店頭での顧客の把握は 顧客の性別 年齢 の把握にとどまっていたが 共通ポイントカードの導入で詳細なデータがとれるようになった

例 ポイントカードの購入履歴分析事例
 ローソンでも共通ポイントカード ポンタ(2010年3月導入 会員数5100万人 来店客の45%が利用:2013年3月)の活用
 同一顧客の同じ商品購入率:リピート率 
 発売初日リピート率が高い:ヒットの波頭 → 供給量増やす 2012年10月発売の焼パスタ ラザーニャ
 来店頻度の高さとリピート率の高さ:得意客のお好み → 売り場に残す必要 2012年2月発売のエッグタルト

 電子マネー ナナコあるいは共通ポイントカード Tカードの分析(セブンイレブン)
 同時購買率
  酒と惣菜 購買率が 品揃えの強化で上昇 → ついで買いの効果が出ている
 過去の分析で確認(2011春→2012春) これを踏まえて種類の品ぞろえ強化した(2010年秋から2013年1月)

 交通系IC どの駅で乗り降りして どの商業施設で買い物したか 分析可能

消費者
 消費者の位置情報 + 消費者の購買履歴 → 消費者の現在地付近の 消費者のし好にあった商品 のクーポン 配信

生産工程
 部品ごと 生産工程ごと 作業状況(どの機械で何秒作業したか) → 最適な作り方(探究) 

販売情報 
 いつ何がどれだけ売れたか 店舗数 → 鮮度管理(現状)  → 需要予測の精度改善 仕入れ量 人員配置最適化
カーナビから得られる走行データ → 渋滞情報(現状 道路の込み具合) → 交通情報配信
M2M(machine to machine:機器と機器を通信ネットワークで結び情報をやりとりする技術)の代表的事例
NTTドコモとパイオニアが車載器を共同開発。2014年にもサービス開始。
自社車両の走行データ → 走行状況 → 安全運転・燃料費節約(現状)
個々の走行データ(電気自動車)と損害保険料との関連付け
このほか
 健康診断結果 電子カルテ データ間の規則性分析 → 病気になる確率を一定精度で予測
電子商取引サイトのお薦め商品表示
 過去に何を買ったか 年齢性別地域でどの商品が売れているか などから消費者に合った商品を選択配信
就職情報サイトの利用(リクナビ)
 過去の検索履歴 登録学生の大学 住所 志望企業 + 企業 学生 の過去データ → 推薦企業(現状)
SNSでの発言(書き込み)も商品販売に利用 ・・・・
さまざまな行動履歴(合わせ買い) 位置情報 天候(温度 湿度など) 
個人からの同意がないまま 情報が集められている 不正行為の発見 採用活動 ローン審査 にも利用される
個人プライバシー侵害の恐れ 年齢 性別 住所 住所を外せばいいの?
逆に 消費者の行動 発言から 年代 性別は 推定可能
さまざまなアプリはデータの取得と利用を利用規約に書いているものの、利用者にどこまで
意識されているかは疑問がある。
ビッグデータの活用事例 2013/12/09
事例
 商品のお勧め機能

事例
 ネット上の消費者の閲覧・購買履歴、ほかの商品への関心が推測できる消費者の検索の傾向 商品開発に役立てる
 アマゾンが自社保有のビッグデータを取引先に提供 独自性のある商品開発に役立てるというもの。
 カゴメと共同開発したのはトマト飲料プレミアムレッド。抗酸化作用が注目されるリコピンを従来製品比2倍に高めた
 とのこと(日経2013年10月10日)。
事例
 ツイッターにおける「つぶやき分析」:一人で同じ問題を繰り返し大量につぶやく人がいる。同じつぶやきが転載されて拡大することも
ある。現実の政治に結びつけるには、これらの偏りを修正する必要がある(日経2014年1月14日p.3)。
 2013年9月7日から12月8日まで 
 原発 420万件 40.3万人 100回以上つぶやいた人100人中1.8人 その人の件数に占める割合56.8%
 消費税 192万件 51.8万人 同上0.4人  28.3%
 TPP 95万件 13.2万人  同上1.0人  46.9%

投資への応用
 過去10年の蓄積データをもとに株価に影響を与える3000のキーワードを抽出 それが増殖しているかを
ラルタイムで追跡する。言葉と株価の相関関係をみる。数値は使わない。
 例「工場」「フル生産」

事例
 過去の株価と市場の注文状況をパターンとして蓄積。高速コンピューターで過去の似た例を見つけ出して株価の方向を予測する。
 高頻度取引HFT(あらかじめ定められた手続気に沿って1秒間に数千回の売買注文をだすもの ネット上のさまざまな情報を
 自動収集して注文をだすものもめずらしくないとされる)
 HFT 東証の場合 注文件数の6割。代金の4割を占める。
 これまでの金融工学 数学のモデルから外れる予想外の市場の動きには弱かった。ツイッター ブログの分析は相場全体の方向を
 ある程度予測できるようにするとも。
 従来予測がむつかしかった市場の心理。→ ネット上の言葉の分析で読み取れる可能性が指摘されている。
 従来むつかしかった売買注文のバランスの分析。経験的に
売り買いどちらかに注文が偏ると相場の動きが激しくなる。→ 経済物理学ではこのメカニズムの理論化が進み、
 これを応用すればリアルタイムで予測できるようになるともともされている。
 カブコム 予約注文の状況から株価の寄り付きを予測するツールを個人投資家に有料で提供。 

事例
 株式銘柄ごとにツイッターの言葉をネガテイブとポジテブに振り分け「評判」に見立てる。
 「マーケテイング」「投資」に応用可能。

original in Jan.20, 2014; revised in Jan.4, 2015


分類:Case Studies金融システム論
 

名前:
コメント:

※文字化け等の原因になりますので顔文字の投稿はお控えください。

コメント利用規約に同意の上コメント投稿を行ってください。

 

  • Xでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

最新の画像もっと見る

最近の「Management」カテゴリーもっと見る

最近の記事
バックナンバー
2024年
2023年
人気記事