gooブログはじめました!

写真付きで日記や趣味を書くならgooブログ

データ分析を載せる

2024-05-26 10:00:24 | 日記

ケーススタディ① 自転車シェアリングを迅速に成功するには?

ビジネスタスクステートメント

  • カジュアルライダーとサイクリストの差を整理する
  • カジュアルライダーが年間会員権を購入する理由を整備する
  • デジタルメディアがカジュアルライダーに与える影響を整理する

以上の内容から自転車を利用する人々が利用を拡大する理由やその要件を検討し整備する。自社のサービスにエンゲージメントする境界を整備し、その内容を利用する層に対して一番適したデジタルメディアを推測して、エンゲージメントする要件を伝える

  1. 移行する対象者を整備する
  2. 移行する理由を捉える
  3. 移行する閾値を整備する

※ デジタルメディアに関するデータは別途入手する必要がある

ビジネスタスク

  • データの入手:データ入手先整備とデータ価値特定
  • データの整備:データ内容確認とデータクリーニング内容想定
  • データの分析:利用内容とカテゴリ整備、仮説検討と実質比較
  • データの共有:仮説と実施の組織内共有と評価検討
  • 方向性の提案:提案内容の更改

主要な利害関係者

  1. 自転車購入者:シェアリングから脱却を視野に入れる
  2. 競合他社:公共施設などで自転車をレンタル提供する
  3. 歩行者:通行路、駐輪場での移動にまつわる利害
  4. 自動車利用者:道路に関わる影響に関わる利害

データの準備

Lyft Bikes and Scootersより入手。Google ドライブにてCSVファイルを保存する

データ項目

乗車ID ユニークなID

乗車可能タイプ 利用車種

開始時刻 利用開始日時

終了時刻 利用終了日時

開始駅名 利用開始駅名称

開始駅ID 利用開始駅ID

終了駅名 利用終了駅名称

終了駅ID 利用終了駅ID

開始緯度 利用開始緯度

開始経度 利用開始経度

終了緯度 利用終了緯度

終了経度 利用終了経度

メンバー_カジュアル メンバー種類

メンバー種別により、移動距離や移動ベクトルの特定、駅名からの基点規模などの推測も可能とかんがえられる。

データの確認

  1. カジュアルライダーとサイクリスト項目確認
    1. null データはなし
    2. データ比率は、7:3
  2. 終了駅名等のデータ
    1. データ無しが存在する
    2. 15%のデータが null 値になっている
    3. 終了位置の特定ができないために発生している
  3. 開始時間と終了時間
    1. 終了と開始が逆の場合が存在する
    2. 経過時間が無い場合が存在する
    3. 経過時間により異常データを排除する
  4. 開始緯度と終了緯度
    1. 利用の最初と最後なので移動した距離とは限らない
    2. 終日貸出して、同じ場所に返却することも考えられる
    3. この分に特化して分析は可能だが関連付けは難しい

プロセス

  1. 異常データ
    1. 開始時刻と終了時刻の差が0秒以内のデータは削除する
  2. 選択ツール(Excel)
    1. 現在利用できるレベルに近いため
    2. データ変換後、R studioの利用も考慮する
  3. データ変換
    1. 利用時間によるデータ
      1. 異常データは対象外とする
      2. 10分、60分、360分、720分、1日の単位で分類する
    2. 利用時間帯によるデータ
      1. 時間帯による対象者を分別する
      2. 午前、午後。早朝から10時、10時から14時、14時以降
    3. 移動距離によるデータ
      1. 異常データは対象外とする
      2. 開始緯度と終了緯度の差が0は、対象外とする
      3. 終了緯度がないものは対象外とする
      4. 0.001以下、0.02、0.03 ~ 0.1まで区切り分類する
    4. 移動距離なしのデータ
      1. 利用時間別に分類する
      2. 10分、60分、360分、720分、1日の単位で分類する

分析

  1. 仮説
    1. 利用時間による人数比率(短時間と長時間で会員数が多い)
    2. 時間帯による人数比率(会員外は、午前中が多く。14時以降は少ない)
  2. 分析結果
    1. 短時間3時間以内に集中していた
      1. 長時間の利用が少ない
      2. カジュアルの場合、時刻見積が甘いのか1時間以上の利用が多い
    2. 午前中が少ない
      1. 午前中が少ない
      2. 14時以降の利用者が多い
  3. 検討
    1. 午後からの利用者に対して会員登録活動を行う
    2. 時間帯から成果物を終日中に届ける想定が考えられる
    3. 目的が同じで利用場所も似通っていると考えられる
    4. 日常の利用を考えて利用促進を考える