6月15日、
Datapalooza(でーたぱるーざ)Tokyoに行ってきた
(というか、会場ではまだやっている。今日は午前中しか参加できないので、ここまで)
■開始前に流れていたもの
・今日の予定
・Moocしてる bigdatauniversity.com
・ミートアップを開催中 meetup.com/BDU-Tokyo
・オンライン無償分析ツール datascientistworkbench.com
・データ分析コンペ bit.ly/sansan-datapalooza
・slackやってる
(14:00追加
slackに入るメールがきていた。ちなみに、slackについては以下のサイト参照
大流行中・Slack(スラック)の使い方を隅々まで徹底解説!(保存版・1/全10回)【設定について】
https://seleck.cc/note/seleck_howto/article/1
)
■みなさんへのご挨拶
・去年からサンフランシスコから、データサイエンスのコミュニティイベント
・情報を交換していただくのが目的
・データ分析コンペ Sunsunのデータ
■データサイエンスの事業への装着と利益創出のコンセプト事例
(リクルートの人)
・私
・市場 抽象度高
・業務
・自己紹介
データサイエンティスト オブ ザ イヤー 2015
白書を出す仕事をしてた
ベストセラー
生体認証白書
電子ペーパー
非接触IC
Webコンサル
言っていることとやってることの違い
→定量的に取れる
いいね の建前と本音
・市場について
マクドナルド(オーストラリア)の実験店舗 リアルABテスト
リアルABテスト 遺伝子検査
ハードウェアスタートアップ 健康モニタリング→ビタミン剤がでてくる
パーソナライズ コーディネート
Amazon Dash
導電繊維→ログデータ取得
服を買う
データを取る
出口をもって
センサー→なんでもいれとけ:ちょっと考える時期
出口がないと施策につながらない
・実務について
データサイエンス:横断的になる→権限もらわないと
はなすこと
(1)案件のスコープと攻守を明確にすること
(2)業務のコストとインパクトを精査し合意形成と納得感の醸成をすること
(3)戦力構想を可視化すること
・(1)案件のスコープと攻守を明確にすること
データベース概念検証(机)
Hadoopを入れる必要性
事業モニタリング環境改善(はかり)
データ内容が標準化されていない
データ活用が高速化されていない
データへのアクセスがオープン化されていない
↓
データによる経営が困難
バッチ処理、計測ルールでKPIが変わる
→ルールを作る:ツールを使う
データへのアクセスをオープン化
クライアントサポート体制改善
えあれじサービス
参入障壁を下げる
クラスタリングで分けて、モデリング
→営業管理ツールと連動
重回帰分析による内定要因定量化
採用成功方程式
→高望から始まる:なにもきまらない→期待値を下げる
景気悪くなると、マッチング悪くなる
効果出た
機械学習によるメール振り分け
転職活動ステータス別アシストレコメンド
自然言語処理・テキストマイニング
形態素分解・頻度・単語出現→共起
アソシエーションルールによる行動喚起
→直観的に把握しやすい
・(2)業務のコストとインパクトを精査し合意形成と納得感の醸成をすること
施策
分析
運用
基盤
関与度
1% ビジネス検討のための集計依頼に対応
50% 発起から
影響組織
1pt 1人
・(3)戦力構想を可視化
データ分析の組織装着
3つの型
専門組織型:R&Dから派生、高度分析→組織移動
システム部門型:
カスタマWeb型 MP(メディアプランナー):できる範囲に限界
→ハイブリッド型:全部のせ
データマップ→スキルマップ→スキルスコア
データマップ
どんなDBを見ているか
スキルマップ
リテラシーをマップ:人と組織
スキルスコア
組織単位で
お金で買えるスキル
そのDBを
分かって
ないとX
・最後に
赤の女王仮説
その場にとどまるためには、全力で走り続けなければならない。
自然淘汰
進化して進化して進化してやっと現状維持
みずから機械を作りだし機会によって自らを変えましょう