4月18日に行ってきた、
Microsoft SQL Server2014 発売記念フォーラム
ビジネス成長を支えるデータ基盤とビッグデータ活用
のメモメモ、まずは、
一億総データサイエンティスト時代に向けて
について
・マイクロソフトが分析ツールに本気だしたら、
ベンチャなんて一気につぶれる
・マイクロソフト→パソコンがある世界
2000年:PC50%超える
→統計学でデータ解析
・医学部で統計学が必要な理由
根拠に基づく医療
経験と勘→もんだいだよね!と80年代から知られる
心筋梗塞→不整脈
不整脈の薬、どれがいいかを調べたい
→プラセボをしらべたら・・プラセボのほうがいいじゃん(>_<!)
意外と人間の反応複雑・・・
エビデンスド・ベースド・マネジメント
・医学における統計学
何によって死ぬ?→がんが多い 集計だけでわかる
減らすアイデア:喫煙、野菜不足、過剰塩分(生活習慣病)
→ただしい知識だけでは。。。
行動科学:心理、環境
寿命の延び:塩分摂取量変わった→冷蔵庫
たばこ:反抗心→きみたちが
戦略さをひっくり返せる
→ソーシャルマーケティング:フィリップことラー
Hal varian(2009)
10年
データサイエンティスト→統計家といっている!!
・さいえんてぃすと
暗闇からはじめちゃだめ
→先人があけてくれている穴を探す
いろんな人が別々に・・・つながる!
・データ分析者の必読書
Research Design
・リサーチデザインを知らないと
わが社のデータを分析したいんですが
なるほど、あなたの仮説を教えてください
・仮説指向の限界
多くのデータがあるのに、仮説の部分しか見ていない
YESかNOかに頭が反応→上司がいうと、引っ込めなくちゃならない
・かつては正しかった理由
パンチカードの時代
いまはすべてできる
・仮説ではなく、問いを
オープンクエスチョン
具体的
解析単位 :望ましさを比べる単位
アウトカム:望ましさを具体的に定義
説明変数 :望ましさを左右しうる特徴
分析→基本的に比較
・分析方針は比較軸→望ましいものと望ましくないものの比較軸
・アウトカム(成果)を重視
アウトプット:中間結果でも。。
アウトカム:ゴールに対して
・アウトカムの定石
ブランドイメージ→利益:わからない
・解析単位の定石
・仮説ではなく説明変数を
・ECサイトのログ解析を例に
・全ての説明変数を多変量解析
・分析結果からアクションへ
動かせないアウトカム→動かし得る説明変数:相手を変える
動かせないアウトカム→動かせない説明変数:狙いをずらす
動かせないアウトカム→動かない説明変数*
→制御下にある説明変数:最適化
*季節、天候など
・今、自分が行っていること
一番低い人に合う
すごいお金をかけても、迷惑メールに
・世界史上最も統計学で儲けた国
日本:「KAIZEN]
→デミング
デミング以前の日本の工業
GHQ:電話不安定すぎ
→セミナー→かいぜん
・If Japan Can... Why Can't We?
1つは数学能力高かった
塵劫記:1627年に吉田光由で執筆
もうひとつの答え:QC7つ道具
管理図、パレート図・・・
意味のある視覚化
型をきめて体で覚える
現場レベルで全員が迅速に
まとめ
科学の型を利用しよう
仮説ではなくオープンな問いを
データとサイエンスが当たり前の国へ
このあと、
本気で始めるクラウド&ビッグデータ活用
ということで、デモ中心のセッションがあった。
こんなかんじ
--------------------
ビッグデータの活用
マイクロソフトのビッグデータ活用ビジョン
・ビッグデータの民主化
非構造化、構造化データ SQL Server
使うには:Office365・・・
・活用例
流動人口データ解析:Agoop
スマホアプリログ解析:ビデオリサーチインタラクティブ
SNS分析サービス:ジー・サーチ
生産情報の見える化:マイスター
・デモ1
POWER BI
Power Map
ヒートマップ
棒グラフ
→コーディングいらない
池袋駅前
・でも2
消費者スマホ利用行動分析
ぱずどら、Lineつよし
ゲームユーザー、30台以上は女性つよし!
・でも3
Twitterのログ情報をとってきて・・
気分、感情・・・
イメージのみ(200件しか取れていない)
・でも4
Visio
工程表の上で可視化
CAD図面
→壁に出すとか
Microsoft SQL Server2014 発売記念フォーラム
ビジネス成長を支えるデータ基盤とビッグデータ活用
のメモメモ、まずは、
一億総データサイエンティスト時代に向けて
について
・マイクロソフトが分析ツールに本気だしたら、
ベンチャなんて一気につぶれる
・マイクロソフト→パソコンがある世界
2000年:PC50%超える
→統計学でデータ解析
・医学部で統計学が必要な理由
根拠に基づく医療
経験と勘→もんだいだよね!と80年代から知られる
心筋梗塞→不整脈
不整脈の薬、どれがいいかを調べたい
→プラセボをしらべたら・・プラセボのほうがいいじゃん(>_<!)
意外と人間の反応複雑・・・
エビデンスド・ベースド・マネジメント
・医学における統計学
何によって死ぬ?→がんが多い 集計だけでわかる
減らすアイデア:喫煙、野菜不足、過剰塩分(生活習慣病)
→ただしい知識だけでは。。。
行動科学:心理、環境
寿命の延び:塩分摂取量変わった→冷蔵庫
たばこ:反抗心→きみたちが
戦略さをひっくり返せる
→ソーシャルマーケティング:フィリップことラー
Hal varian(2009)
10年
データサイエンティスト→統計家といっている!!
・さいえんてぃすと
暗闇からはじめちゃだめ
→先人があけてくれている穴を探す
いろんな人が別々に・・・つながる!
・データ分析者の必読書
Research Design
・リサーチデザインを知らないと
わが社のデータを分析したいんですが
なるほど、あなたの仮説を教えてください
・仮説指向の限界
多くのデータがあるのに、仮説の部分しか見ていない
YESかNOかに頭が反応→上司がいうと、引っ込めなくちゃならない
・かつては正しかった理由
パンチカードの時代
いまはすべてできる
・仮説ではなく、問いを
オープンクエスチョン
具体的
解析単位 :望ましさを比べる単位
アウトカム:望ましさを具体的に定義
説明変数 :望ましさを左右しうる特徴
分析→基本的に比較
・分析方針は比較軸→望ましいものと望ましくないものの比較軸
・アウトカム(成果)を重視
アウトプット:中間結果でも。。
アウトカム:ゴールに対して
・アウトカムの定石
ブランドイメージ→利益:わからない
・解析単位の定石
・仮説ではなく説明変数を
・ECサイトのログ解析を例に
・全ての説明変数を多変量解析
・分析結果からアクションへ
動かせないアウトカム→動かし得る説明変数:相手を変える
動かせないアウトカム→動かせない説明変数:狙いをずらす
動かせないアウトカム→動かない説明変数*
→制御下にある説明変数:最適化
*季節、天候など
・今、自分が行っていること
一番低い人に合う
すごいお金をかけても、迷惑メールに
・世界史上最も統計学で儲けた国
日本:「KAIZEN]
→デミング
デミング以前の日本の工業
GHQ:電話不安定すぎ
→セミナー→かいぜん
・If Japan Can... Why Can't We?
1つは数学能力高かった
塵劫記:1627年に吉田光由で執筆
もうひとつの答え:QC7つ道具
管理図、パレート図・・・
意味のある視覚化
型をきめて体で覚える
現場レベルで全員が迅速に
まとめ
科学の型を利用しよう
仮説ではなくオープンな問いを
データとサイエンスが当たり前の国へ
このあと、
本気で始めるクラウド&ビッグデータ活用
ということで、デモ中心のセッションがあった。
こんなかんじ
--------------------
ビッグデータの活用
マイクロソフトのビッグデータ活用ビジョン
・ビッグデータの民主化
非構造化、構造化データ SQL Server
使うには:Office365・・・
・活用例
流動人口データ解析:Agoop
スマホアプリログ解析:ビデオリサーチインタラクティブ
SNS分析サービス:ジー・サーチ
生産情報の見える化:マイスター
・デモ1
POWER BI
Power Map
ヒートマップ
棒グラフ
→コーディングいらない
池袋駅前
・でも2
消費者スマホ利用行動分析
ぱずどら、Lineつよし
ゲームユーザー、30台以上は女性つよし!
・でも3
Twitterのログ情報をとってきて・・
気分、感情・・・
イメージのみ(200件しか取れていない)
・でも4
Visio
工程表の上で可視化
CAD図面
→壁に出すとか