ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

”「いつやるの、今でしょ。」-なぜ、未然形に「。」がつく?”の謎が解けた!

2013-04-22 20:09:02 | AI・BigData
あ~、気になる。
国語、あまり得意じゃないです。もの、知らないです。

だから、ついさっきまで、

「いつやるの、今でしょ。」


の最後、「でしょ。」って、「です」の未然形なのに、なぜ、。が付くのか、
気になってしょうがなかった。

mecabで確認!

いつやるの、今でしょ
いつ 名詞,代名詞,一般,*,*,*,いつ,イツ,イツ
やる 動詞,自立,*,*,五段・ラ行,基本形,やる,ヤル,ヤル
の 名詞,非自立,一般,*,*,*,の,ノ,ノ
、 記号,読点,*,*,*,*,、,、,、
今 名詞,副詞可能,*,*,*,*,今,イマ,イマ
でしょ 助動詞,*,*,*,特殊・デス,未然形,です,デショ,デショ
EOS

やっぱり、「でしょ」・・・未然形だ・・・




で、さっき、気が付いた!
でしょって、「でしょう」の「う」を省略した形??

いつやるの、今でしょう。
いつ 名詞,代名詞,一般,*,*,*,いつ,イツ,イツ
やる 動詞,自立,*,*,五段・ラ行,基本形,やる,ヤル,ヤル
の 名詞,非自立,一般,*,*,*,の,ノ,ノ
、 記号,読点,*,*,*,*,、,、,、
今 名詞,副詞可能,*,*,*,*,今,イマ,イマ
でしょ 助動詞,*,*,*,特殊・デス,未然形,です,デショ,デショ
う 助動詞,*,*,*,不変化型,基本形,う,ウ,ウ
。 記号,句点,*,*,*,*,。,。,。

おお、「う」は、基本形になっている。
Wikipediaで調べると、助動詞「う」の終止形は、「う」で、然形の最後が「ろ」「ょ」で終わる助動詞に接続すると書いてある。

でしょは、「ょ」で終わる未然形だから、このかたち!

おお、これかあ・・・やっとわかった(^^;)v


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

グーグルが提唱するZMOTのためのソーシャルマイニング

2013-04-22 17:32:19 | AI・BigData
ビッグデータついでにもう一つ。

ビッグデータというと、Twitter,Facebookなどのソーシャルメディアの
テキストマイニング(ソーシャルマイニング?)が盛んな気がします。

それに華を添える言葉が、ZMOTですよね。

ZMOTについては、

「ZMOT」とは?絶対知っておきたい注目のマーケティング用語!
http://smmlab.aainc.co.jp/?p=14104

(以下太字は、上記サイトより引用)
がくわしい。以下、ZMOTの意味を引用。

2010年にGoogleが提唱した購買意思決定に関するマーケティングモデル。「Zero Moment of Truth」の頭文字を取ったもので、「ジーモット」と呼ばれる。

2004年、米P&G社は『来店したお客様は商品棚を見て、最初の3秒から7秒でどの商品を買うかを決めている。』という独自リサーチから、商品配置や陳列等が購入商品を選択する決定的な瞬間を左右する、「インストア」のマーケティングモデルをFMOT(First Moment of Truth)、「エフモット」と呼んだ。

しかし、インターネットの普及により多くの情報が簡単に入手できるようになったため、消費者は店に行く前の検索や、レビュー等のクチコミ、SNS上の友人からのレコメンドから既に購入商品を決定するようになった。ZMOTとは、こうしたオンライン上での情報収集によって、FMOTの前に実質的な購買意思決定の瞬間があるとした、「プレストア」マーケティングの概念。


つまり、いままでは、お店に来てからが勝負!
今は、お店に来る前が勝負!TwitterやFacebook,Lineでの評判が大事ということでしょうか・・・

こうなってくると、それらソーシャルメディアの分析が大事という論理展開になるんでしょうね。
ビッグデータの出番ですね。

P.S なお、ZMOTのページは

こちら http://www.zeromomentoftruth.com/



  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

なので、ビッグデータと来るとベイズ?なのかしら・・

2013-04-22 14:47:18 | AI・BigData
前に、アンスコムのことを書いたけど、
そんなこんなで、ビッグデータをやっている人は、因果関係を示すには、
ベイズを使いたがるのでしょうか・・・
(もちろん、共分散構造分析(SEM)も使うけど)

最近のユニシス技報でも

ベイズ法を用いたノイズに頑健な高次元データの推定
http://www.unisys.co.jp/tec_info/tr115/11503.pdf

なんていうのが出ている。

マーケティング、ビッグデータ的には、ベイズの香りをさせないと、いけない時代なんでしょうかね(^^;)




 特に最近は、「ビッグデータ時代のマーケティング―ベイジアンモデリングの活用」という本が出て、著者の一人は、統計数理研究所長の樋口知之先生(最近、データサイエンティストについていろいろ発言している)なので、今後、ビッグデータなSIerさんに、もっともっと、ベイズ話が浸透しそう・・・(ちなみに、さっきの本、もう一人の著者は、筑波大大学院(東京キャンパスのほう)の佐藤先生)。

 もっとも、この辺の話題は、グラフィカルモデリングとして、近頃、いろいろ議論されているようですね。

 ただ、ビッグデータな人たちは、あんまり、グラフィカルモデリングの話って、取り上げてないような気がするんだけど、どうだろう・・・??
 ベイズちゃん、グラフィックちゃんなどのめがねっ子萌えキャラができれば、一挙にいくかもしれません!!

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ビッグデータを襲うアンスコム

2013-04-22 11:53:16 | AI・BigData
ビッグデータを使って、何らかの予測を行おうとした場合、
予測しようとする値が、複数の要因(変数)がある場合、重回帰分析を使ったりする(ほかのモノ使うときもあるけど)。
このとき、予測式は、でるかもしれない。
では逆に、仮説を立て、いくつかの要因(変数)から、重回帰で予測式が得られるかというと・・・

 重回帰分析だと、多重共線性(multi collinearity:頭を取るとmulti co マルチコ)があると、
うまく求まらない。
なので、変数間が独立していればいいが、因果関係があったりすると、強い相関が出るので、多重共線性により、うまくいかない。つまり、複雑な因果関係は、重回帰をつかってどうのこうのというのは、無理。

 複雑な因果関係があり、どのような関係で、値が決まってくるか、ある程度見える場合は、共分散構造分析を使う。これだと、因果関係のパス図を書けば、確かめられる(ただし、SPSS AMOSでは書きやすいが、Rでこれをやるのは、かなりたいへん)。ビッグデータを使って、何かを確かめたい場合、このような因果関係の複雑なメカニズムを知りたいことも多いだろうから、共分散構造分析は役立つ。

 しかし、共分散構造分析は、その名のとおり、共分散、相関を元に考えている。
 これは、線形の関係が成り立つときに成立する。
 線形の成り立たない2つのモノがあった場合、その相関、共分散は正しく出ない。
 ということは、共分散構造分析では、線形の関係が成り立たないと、分析が正しく出ない。
 (共分散構造分析だけでなく、重回帰でも、線形が成り立たないと、まずい)

 これは、「アンスコム」として知られる。具体的な例は、

 こちら http://sun.econ.seikei.ac.jp/~inoue/HPtemp/temp3.htm





ということは、ビッグデータで何でも解析できるというわけではなく、
重回帰を使う場合は、制限がある(線形&多重共線性がない)。
共分散構造分析も、線形でないといけない。
(SVMだと、カーネルトリックを使って線形でないものを取り扱える)

なので、「ビッグデータ使えば、なんでも解析、予測できちゃう!」と
いう考えに、アンスコムは冷や水を浴びせてしまう、それはそれは、まずい概念。
これが知られると、これからビッグデータで金儲けしようという人たちには、
困ったモンなわけだ。

でも、このアンスコムが書かれている本がこれ


アンスコム的な数値例で学ぶ統計的方法23講―異なるデータ構造から同じ解析結果が得られる謎を解く
http://www.amazon.co.jp/gp/product/4817194588


・・・うん、この題名では・・・
・・・ビッグデータは、安泰そうです(^^;)

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする