ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

「男の人は胸の大きい女の人が好きなんですか?」をビッグデータ解析で答えるには、どうする?

2018-11-25 14:19:40 | AI・BigData
頭の体操。

【データ】

DMM Webサービス
https://affiliate.dmm.com/api/

・商品検索API
 で、上位適当な数検索

・取得したデータの「genre」に注目、作品名を独立変数、ジャンルを従属変数にして、
 (=1作品1行、1ジャンルで1桁)

 各作品が、そのジャンルに属していたら1、属していなかったら0にする

例:
https://affiliate.dmm.com/api/v3/itemlist.html
のサンプルデータ

product id  独占配信 中出し ・・・ 巨乳 貧乳・微乳
28ara00014   1   1  ・・・  0   0
kawd00415    1   0  ・・・ 0    0
h_175dxrt00001 0    0 ・・・・ 0   0

(サンプルは「上原亜衣」"で"縛っている(助詞は"を"ではない。わかってる)。
 上原亜衣さんが巨乳でも貧乳でもないため、このカテゴリに値が入らないが、
 上原亜衣さん以外なら、入る作品があるはず)

【分析】

単純に、巨乳と貧乳・微乳の数をみて、結論を出してもOK
→たぶん、巨乳好きは多いが、貧乳・微乳もある程度あるので、みんな好きとは言い切れない
 になると思う

見栄え良くするには、多次元尺度構成法を使ったり、コレポンしてみたり・・・というところでしょうか?

【深堀するには】
購買情報があると、微乳・貧乳を購入している人は、巨乳を購入するか YES/NOで、
微乳好きの人は、巨乳を好きではない・巨乳も好きということが言えるんだけど、
購買データはとれないですね・・・


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする