ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

分散表現って、こういうこと?(統計で言う因子分析?)

2019-05-08 08:54:04 | Weblog
AIの自然言語処理ででてくる「分散表演」だけど・・・

自然言語処理の精度を向上させた”単語のベクトル表現”とは?簡単に実装してみた
https://blog.aidemy.net/entry/2017/07/01/184421

をみて、もしかして、こういうこと?と思ったことを書きます。
(はずれているかもしれない。間違ってたらごめん!)




上記サイトには、以下の表が出ている。

(https://blog.aidemy.net/entry/2017/07/01/184421から引用)
このとき、大きさ、甘さ、黄色さが特徴。ここでは特徴が3つなので3次元。
で、それぞれの単語(ここでは、リンゴ、バナナ、車)が、どれくらいその特徴を持っているか、0~1までの数字で表している。この単語を特徴の量で表すのが、分散表現らしい。

 ってこれ、統計でいう因子分析分析なんすかね?
 特徴は因子分析の因子
 それぞれの単語の特徴量は、因子負荷?

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする