にんげんばんじ さいおうがうま

マイナス感情に苛まされるのもまた一興

つれづれなるままにヒグラシ
好きなもの食べて寝れば明日が来る:-)

KHkoder 初級セミナー メモ

2018年02月23日 16時18分32秒 | 論文を書こう
図は、http://khc.sourceforge.net/screen_r/bubble1.png より


データがある、さてどう分析する???
その助けになるのが、KHcoderなのだ。
excelでできればそれでいいのだけど、組み合わせるともっとできることが増える

>>KHcoderのサイト
http://khc.sourceforge.net/#

>>開発は個人の方

セミナーを企画されたのはこの会社さん
SCREEN Advanced System Solutionsさん


ひとまず、難しいことはさておき、
いくつか気になった部分をメモ


◆計量的分析の利点
・データの全体像の把握        
・ドラマの生じたポイントの探索


>>データ分析報告に対しての下記のような突っ込みへの反論ができる
「それって本当?」「あなたにとって都合のいいことだけでしょ」
「どうやってそこに着目したの?」


…ああ、わかる。
これ、去年すごく苦労して、完成できなかったやつだ


<ポイント>量的分析⇒質的分析(解釈)⇒量的分析⇒質的分析の繰返し



◆KHcoderのポイントは大きく3つ

#1 言葉(頻出後)の抽出  ←動詞は、活用系をまとめて1つにして計測してる
#2 コーディング(ラベル張り)
#3 検索・閲覧(気になったワードを後から簡易にチェック) closeness to Date



◆KHkoderの活用方法

アンケートって、選択肢の作成がすごく難しい
で、自由回答が利用されている

⇒⇒⇒うーん、で、どうやって活用するんだろうか
  そこのtheノウハウ、となるとよくわからないんだなあ



◆クロス集計



⇒自己解釈だけど、、
●●というセグメント(属性とか分類)においては、「●▼」というコード(自分でラベル貼り)が多く出ている、という見方ができる。。

例は、小説だから、段落だけど、
これが実際のデータだと「30代以下男性」「40代以上男性」とかってセグメントされている感じになるのだろう


仕事で使わせてもらったデータだと、各調査会社が独自にソフト作成してて、
縦軸に「年代」横軸に「転職時期」とか入れると、数値とグラフが出た。


でも、KHcoderは全然違う…

・・・戸惑う。


エクセルの元データで自分で
自分で見たい組み合わせを作っておくらしい。
これは、テキストデータの隣に入れていく


別途、コーディングで大まかなデータも作成。これはテキストで



で、ツール⇒コーディング⇒クロス集計⇒そのテキストデータ参照⇒クロス集計で、みたいクロスを指定⇒集計⇒バブル

…遠い

見方が難しい。。







追記:余談が面白かった

------------------------------------------

◆元データをいかに整えられるか、という視点が大切。。。

◆ラベルを貼る、というのが「技」にあたるのだろうか





◆有意差ってなんだ?
これは有意差だ、ってのはどこで言えるの???

そもそも線形モデルって???

数字の読み方がわからないなあ



◆データがある。さて、どう扱う





>>用語解説

・テキストマイニングとは
「構造化されていない文章から、必要な情報を抽出する方法」

⇒都合のいいようにできる


・計量テキスト分析とは
「文字データにラベル貼って(コーディングして)数値化し、計量的分析手法を適用して、
データを整理・分析する方法」





注意:

表記の違いは、区別されるらしい
※いろいろと、色々は区別される。


否定は、区別されないらしい
※「きれい」頻出後抽出とすると、「きれい」と「きれいでない」がでる。

⇒コーディングで、分類するしかないらしい… え!!?

 なので、データは1つ1つみるべし、ということで「検索」ができるのだー


なお、コーディングのルールでは

きれい and ない みたいにするらしい。





>>共起ネットワークは、KJ法自動装置! なるほど…


イメージ:http://khc.sourceforge.net/screen_r/as_father_net.png




で、クラスタとして、キーワードを抽出できる。
大きく●個の塊がある。

で、それの文章を読んで、●▼については、肯定的な意見がある、
とかわかる


ツール>抽出語>「関連語検索」

で、どんな言葉と関連している科の一覧が出る。
「共起」が強い順に並べて、そこで再度ネットワークの表示もできる!!


すごいなあ。。使いこなせるかな
なんか分析できるデータないかな


>>特定のテーマの深堀には

「コーディング」&「クロス集計」

※関連後抽出して、コーディングのルールを作成しておく


データが時系列だと、
1つ1つのテーマについての経年変化が出る!!


⇒⇒⇒やってみて思うけど、これ、アンケート項目で
コーディング内容を聞けばいいって話だよね???

いや、アンケート調査してないけど、自由回答がある場合に
アンケート調査したかのような結果が手に入る方法が、
KHcoderの活用方法の1つといえるのか




>>文錦ソフトの説明があった!
  年齢別のデータを年代別にする、とか。。当たり前にあってほしい機能だった。
  いや、エクセルで作れるといえば作れるから、、+アルファでいいのか…


>>データを汚すもの
機種依存文字、文の終止符に「?」「!」、半角カタカナ
英字の半角全角

⇒なんと、セミナー企画された同じ会社さんが、KHcoderの処理に影響する困ったものを
 一括対処してくれるソフトを開発!!














最新の画像もっと見る