図は、http://khc.sourceforge.net/screen_r/bubble1.png より
データがある、さてどう分析する???
その助けになるのが、KHcoderなのだ。
excelでできればそれでいいのだけど、組み合わせるともっとできることが増える
>>KHcoderのサイト
http://khc.sourceforge.net/#
>>開発は個人の方
セミナーを企画されたのはこの会社さん
SCREEN Advanced System Solutionsさん
ひとまず、難しいことはさておき、
いくつか気になった部分をメモ
◆計量的分析の利点
・データの全体像の把握
・ドラマの生じたポイントの探索
>>データ分析報告に対しての下記のような突っ込みへの反論ができる
「それって本当?」「あなたにとって都合のいいことだけでしょ」
「どうやってそこに着目したの?」
…ああ、わかる。
これ、去年すごく苦労して、完成できなかったやつだ
<ポイント>量的分析⇒質的分析(解釈)⇒量的分析⇒質的分析の繰返し
◆KHcoderのポイントは大きく3つ
#1 言葉(頻出後)の抽出 ←動詞は、活用系をまとめて1つにして計測してる
#2 コーディング(ラベル張り)
#3 検索・閲覧(気になったワードを後から簡易にチェック) closeness to Date
◆KHkoderの活用方法
アンケートって、選択肢の作成がすごく難しい
で、自由回答が利用されている
⇒⇒⇒うーん、で、どうやって活用するんだろうか
そこのtheノウハウ、となるとよくわからないんだなあ
◆クロス集計
⇒自己解釈だけど、、
●●というセグメント(属性とか分類)においては、「●▼」というコード(自分でラベル貼り)が多く出ている、という見方ができる。。
例は、小説だから、段落だけど、
これが実際のデータだと「30代以下男性」「40代以上男性」とかってセグメントされている感じになるのだろう
仕事で使わせてもらったデータだと、各調査会社が独自にソフト作成してて、
縦軸に「年代」横軸に「転職時期」とか入れると、数値とグラフが出た。
でも、KHcoderは全然違う…
・・・戸惑う。
エクセルの元データで自分で
自分で見たい組み合わせを作っておくらしい。
これは、テキストデータの隣に入れていく
別途、コーディングで大まかなデータも作成。これはテキストで
で、ツール⇒コーディング⇒クロス集計⇒そのテキストデータ参照⇒クロス集計で、みたいクロスを指定⇒集計⇒バブル
…遠い
見方が難しい。。
追記:余談が面白かった
------------------------------------------
◆元データをいかに整えられるか、という視点が大切。。。
◆ラベルを貼る、というのが「技」にあたるのだろうか
◆有意差ってなんだ?
これは有意差だ、ってのはどこで言えるの???
そもそも線形モデルって???
数字の読み方がわからないなあ
◆データがある。さて、どう扱う
>>用語解説
・テキストマイニングとは
「構造化されていない文章から、必要な情報を抽出する方法」
⇒都合のいいようにできる
・計量テキスト分析とは
「文字データにラベル貼って(コーディングして)数値化し、計量的分析手法を適用して、
データを整理・分析する方法」
注意:
表記の違いは、区別されるらしい
※いろいろと、色々は区別される。
否定は、区別されないらしい
※「きれい」頻出後抽出とすると、「きれい」と「きれいでない」がでる。
⇒コーディングで、分類するしかないらしい… え!!?
なので、データは1つ1つみるべし、ということで「検索」ができるのだー
なお、コーディングのルールでは
きれい and ない みたいにするらしい。
>>共起ネットワークは、KJ法自動装置! なるほど…
イメージ:http://khc.sourceforge.net/screen_r/as_father_net.png
で、クラスタとして、キーワードを抽出できる。
大きく●個の塊がある。
で、それの文章を読んで、●▼については、肯定的な意見がある、
とかわかる
ツール>抽出語>「関連語検索」
で、どんな言葉と関連している科の一覧が出る。
「共起」が強い順に並べて、そこで再度ネットワークの表示もできる!!
すごいなあ。。使いこなせるかな
なんか分析できるデータないかな
>>特定のテーマの深堀には
「コーディング」&「クロス集計」
※関連後抽出して、コーディングのルールを作成しておく
データが時系列だと、
1つ1つのテーマについての経年変化が出る!!
⇒⇒⇒やってみて思うけど、これ、アンケート項目で
コーディング内容を聞けばいいって話だよね???
いや、アンケート調査してないけど、自由回答がある場合に
アンケート調査したかのような結果が手に入る方法が、
KHcoderの活用方法の1つといえるのか
>>文錦ソフトの説明があった!
年齢別のデータを年代別にする、とか。。当たり前にあってほしい機能だった。
いや、エクセルで作れるといえば作れるから、、+アルファでいいのか…
>>データを汚すもの
機種依存文字、文の終止符に「?」「!」、半角カタカナ
英字の半角全角
⇒なんと、セミナー企画された同じ会社さんが、KHcoderの処理に影響する困ったものを
一括対処してくれるソフトを開発!!
データがある、さてどう分析する???
その助けになるのが、KHcoderなのだ。
excelでできればそれでいいのだけど、組み合わせるともっとできることが増える
>>KHcoderのサイト
http://khc.sourceforge.net/#
>>開発は個人の方
セミナーを企画されたのはこの会社さん
SCREEN Advanced System Solutionsさん
ひとまず、難しいことはさておき、
いくつか気になった部分をメモ
◆計量的分析の利点
・データの全体像の把握
・ドラマの生じたポイントの探索
>>データ分析報告に対しての下記のような突っ込みへの反論ができる
「それって本当?」「あなたにとって都合のいいことだけでしょ」
「どうやってそこに着目したの?」
…ああ、わかる。
これ、去年すごく苦労して、完成できなかったやつだ
<ポイント>量的分析⇒質的分析(解釈)⇒量的分析⇒質的分析の繰返し
◆KHcoderのポイントは大きく3つ
#1 言葉(頻出後)の抽出 ←動詞は、活用系をまとめて1つにして計測してる
#2 コーディング(ラベル張り)
#3 検索・閲覧(気になったワードを後から簡易にチェック) closeness to Date
◆KHkoderの活用方法
アンケートって、選択肢の作成がすごく難しい
で、自由回答が利用されている
⇒⇒⇒うーん、で、どうやって活用するんだろうか
そこのtheノウハウ、となるとよくわからないんだなあ
◆クロス集計
⇒自己解釈だけど、、
●●というセグメント(属性とか分類)においては、「●▼」というコード(自分でラベル貼り)が多く出ている、という見方ができる。。
例は、小説だから、段落だけど、
これが実際のデータだと「30代以下男性」「40代以上男性」とかってセグメントされている感じになるのだろう
仕事で使わせてもらったデータだと、各調査会社が独自にソフト作成してて、
縦軸に「年代」横軸に「転職時期」とか入れると、数値とグラフが出た。
でも、KHcoderは全然違う…
・・・戸惑う。
エクセルの元データで自分で
自分で見たい組み合わせを作っておくらしい。
これは、テキストデータの隣に入れていく
別途、コーディングで大まかなデータも作成。これはテキストで
で、ツール⇒コーディング⇒クロス集計⇒そのテキストデータ参照⇒クロス集計で、みたいクロスを指定⇒集計⇒バブル
…遠い
見方が難しい。。
追記:余談が面白かった
------------------------------------------
◆元データをいかに整えられるか、という視点が大切。。。
◆ラベルを貼る、というのが「技」にあたるのだろうか
◆有意差ってなんだ?
これは有意差だ、ってのはどこで言えるの???
そもそも線形モデルって???
数字の読み方がわからないなあ
◆データがある。さて、どう扱う
>>用語解説
・テキストマイニングとは
「構造化されていない文章から、必要な情報を抽出する方法」
⇒都合のいいようにできる
・計量テキスト分析とは
「文字データにラベル貼って(コーディングして)数値化し、計量的分析手法を適用して、
データを整理・分析する方法」
注意:
表記の違いは、区別されるらしい
※いろいろと、色々は区別される。
否定は、区別されないらしい
※「きれい」頻出後抽出とすると、「きれい」と「きれいでない」がでる。
⇒コーディングで、分類するしかないらしい… え!!?
なので、データは1つ1つみるべし、ということで「検索」ができるのだー
なお、コーディングのルールでは
きれい and ない みたいにするらしい。
>>共起ネットワークは、KJ法自動装置! なるほど…
イメージ:http://khc.sourceforge.net/screen_r/as_father_net.png
で、クラスタとして、キーワードを抽出できる。
大きく●個の塊がある。
で、それの文章を読んで、●▼については、肯定的な意見がある、
とかわかる
ツール>抽出語>「関連語検索」
で、どんな言葉と関連している科の一覧が出る。
「共起」が強い順に並べて、そこで再度ネットワークの表示もできる!!
すごいなあ。。使いこなせるかな
なんか分析できるデータないかな
>>特定のテーマの深堀には
「コーディング」&「クロス集計」
※関連後抽出して、コーディングのルールを作成しておく
データが時系列だと、
1つ1つのテーマについての経年変化が出る!!
⇒⇒⇒やってみて思うけど、これ、アンケート項目で
コーディング内容を聞けばいいって話だよね???
いや、アンケート調査してないけど、自由回答がある場合に
アンケート調査したかのような結果が手に入る方法が、
KHcoderの活用方法の1つといえるのか
>>文錦ソフトの説明があった!
年齢別のデータを年代別にする、とか。。当たり前にあってほしい機能だった。
いや、エクセルで作れるといえば作れるから、、+アルファでいいのか…
>>データを汚すもの
機種依存文字、文の終止符に「?」「!」、半角カタカナ
英字の半角全角
⇒なんと、セミナー企画された同じ会社さんが、KHcoderの処理に影響する困ったものを
一括対処してくれるソフトを開発!!