情報統計研究所へのアクセスはここから.
テキストマイニング分析ソフトの使用経験(その1)
診療現場での医師と患者の自由文アンケートを要約したファイルを下記のURLからダウンロード出来ます。
http://www3.ocn.ne.jp/~stat/dbase/dbase.html
画面の Down Loard ( 医師・患者アンケート ) をクリックしダウンロードすると、
「Enquate.xls (sheet名:医師自由文、患者自由文)」をみることが出来ます。ここでは、
このサンプル・ファイルのデータをフリーソフトの「KH Coder」を使って分析してみましょう。まずは、使用に当たって下記のURL にアクセスして下さい。
そして、
「KH Coder の入手」から、Windows 版パッケージ 「 khcoder-2b25a-f.exe (2011 05/25) 」 をダウンロードして下さい。ダウンロードの後に、このファイルをダブルクリックすれば、自動的に下記のディレクトリー階層になると思います。
図1:KH Coder のディレクトリー階層
「KH Coder」は、ChaSen(茶筌)、MySQL( リレーショナル・データベース )、R (統計解析環境ソフト)、MS Excel などをバックエンドとして利用していますので、これらの環境が必要かもしれません。多分、MS Excel が使用出来る Windows OS なら、大丈夫だと思います(保障は出来ません)。それでは、
図1 のディレクトリーにある使用説明書( khcoder_tutorial.pdf )を読み、使用方法を経験してみて下さい。
図2は次回に説明する Enquate.xls ( sheet名:医師自由文 )の一例です。
図2:医師アンケートで出現頻度の多い抽出語
次回に続く!