このブログは「すぐに役立つ統計のコツ」(オーム社)に紹介されている内容を補足(書き足らなった)するためのものです。だから、出来ましたら本書を手元に置いてお読み頂けると嬉しいです。
TVドラマの「重版出来」じゃないけでど・・、編集者のご苦労を垣間見た感じで、その影響もあるかな・・!?
では、本題に入ります。
「すぐに役立つ統計のコツ」の「はじめに」について。
私が最初に見た統計学の本は、Fortran言語で書かれていました。コンパイラー言語ですのでバグがあれば書き直してコンパイルし直して実行してを繰り返しますが、なにせコンピュータの性能が今のパソコン以下の時代ですから厄介でした。それから、しばらくしてBASIC言語(インタプリタ)がパソコンの急速な普及と共にパソコン言語の主流となりました。N88BASICは NEC の全盛時代でした。その後は、Visual Basic・Pascal・C言語 などとなりました(爺かもよ)。今日では C言語や Script が主流です。
今は統計のための言語は「R」でしょうか!?。
私は、
今でもプログラミングのフローチャートは「Fortran+BASIC」で書いています。そうそう・・・、MS-Excelの統計分析(関数)は大いに役立っています。パソコンを買えば Excel が付いているので”タダ”みたいに思うけど結構な値段ですよね。MS の商売上手で世界標準になった感じです。
例えば、
Excel VBA での条件文や繰返し文だと次のようになります。
if Value=[ ] Then [ ] Else [ ]
For i=1 to n
Worksheets("Sheet1").Cells(i,1).Value=i
Next i
数式文は次のように書くことも出来ます。
Sub 数式の指定()
Worksheets("Sheet1").Range("B1").FormulaArray="=sum(R1C1:R10C1)"
End Sub
これは、1行1列~10行1列までの数値を合計することです。
Excelでは、
1行2列のB1セルに「=sum(A1:A10」と書けば合計値を求められます。
こうして見ると、FORTRANやBASICに似ていますね。
全く統計の初心者なら、
以下のExcel統計用関数から初めて下さい。
A列1行からA列10行までのセルに数値がある場合、適当な空白セルに下記の関数式を書きます。
個数:count(A1:A10)→「数値」の個数を数えます。文字列は数えません。
最小値:MIN(A1:A10)→ 一番小さい値)を求めます。
中央値:MEDIAN(A1:A10)→ 真中の値を求めます。
最大値:MAX(A1:A10)→ 一番大きな値求めま平均値:AVERAGE(A1:A10)→「平均の値」を求めます。
標準偏差:STDEV(A1:A10)→「バラツキ」を求めます。
以上の統計量は統計分析を行う上で欠かせないものです。まずは、このExcel関数をマスターして下さい。
高度な統計分析になるとExcelでの限界を感じるかも知れません。やはり、統計分析に特化したExcelアドインソフトが欲しくなります。本章では、
Excelのアドインソフトに代わるものとして、統計分析環境「R」(フリーソフト)で作成されているフリーオンラインソフトを紹介しています。日本にも優れたフリーソフトが公開されていますのでWeb上で検索してみて下さい。
次回は、
「すぐに役立つ統計のコツ」の「第1章 統計をはじめる前に」です。