統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(2)

2016-06-30 12:40:47 | 日記・エッセイ・コラム
このブログは「すぐに役立つ統計のコツ」(オーム社)の内容にそって書いています。
だから、本書のページを開いてお読み頂けると嬉しいです。
 
「すぐに役立つ統計のコツ」の「第1章 統計をはじめる前に」(1ページ)について。
この章では、分析を始める前に行っておくべきこと・・・、それは、標本が量的な数値であるなら、、
その標本の分布を見ておくことです。最近の多くの商用統計ソフトには1標本の分布を簡単な操作で見ることが出来ます。
Excelでは度数分布(ヒストグラム)で知ることが出来ます(詳しくは、「すぐに役立つ統計のコツ」第3章(11ページ)」を見て下さい。分析を行う前には標本の分布を見る習慣をつけておくと良いでしょう。
そして、
標本の分布が右か左に尾を引くような分布であれば、正規性の検定を行ってみます。正規性の検定については「すぐに役立つ統計のコツ」第3章(14ページ)」を見て下さい。
 
このひと手間が後々の分析に生きて来ます。
 
 
そして、標本の分布の型を見てから、目的とする統計分析に必要な統計的な手法を選択します。
 
次回は、
「すぐに役立つ統計のコツ(3)」の「第2章 分析の準備」です。
 
情報統計研究はここから
 
 
 

統計のコツのこつ

2016-06-23 13:27:40 | 日記・エッセイ・コラム

このブログは「すぐに役立つ統計のコツ」(オーム社)に紹介されている内容を補足(書き足らなった)するためのものです。だから、出来ましたら本書を手元に置いてお読み頂けると嬉しいです。
TVドラマの「重版出来」じゃないけでど・・、編集者のご苦労を垣間見た感じで、その影響もあるかな・・!?
では、本題に入ります。

 

「すぐに役立つ統計のコツ」の「はじめに」について。
 
私が最初に見た統計学の本は、Fortran言語で書かれていました。コンパイラー言語ですのでバグがあれば書き直してコンパイルし直して実行してを繰り返しますが、なにせコンピュータの性能が今のパソコン以下の時代ですから厄介でした。それから、しばらくしてBASIC言語(インタプリタ)がパソコンの急速な普及と共にパソコン言語の主流となりました。N88BASICは NEC の全盛時代でした。その後は、Visual Basic・Pascal・C言語 などとなりました(爺かもよ)。今日では C言語や Script が主流です。
今は統計のための言語は「R」でしょうか!?。
 
 
私は、
今でもプログラミングのフローチャートは「Fortran+BASIC」で書いています。そうそう・・・、MS-Excelの統計分析(関数)は大いに役立っています。パソコンを買えば Excel が付いているので”タダ”みたいに思うけど結構な値段ですよね。MS の商売上手で世界標準になった感じです。
 例えば、
Excel VBA での条件文や繰返し文だと次のようになります。
 if Value=[  ] Then [   ] Else [   ]
 
 For i=1 to n
 Worksheets("Sheet1").Cells(i,1).Value=i
 Next i
 
数式文は次のように書くことも出来ます。
 Sub 数式の指定()
 Worksheets("Sheet1").Range("B1").FormulaArray="=sum(R1C1:R10C1)"
 End Sub
 
これは、1行1列~10行1列までの数値を合計することです。
Excelでは、
1行2列のB1セルに「=sum(A1:A10」と書けば合計値を求められます。
 
こうして見ると、FORTRANやBASICに似ていますね。
 
全く統計の初心者なら、
以下のExcel統計用関数から初めて下さい。
 
A列1行からA列10行までのセルに数値がある場合、適当な空白セルに下記の関数式を書きます。
 
 個数:count(A1:A10)→「数値」の個数を数えます。文字列は数えません。
 最小値:MIN(A1:A10)→ 一番小さい値)を求めます。
 中央値:MEDIAN(A1:A10)→ 真中の値を求めます。
 最大値:MAX(A1:A10)→ 一番大きな値求めま平均値:AVERAGE(A1:A10)→「平均の値」を求めます。
 標準偏差:STDEV(A1:A10)→「バラツキ」を求めます。
 
以上の統計量は統計分析を行う上で欠かせないものです。まずは、このExcel関数をマスターして下さい。
 
高度な統計分析になるとExcelでの限界を感じるかも知れません。やはり、統計分析に特化したExcelアドインソフトが欲しくなります。本章では、
Excelのアドインソフトに代わるものとして、統計分析環境「R」(フリーソフト)で作成されているフリーオンラインソフトを紹介しています。日本にも優れたフリーソフトが公開されていますのでWeb上で検索してみて下さい。
 
 
 
次回は、
「すぐに役立つ統計のコツ」の「第1章 統計をはじめる前に」です。
 
情報統計研究はここから
 
 

 

 


ビジネスと統計(終わりに)

2016-06-01 16:40:13 | 日記・エッセイ・コラム

気ままに「ビジネスと統計」を書いて来たけど、自分の忘備帳的なところがありますので、これにて終了します。

「社会人のためにデータサイエンス演習」(総務省統計局)が主催する講座がビジネスに役立つと思います。

「gacco」で検索して見て下さい。

次回からは、「統計のコツのこつ」(仮定)と題して気ままに書きますのでよろしくお願いします(予定ですよ・・・)。

情報統計研究所