3816(統計の猿)

統計家を目指して 写真付きで日記や趣味方式で 記載しています。

ビックデータを活用して 簡単な 分析をしてみました

2017-03-31 03:41:07 | 日記
ここでいう ビックデータは「マンション管理会社が行う・・会計収支計算書」を 分析してみたいと思います。マンションにお住まいであればこのような総会資料をご覧になったことでしょう。
 会議に出席して見て 毎回思うことは「一方的に聞き役で・・マンション管理会社の係員が説明しますね」まったく理解できません、簿記を多少知っているぐらいでは・・正しいのか??間違っているのか??・・こんな経験が有りませんか??

 参加者が一番気になるのは「経費の動き」ではないでしょうか。


① まず総会の資料見本をご覧ください。




図表は 本誌と 分析レポート の2枚を継ぎ合わせしています。さらに分析レポートにはデータを転記しています。

自問自答します・・・データの最大値はどれでしょうか、最小値はいくらでしょうか、また平均値は・・・標準偏差は・・・以下省略。

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
ビックデータの中で「政府のデータは莫大な量に圧倒します、そのような時は・・・・・・・・・・・・・・・・・・




Excel分布のデータ➡ ツール分析➡基本統計量を クリックします、あとは指示が出ますのご安心くださいこのデータの特性を導出してみましょう。赤枠は5年分のデータです



つぎは基本統計量を ツールから 分析 基本統計量をクリック➡することで下記のような統計量が出ました。よく見ると年度ごとの予算書の特性が読みとれるようになりました。

このデータは推測統計で言う母集団の平均値を求めるときの標本(サンプル)に使えるという説もあるようです、私は実験したことがありません。

抽出データを使ってさらに 例えば お子さん2人以上学年の違う成績の比較(評価)(実数-平均値/標準偏差)を計算する。また決算書を5カ年分を比較することが出来ます。試してみて下さればなるほど!!

では分析を御覧ください。


⑤右クリックでコピーが取れます 読者のレポートに添付してみてください

このレポートは「基本統計量の完成表です」表中上の欄の 11は 2011年意味です

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・


このページには時系列ことに追加してご説明します・・・ しばらくお待ちください。つぎは相関係数分析を実施します、相関図とはA項とB項目との関係の強さを学習してみます。私の過去のブログ日記の バックナンバーの中で 基礎を添付しています一度ご覧ください 
 




⑨相関関係図表

⑩強い相関グラフ(夜空の尾を引く流れ星のように・・・)


⑪弱い相関グラフ(ばらつきがある・直線から左右に分散しています


今日の日記は 統計の猿でした。


今です!!どこかでお聞きした 言葉です 統計の学びは これからの社会人として通過しなければなりませんね

2017-03-30 00:15:44 | 日記
今です!!どこかでお聞きした 言葉です 統計の学びは これからの私達が通過しなければなりませんね。
趣味で「統計を学んでいます」・・だけでなく・・文部科学省も小学校中学校そして 高等学校に激を飛ばしています。
約5年後には 会社の部下において「情報科学とIT社会に対応する新入社員が登板する時代になりつつあると推察します。
流通関係者の学びも必要ですが 学校の先生の養成も急務でしょうね、英語のように!!!!


参考別紙をご覧ください





統計の猿より

Excel関数 の応用の①考察

2017-03-29 16:19:34 | 日記
ヒストグラムの可視化を復習してきました、しかし ヒストグラムは もっと実際の社会に貢献して 学んだ意味があると感じるようになりました。

そこで ①サンプルの中に 区間集計 が出来る事を学んだ ・・・・・・・・・・・・・・・・・・・
②例えば TPPで話題になった コメの値下がりで 輸入米が攻勢をかけている実態から いかにおいしい日本米を輸出できる 力を期待されているところです。大阪の書籍や図書館では米造りの新図書が消えて 野菜造りの本が沢山で回っています。

野菜を否定するものでは無いが、生産コストでは コメ作ほどコストがかかっていないと素人では見ています。

そこで ご提案ですが●加算や除算の考えに加えて・・市場の動向を分析する「農協さん」にお願いして消費者がほしい時期は 何時か安定した野菜造りは作れば良いのか「今年の秋のレタス1玉が¥390円になりました 一方で3月には¥190円となりました」このような現象の原因と再発防止の対策は流通の段階で「何処が把握」しているのでしょうか??。昨今政府のビックデータを分析したところ「農業従事者より 非農家の従事者の参入が多くなっています・小泉さんの働き??・・・」を発見しました。

生産者と消費者の調整コントロールはどのようになっているのでしょうか。

最近は農家のトイレも水洗便所化しています、トイレットペーパは安く都会から田舎に入っていますね。

統計を学ぶ者から見ると 不自然な 現象起きていることを知ります。これは小さな事象ですが輸入輸出の産物や食料品見比べては輸入品が安いです、外国の野菜を買うより日本の農家の皆さんの野菜は「おいしいです」

 今日の「統計の猿は 学習を大きく外れた 内容になりました」ごめんなさい・・・・


・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
さて気を取り直して本文をご覧ください。今日の私の日記は 喫茶店の営業を別として 農家の皆さんに読んでいただきたいです









猿より

ヒストグラムの 作成 応用 (母集団を乱数で発生させる)

2017-03-28 19:51:08 | 日記
ヒストグラムの 作成 応用 (母集団を乱数で発生させる) ことで ヒストグラムの練習実験が 出来ました。

例えば PCのExcelメニユーの分布」からデータ」 から分析」 から乱数」 から均一」を選択します。・・・変数の数を10」とし乱数の数を100」に設定 出力場所はL3] ですが 黄色面は 0.5」とします。


関数FREQUENCY=(1行を参照、$L$2)   別紙をご覧ください



















EXCEL関数を使って ヒストグラム 作成してみました

2017-03-22 19:58:11 | 日記
EXCEL関数を使って ヒストグラム 作成してみました。

この方法は 私が所属してる「実務教育研究所」の後押しで可能にした方法です。

特徴は Excel関数「FREQUNCY($D$5:$D$35,J4 )」マイナス FREQUNCY($D$5:$D$35,J3)」

同じ関数が2つありますが マイナス を挟んでいます。










ヒストグラムの 作成方法 その②

2017-03-21 01:57:24 | 日記
10
階級ヒストグラム
 の 作成 方法と 前準備について。

前準備とは・・・・・階級を先行して表を準備することが コツです。

今回は 喫茶店の1月分について 基本統計量 の表を先行して作成すると「範囲、最小値、最大値 平均値」が出力します この値を参考にし階級立案に反映しましたのでご覧ください。

では ご覧ください


B1************************


B1




















ヒストグラム の 作成 方法と 前準備について

2017-03-21 00:42:56 | 日記
5階級ヒストグラム の 作成 方法と 前準備について。

前準備とは・・・・・階級を先行して表を準備することが コツです。

今回は 喫茶店の1月分について 基本統計量 の表を先行して作成すると「範囲、最小値、最大値 平均値」が出力します この値を参考にして実施してください。

では ご覧ください















喫茶店の売り上げ 分析について 編集日記をご覧ください

2017-03-16 00:37:46 | 日記
喫茶店の売り上げ 分析について 編集日記をご覧ください。

ここでいう編集日記とは、分析する上に「1ページにすべて網羅できない」ことが生じます。

読者さまが お読みになっていて「迷路」に入らないよう 配慮したものです。

では5枚の統計日記を通じて 流れを 汲んでくだされば幸いです。(下欄の編集イメージを参考にしてご覧ください)

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

詳しくは過去の日記をヒントに挑戦してみてください(2016年12月6日から20日の間)NO1からNO7を御覧くださ<い/font>

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

1ページは1月分の ①散布図 ②関数LINEST ③回帰分析です。font>




2ページは2月分の ①散布図 ②関数LINEST ③回帰分析です。



3ページは1月分と2月分を合わせた ③回帰分析です。


4ページは1月分と2月分を合わせた ②の関数LINESTです。


5ページは1月分と2月分を合わせた ○基本統計量です。


Y=21.46 +1.033x 回帰式 が 導出しました xに来店人数を代入するとY=売り上げ値が出ます

以上


開店喫茶店の売り上げ実績をもとに 次の売り上げ予測をしてみましょう

2017-03-14 20:37:19 | 日記
開店喫茶店の売り上げ実績をもとに 次の売り上げ予測をしてみましょう。

その 売り上げ予測式を導出する必要が出ました。

その予測は 1月実績から 回帰式を 発見する必要があります。

方法は 下記の 資料をご覧ください。(ご説明不足は過去の日記の中にヒントあります


・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・



・・・・・・・・・・・・・・・・・・





この喫茶店様は 開店早々 上昇機運ですね。後は 来客数次第ですね まず一安心!!



統計の猿より

基本統計量から見て 売り上げの 特性が見えてヒントになります。

2017-03-09 01:54:47 | 日記
基本統計量から見て 売り上げの 原因ヒントがつかまりました。

1月2月を比較して 何かを 発見しましたか??。

①グラフ(分散図)の作成は見えない部分を 可視化 することで中学生なら「1月の特徴は杉や檜ヒノキの成長に見えますね、
②2月散布図は広範囲に枝別れする桜かな・・・と答えるでしょう。
③散布図のなかにR2乗=0.86・・とあるのは寄与率と言います、後に相関関係の復習を行いますが「XとY」との関係のつよさです。例えば商品パンと牛乳は日本文化によく合いますが パンと味噌汁はどうでしょうか??係数が 1 に近いほうが強い関係言います。
④係数で 「マイナス」例えば -0.45の極端例では、学校の先生が転勤して新しい先生と相性が悪いと仮定するとお二人の相性が平均線から離れていきます つまり互いにその努力は今後の課題となりますね。
⑤要因が解れば事前に対策を打てますね。ヒントを発見した訳です 頑張ってください









統計の猿


A喫茶店の2月分実績が報告ありました。

2017-03-08 23:59:22 | 日記
A喫茶店の2月分実績が報告ありました。

2月分のデータから「基本統計量」を出力しました。

ご覧ください。

方法は①データ ➡ ②分析 ➡ ③基本統計量・・・が出ました。










統計の猿

データ分析・勝つための絶対スキル(週間ダイヤモンド)

2017-03-08 07:45:54 | 日記
データ分析・勝つための絶対スキル(週間ダイヤモンド)・・・・本文はダイヤモンド社の週刊誌の表紙3月4日発売

この内容は P31 身の周りのデータが増える一方で、それを活用できる人材が圧倒的に足りないと報じています。

一人でも多く 学ぶ仲間を思う「猿」としては 気になりますね。

ちなみに 私(統計の猿)の日記への来訪者3月7日は IP=62名でしたまた PV=95ページの閲覧でした。ブログ訪問有難うございました。

頑張ってください!!!

復習 基本統計表 により 売り上げの総枠をつかもう

2017-03-07 01:08:41 | 日記
復習 基本統計表 により 売り上げの総枠をつかむことがまず先決でしょう。

①散布図グラフで可視化しよう。②基本統計表により 総枠把握が出来るでしょう。③基本統計表は Excel関数が16個束ねた パッケージと理解したほうが 効率的で良いことに気が付きました。









統計の猿の復習でした。




復習 A喫茶店分析してみましょう(基本統計表?)

2017-03-05 12:31:54 | 日記
復習 A喫茶店分析してみましょう(基本統計表?)

Q:某喫茶店のデータをもとに・・基本統計表 を 猿まね してみてください。

自分の喫茶店の 実態を 把握すすることが 店長さんに必要ですね 頑張ってください











次回をお楽しみ ください。

私の 統計学を学ぶ基本姿勢は?

2017-03-03 16:18:51 | 日記
私の 統計学を学ぶ基本姿勢は?

下記の添付紙面ご覧になって・・・・・・地上絵が小さくて見えない読者には、PC画面右角の「歯車」をクリックしてくだされば地上絵が拡大できます。

① 紙面の上側の添付は「1939年6月22日に考古学者:ポール・コソック博士氏」が発見しました 場所は、ペルーのナスカの地上絵です。地上では見えないものがドロンがある今日では空からの 観光も大きな発見ではないでしょうか。


統計分析学問に置き換えれば「パソコン」の進化に伴い統計学が 21世紀になって脚光を浴びています,階層の基礎さえあれば、私のように素人でも扱えます時代です。 この一瞬において統計分析を学べることは、 地上絵の発見と比較して今では誰でも統計分析には PC があるので データ値だけでは見えないものを分析することで 疎外要因などを発見することが出来る事でしょう。

② 次に左下側の△の添付切片は「Excel関数」465個の関数で消費者に貢献していますね、関数というツールは小さな事象を解決するには便利なものです。もちろん統計分析によって課題の予測や推定によって推進力を感じています。わたしの20代の時の電卓なくを開くことが夢のようだ。

③ 次に右側中央の切片資料は「R統計」著作権を無料化して下さっている。私たちのような学ぶ者にとっては非常に有り難く感じています。余談ですがR統計のプログラムは Excel関数ののように 用途にあうプログラムをあらかじめに用意したもので、つまりフローチャート原理で 基礎がパッケジ化した集合帯に感じられます、意外と怖くなく楽しいです。最近読んだ購読図書は●楽しいR 豊澤栄治(著) ●Rにやさしいテキストマイニング小林雄一郎(著)が私を助けてくれました。

④ 最後に紙面全体の壁紙は 私が現在学んでいる 「R 統計のプログラムの記述言語」です、参考までに添付しました!








これからの統計学問を駆使して「仕事の仕組み」等に変化が出てくることでしょう。
したがって、これから学ぶ者にとって 効率よく学ぶことが大切と感じています。
日々が進化している中で「②項から③項について」薄く広く早く頑張りたく感じています。


今日の日記は 統計の猿が投稿しました。