統計 学習メモ

何かと必要になってきそうなので勉強をはじめるついでにメモ

 

データの整理 (記述統計学)

ある実験や、調査によって得られたデータの特性をとらえやすくするための整理手法。

測定尺度

 データには、いくつかの種類があり、そのデータの形によっては実施することができる計算や、統計的手法が異なる。

1.量的データ

 数値で表すことの出来るデータのこと。(℃,cm,gなど)

2.質的データ(カテゴリーデータ)

 数値で表すことの出来ないデータ。(感想、性別、住所、IDなど)

 

量的データは、ある単位で表されている数値なため足し算や、平均など計算を行う事が出来る。一方、質的データは男.1 、女.2などのようにそれぞれに数値を与えることはあるが、それぞれを計算に使うことはできない。可能なことは、それぞれの数をカウントすることくらい。

 

度数分布表とヒストグラム

度数分布表やヒストグラムを作成することで、ある大量のデータを手に入れたときそのデータを直感的にそのデータの特性をつかむことが出来るようになる。

 ざっくりデータ。


値段(円)
ラーメン屋1 700
ラーメン屋2 850
ラーメン屋3 600
ラーメン屋4 650
ラーメン屋5 980
ラーメン屋46 890
ラーメン屋47 930
ラーメン屋48 650
ラーメン屋49 777
ラーメン屋50 700
合計 37147

 

 

度数分布表

         
以上 未満 階級 (以下) 度数 相対度数
500 600 550 599 4 8
600 700 650 699 13 26
700 800 750 799 18 36
800 900 850 899 12 24
900 1000 950 999 3 6
           

 

階級 ・・・あるデータの範囲
階級値 ・・・階級にあたえられた値
度数 ・・・あるデータの範囲に入っているサンプル(標本)の数
相対度数 ・・・データ全体の数に対する度数の割合のこと
       全体を1としたときの割合

 

度数の計算をExcelで算出する場合、関数のFREQUENCY()を使う。

 

ヒストグラムは、棒グラフのこと。階級に対する度数の値や、相対度数の値から作成するとそれぞれの階級がどんな関係なのかを見やすくなる。

今日は、ここまで。

思ったよりも編集が大変だな・・・。画像とかはれないのかなぁ。