Powered By Blogger

統計学とは

統計学(Statistics)は、散らばり・バラツキのあるデータから、数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす学問。 実際には、コンピュータを用いて分析します。本講では表計算ソフトEXCEL,統合型統計解析ソフトSPSSで分析します。

統計学の基本概念
<母集団と標本>
統計的なデータ(簡単にいえば、情報や資料)を有する対象の情報(人の判断・意思を左右・決定させるすべての事象)を得たいとき、その全部全体を母集団(population)といい、母集団から抽出された一部を標本(sample)という。母集団の情報を得るときに、標本調査を行い、母集団を評価したりする。ただし、標本から得た情報が必ずしも母集団の特徴を反映しているとは限らない。
母集団を正しく知るためには、すべてのデータについての調査が必要となる。これを全数調査と呼び、国勢調査が良い例である。全数調査は、確かに母集団を把握する上で、確実な方法といえるが、これには多くのコストと時間を費やす必要がある。たとえば、缶詰を製造している会社が不良品がないかどうかを調査するとき、生産するすべての缶詰を開けて確認するようなことはしない。できない。これには、ランダムによりサンプリングされた商品について調べる。これを標本調査という。
できるだけ母集団を、一部の標本より評価したいという試みが統計学において重要である。
そのため、標本抽出(sampling)は、無作為(random sampling)に行われる必要があり、偏りを生じてはならない。しかし、たとえば母集団の平均(母平均という)が、標本平均と必ずしも一致しているとは限らない。このような誤差を標本誤差という。これに対して、偏った標本抽出において、母平均と標本平均などが一致しないことを非標本誤差という。標本誤差は統計的にその大きさを評価することができるが、非標本誤差は統計的評価が不可能である。では、これらの集団をどのように評価するのでしょうか?これには主に、平均と分散が利用されます。平均で、集団を代表する数値とし、分散で集団の散らばりを知る。 
<母数と統計量>
母集団の統計学的指標として、母平均や母分散などがあげられる。これらを総称して、母数と呼ぶ。これに対して、標本の統計学的指標(標本平均や標本分散など)は統計量という。
基本統計量の代表値として
①標本)平均, 算術平均,相加平均:
すべてのデータの 値をたして個数nで割ったもの。 (x1+x2+x3+…+xn)/n
②幾何平均, 相乗平均 :す
べてのデータの 値をかけた値のn乗根。
③調和平均 :すべてのデータの 逆数をたして個数nで割ったものの逆数。 1/{(1/x1+1/x2+1/x3+…+1/xn)/n}
④中央値(メジアン):データのちょうど 真ん中の値。  
⑤最頻値(モード):データ数が最も 多い値。
がある。
散布度・散らばり・バラツキの統計量として、標準偏差、分散がある。

統計学は,大きく二つに分けることがでる。
統計学―記述統計学
      ―推測統計学
*記述統計学:母集団全体を調べることを目指して,できるだけ沢山のデータを集めてこれを整理し,そのデータだけの特徴を記述する方法について研究する学問。 簡単にいえば、平均を求めたり、グラフをつくり統計学。
*推測統計学:直接、母集団について調べることはしないで,母集団からランダムに抽出した標本を手がかりにして,この標本の特徴から母集団の特徴を推測する方法について研究する学。簡単にいえば、予測したり、検定をしたりする統計学。

0 件のコメント:

補講課題資料のダウンロード