標準偏差とは
標準偏差って何?
標準偏差
分散(偏差を2乗した値の平均値)の平方根のこと。
この値が大きいと収集したデータの「散らばり具合」が大きいということである。
逆にこの値が小さいと、収集したデータの平均値前後にデータが集中していることになる。
日常的にはテストの点数など、データによってばらつきのある現象の散らばり具合を知るために利用する。
例えばある試験でクラス全員が同じ点数であった場合はデータにはばらつきがないため標準偏差は0となり、逆に0点から100点までの生徒がいた場合は標準偏差は大きくなる。
分散とは
標準偏差は分散の平方根ということでまずは分散から見ていこう。
分散とはデータが標本平均からどれだけ散らばっているかを示す指標のこと。
個々のデータと平均値の差を求め、値をそれぞれ2乗し、それらを合計したものをデータの個数で割ることによって求められる。
例えばA、B、C、D、Eの5人の生徒がいたとする。
それぞれのテストの点数がA:60点、B:55点、C:85点、D:70点、E:40点であった時、平均点は(60+55+85+70+40)÷5=62となる。
さらにここから各データから平均点を引いた数を2乗してそれらを足していく。
つまり
(60-62)^2+(55-62)^2+(85-62)^2+(70-62)^2+(40-62)^2
=(-2)^2+(-7)^2+ 23^2+12^2+(-18)^2
=4+49+529+144+324=1050
※「^2」と書かれている部分は2乗の計算をしているということ
最後にこれをデータの個数で割ると1050÷5=210となる。
つまりこのテストの分散は210ということだ。
このテストは平均点よりも10点以上離れた点数を取っている人が3人。
そのうち1人は20点以上も平均点から離れているため、やや分散が大きいという結果となった。
もしこれがA:60、B:55、C:65、D:57、E:63のように5人の点数が比較的近い数字だったらどうなるだろう。
平均点は(60+55+65+57+63)÷5=60であり、分散は
(60-60)^2+(55-60)^2+(65-60)^2+(57-60)^2+(63-60)^2
=0^2+(-5)^2+5^2+(-3)^2+3^2
=0+25+25+9+9=72
したがって分散は72÷5=14.4となる。
このように5人の点数が平均点付近に固まっていると分散は小さくなる。
標準偏差を求めよう
さて分散の求め方を説明したところでいよいよ標準偏差を求めよう。
先ほどの1番目の例でいくと、分散は210であったため、分散はその平方根、つまり√210ということになる。
これを小数で表すと√201≒14.49となる。
2番目の例でいうと、√14.4となり、これを小数で表すと、√14.4≒3.8となる。
このように分散も標準偏差も、各個人ごとの得点のばらつきが大きいほど、大きくなる。
標準偏差が14.49、3.8と出たが、皆さんにはどちらの数字が一般的だと思うだろうか。
例えば普段のテストでは、標準偏差はどれくらいになると予想されるだろうか。
やはり3.8のほうが多少イメージしやすいので、3.8のほうが普通と感じるだろうか。
一般的にはテストの標準偏差は15~20くらいに収まることが多い。
そのため先ほどの例でいえば1番目の数字のほうが標準偏差としてリアリティのある数字なのである。
「ワードサーチ」は日常雑学・各種専門用語や業界用語などの意味を初心者にも分かる様に解説している用語集サイトです。
IT用語、お金・投資用語、ビジネス用語、日常雑学用語等を調べる際にご活用くださいませ。