第14回 標準偏差をマスターしよう(2)標準偏差の求め方
[ 2014年08月19日(火) ]
統計学は平均値の学問とも言え、データのバラツキの度合いを把握するために用いられる標準偏差は、データの数だけ存在する偏差を平均したものだということを前回、説明しました。
統計学においてとても重要なものである標準偏差の本質について、理解してもらえたかと思います。
今回は、実際にデータからどのように標準偏差を算出するのか、その方法を紹介しましょう。
『たしか、少し手のこんだことをする必要があるんですよね。』
おお、新人CRAのさくらさん、前回の言葉を覚えていてくれましたか。 では、さっそく、「少し手のこんだこと」が必要な理由も含めて、説明していきますね。
まず、次のグラフ(図3左)を見てください。 これは前回出てきたグラフと同じく、ある試験での得点分布を示したものです。今回のものは実際の点数を書き入れています。
それでは、このグラフの中の数字を使って、標準偏差を求めていくことにしましょう。
基準となる平均点は50点ですから、それぞれの点数を50から引いたものが、この点線の長さになります。
図3の右側は、その計算結果になります。
これで、それぞれの点線の長さ「偏差」の数字が出たことになります。
先ほど、標準偏差は、この点線の長さの平均値だと説明しました。 それでは、これらの数値を使って平均値を出してみることにしましょう。
平均値を出すには、まずすべてのデータを加えなければなりません。 さくらさん、これらの数字をすべて加えていただけますか?
『いいですよ。えーと……あれ?』
どうしました?
『全部足したら、ゼロになってしまう気がするんですが……。』
はい、その通りです。実はすべての偏差を加えると、必ず0になってしまうのです(図4)。
『待ってください! これじゃ、平均を出せないんじゃないですか?』
確かに、これでは平均値を出すことができません。 そこで、プラスとマイナスが相殺しないように加えるにはどうしたらよいかを考えることにするのです。
『つまり、少し手のこんだことをするんですね。なんだろう……あ、2乗すればマイナスもプラスになりますよね!』
おお、さくらさん、鋭いですね。 昔の偉い統計学者も、各データを2乗することを考えたのです。 それぞれのデータを2乗すれば、すべての点線の長さ(偏差)をプラスに変えることができますね(図5)。
『はい。でも、いちいち計算するのは、少しではなく、けっこう手のこんだことのような……。』
そうですね、でも、電卓でもエクセルでもかまいません。小難しい計算はすべてコンピュータに任せればよいのです。
『あ、そうですね!』
コンピュータによれば、先ほどのデータを2乗して加えると3300になるようです。
ここで出た3300という数値を、加えたデータの個数7で割ると、3300/7=471.4285……という数字が出てきます。
しかし、これで、点線の長さの平均が出た!! と思うのはあせりすぎです。471という数字を見ただけでも、数字が大きすぎることがわかるでしょう。
この数字は2乗してある数値ですから、この数値のルート、平方根を取る必要があるのです。
では、さくらさん、471.4285……のルートを計算してください。
『ええっ? いきなりそんなことをいわれても困りますよ!!』
まだまだ、頭が固いですね(笑)。 ルートの計算方法は簡単です。
『そうか、パソコンとか電卓を使えばいいんですね。』
はい。ルート計算機能が付いている高機能電卓をお持ちなら、数値を打ち込み、√と書いてあるボタンを押せばいいんです。
『私の電卓には…√ボタンがありました。……ええと、電卓によると、先ほどの計算結果471.4285……のルートは…と、21.7124……になりますね。』
ありがとうございます。 これが、この試験結果の標準偏差ということになるわけです。
最近は、スマホの計算機を使う人も多いでしょう。普通の計算機には、ルート計算機能がないものが多いと思います。
その場合は、Googleの検索ボックスに数式や単位変換を入力すると、瞬時に回答が出てきます。例えば、√5で検索してみてください。答えとルート計算機能もついている電卓が表示されるはずです。
ざっと以上のような手順で、標準偏差は算出されるわけですが、特に難しいと感じるところがあったでしょうか?
『いえ、意外と単純でした。』
そうでしょう!? ただ、繰り返しになりますが、単純とは言っても、標準偏差は、数的データを扱ううえで非常に重要な概念です。 それは、次の回でとりあげる「正規分布の見方」で、より実感することになると思います。
数的データ特有の正規分布の特徴とあわせて、標準偏差の特徴をより深く学習していきましょう。
出典:世界一わかりやすい。医学統計シンプルスタイル プラス
医学系出版社SCICUS(サイカス)の書籍
実際の臨床研究を題材に、論文吟味のポイントを踏み込んで解説
ドキドキワクワク論文☆吟味。医学統計ライブスタイル (\2,940)
大手新薬メーカーのMR研修資料も多数手がける、サイカスの新書
新人MRマニュアル (\1,500)