第13回 標準偏差をマスターしよう(1)標準偏差の本質はとても簡単
[ 2014年07月25日(金) ]
統計学を理解するために必要な基礎用語について、これまでの回でひと通り説明してきました。 用語の数々を覚えていただけたでしょうか? 統計学の専門家から見れば入り口にも立っていないように見えるかもしれませんが、これは十分な進歩です。
ここからは、基礎用語のおさらいをしつつ、数的データを扱ううえでとても重要な標準偏差と正規分布について、さらに詳しく学んでいきましょう。
まずは標準偏差の概念について説明していくことにします。
さっそくですがさくらさん、標準偏差とはどのようなものだったか覚えていますか?
『はい、データにはバラツキがあって、そのバラツキの度合いを把握するためによく利用される代表値が標準偏差です。』
そう、その通り! 読者の方で、もし覚えていない場合は、第11回を読み返してみてくださいね。
それでは、世界で一番わかりやすい標準偏差の説明を始めましょう。
統計学は、平均値の学問であると言う人がいます。 確かに、統計のさまざまな概念は、平均値を中心にして考えると、非常に説明しやすいのです。 ここで解説する標準偏差も、この平均値を中心にした考え方です。
大部分の統計の解説書では、標準偏差の算出方法を教えるために数式を使って解説しています。 しかし、たとえば、ドクターが臨床研究論文を読むときにそんな計算式はまったく必要ありません。 難しい計算は研究者がすでにやっていて、その結果を見るだけだからです。
ここで大事なことは、標準偏差の算出方法ではなく、標準偏差とは一体なんだろう? という理解に尽きるのです。
繰り返しになりますが、データにはバラツキがあり、そのバラツキの度合い、言いかえればデータの広がりを把握するためによく利用される代表値が標準偏差です。
すでに学んだように、代表値とは、平均値や最大値など、たくさん集めたデータをひとつの数字で表現するものですが、標準偏差も同じことです。 ただ、バラツキの度合いやデータの広がりといった、なんとなくムズムズするあいまいな表現が、わかりにくくさせているだけなのです。
次の図を見てください(図1)。
唐突な例ですが、これはある試験を行い、その得点の分布を示したものです。
Y軸が得点で、X軸が受験者でAさんからGさんまで、7人が受験しています。 そして、×印が7人それぞれの得点を示しています。 真ん中の横線は平均点で、その周辺にそれぞれの点数が散らばっているのがわかるでしょうか。 そして、それぞれの×印から平均点の線に向かって点線を引いてみることにします。 すると、何かが見えてくるはずです。
『う~ん。よく見ると何かが浮かんでくるんですか?』
違います……。 点線に注目してみてください。
この点線はA~ Gさんのそれぞれの得点と平均点との距離、すなわち、各データのバラツキを示しています。 平均点を中心にした点線の長さを見ると、長さがずいぶん違いますね。 これが、それぞれの点数のバラツキの度合いというやつです。
この点線にあたる部分を統計学では偏差と呼んでいます。
『偏差……ですか?』
はい。そして、この偏差は、データの数だけ存在します。 今回は、7人の点数ですが、数万人が受ける試験ならば、数万人分の偏差が存在するわけです。
ここで、さくらさんに質問です。 この偏差は、代表値ですか?
『代表値は、平均値とか、たくさんのデータをひとつの数字で代表させるものですよね。偏差は、データの数だけあるわけですから、代表値ではないですね。』
その通り!! 偏差は代表値ではありません。 そこで、このたくさんある点線、偏差の長さをひとつの数字で代表させたいと思うのですが、どうすればいいでしょうか。
『ん!? なんだか、わかってきたぞ、この偏差の平均をとればいいんじゃ……!?』
どうやら、さくらさんは、ピンときたようですね。 さくらさんの言う通り、代表値の代表格、平均値を出してみればよいのです。 何を隠そう、標準偏差とは、ここにある点線の長さの平均値のことを指しているのです(図2)。
ここで、先ほど申し上げた「統計は平均値の学問」という言葉を思い出してください。
このように、平均値という代表値がなければ偏差は出せないし、平均値の考え方がなければ、偏差から標準偏差も導き出せません。
統計学は平均値の学問であるという意見も納得できたのではないでしょうか。
もしかすると、標準偏差がこんなに単純なはずがないと疑っている人もいるかもしれません。 しかし、安心してください。 標準偏差の本質は、さきほど説明した通りです。 ただ、実際にデータから標準偏差を算出するときに、少し手の込んだことをする必要があるだけなのです。 そのことについては、次回、詳しく説明することにしましょう。
出典:世界一わかりやすい。医学統計シンプルスタイル プラス
医学系出版社SCICUS(サイカス)の書籍
実際の臨床研究を題材に、論文吟味のポイントを踏み込んで解説
ドキドキワクワク論文☆吟味。医学統計ライブスタイル (\2,940)
大手新薬メーカーのMR研修資料も多数手がける、サイカスの新書
新人MRマニュアル (\1,500)