第15回 標準偏差と正規分布の関係を知ろう (1)正規分布の見方
[ 2014年09月11日(木) ]
前回まで、標準偏差の本質や算出法について、詳しく説明してきました。
標準偏差は、数的データを扱ううえで非常に重要なものだということを何度も書いて来ましたが、これからの説明を読んでいただければ、その重要性をさらに実感してもらえると思います。
読者の皆さんは、下の図のような分布のことを覚えていますでしょうか?
代表して、新人CRAのさくらさんに答えてもらうことにしましょう。
『これは、正規分布ですね。』
その通り、これは正規分布です。 さすが、しっかり覚えてくれていましたね。
『えへっ、モニターの鑑でしょう!』
……そこまでは言ってません。
さて、この分布になるデータの種類は、数的データであることはすでに学習しました。 身長や体重などはもちろん、多くの医学データはこの正規分布を描きます。
では、この正規分布の特性をより詳しく見ていくことにしましょう。 なんといっても、この正規分布が一番身近で一番基礎となる分布ですから。
医学論文では、この正規分布にまったく関わらないものはまずありません。
そういわれても、今ひとつピンとこない人が多いかもしれませんが、とにかく、医学統計を学ぶうえで最も大事な分布は、正規分布である、ということをしっかり頭にインプットしてください。 ここからは、理論的な解説はとりあえず横において、正規分布の持つ特徴を覚えることに専念しましょう。
正規分布の特徴の一部を列挙します。
1.釣り鐘型をしている 2.中心の線は平均値である 3.平均値の両側は対称である
これらは、グラフの見た目からも何となくわかる特徴ですね。
次の図6を見るとわかるように、正規分布は、中心の平均値が増えると右側に移動し、平均値が減れば左側に移動します。
中心の線が平均値だから当然の話ですが、大事な特徴のひとつです。
また、平均値が変わらずに、データの幅が広がると平坦な形になりますね。逆に、広がりが少なければ鋭くなります(図7)。
ところで、さくらさん、つかぬことをお伺いしますが……。
『はい、なんでしょう?』
あなたは、理屈がわからないと先に進めないタイプですか?
『いきなり、何の質問ですか? えーと、どちらかといえば、あまり深く考えない方ですね。とりあえず、受け止めるタイプというか……、一体何の話ですか?』
えーと……ちょっと安心しました。
実は、これから説明する正規分布の特徴は、ここまでの正規分布の特徴のように、見れば納得できるものではないのです。 もし、読者の皆さんの中に、探究心が旺盛で理屈がわからないと先に進めない人もいるとなると、難しい数式を使わずに説明するのが難しくなってしまうのですよ。
『なるほど。じゃあ、探究心旺盛なので、理屈がわからないと先に進めません。』
「じゃあ」って……。
『えへへ、ごめんなさい。説明は易しいほうがありがたいです。』
……わかりました。 心を強く持って、解説に難しい数式を使わないことにします。
それでは、正規分布の非常に重要な特徴である、正規分布における標準偏差の役割について解説しましょう。
これまでに説明しましたが、標準偏差はデータの広がりを示しています。 この広がり具合をビジュアル化したのが、正規分布の形というわけです。
標準偏差は平均値を中心にした偏差の平均ですから、正規分布では、平均値をまたいでプラスとマイナスに存在することになります。
では、この正規分布の中で標準偏差はどんな役割をしているのでしょうか? 図8の塗りつぶし部分を見てください。
SDという文字は、標準偏差のことでしたね。
実は、正規分布では、平均値を中心にして存在する標準偏差の間に、どれだけのデータが存在するかが理論上決定されています。
ここで、皆さんに覚えてもらいたいことは、この標準偏差の範囲には、全体のデータの約68%が入るということです。 これは非常に重要な正規分布の特徴です。
なぜそうなるのかは考えないで、ただ、こういうものなのだと覚えてしまいましょう。
データの広がりを示す代表値、標準偏差を基準にすると、正規分布の広がりを把握するのに非常に具合がよいのです。
『そうなんですね。』
はい。実は、まだまだ標準偏差の範囲と正規分布の特徴の関係には法則があるのですが、それは次回説明することにしましょう。
ひとまず、正規分布での標準偏差の範囲には、全体のデータの約68%が入るということを覚えておいてください。
出典:世界一わかりやすい。医学統計シンプルスタイル プラス
医学系出版社SCICUS(サイカス)の書籍
実際の臨床研究を題材に、論文吟味のポイントを踏み込んで解説
ドキドキワクワク論文☆吟味。医学統計ライブスタイル (\2,940)
大手新薬メーカーのMR研修資料も多数手がける、サイカスの新書
新人MRマニュアル (\1,500)