第9回 統計の基礎用語をマスターしよう!(4)母集団を代表する標本とは?
[ 2014年05月15日(木) ]
前回は、母集団と標本、サンプリングといった、データを集める際に重要な基礎用語について解説しました。
標本をサンプリングする際に、本当に母集団を代表しているかどうかが大切だということを覚えていただけたでしょうか。 今回は、このことについて、もう少し掘り下げます。
ちょっとここで、さくらさんに質問をしてみましょう。
たとえば、次のケースでは、標本は母集団をきちんと代表しているといえるかどうか、考えてみてください。
成人女性について、食習慣がしっかりしている女性は便秘になりにくいのではないかと考え、便秘と食習慣の関係を調査することにしました。 この場合、成人女性全体が母集団となると考えられます。 そこで、食材や栄養、食習慣に対し高い意識を持っていると考えられる栄養士の成人女性を標本として抽出しました。
『え〜と、栄養士も成人女性なんですよね。だったら問題はないような…。』
そう来ましたか。
『いや、待ってください!この標本は、母集団をきちんと代表しているとはいえないと思います!』
ほう、それはどうしてですか?
『栄養士が成人女性だったとしても、成人女性全体が栄養士なわけはないですし、栄養士と同程度の食材に関する知識や意識を持っているとも考えにくいです。 だから、成人女性全体という母集団の標本としては適していないんじゃないかなぁ。』
その通りですね。 この便秘と食習慣の関係の例のように、標本が偏っていて、目標とする母集団を忠実に反映していない場合があります。
このような偏りを、バイアスと呼んでいます。
バイアスにもいろいろありますが、これをできる限り排除することが、推論統計では非常に重要になるのです。
たとえば、数千人を対象に、長期にわたって調査研究を行う大規模臨床試験があったとします。 標本の数が大きくなれば、それだけ母集団に近くなり、より正確に母集団の姿が推定できるはずです。
しかし、実際にはサンプル数が多くなるにつれて、データ管理が煩雑になっていくでしょうし、そのせいでさまざまなバイアスが入りやすくなったり、測定の結果にバラツキが出たりするかもしれません。
大規模臨床試験の成否は、最初のサンプリングをしっかり行うところにかかっています。
『素朴な疑問なんですが、大規模臨床試験っていいますけど、どの程度から大規模になるんでしょうか?』
おお、鋭い質問ですね。 ちなみに、さくらさんが担当されている治験の場合は、大体どの程度の規模なんでしょう?
『第Ⅰ相試験の目的で、健常人のボランティア十数人から50人程度の規模でしょうか。 第Ⅱ相試験は治験薬が対象となる少数の患者さんで、前期試験では50人程度、後期試験では100人以上かな。 第Ⅲ相試験は治療薬の対象となる患者さんで、通常約200人以上だと思います。』
ありがとうございます。
一般的には、数千人規模を対象にしている臨床試験を大規模臨床試験と呼んでいるようですが、想定される母集団の大きさにも関係してきます。
たとえば、患者数が非常に多い病気に関する臨床試験と、患者数が非常に少ない珍しい病気の臨床試験は同じ土俵では比べられませんね。
患者1億人のうちの4,000人と、患者1万人のうちの400人の臨床試験を比べれば、圧倒的に、後者の方が大規模な臨床試験ともいえるわけです。
『なるほど。これも、母集団と標本の関係ですね。おもしろいですね。』
その通りです。
繰り返しますが、この連載の目的は、研究する立場ではないけれど、治験に深くかかわっている臨床開発モニターの皆さんが、「治験実施計画書」や治験の正しさを支えている統計学を理解することにあります。
第Ⅲ相試験は治療薬の対象となる患者さんで、通常約200人以上ということでしたね。 第Ⅱ相試験より人数が多い設定されている背景には、より多様な患者さん、言いかえれば広く異なる病態の患者さんが含まれるようにという考えがあることがわかります。
皆さんは、これから治験で扱われている標本が、きちんと母集団を代表しているかを意識するようになるはずです。
『はい。』
研究者は公正な結果を出すために、データのバラツキやバイアスが出ないように努力しています。
それを見極めるための第一歩が、この母集団と標本の関係をしっかりと理解することなのです。
さて、前回と今回はデータを集める際に登場する基礎用語とその重要性について解説してきましたが、次回からは、データを集めたあとの話題に移ります。
集めてきた膨大なデータをいかにわかりやすく整理するか、基礎用語とともに紹介していくことにしましょう。
——(チャレンジ問題)——————
問1 次の例では、標本は母集団をきちんと代表しているといえるでしょうか?
成人女性について、食習慣がしっかりしている女性は便秘になりにくいのではないかと考え、便秘と食習慣の関係を調査することにしました。この場合、成人女性全体が母集団となります。 そこで、40 代の主婦で構成された近所のママさんバレーチームを標本として抽出しました。
問2 次の文章の〔 〕内にあてはまる言葉を答えてください。
問1の便秘と食習慣の関係の例のように、標本が偏っていて目標とする母集団を忠実に反映していない場合があります。このような偏りを〔 〕と呼んでいます。 〔 〕にもいろいろありますが、これをできる限り排除するのが、推論統計では非常に重要になるのです。
————————————————— 解答
問1 答え.いえない 年齢層を40 代に限定しては、成人女性全体という母集団の標本としては不適と考えられます。
問2 答え.バイアス
出典:世界一わかりやすい。医学統計シンプルスタイル プラス
医学系出版社SCICUS(サイカス)の書籍
実際の臨床研究を題材に、論文吟味のポイントを踏み込んで解説
ドキドキワクワク論文☆吟味。医学統計ライブスタイル (\2,940)
大手新薬メーカーのMR研修資料も多数手がける、サイカスの新書
新人MRマニュアル (\1,500)
お知らせ
年末年始休業中のお問い合わせについて
CRAお役立ちコンテンツ
Answersとは
Answersは製薬業界専門の転職サイト。長年の実績と製薬企業各社との太いパイプを活かし、製薬業界の求人を豊富に取りそろえています。
Answersは東証プライム市場上場の(株)クイックが厚労省の許可を受けて運営しています。