第7回 統計の基礎用語をマスターしよう!(2) 質的データを見極める
[ 2014年04月03日(木) ]
前回は、統計に関する最低限の基礎用語として、まず、データについて説明しました。
データは、統計学にとって絶対に欠かせない要素であり、それを利用するにはどんな性質のものであるかを見極めることが必要だということを覚えていただいてますでしょうか。
そして、データはまず大きく2つに分けられることを話しましたが、その2つとは、何と何だったでしょう。 さくらさんに聞いてみましょう。
『数であらわすことができる数的データと、数ではあらわせられない質的データですよね。』
さすが! しっかり覚えていてくれましたね。
『はい! ええと、質的データは、性質の異なるものを分類、集計したもので、さらに2つに分けられるんですよね。』
そうです。今回は、この質的データについて、さらに詳しく話をすすめていきましょう。
たとえば、血液型と患者の満足度、これらはどちらも質的データですが、異なった特徴を持っています。 血液型は4種類で、それぞれにA、B、O、ABという名前がついています。 当然ですが、この場合、A型がB型よりえらいとかO型よりAB型が優れているとかいう順序関係はありません。
『わたしは彼氏にするならA型の人と相性がいいそうです…。』
おお、わたしはA型ですよ!
『本当ですか?』
…って、根拠のない相性の話で、説明をややこしくしようとしてませんか?
『す、すみません…。』
とにかく、血液型のように、順序関係がなくて、ただ名前がついている質的データを、名義尺度のデータと呼んでいます。
このような名義尺度のデータに対して、患者満足度のような質的データは、また異なった特徴を持っています。
患者満足度は、たとえば(1.非常に満足 2.満足 3.普通 4.不満 5.非常に不満)のようにあらわされますよね。 これらの各要素には順序関係があるのがわかるでしょう。
このように、各要素に何らかの順序関係がある質的データを、順序尺度のデータと呼んでいます。
ちなみに、質的データなので、この順序関係は数値的な関係ではありません。
ここまでで、データには、大きく分けて数的データと質的データの2種類があることがわかりました。 そして、質的データは、名義尺度のデータと順序尺度のデータに区別できることもわかりました。
『はい。ところで、これらのデータの種類を覚えると、具体的にどんないいことがあるのですか?』
それは後でのお楽しみ…といいますか。
たとえば、臨床試験の医学論文では、検定などのさまざまな難しい統計処理がなされていますが、データの種類によって使うべき処理が変わってきます。
その論文で集められたデータがどんな性質のものなのかに注目すると、その後の理解がしやすくなるというわけなのです。
繰り返しますが、データは、統計学に絶対に欠かせない要素です。
実は、数的データもさらに細かく分類することができるのですが、ここでは触れないでおきます。 というのも、次回以降では、数的データを中心に統計の基礎用語を解説していくため、おのずと理解できるようになるからです。
–(チャレンジ問題)———–
質的データを見極めてみましょう。次のデータの尺度はなんでしょうか?
問1 性別(男/女)
問2 病気の重篤度分類(重症、中等度、軽症、疾病なし)
問3 痛みの強さ(高度、中程度、軽度、痛みなし)
問4 職業
問5 意見
–(解答)———–
問1 答え.名義尺度 性別は名義尺度です。アンケートや調査などで、男性は1、女性は2 にチェックをつけるときがありますが、この1 と2 は便宜上の表記に過ぎません。
問2 答え.順序尺度 順序尺度です。問6 の患者の満足度の例と同じ理屈です。
問3 答え.順序尺度 これは、順序尺度です。問9 の病気の重篤度分類と同じ例です。
問4 答え.名義尺度 たとえば、ドクター、薬剤師、MR などの職業間に順序関係はありません。
問5 答え.名義尺度 意見は、名義尺度です。すばらしい意見、悪い意見、さまざまな意見がありますが、統計的にはべつに順序があるわけではありません。
出典:世界一わかりやすい。医学統計シンプルスタイル プラス
医学系出版社SCICUS(サイカス)の書籍
実際の臨床研究を題材に、論文吟味のポイントを踏み込んで解説
ドキドキワクワク論文☆吟味。医学統計ライブスタイル (\2,940)
大手新薬メーカーのMR研修資料も多数手がける、サイカスの新書
新人MRマニュアル (\1,500)