〈結果〉の大きさ(サイズ)の問題は、関連の統計的有意さ(通常P値または信頼区間として表現される)のそれとはまったく別のものだ。P値とは、発見が偶然に帰せられる確率の尺度であり、それはサンプル集団のサイズを反映する。もし研究規模が十分大きければ、非常に〈小さい結果〉であってもかなり確かかも知れない。逆に、研究規模の小さい研究では、〈大きい結果〉でも偶然によるかも知れない。ところが、統計的に有意な結果でさえ、それでも間違っていることがある。それは、交絡変数のせいであったり、集団全体の偏りのせいであったりする。集団全体の偏りの一例としては、症例集団は対照集団より何かにさらされたことを思い出す可能性が高いという例が挙げられる。統計的に、有意性検定をしても、そういうものは排除できない。なぜなら、有意性検定では、単に、比較される集団をサンプリングする際の〈偶然の結果〉について処理するだけだからだ。疫学的研究には限界があるので、研究結果を解釈するのには警戒が必要だ。第一に、どんな研究成果も単一では最終的なものとして受けとるべきではない。非常に似通った数件の研究があっても、同一の交絡変数や気がつかない同一の偏りが全てに影響しているかもしれないので、同様の警戒をすべきだ。そうではなく、一つ一つの研究はパズルの中の一片として見るべきだ。対象集団も研究計画も異なる研究がよく似た結果を示せば示すほど、その結論を信頼することができる。そのような一致がない限り、疫学研究者はめったに発見したことに信頼を置かないし、置くべきでもない。第二に、強い危険因子は弱いものよりも本物である可能性が高い。強い危険因子の場合、交絡変数と偏りが状況を紛らわしくすることは少ない。その理由は、危険因子が隠されたり、実在しない危険因子があるかのごとく示唆されたりしないからだ。逆に、小さい危険因子の存在が、交絡変数と偏りによって隠されたり、間違って示唆されることは起きやすい。この理由のために、発見がこれまでにないもので予想もされていなかった場合、ほとんどの疫学研究者は3.0〜4.0より低い相対危険度には非常に懐疑的になる。相対的危険度がこれよりもっと低ければ、相当、確認作業が必要だ。もし発見が生物学的に妥当なら、〈弱い結果〉でも受け入れられる可能性は高まる。例えば、看護婦が患者の世話をした後、そのつど、自分の手を洗わない病院内で、患者が他の病院の患者より2倍感染したという研究結果が出たとしても、それは生物学的に妥当である。その結果が逆なら妥当ではなく、2.0の相対危険度はほぼ確実に、交絡変数または何か思いもよらない偏りのせいにされるだろう。
[おすすめサイト]
美容健康の手引き
ビューティーオンライン
アンチエイジングチャンネル