医学界新聞

臨床研究・疫学研究のための因果推論レクチャー

連載 後藤 温,井上 浩輔,杉山 雄大

2021.05.10 週刊医学界新聞(通常号):第3419号より

 第1回は実現可能な研究デザインの考え方について解説しました。今回は因果推論の考え方を紹介します。

 因果推論とはそもそも何なのでしょうか? 一般に臨床研究で行う因果推論とは,集団において曝露や治療・介入が健康に及ぼす効果(因果効果と呼ぶ)を推測するアプローチを指します。あまりピンとこないかもしれませんが,医学において因果推論と密接に関係する概念として,Evidence-Based Medicine(EBM:エビデンスに基づく医療)があります。EBMを実践している臨床家にとって,「エビデンス」は比較的身近な言葉のはずです。では,「エビデンスとは何か?」という問いに対して皆さんは,どのように回答されるでしょうか。

 議論しやすいように,治療や介入に関するエビデンスに限定して話を進めていきます。『広辞苑 第7版』によると,エビデンスとは,「証拠。特に,治療法の効果などについての根拠」とあります。治療法の効果とは,当該治療法がアウトカムに及ぼす因果効果のことです。つまり,EBMの実践において私たちは,個々の論文を批判的に吟味して治療や介入について因果推論を行い,患者に適用できるかどうかを検討しているのです。

 ここで,糖尿病患者における保健指導が末期腎不全の発症リスクに及ぼす因果効果を例に考えてみましょう。例えば,2型糖尿病のある40歳男性Aさんが保健指導を受けず,腎症が進行して5年後に末期腎不全になったとします。タイムマシンがあれば,Aさんが40歳だった時に保健指導を受けてもらい,5年後に末期腎不全を発症するかを観察することで,Aさん個人に保健指導を行うことが末期腎不全の予防に有効であるかを評価できます。しかし,時間を巻き戻すのは現実的に不可能なので,Aさん個人を対象に保健指導の因果効果を推定することはもちろんできません。そこで通常は,集団レベルでの因果推論を行うことになります。

 先の事例では,保健指導を受けた人たち(曝露群)と受けなかった人たち(対照群)を比べて,それぞれの群の末期腎不全の発症割合(リスク)を比較します。すると,集団レベルでの因果効果の推定に一歩近づくことができるのです。この研究デザインをコホート研究と呼びます(図1)。

3419_0401.png
図1 保健指導を受けた曝露群と受けなかった対照群における末期腎不全発症割合(リスク)を比較するコホート研究の例

 少し脱線しますが,このように比較対照を置いて因果効果を推定することの重要性は古くから認識されていたようです。旧約聖書のダニエル書には,野菜食と水を10日間与えた群と,王が食べている肉とワインを10日間与えた群とを比較すると,野菜食と水を与えた群のほうが健康状態が良かったというエピソードが記されています。日本では,明治時代に海軍軍医であったたかかねひろが軍艦上での食事として,白米を中心にした群(白米群)と麦飯を中心とし野菜などを取り入れた群(麦飯群)とを比較し,麦飯群で脚気のリスクが低かったと報告したことが有名です。

 しかし,コホート研究などのランダム化を伴わない比較研究では,第1回でも紹介したバイアス(特に交絡)が問題となります。例えば,保健指導あり群のほうが,保健指導なし群よりも若くて健康的だったとしましょう。その場合,保健指導あり群における末期腎不全リスクが低いのは,年齢や健康的な食生活によるもので,保健指導を受けたかどうかとは関係ないかもしれません。このように曝露の有無以外にも,曝露群と対照群との間の差異が交じってしまい,曝露と疾病が見掛け上相関してしまうことがあります。この現象を「交絡」と呼びます。

 交絡の問題への対処法は,20世紀後半に統計的因果推論の枠組みで理論的に確立されました。学者・分野による考え方の違いもいくつか存在しますが,本連載では,米カリフォルニア大ロサンゼルス校教授のJudea Pearlによる因果推論の枠組み1~3)を中心に説明していきたいと思います。

 一般的に因果推論においては,反事実(counterfactual)的に同じ状況で曝露があった場合/なかった場合を比較し,曝露の有無による結果の違いを効果としてとらえます。このような反事実的な比較を観察したデータで行えるのかどうかを考えるためには,変数間の関係をよく知ることが重要です。例えば,先ほどの糖尿病患者における保健指導の事例ですと,Directed Acyclic Graph(DAGダグ)を用いて,図2のように描けます(DAGは次回,詳しく説明します)。現実はもっと複雑ですが,今回は図2のように,保健指導と末期腎不全に影響を与える他の因子が存在しないと仮定します。

3419_0402b.jpg
図2 保健指導の有無と末期腎不全の影響をDAGから考える
年齢と生活習慣で条件付けた上で,保健指導の有無から末期腎不全リスクを比較すると,年齢や生活習慣の影響を受けない「仮想的な介入」と見なすことができ,因果効果を正しく推定できる。

 まず,観察したデータで保健指導の有無を「仮想的な介入」の有無と見なせるか否かを考えます。集団全体で見ると,年齢や生活習慣の差異により保健指導を受けるか否かの判断が異なり,また末期腎不全の発症リスクにも違いがあるでしょう。そのため,単に保健指導の有無による末期腎不全リスクを比較しても,年齢や生活習慣による差異が結果に影響を与えてしまい(交絡),保健指導の有無は「仮想的な介入」の有無とは見なせない,と考えられます。

 では,40歳で同じ生活習慣を有する集団に限定すると,どうでしょうか? この場合,保健指導あり/なし群における年齢や生活習慣の差異がなくなります。そのため保健指導の有無による末期腎不全リスクを比較すると,年齢や生活習慣による影響を受けず,「仮想的な介入」の有無による結果を比較していると見なせることになり,因果効果を正しく推定することができます。このように交絡をもたらしている原因と結果の双方に関連する要因(図2の例では年齢と生活習慣)が等しい集団に限定することを「条件付け」と呼び,因果推論の基本となる方法の一つです。一方で,40歳でない,または同じ生活習慣を有さない集団における因果効果は今回推定したものと異なる可能性があるので注意が必要です。詳細は別の回で解説します。

 今回取り上げたシナリオはとてもシンプルですが,ランダム化を伴わない研究データ(観察研究等)においても,統計的に「仮想的な介入」の有無を比較する状況を作り出すことにより,因果推論が可能となることを紹介しました。しかし実際の研究では,このような状況を作るための因子を選択するのはけっこう難しいものです。そこで次回は,条件付けを行うべき因子を検討する際に有用なツールであるDAGについて詳しく説明していきます。


謝辞:横浜市立大学の田栗正隆教授にご助言をいただきました。心より感謝申し上げます。

1)林岳彦,他.相関と因果と丸と矢印の話――はじめてのバックドア基準.岩波データサイエンス vol. 3.岩波書店;2016.pp28-48.
2)Pearl J, et al. Causal Inference in Statistics:A Primer. Wiley;2016.
3)Pearl J, et al. The Book of Why:The New Science of Cause and Effect. Allen Lane;2018.