医学界新聞

臨床研究・疫学研究のための因果推論レクチャー

連載 後藤 温,井上 浩輔,杉山 雄大

2021.07.05 週刊医学界新聞(通常号):第3427号より


 前回の解説では,DAGを用いて変数を整理した上で条件付けなどの調整を行い,「仮想的な介入」の有無を比較する状況を作り出せれば観察研究でも因果効果の推定が可能になると説明しました。今回は具体的に,因果効果をどのように推定するか解説します。

 一般に,個人の因果効果を求めることはできません。そのため私たちは,集団のデータを用いて因果推論を行います。具体的には,反事実的(counterfactual)に集団全員が曝露した(何らかの介入を受けた)場合としなかった(介入を受けなかった)場合のアウトカムを比較し,それら反事実リスクの差(因果リスク差,causal risk difference:因果RD)や比(因果リスク比,causal risk ratio:因果RR)1, 2)などの平均因果効果を推定します。平均因果効果の推定では,まず標的集団が集団全員か,実際に曝露を受けた人たちなど部分集団かを明確にする必要があります。そして,曝露とアウトカムを明確にすることも重要です。

 今回は,アスピリン投与を曝露,5年間の冠動脈疾患発生をアウトカム,冠動脈疾患既往が交絡因子の架空のシナリオ(表1)で説明します。標的集団は,冠動脈疾患既往の有無にかかわらず,3000人の集団全員です。

3427_0401.png
 アスピリン投与と冠動脈疾患発生のDAG
3427_0402.png
表1 観察された結果(架空のデータ)

 未調整のRDやRR(関連RD,関連RRと呼ぶ)によると,アスピリン投与と冠動脈疾患発生リスクとの正の関連が示唆されますが,因果RDや因果RRとは異なると考えられます。そこで,冠動脈疾患既往あり群となし群に層別するとアスピリン投与の有無を「仮想的な介入」の有無と見なせるようになり,冠動脈疾患既往ありの層となしの層のそれぞれを標的集団とする因果RDや因果RRを求められます3)。この層別解析の結果は,アスピリン投与により冠動脈疾患発生リスクが低下したことを示唆しています。

 では,集団全員を標的集団とする平均因果効果はどう推定できるのでしょうか。ポイントは,冠動脈疾患既往で層別すると交絡がないことです。初めに,集団全員にアスピリンを投与したときの冠動脈疾患発生リスクを考えます(表2)。ここでは,実際にはアスピリンが投与されなかった群で冠動脈疾患既往ありの人は200人,冠動脈疾患既往なしの人は2300人いますが,仮想的にアスピリンが投与された場合,そのうち何人が冠動脈疾患を発生したかについては「反事実」のため観測できていません。観測できていない数を表では「?」と表示しています。ヒントになるのは,実際にアスピリンを投与された冠動脈疾患の既往がある300人において30人(10%),冠動脈疾患既往のない200人では2人(1%)に冠動脈疾患が発生していたという「事実」です。この人たちがアスピリン投与という仮想的な介入を受けた場合も32人に冠動脈疾患が発生すると考えられます。

3427_0403.png
表2 仮想的に集団全員にアスピリンが投与されたときの結果(架空のデータ)

 冠動脈疾患既往ありの集団内では交絡がないので,実際にアスピリンを投与された人たちとアスピリンを投与されなかった人たちは,比較可能な集団と考えられ,アスピリンの投与以外の理由で冠動脈疾患発生のリスクは変わらないと考えられます。したがって,アスピリンを投与されなかった200人が仮想的にアスピリン投与の介入を受けたとしたら冠動脈疾患発生のリスクは10%で,20人(期待イベント発生数)に冠動脈疾患が発生しただろうと考えられます。

 なお,アスピリン🠔冠動脈疾患既往🠔(重症度)🠖冠動脈疾患発生の経路以外にも,開いたバックドア経路があるような場合には,異なる発生人数が考えられます(バックドア経路の説明は第3回参照)。

 同じように,アスピリン投与を受けなかった2300人が仮想的にアスピリン投与を受けた場合は,冠動脈疾患発生のリスクは1%(期待イベント発生数=23)と考えられます。観測データから,実際には観測されていないデータを考えた穴埋め(表で[数値]と記入)により,仮想的介入による表を作成できます。集団全員がアスピリンを投与されていた場合は,3000人中30+[20]+2+[23]=75人に冠動脈疾患が発生していたと考えられ,反事実リスクは75/3000=0.025と推定されます。

 次に集団全員がアスピリンを投与されなかった場合の結果を考えましょう。この場合も表3のように観測されていないデータを考えます。集団全員がアスピリンを投与されていなかった場合は,3000人中,[90]+60+[6]+69=225人に冠動脈疾患が発生していただろうと考えられ,冠動脈疾患発生の反事実リスクは225/3000=0.075と推定されます。

3427_0404.jpg
表3 仮想的に集団全員にアスピリンが投与されなかったときの結果(架空のデータ)

 集団全員がアスピリンを投与されたときの反事実リスクは0.025,集団全員がアスピリンを投与されなかったときの反事実リスクは0.075と推定されるので,因果RD=-0.050,因果RR=0.333(小数点第四位を四捨五入)となります。

 このように,観察データから反事実的データを考えて穴埋めすることで,反事実リスクを推定できます。これは,曝露群・非曝露群別に実際に観察したデータを交絡因子により層別してリスクを計算し,集団全員に占める各層の人数で重み付けて平均していることになります(下記)。この方法を,「層別解析に基づく標準化」3)と呼びます。

3427_0405.png

 今回は交絡因子の連続データではなく,層別解析ができるようなシナリオで因果推論の基礎を紹介しました。調整すべき交絡因子が複数の場合,特に連続変数を含む場合はそれらの組み合わせで層別化すると,対象者数が少ないもしくはゼロとなる層が出現し,層別解析が困難となります。

 次回以降,その対処法としても有用な,回帰モデルを用いた因果効果の推定を紹介します。


謝辞:ご助言いただいた岡山大学大学院の鈴木越治先生,横浜市立大学の田栗正隆先生に感謝申し上げます。

1)Int J Epidemiol. 2002[PMID:11980807]
2)Nihon Eiseigaku Zasshi. 2009[PMID:19797847]
3)佐藤俊哉,他.交絡という不思議な現象と交絡を取りのぞく解析――標準化と周辺構造モデル.計量生物学.2011;32:S35-49.