医学界新聞

臨床研究・疫学研究のための因果推論レクチャー

連載 杉山 雄大,井上 浩輔,後藤 温

2021.11.01 週刊医学界新聞(通常号):第3443号より


 ある曝露によるアウトカムへの因果効果は,対象集団の基本属性(年齢・性別など)や特徴(基礎疾患など)によって異なる場合があり,これを効果の異質性(effect heterogeneity),あるいは効果修飾(effect modification)と呼びます。今回は,この効果修飾について学んでいきましょう。

 に示す架空のデータから,(従来薬と比べた)新規抗血小板薬が再発脳梗塞発症を防ぐ効果について考えてみます。ここで新規薬の効果についてリスク比を指標とした場合,(他に交絡がないと仮定すると)男性における新規薬の効果RR男性=0.72,女性における効果RR女性=0.50と女性において新規薬の効果が大きいことになります。このような場合に「効果修飾がある」と判断します。

3443_05_02.jpg
 抗血小板薬の効果(架空のデータ)

 第5回で少し触れたように,多変量回帰モデルで効果の異質性,すなわちYの関数R(Y)とXの関係がZの値によって変わり得ることをモデル上で考慮するには,XとZの積の項(XZ:交互作用項と呼ぶ)をモデルに含めます。ロジスティック回帰モデルや修正ポアソン回帰モデルなど,ロジットlog〔p/(1-p)〕ないし対数のリンク関数を持つモデルの場合,交互作用項の係数の大きさを見ることで,比を指標とした場合の効果修飾を評価することができます。

 ただし,効果の有無や方向は,指標によって異なり得ることには留意が必要です。リスク差を指標とした場合,RD男性 =-0.07,RD女性=-0.05となり,今度は男性の方が新規薬の効果が大きいことになります。得たい効果修飾についての示唆が何かによって,指標をどちらかに選ぶ必要があります。例えば,男女各1000人に新規薬を投与して,脳梗塞の新規発症人数をより多く抑えるのはどちらか? という問いに答えるには,差を指標とした効果修飾を考慮することになります(註1)。

 なお,効果修飾と交互作用は,同義語として使われる場合が多いですが,狭義では,交互作用は2つとも介入可能な変数の場合のみを指すことがあります。この違いは,どの曝露・介入に関心があるのか? モデルに共変量として何を含めるか? 得られる示唆は何か? という議論につながります。詳しくは成書をご覧ください1, 2)

 第7回で述べた逆確率重み付けやG-computationを因果推論の場面で用いると,曝露への介入を観察集団全体に対して行った場合の効果を推定することが多いです。この場合の効果を平均因果効果と呼びます。一方で,例えば第6回で述べた傾向スコアマッチングにおいて曝露群がほぼ解析対象に残った場合には,「曝露群における」平均因果効果を推定していることになります。これらの大きさが異なるのは,属性の分布によって効果の異質性があり,集団全体と曝露群で属性の分布が異なるためです。

 さらには,集団全体をある属性で層別化すると層ごとの推定値が大きく異なり,極端な例では,効果が逆向きの層(先の例でいうと,新規薬を投与すると脳梗塞発症が逆に増える層)がある場合もあり得ます。平均因果効果のみを見ていると重要な情報を見落としてしまうことにもなるので注意が必要です(註2)。近年,このような効果の異質性が注目され,評価手法も開発されています(註3)。

 平均因果効果をめぐるここまでの議論を踏まえると,得られた因果効果が特定の集団のみのものである場合,その効果がより一般化された集団や,別の集団などの標的集団でも見られると推論するのには論理の飛躍があるとわかります。

 例えばRCTから得られた結果をより一般的な集団や別の集団にそのまま適用して推論する事例もありますが,属性分布が同じとは限らず,分布の異なる属性による効果修飾がある場合は誤った解釈につながります。なお,この一般化が許される性質について,部分集団から(その部分集団を含む)より大きな集団に一般化する場合はgeneralizability,ある集団から別の集団へ一般化させる場合にはtransportabilityと呼びます()。

3443_05_01.jpg
  Generalizabilityとtransportabilityの概念
観察集団を含むより大きな集団に一般化する可能性をgeneralizabilityと呼ぶのに対し,別の集団に一般化する可能性をtransportabilityと呼ぶ。ただし厳密には,観察集団の一部が標的集団に含まれている場合にもtransportabilityと呼ぶ。

 Generalizability/transportabilityは,ある程度定性的に評価できます。例えば,ある郊外のA町において検証された住民への健康増進プログラムの効果は,似た特徴を持つ隣のB町では同様であると考えられる一方で,離れた大都会のC市では大きく違うと想像されます。人口分布や生活習慣など,効果の異質性を生じ得る属性に差があることを知っている場合,少なくとも一部はその背景知識を基に効果の異質性を推定していることでしょう。年齢・性別で層別化してプログラムの効果を求めた上で,集団間(例:A町vs. C市)でのこれらの属性分布の違いを念頭に置いて効果の違いを推測することもあります。

 さらに定性的な評価を補う方法として,generalizability/transportability formulaというモデルによる定量的な評価法があります。効果の異質性を生じ得る複数の属性について,重み付けによって観察集団データの属性分布を標的集団のそれと同じ分布に変換することで,標的集団における効果を定量的に推定できます3, 4)註4)。

 当然ながらモデルに含めない属性については考慮できません。例えば先の健康増進プログラムの例で生活習慣を含められない場合,プログラムの効果は生活習慣によってばらつきがあると考えられるため,C市へのtrasnportabilityがモデルで完全に評価できているわけではないかもしれません。それぞれ限界点はあるものの,全ての集団で研究を行うことは現実的でないため,上記のような定性的・定量的な評価に基づいて研究結果をどこまで一般化できるかを検討することが重要です。

 今回は,効果の異質性とそれに関連する研究結果の一般化について紹介しました。交絡を除去して因果効果を推定することだけでなく,どの集団における因果効果を推定したいか(するのか)を考えて,解析方法の選択(結果の解釈)を行うようにしましょう。


註1:リスク比・オッズ比の交互作用を差のスケールで評価する場合は,Relative Excess Risk due to Interaction (RERI)と呼ばれる指標を用いて計算する2)
註2:第5回で述べた通り,因果効果を正確に推定するためには,必要な交互作用項を十分に含んだモデルを設定する必要がある。
註3:全ての潜在的な異質性を検討することは技術的に難しく,機械学習を用いた方法などが提案されているが,モデルの安定性や応用方法についてはまだ十分に確立されていない5)
註4:Generalizability/transportabilityを定量的に評価する際に必要な仮定については文献4を参照されたい。

謝辞:ご助言いただいた米ハーバード大学の芝孝一郎先生に感謝申し上げます。

1)Hernán MA, et al. Causal Inference:What If. Boca Raton:Chapman & Hall/CRC;2020.
2)Lash TLV, et al. Modern epidemiology. 4th ed. Wolters Kluwer;2020.
3)Proc Natl Acad Sci USA. 2016[PMID:27382148]
4)Cancer Epidemiol Biomarkers Prev. 2021[PMID:34548326]
5)Wager S, et al. Estimation and Inference of Heterogeneous Treatment Effects using Random Forests. Journal of the American Statistical Association. 2018;113(523):1228-42.