医学界新聞

臨床研究・疫学研究のための因果推論レクチャー

連載 杉山 雄大,井上 浩輔,後藤 温

2022.03.07 週刊医学界新聞(通常号):第3460号より

 疫学研究が扱う(介入を含む)曝露の中には,パンデミックや政策など,集団レベルで広く影響するものもあります。今回は,集団レベルの曝露効果の推定手法について学びましょう。

 本連載でこれまで対象としていた曝露は,薬剤など主に個人レベルで変わり得るものでした。曝露群と非曝露群が存在し,傾向スコア分析などで交絡を調整し,両群のアウトカムの差分を曝露の効果として推定しました。

 しかし,集団レベルで影響する曝露の場合,個人間の影響などをとらえるのは難しく,個人レベルのアプローチが政策示唆を考える上で有用とは限りません。また同時期の同一集団内には対照群がいない状況が多いため,別の集団や曝露開始前の同一集団との比較になります。このような比較を行って集団レベルの曝露効果を推定するには,これまでと違った工夫と仮定を要します。

 曝露(政策介入など)を受けた集団の他に非曝露群の集団があり,両群にて曝露前後の2時点以上での測定がある場合には,曝露による効果と曝露以前からの群間の違いとを判別できる可能性があります。例えば,ある地域のみに適用される政策介入の,医療費に及ぼす影響を調べたいとします。実際に政策介入を行ったときの医療費と,反事実的にその地域で政策介入を行わなかった場合の医療費を比べたいのですが,その地域で政策介入を行わなかった場合の医療費は観測できていないので,比較できません。

 もし近隣にこの政策介入を行わなかった地域があれば,その地域を対照として比較できるかもしれません。しかし,非適用地域での医療費はもともと適用地域と多少異なるはずなので,非適用地域の結果が適用地域で反事実的に政策介入が行われなかった場合の結果と同様と見なすのは難しそうです。そこで,差分の差分法(Difference-in-differences method:DID法)では,非適用地域での医療費の前後の変化(差分)を適用地域において政策介入が行われなかったときの医療費の変化と見なし,適用地域の実際の変化と比較して(差分を取って)適用地域における因果効果を推定します(図1)。

3460_04_01.jpg

 具体的には,適用地域と非適用地域で介入前後に測定を行い,適用地域による介入前後の医療費の平均をそれぞれȲ10 Ȳ11,非適用地域による介入前後の医療費の平均をそれぞれȲ00 Ȳ01と表すと,介入前後の変化の差分,(Ȳ11Ȳ10)-(Ȳ01Ȳ00)を因果効果として考えます。実際の解析では,Y=α+βXX+βTT+βXTXT+……〔X=曝露(介入),T=曝露前(=0)または後(=1)〕というように,曝露の変数とタイミングの変数,そしてそれらの交互作用項を含めた多変量回帰モデルを作成し,交互作用項のβXTを因果効果として考えます。交絡する可能性のある因子は多変量回帰モデルの中で調整します。また,差分を取ることで未測定交絡もある程度調整できると考えられています。ちなみに集団レベルで影響を及ぼす曝露の効果を推定するため,曝露前後で同一個人がいてもいなくても検討できます(註1)。

 差分の差分法による推定が適切に行われるにはいくつかの仮定が必要ですが1),特に重要なのは「平行トレンド仮定」と呼ばれる仮定です。これは曝露が生じなかった場合には,2測定の差分は同じ,すなわち変化が平行であるとの仮定になります。曝露前の複数時点に測定し,両群の変化が平行であると確認できれば,平行トレンド仮定を傍証します。また,曝露と同時期にアウトカムの変化に影響を与える因子(ショック)が存在し,その影響が2群間で異なるときも,平行トレンド仮定が満たされないことになるので注意が必要です(得られる効果量が,見たい曝露の効果とショックの混合物となってしまい,曝露の効果を正しく推定できなくなる)。これらの仮定の妥当性や推定される因果効果の有無は,アウトカム指標の選択(差または比,すなわちYがそのままか対数変換するか:第8回参照)によって変わり得る点も心に留めておきましょう2)

 なお,COVID-19による診療状況の変化を見る場合などには,同時期の同一集団の中で非曝露群を求めることはできませんが,前年度の同一集団における月や週ごとのトレンドを非曝露群のように扱うことで,曝露の効果を調べることもできます。

 分割時系列分析とは,集団全体が影響を受けるため非曝露群がいないものの,ある時間を境に(閾値として)曝露が生じる場合に用いられる分析方法です。曝露発生前後の複数時点に(できるだけ多く)測定を行います。例えば診療報酬改定で,ある診療行為への報酬や条件に変化があった場合,そのタイミング(3~4月の間)で診療行為の数に大きな変化が起こります。この変化を,曝露の効果としてとらえるのが分割時系列分析〔Interrupted Time-series(ITS)analysis〕です。同年の3月と4月では診療報酬改定以外には集団に大きな変化はないと仮定すると,診療行為の数の変化は,診療報酬改定という曝露(政策介入)の効果と見なせます。

 実際の解析では,多変量回帰モデルの中に時系列での変化について組み込みます。多変量モデルの作り方でさまざまな変化の条件を課すことができますが3),代表的にはY=γ+δXX+δTT+δXTXT+……という差分の差分法とよく似たモデルを用います(Xは曝露開始時点以前か以降かの二値変数,Tは時間変数)。曝露開始とともにYの推定値がδXだけ不連続に変化するモデルとなり,傾きもδXTだけ変化します。したがって,δXは曝露がYに対し一時点に与えた効果,δXTは曝露が時間ごとのYの変化量に与えた効果として解釈されます(図2註2)。

3460_04_02.jpg

 分割時系列分析は,曝露発生の前後のどちらに属するかはランダムに割り付けられ,また曝露以外の変数はほぼ同様に分布しているとの仮定に基づいています。この仮定と一部重なりますが,曝露の有無を対象が操作できないという仮定,曝露を受けた場合/受けなかった場合における条件付き期待値が時系列で連続であるとの仮定も必要です。さらに,周期性(季節性)や自己相関(時間ごとの値が独立でなく,前後で関連がある)がある場合が多く,月などの変数を共変量として投入する,曝露が発生しない同時期との差分を取るなどの方法で対処します(註3)。

 今回は,集団全体に影響を与える曝露の効果を推定する手法を説明しました。これらの手法から得られる示唆は,個人レベルではなく集団レベルでの効果である点に注意が必要です。一方で,特に医療政策を考える際などには,仮定が満たされると確認された,または想定できる状況下でこれらの手法を適切に用いることで,政策介入の効果についての実践的なエビデンスを形成できます。最近では,根拠に基づく政策立案(Evidence-based Policymaking:EBPM)が重要視されており,今回示した手法が注目されています。


註1:一般化推定方程式や一般化線形混合モデルなどを用いて個人内の結果変数間の相関を考慮する。
註2:TがYと非直線的に関連することが想定される場合は,二乗項などをモデルに含める場合もある。
註3:分割時系列分析における時間変数の代わりに,年齢や検査データなどの連続量を用いて同様の回帰分析も行える。これを回帰不連続デザイン(Regression Discontinuity Design:RDD)と呼び,国内でも政策評価などさまざまな応用場面が考えられている。本手法で求められる曝露の効果は,連続量での閾値における平均効果であり,必ずしも集団全体での効果ではない点に注意する4)

謝辞:横浜市立大学の田栗正隆先生にご助言をいただきました。心より感謝申し上げます。

1)Curr Epidemiol Rep. 2020[PMID:33791189]
2)Rosenbaum PR,著.阿部貴行,他訳.ローゼンバウム統計的因果推論入門.共立出版;2021. p389.
3)Int J Epidemiol. 2017[PMID:27283160]
4)Epidemiology. 2014[PMID:25061922]

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook