医学界新聞

臨床研究・疫学研究のための因果推論レクチャー

連載 井上 浩輔,杉山 雄大,後藤 温

2021.09.06 週刊医学界新聞(通常号):第3435号より


 今回は因果推論の手法の中でも広く応用されている「傾向スコア(Propensity Score:PS)分析」について説明します1, 2)。具体的なアプローチに入る前に,まずはPSとは何か考えてみましょう。

 前回までの因果推論の解説は交絡因子が1つしか存在しない単純な場合に限定していました。しかし,実際の研究では交絡因子が多く存在します。ただし,交絡因子が多いとその分,各値を取るパターン(交絡因子の組み合わせ)が指数関数的に多くなり(例えば,二値変数が10存在すると,210=1024通りの層ができる),実際上は層別解析が不可能になってしまいます。このような状況でも,アウトカムの回帰モデルが交絡調整に有用であることは前回の連載で説明した通りですが,アウトカムの発生数が少ないとモデルの推定値が不安定になる場合もあります。一方で,もしアウトカムに比して曝露の頻度が多いようであれば,これら複数の交絡因子の情報を一つの値に集約した指標,すなわちPSを用いることもできます。

 具体的には,曝露Xの有無を被説明変数,交絡因子Z1,Z2,……を説明変数としたロジスティック回帰モデルlog〔P(X=1)/{1-P(X=1)}〕=α+βZ1Z1+βZ2Z2,……を当てはめ,各個人の持つ実際のZ1,Z2,……の値をモデルに代入することで得られる「各個人がX=1である確率」を,PSとして使うことができます(曝露との関連によっては一次項のみでなく,交互作用項や二乗項などを含めることもある)。

 PSは交絡に対処するために求める指標であり,モデルの右辺に投入する変数は交絡因子です。すなわち曝露を予測する全ての因子とは限らない点には注意しましょう(註1)。

 では,このPSをどのように使えば,交絡を調整できるのでしょうか?

 まず,交絡に対処するというPSの役割を直感的に理解しやすいアプローチとして,アウトカムモデルの共変量に用いる方法を紹介します。今回もアスピリン投与(X)が冠動脈疾患発症(Y)を予防する効果について考えてみます。図1のDAGに示すように,アスピリンと冠動脈疾患には多くの交絡因子(Z)が存在します。これらの交絡因子を用いてアスピリンのPSを算出し,Yに対する(例えば)ロジスティック回帰モデルlog〔P(Y=1)/{1-P(Y=1)}〕=α+βXX+βPSPSを当てはめます。するとアスピリン投与から冠動脈疾患発症に向かうバックドア経路が,PSの調整で(曝露と共変量が独立となるため)全て閉じたと判断でき,アスピリン投与による因果効果をβXとして求められます。

3435_0401.jpg
図1 DAGによる傾向スコアの概念図
傾向スコアで調整することでアスピリンと共変量(=年齢,性別,脂質異常症,冠動脈疾患既往)が独立となるため,それぞれの変数全てで調整した時と同様にアスピリン投与から冠動脈疾患発症へのバックドア経路が全て閉じたと判断できる。

 次に,PSの枠組みでよく使われているマッチングのアプローチについて紹介します。PSマッチングは

この記事はログインすると全文を読むことができます。
医学書院IDをお持ちでない方は医学書院IDを取得(無料)ください。

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook