臨床研究・疫学研究のための因果推論レクチャー
[第5回] 多変量回帰モデルを因果推論に用いる

連載杉山雄大，井上浩輔，後藤温

2021.08.02 週刊医学界新聞（通常号）：第3431号より

Today's Key Points

✓ 多変量回帰モデルは因果効果の推定に役立つシンプルな方法である。
✓ モデルごとの推定値の解釈の違いに留意する。
✓ モデルを構築する際は，課している仮定について意識する。

　今回は，多変量回帰モデルの説明と，回帰係数を直接的に因果効果と解釈できるために必要な仮定を説明します。

回帰モデルの基本

　回帰モデルとは，現実を簡略化し，数式で変数間の関係を表したものです。統計の講義で最初に習う最も単純な回帰モデルはY＝α＋βXという式でしょう。図では散布図の点が標本の観察データを表しています。Xが決まってもYは1つに決まりませんが，回帰モデルを用いるとばらつきに当たりをつけられます。係数βは，「平均して，Xの1の増加は，Yのβの増加と関連がある」ことを意味します。図ではXは連続変数ですが，0または1の2値変数などでも構いません。また，回帰モデルは本来Yを予測するモデルにすぎず，その作成においてXとYの因果関係を想定する必要はありません。

　上記のように説明変数（X）が1つのものを単回帰モデルと呼びますが，複数（例えばXとZなど）の場合は多変量回帰モデルと呼びます。一般に，目的変数（Y）が連続変数の場合，Y＝α＋β_XX＋β_Z₁Z₁＋β_Z₂Z₂……などの「線形回帰モデル」を用います。一方でYが（0，1）の2値変数の場合には，Yの代わりにY＝1である確率P（Y）で表される関数R（Y）についてのモデルを構築します〔R（Y）＝α＋β_XX＋β_Z₁Z₁＋β_Z₂Z₂……〕。このように目的変数の型やその分布によって定める関数R（Y）をリンク関数と呼び，Yが従うことを仮定する分布を分布族（あるいは指数型分布族，family）と呼びます。リンク関数と分布族を変えることで線形回帰モデルを応用したモデルを総じて，一般化線形モデル（Generalized Linear Model：GLM）と呼びます。各モデルのβ_Xの解釈を表1に示します。

表1　代表的な一般化線形モデル（GLM）の種類と，β_Xの解釈（クリックで拡大）

　なお，R（Y）＝α＋β_XX＋β_Z₁Z₁＋β_Z₂Z₂＋β_XZ₁XZ₁のように，XとZ₁の積の項（XZ₁，交互作用項と呼ぶ）が含まれると，XとR（Y）の関係はZ₁の値による変化をモデルに許すことになります。逆に言えば，交互作用項を含めないモデルの場合，XとR（Y）の関係はZ₁の値によって変化しないとの仮定をモデルに課していることになります。

　現実を簡略化するモデルを作った時点で（正しいかどうかわからない）仮定を課している点に留意が必要です。他にも，R（Y）とZ₁がU字型の関連を有するのにZ₁の一次項しか入っていない〔R（Y）とZ₁の間に直線関係を仮定している〕場合など，モデルが現実をうまく表していないことの総称を「モデルの誤設定」と呼び，正しい推定結果が得られな...

この記事はログインすると全文を読むことができます。
医学書院IDをお持ちでない方は医学書院IDを取得（無料）ください。

臨床研究・疫学研究のための因果推論レクチャー
[第5回] 多変量回帰モデルを因果推論に用いる

Today's Key Points

✓ 多変量回帰モデルは因果効果の推定に役立つシンプルな方法である。
✓ モデルごとの推定値の解釈の違いに留意する。
✓ モデルを構築する際は，課している仮定について意識する。

回帰モデルの基本

いま話題の記事

最新の記事

医学界新聞公式SNS

臨床研究・疫学研究のための因果推論レクチャー [第5回] 多変量回帰モデルを因果推論に用いる

シェアする

Today's Key Points

✓ 多変量回帰モデルは因果効果の推定に役立つシンプルな方法である。 ✓ モデルごとの推定値の解釈の違いに留意する。✓ モデルを構築する際は，課している仮定について意識する。

回帰モデルの基本

この記事の連載 臨床研究・疫学研究のための因果推論レクチャー（終了）

シェアする

いま話題の記事

最新の記事

医学界新聞公式SNS

臨床研究・疫学研究のための因果推論レクチャー
[第5回] 多変量回帰モデルを因果推論に用いる

✓ 多変量回帰モデルは因果効果の推定に役立つシンプルな方法である。
✓ モデルごとの推定値の解釈の違いに留意する。
✓ モデルを構築する際は，課している仮定について意識する。

この記事の連載
臨床研究・疫学研究のための因果推論レクチャー（終了）