医学界新聞

連載

2011.06.20

今日から使える
医療統計学講座

Lesson2
回帰分析モデルの選び方

新谷歩(米国ヴァンダービルト大学准教授・医療統計学)


2927号よりつづく

 臨床研究を行う際,あるいは論文等を読む際,統計学の知識を持つことは必須です。
 本連載では,統計学が敬遠される一因となっている数式をなるべく使わない形で,論文などに多用される統計,医学研究者が陥りがちなポイントとそれに対する考え方について紹介し,臨床研究分野のリテラシーの向上をめざします。


 飲酒と肺がんの関連を調べるため,肺がん患者と健常者の飲酒率を比較したところ,肺がん患者の飲酒率は健常者に比べ統計的な有意差をもって高いことが分かりました。では,肺がんと飲酒の間に関連性があると言えるでしょうか? 答えは明らかにノーです。通常飲酒者の間では喫煙率が高く,飲酒が肺がんに関連しているのか,喫煙が関連しているのか,不明だからです。このような現象を,疫学および統計学の専門用語で「交絡」と呼びます。

交絡の意味

 交絡とは,アウトカム(肺がん)に直接影響を及ぼすような研究対象外の関連因子(喫煙)が,研究対象である暴露因子(飲酒)と関連性があるときに起こります。交絡が起こると研究対象である暴露因子(飲酒)と交絡因子(喫煙)が混ざり合ってしまい,本当の暴露因子(飲酒)の効果を調べることができなくなり,この場合喫煙は交絡因子と見なされます。

 マウスなどの動物を使った基礎研究とは異なり,人を対象とする臨床研究では研究環境のコントロールが難しく,この交絡をどう防ぐかで臨床研究の質が決まると言っても過言ではありません。そのため,交絡を防ぐためのさまざまな研究デザインおよび統計手法が考案されてきました。最もよく使われる研究デザインの一つであるランダム化比較試験では,コインの表が出れば「介入あり」,裏が出れば「介入なし」のように,患者が介入治療を受けるかそうでないかの割り付けを完全に無作為に行うことによって,両群間の患者の性質をそろえることができます。これにより,両群間の違いは「介入があるか,ないか」のみと限定でき,観測される違いがまさしく介入治療によるものだと判断できます。 

 それでは,ランダム化が可能でない臨床研究の場合はどうでしょうか。例えば,ICUにおけるせん妄と6か月後の死亡率の関連を問う研究で,ICUの入院患者をランダムに「せん妄あり,なし」に割り付けることはできません。たとえ「せん妄あり」の群で6か月後の死亡率が高く出たとしても,それは「せん妄あり」の群に高齢患者が多いことによるものなのかもしれません。

 このような場合の有効な交絡防止手段となるのが回帰分析です。回帰分析を使うことにより年齢に依存する死亡率を考慮に入れ,その影響を差し引いた後せん妄と死亡率の関連を調べることができます。これを「回帰分析による交絡の補正」と呼んでいます。交絡の補正法には,例えば,研究を高齢者のみに限定する方法や,「せん妄あり,なし」のグループ間で高齢者の数をそろえるマッチング法などもあります。臨床研究などデータ数が限られている場合は回帰分析による補正が最も有効です。

 この回帰分析による補正の考え方について,ぴんとこないと言われることが多いのですが,実は日常私たちがごくごく普通に使っている考え方です。私の9歳になる娘は,6歳の妹に「妹は1桁の足し算しかできない,掛け算のできる自分のほうが偉い」と得意げに言います。「6歳なんだから掛け算ができないのは当たり前でしょ,あなたも6歳のころはできなかったのよ」と言っても,どうして自分のほうが偉くないのか理解できないようです。

 この場合の交絡の補正とは,年齢による算数能力の違いを考慮に入れ,それを差し引いた後,つまり9歳の娘が「自分が妹と同じ6歳のときはどうだっただろう」と算数能力を比較するということです。どうやら娘は年齢による算数能力の補正ができないようですね。

 一般に,ランダム化比較試験では交絡が生じにくいため,解析もt検定やカイ2乗検定など単変量解析で済ませられますが,ランダム化のない観察研究では,回帰分析などによる交絡の補正が不可欠です。単変量解析のみでは,国際誌に研究結果を発表することはほとんど不可能です。

回帰分析モデルの選択の仕方

 ではここからは,回帰分析モデルの選択方法のポイントについてお話しします。まずは,下記に挙げた3つの研究における適切なモデルを選んでください。

研究1 新規の鎮静薬を投与した50人の患者と投与しない50人の患者間で,重篤度を補正しながら入院日数を比較する。

研究2 30人の慢性腎臓病患者のBMIと炎症マーカー(CRP)の相関を,性別を考慮に入れて調べる。

研究3 ICUに入院中のせん妄の有無について,入院中毎日測定し変化を調べる。

[選択肢]線形回帰モデル,順序ロジスティック回帰,2値ロジスティック回帰,コックス比例ハザードモデル,混合効果モデル,一般化推定方程式

 データに合った......

この記事はログインすると全文を読むことができます。
医学書院IDをお持ちでない方は医学書院IDを取得(無料)ください。