医学界新聞

連載

2011.10.17

今日から使える
医療統計学講座

Lesson6
多変量解析――説明変数の選び方

新谷歩(米国ヴァンダービルト大学准教授・医療統計学)


2945号よりつづく

 臨床研究を行う際,あるいは論文等を読む際,統計学の知識を持つことは必須です。
 本連載では,統計学が敬遠される一因となっている数式をなるべく使わない形で,論文などに多用される統計,医学研究者が陥りがちなポイントとそれに対する考え方について紹介し,臨床研究分野のリテラシーの向上をめざします。


 通常ランダム化の行われていない観察研究では,効果を明らかにしたいリスク因子と絡んでさまざまな因子がアウトカムに影響を及ぼすため,それらの因子(交絡因子)の影響を補正する手段として,多変量回帰分析が有効であることを第2回(第2933号)でお話ししました。回帰分析にこれらの交絡因子を説明変数として加えることで,数学的に交絡の影響を取り除きます。では,すべての交絡因子をモデルに加えることはできるのでしょうか? 今回は,その簡単なルールについて,例を示しながら解説します。

交絡因子をいかに取り除くか

 「ICUにおけるせん妄の発症が人工呼吸管理患者の予後(ここではICU入室から6か月後の死亡率)にどうかかわるか」について調べた研究例に沿って,モデルの作り方を紹介します。この研究では,せん妄を発症するかどうかはランダム化による割り付けができないため,人工呼吸管理患者をICU入室中毎日観察し,せん妄発症の有無で2群に分けました1)

 「せん妄あり」群には高齢者や敗血症患者が多く,両群の死亡率を短絡的に比較することはできません。仮に「せん妄あり」群の死亡率が高くても,それがせん妄によるものなのか,年齢,敗血症によるものなのか区別できないからです。そのため多変量解析では,せん妄と共に年齢や敗血症という交絡因子を説明変数としてモデルに加えることで,せん妄,年齢,敗血症それぞれに依存する死亡率を計算します。せん妄に依存する死亡率は他の変数の影響を受けないため,せん妄のみによる死亡率への影響を解析できるのです。この影響をハザード比やオッズ比などを用いて表しますが,この例では「年齢,敗血症で補正されたせん妄の死亡率へのハザード比もしくはオッズ比」と呼んでいます。

 では,せん妄と関連があり,アウトカムに影響を及ぼすような交絡因子は年齢と敗血症だけでしょうか? 因果関係を探究する研究では,交絡因子をいかにうまく取り除けるかが研究の質を左右するので,この場合起こり得る交絡因子がほかにないか,よく考えてください。重篤度,基礎疾患,投与された鎮静薬の種類,ベースラインの認知機能障害,併存疾患,入院時の生活運動能力,低酸素血症の有無,ショック状態の有無,臓器不全評価スコア,などいろいろありそうですね。

 このように数多くある交絡因子をすべてモデルに加えることは可能なのでしょうか? 答えはNoです。説明変数をモデルに入れ過ぎてしまうとモデルの結果が不安定になるため,サンプル数の小さな研究ではモデルに加えられる変数の数は限られています。

 第2回で紹介した簡単な方法を用いてサンプル数を基に大体の目安をつけていきますが,そのルールはモデルの種類によっても異なります。この研究の場合,アウトカムである「6か月後に生存または死亡したかどうか」は2値変数で表せるので,第2回の表を用いると,2値ロジスティック回帰を選択できそうです(論文中では,時間変量Cox回帰を使用しました)。ロジスティック回帰では,アウトカムの死亡者,生存者のいずれか少ないほうの数を10で割った数までを説明変数として加えることができます。この研究では,死亡者数69人,生存者数175人でした。ですから,69を10で割った6または7つまで変数を入れることができます。

説明変数の選び方

 次に,研究対象因子のせん妄に加え,先ほど割り出した10以上ある交絡因子のうち5つを選び出します。選択法として正しいと思う方法を,以下の(1)-(6)から1つ選んでください。

(1)それぞれの交絡因子を「せん妄あり」「せん妄なし」の2群間でスチューデントのt検定やピアソンのカイ2乗検定などを用いて比較し,有意差の出たもののみ(またはP値の小さい順に5つ)モデルに加える。

(2)それぞれの交絡因子を「死亡」「生存」の2群間でスチューデントの...

この記事はログインすると全文を読むことができます。
医学書院IDをお持ちでない方は医学書院IDを取得(無料)ください。

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook