多変量解析―説明変数の選び方(新谷歩)
連載
2011.10.17
医療統計学講座
【Lesson6】
多変量解析――説明変数の選び方
新谷歩(米国ヴァンダービルト大学准教授・医療統計学)
(2945号よりつづく)
臨床研究を行う際,あるいは論文等を読む際,統計学の知識を持つことは必須です。
本連載では,統計学が敬遠される一因となっている数式をなるべく使わない形で,論文などに多用される統計,医学研究者が陥りがちなポイントとそれに対する考え方について紹介し,臨床研究分野のリテラシーの向上をめざします。
通常ランダム化の行われていない観察研究では,効果を明らかにしたいリスク因子と絡んでさまざまな因子がアウトカムに影響を及ぼすため,それらの因子(交絡因子)の影響を補正する手段として,多変量回帰分析が有効であることを第2回(第2933号)でお話ししました。回帰分析にこれらの交絡因子を説明変数として加えることで,数学的に交絡の影響を取り除きます。では,すべての交絡因子をモデルに加えることはできるのでしょうか? 今回は,その簡単なルールについて,例を示しながら解説します。
交絡因子をいかに取り除くか
「ICUにおけるせん妄の発症が人工呼吸管理患者の予後(ここではICU入室から6か月後の死亡率)にどうかかわるか」について調べた研究例に沿って,モデルの作り方を紹介します。この研究では,せん妄を発症するかどうかはランダム化による割り付けができないため,人工呼吸管理患者をICU入室中毎日観察し,せん妄発症の有無で2群に分けました1)。
「せん妄あり」群には高齢者や敗血症患者が多く,両群の死亡率を短絡的に比較することはできません。仮に「せん妄あり」群の死亡率が高くても,それがせん妄によるものなのか,年齢,敗血症によるものなのか区別できないからです。そのため多変量解析では,せん妄と共に年齢や敗血症という交絡因子を説明変数としてモデルに加えることで,せん妄,年齢,敗血症それぞれに依存する死亡率を計算します。せん妄に依存する死亡率は他の変数の影響を受けないため,せん妄のみによる死亡率への影響を解析できるのです。この影響をハザード比やオッズ比などを用いて表しますが,この例では「年齢,敗血症で補正されたせん妄の死亡率へのハザード比もしくはオッズ比」と呼んでいます。
では,せん妄と関連があり,アウトカムに影響を及ぼすような交絡因子は年齢と敗血症だけでしょうか? 因果関係を探究する研究では,交絡因子をいかにうまく取り除けるかが研究の質を左右するので,この場合起こり得る交絡因子がほかにないか,よく考えてください。重篤度,基礎疾患,投与された鎮静薬の種類,ベースラインの認知機能障害,併存疾患,入院時の生活運動能力,低酸素血症の有無,ショック状態の有無,臓器不全評価スコア,などいろいろありそうですね。
このように数多くある交絡因子をすべてモデルに加えることは可能なのでしょうか? 答えはNoです。説明変数をモデルに入れ過ぎてしまうとモデルの結果が不安定になるため,サンプル数の小さな研究ではモデルに加えられる変数の数は限られています。
第2回で紹介した簡単な方法を用いてサンプル数を基に大体の目安をつけていきますが,そのルールはモデルの種類によっても異なります。この研究の場合,アウトカムである「6か月後に生存または死亡したかどうか」は2値変数で表せるので,第2回の表を用いると,2値ロジスティック回帰を選択できそうです(論文中では,時間変量Cox回帰を使用しました)。ロジスティック回帰では,アウトカムの死亡者,生存者のいずれか少ないほうの数を10で割った数までを説明変数として加えることができます。この研究では,死亡者数69人,生存者数175人でした。ですから,69を10で割った6または7つまで変数を入れることができます。
説明変数の選び方
次に,研究対象因子のせん妄に加え,先ほど割り出した10以上ある交絡因子のうち5つを選び出します。選択法として正しいと思う方法を,以下の(1)-(6)から1つ選んでください。
(1)それぞれの交絡因子を「せん妄あり」「せん妄なし」の2群間でスチューデントのt検定やピアソンのカイ2乗検定などを用いて比較し,有意差の出たもののみ(またはP値の小さい順に5つ)モデルに加える。
(2)それぞれの交絡因子を「死亡」「生存」の2群間でスチューデントのt検定やピアソンのカイ2乗検定などを用いて比較し,有意差の出たもののみ(またはP値の小さい順に5つ)モデルに加える。
(3)すべての交絡因子をモデルに入れ,ステップワイズ法を用いてコンピューターで自動計算し,有意差の出る交絡因子のみを選択する。
(4)すべての交絡因子をモデルに入れ,有意差の出ない交絡因子をコンピューターによる自動計算ではなく自分でモデルから取り除く。
(5)(1)のように,せん妄との関連を単変量解析で調べた後,有意差の出た交絡因子の中からさらにステップワイズ法で有意差の出る交絡因子を探す。
(6)データを一切見ず,文献や医学的見地を参照し,アウトカムである死亡に対するリスク因子の中からリスクの大きい順に5つ選び出す。
いずれもよく用いられる方法ですが,正解は(6)です。(1)から(5)は,データを用いてP値を一番小さくする方法として知られていますが,これらの方法を用いると,P値が小さくなり過ぎてしまうという問題が生じます。「P値は小さいほうがよいのではないか」との声もよく耳にしますが,P値が小さ過ぎると再現性のない結果になりかねません。自分が行った研究では差が出たけれど,他の研究者が同様の研究を繰り返した場合にまったく異なる結果が出てしまうようでは信頼性のある結果とは呼べませんよね。
(1)から(5)では,最終的なモデルに加える変数の数はせん妄を加え6つですが,そこに到達する前に単変量解析やコンピューターによる自動計算などによって多数のP値が計算されています。サンプル数によって決められた6つとは,正確には最終的なモデルに入っている説明変数の数だけではなく,説明変数の選択時に計算されたP値すべてを数えます。で...
この記事はログインすると全文を読むことができます。
医学書院IDをお持ちでない方は医学書院IDを取得(無料)ください。
いま話題の記事
-
医学界新聞プラス
[第1回]心エコーレポートの見方をざっくり教えてください
『循環器病棟の業務が全然わからないので、うし先生に聞いてみた。』より連載 2024.04.26
-
適切な「行動指導」で意欲は後からついてくる
学生・新人世代との円滑なコミュニケーションに向けて対談・座談会 2025.08.12
-
医学界新聞プラス
[第2回]アセトアミノフェン経口製剤(カロナールⓇ)は 空腹時に服薬することが可能か?
『医薬品情報のひきだし』より連載 2022.08.05
-
医学界新聞プラス
[第1回]ビタミンB1は救急外来でいつ,誰に,どれだけ投与するのか?
『救急外来,ここだけの話』より連載 2021.06.25
-
医学界新聞プラス
[第3回]冠動脈造影でLADとLCX の区別がつきません……
『医学界新聞プラス 循環器病棟の業務が全然わからないので、うし先生に聞いてみた。』より連載 2024.05.10
最新の記事
-
適切な「行動指導」で意欲は後からついてくる
学生・新人世代との円滑なコミュニケーションに向けて対談・座談会 2025.08.12
-
対談・座談会 2025.08.12
-
対談・座談会 2025.08.12
-
発達障害の特性がある学生・新人をサポートし,共に働く教育づくり
川上 ちひろ氏に聞くインタビュー 2025.08.12
-
インタビュー 2025.08.12
開く
医学書院IDの登録設定により、
更新通知をメールで受け取れます。