医学界新聞

連載

2012.04.16

今日から使える
医療統計学講座

Lesson12(最終回)
カプランマイヤー曲線

新谷歩(米国ヴァンダービルト大学准教授・医療統計学)


2971号よりつづく

 今回は,基礎研究や臨床研究論文に非常によく登場するカプランマイヤー曲線について解説します。

カプランマイヤー法の活用方法

 治療による死亡リスクの違いを調べる際,暴露の有無で生存率を比較します。一番簡単に死亡リスクを計算できるのは,研究終了時に,追跡された患者における死亡者数の割合で置き換える方法です。ただこの方法では,研究終了時点での死亡リスクの計算は可能ですが,研究途中での時間の経過に伴うリスクの推移を見ることはできません。

 そこで登場するのがカプランマイヤー法です。カプランマイヤー法は,「死亡」「生存」など2値のアウトカムの時間の経過に伴うリスクの推移を考慮に入れながら,介入治療など暴露の効果を解析するときに広く用いられます。

 は,集中治療における覚醒と呼吸プロトコールの介入の有効性を見るために,「介入あり(介入群)」と「介入なし(コントロール群)」で人工呼吸器管理患者のICU入室から1年間の生存率を比較したものです1)。ICU入室時点ではもちろんすべての被験者が生存していますが,1年後には約半数(介入群では55%,コントロール群では40%)の被験者のみが生存していると解釈できます。

 ランダム化比較試験におけるカプランマイヤー曲線(文献1より改変)

 次に,生存率を時間ごとに見ていくと,ICU入室から20日目までに生存率が急速に減少していることがわかります。その後,1か月を越えると,生存率はかなり安定しています。カプランマイヤー曲線を見ると,時間経過に伴う生存率の推移がよくわかりますね。

 カプランマイヤー法を使用するためには,2種類のデータが必要となります。1つは「死亡」や「生存」などのアウトカムが起こったかどうかを表す2値のデータで,2値であればどんなものでも構いません。例えば,がんの罹患,再発,人工透析の有無,入院,退院など,使用されるアウトカムはさまざまです。追跡は,被験者が全員アウトカムなしの状態でスタートし,アウトカムが起こった時点で終了します。繰り返し起こるアウトカムは,通常最初のアウトカムが起こった時点で追跡を終了します。

 もう1つ必要なのは時間のデータです。時間のデータとは,アウトカムが起こった被験者ではアウトカムの起こった時間,アウトカムが起こらなかった被験者では追跡中に被験者が観察された最後の時間を指します。後者のデータは「中途打ち切り(Censor)されたデータ」と呼ばれます。

 中途打ち切りは,研究途中で被験者の追跡が不可能になるなど研究から脱落することによって起こりますが,大多数の研究ではすべての被験者のアウトカムが確認されるまで追跡を続けることが難しいため,研究終了による追跡の打ち切りによっても起こります。そのような場合の時間のデータは,生存時間ではなく最終的な追跡時間なので,単純に観測された時間のデータの算術平均で平均生存時間(平均余命)を割り出すことはできません。

 一般に,医療現場で平均生存時間として表される値は,カプランマイヤー曲線で生存率がちょうど50%になる時間です。これを専門用語では"生存期間中央値"と呼んでいますが,図では,コントロール群の生存期間中央値はICUの入室後85日目でした。

 生存期間中央値は,データによっては計算できないことも多くあります。図のデータをみると,コントロール群では85日と簡単に割り出せますが,介入群では研究終了時に50%以上の被験者が生存しているため,この図のみからは判断できません。

累積の生存率とリスク

 カプランマイヤー曲線で,Y軸上に"生存率"として表されている値は,正確には"累積生存率"と呼ばれ,その時点で患者が生存している確率を表します。例えば,3日目の時点で生存しているためには,1日目,2日目も生存していなければならないので,

3日間の累積生存率
=1日目の生存率×2日目の生存率×3日目の生存率
=(1-1日目の死亡リスク)×(1-2日目の死亡リスク)×(1-3日目の死亡リスク)

と計算できます。

 仮に,ある人が交通事故にあう確率を1日当たり10%とすると,今日から3日目が終わるまで交通事故にあわない確率は,「3日間の累積生存率=90%×90%×90%=73%」と計算できます。カプランマイヤー曲線における生存率は,死亡の起こったそれぞれの時点で階段状に減少します。時間の経過とともに死亡する被験者の数は増加するので,この累積生存率はどんどん減っていくのみで増えることはありません。逆に累積死亡率は増える一方で,減ることはありません。

 ただしここで注意が必要です。実は,一般に文献などで"リスク"として表されているのは累積ではなく,それぞれの時点でのリスクを示すことが多いのです。先ほどの例で言うと,交通事故にあう確率である10%のことです。このそれぞれの時点のリスクを累積リスクと区別するために,私は"瞬間的なリスク"と呼んでいます。

 生存率解析でよく用いられるCox比例ハザードモデルで使われる"ハザード"とは,この"瞬間的なリスク"を指します。カプランマイヤー曲線では累積生存率をプロットしていますが,研究者が最も関心のある指標"ハザード"は,曲線の傾きで表されます。図では,ICU入室後20日間程度,つまり入室中に最も死亡ハザードが高くなり,30日を過ぎると比較的低く安定していることがわかります。

中途打ち切りのデータは計算上どう扱うか

 研究途中で脱落してしまった中途打ち切りの被験者のデータは,脱落直前の生存率の計算には使用されますが,脱落した時点で計算から削除されます。例えば,100人の患者を追跡し,10日目までに10人が死亡,11日目終了前に5人が脱落,3人が死亡した場合,11日目のリスクはこれ以前に死亡した10人と11日目に脱落した5人を除き,「85分の3」と計算できます。

 また11日後の累積生存率は,「10日目までの累積生存率×11日目のみの生存率[(1-10÷100)×(1-3÷85)]」で計算され,11日目に脱落した5人は10日目までの計算には含まれていますが,11日目の計算からは除外されています。除外せずにリスク計算をしていれば,11日目のリスクは10日目までに死亡した被験者のデータのみを分母から除いて「90分の3」となり,抜け落ちた5人は11日目には生存していたとして計算が行われたことになります。

 カプランマイヤー法では,分母からこの5人を抜くことにより,この5人の患者が脱落せずに11日目も追跡されていれば5人のうち何人が死亡するのかを考慮して生存率をより正確に見積もることができるのです。ですから,中途打ち切りが多く起こっているようなデータでは,時間の経過に伴いリスク計算の分母がどんどん減少し,正確性を失います。この正確度を示すため,カプランマイヤー曲線を論文に記載する際には,図のように,各時点で何人の被験者が研究に残っているかをグループごとに示す必要があります。

 今回で,「今日から使える医療統計学講座」は最後となります。難解だと思っていた統計解析も,考え方は意外と簡単だったと思っていただけたでしょうか。「考え方はわかったけれど,実際にはどうするのか」といったご意見も多くいただきました。具体的な 方法を含め今後さらに内容を充実させ,ご紹介する機会を持ちたいと思います。1年間ありがとうございました。

Review

*カプランマイヤー曲線における平均生存時間は,生存率がちょうど50%になる時間で計算される。
*カプランマイヤー曲線で表される累積生存率とは,"瞬間的な生存率"の累積である。
*中途打ち切りの被験者のデータは,打ち切り以降のリスク計算から除かれる。
*各時点でのサンプル数は,群ごとに必ず記載する。

(了)

参考文献
1)Girard TD, et al. Efficacy and safety of a paired sedation and ventilator weaning protocol for mechanically ventilated patients in intensive care (Awakening and Breathing Controlled trial): a randomised controlled trial. Lancet. 2008; 371 (9607): 126-34.

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook