医学界新聞

連載

2010.03.08

論文解釈のピットフォール

第12回
客観性の低いエンドポイントで治療効果を過大評価する危険性

植田真一郎(琉球大学大学院教授・臨床薬理学)


前回からつづく

ランダム化臨床試験は,本来内的妥当性の高い結果を提供できるはずですが,実に多くのバイアスや交絡因子が適切に処理されていない,あるいは確信犯的に除 去されないままです。したがって解釈に際しては,“ 騙されないように” 読む必要があります。本連載では,治療介入に関する臨床研究の論文を「読み解き,使う」上での重要なポイントを解説します。


 これまで何回かに分けて,より重篤度の低いエンドポイントに関連して生じる問題についてお話ししました。そして前回は,そのようなエンドポイント(循環器領域では「狭心症での入院」など)判定において客観性を維持することが困難であること,試験間で診断基準の統一がなされていないことなどの問題点を指摘しました。さらに,これらはPROBE法と呼ばれるオープン試験で特に問題になりやすいことを理解していただいたと思います。

 PROBE法では,主治医が割り付け治療の内容を知ってエンドポイントを判定することで生じるバイアスを排除し,客観性を維持するために,割り付け治療の内容を知らされていない独立した委員会が判定することになっています。しかし,例えば「入院」や「PCI」などは判定しようがなく,入院の理由になるような疾患は報告があれば判定できても,入院しなければエンドポイントとしてカウント(報告)しないわけですから,結局主治医の判断に左右されることになりますね。事実,連載第9回で取り上げた,PROBE法を採用しているJIKEI HEART STUDYは,この「入院」エンドポイントで大きな差が生じており1),その結果を明確な約40%の複合心血管イベントリスクの減少と解釈することが妥当かどうか,今後の研究を待つ必要があります。

 判定に際して主観が入りやすい,重篤度の低いエンドポイントによる治療効果の評価は,オープン試験だけではなく,治療薬の割り付けが不適切であった場合にも信頼性が低いものとなる可能性があります。ランダム化比較試験の報告に際して記載すべき事項は,現在CONSORT声明として標準化されています2)。このCONSORT声明の項目が適切に行われ,かつ報告されているかどうかをみることで,試験の質を評価することができます。

 この中に,「割り付けの隠匿(allocation concealment)」という項目があります。これは,試験に登録された患者にどの治療法が割り付けられるか,患者も研究者も知ることができない方法が用いられているかどうかということです。二重盲検でなく,しかも割り付け薬の予想ができ,主観的に判定されやすいエンドポイントであれば,例えば患者の選択により薬物介入の効果がより大きくなることも十分考えられます。

不適切な割り付けの隠匿や二重盲検化が行われると……

 実は,以前から盲検化が(可能であるのに)行われていないことや,割り付けの隠匿が適切に実施されていないことによって,研究結果に影響が出る可能性が指摘されていました。Schulzらは,同じ治療介入を評価した研究でも,中央割り付けなどで割り付けの隠匿が適切に行われている研究と比較すると,適切に行われていない研究(例として,誕生日やカルテ番号での割り付け。これらは次の割り付け治療を知ることができる)や,二重盲検法を採用していない研究では,治療効果を過大評価する危険性があることを報告しています3)

 Woodらは,これをエンドポイントの種類ごとに検討しています4)。図1は,割り付けの隠匿が不適切あるいは行われていなかった532研究と適切に実施されていた272研究で得られた治療効果の比較をオッズ比で表したものです。これを見ると,割り付けの隠匿が適切に行われなかった研究で効果を過大評価していることが明らかです。特に,より主観的なアウトカム(○○による入院など)でその影響が大きく,客観的に評価できるアウトカムと比較すると有意差があります。また,最も重篤で客観性の高いアウトカム,総死亡と比較すると,その他のアウトカムはやはり過大評価になってしまうようです。

図1 割り付けの隠匿が適切に行われたか否かが治療介入の効果(オッズ比)に与える影響・エンドポイント別の検討(文献4より改変)
不適切に割り付けの隠匿が行われた臨床試験532例のオッズ比に対する,適切に行われた臨床試験272例のオッズ比の比。総死亡では比がほぼ1であり影響は認めらないが,その他のエンドポイントでは,有意に過大評価となる。また,客観的に判定可能なエンドポイントと主観が入りがちなエンドポイントの間にも影響の違いが見られる。後者では,適切な割り付けの隠匿が実施されていない場合,オッズ比は1.5倍になってしまう。

 図2は,二重盲検法を採用しているかどうかで同様に影響を評価したものですが,総死亡以外のエンドポイントは有意に影響を受け,効果を過大評価する可能性があること,また主観的なエンドポイントで非盲検化により効果を過大評価してしまう恐れがあることが明らかになっています。結局前述したように,信頼性の高い結果を得るには,1次エンドポイントには客観的に判定できる,重篤度の高い,患者医師双方に重要なエンドポイントを用いること,割り付けの隠匿を適切に実施することが重要です。また,オープン試験でも割り付けを適切に実施し,エンドポイントの判定をなるべく標準化し,主観を排するように努めることも重要と言えます。ここまで書くと,すべて二重盲検化すればいいのではという意見が出ると思います。しかし二重盲検化が逆に不適切,不可能となる場合もあるのです。

図2 二重盲検法が行われたか否かが治療介入の効果(オッズ比)に与える影響・エンドポイント別の検討(文献4より改変)
非盲検化臨床試験314例のオッズ比に対する盲検化臨床試験432例のオッズ比の比。総死亡や客観的に判定可能なエンドポイントでは比がほぼ1であり,効果は総死亡以外のエンドポイント,主観が入りがちなエンドポイントでは過大評価になる可能性が示唆されている。主観が入りがちなエンドポイントでは盲検化されていない場合,オッズ比は1.3倍になってしまう。

EfficacyとEffectiveness

 そもそも前述したような問題の多いPROBE法がなぜ採用されるのでしょうか? 日本においては,二重盲検法を採用しにくいという状況があります。短期間ならともかく,欧米の試験のように数年間にわたってプラセボが投与されることは,患者医師双方にとってなかなか受け入れがたいものだと思います。しかし本来は,PROBE法は二重盲検法の代替でもないし,それぞれの優劣を論じるべきものでもありません。試験の目的によって使い分けるべきものなのです。

 連載第5回では,RCTと観察研究はそれぞれ目的が異なっており,前者は薬剤そのものの効能(efficacy)をより実験的な環境で評価し,後者はその薬剤を用いた治療の,より現実的な医療の現場での効果を評価するものと述べました。また,この中間にあたるような,よりプラグマティックな,広い範囲の患者を対象としたRCTについても少し触れました。すなわち薬剤が開発され,その効能を評価しようとするとき,当然厳格な評価が必要とされますから,厳密に二重盲検法を用いた評価が必要です。しかし,承認後使用されるようになってからの臨床試験では,効能よりも診療の現場での治療法(その薬剤を用いることで生じる他の医療行為などを含めたもの)の効果(effectiveness)の評価が必要になります。このときは二重盲検法では難しく,PROBE法が必要なのです。次回はこのことを詳しくお話しします。

つづく

参考文献
1)Mochizuki S, et al, Jikei Heart Study Group. Valsartan in a Japanese population with hypertension and other cardiovascular disease (Jikei Heart Study): a randomised, open-label, blinded endpoint morbidity-mortality study. Lancet. 2007;369(9571):1431-9.
2)The CONSORT statement(accessed 2010/2/12)  http://www.consort-statement.org/
3)Schulz KF, et al. Empirical evidence of bias. Dimensions of methodological quality associated with estimates of treatment effects in controlled trials. JAMA. 1995;273(5):408-12.
4)Wood L, et al. Empirical evidence of bias in treatment effect estimates in controlled trials with different interventions and outcomes: meta-epidemiological study. BMJ. 2008;336(7644):601-5.

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook