医学界新聞

連載

2011.05.16

論文解釈のピットフォール

第26回 最終回
論文の記載と解釈における見識と矜持――SPINとRELY試験からの考察

植田真一郎(琉球大学大学院教授・臨床薬理学)


前回からつづく

 本連載も残念ながら最終回を迎えました。臨床試験とは,背景,病態の多様な患者を対象とし,研究デザインを工夫してバイアスやランダムエラーを最小限にしつつ,いわば確率論的な見地から正答を見いだそうとする研究手法です。したがって,これまで本連載で述べてきたような弱点はたくさんあります。しかし,薬効はランダム化比較試験(RCT)の結果に基づいて厳密に評価される必要があるなど,臨床試験で解決しなければならない診療上の問題はまだまだ多いのです。完璧にデザインされた研究を実施することは不可能であることを踏まえ,トレードオフを重ねる必要はありますが,真実に近付くためには今後も不可欠な研究手法だと思います。

RCTにおけるSPIN

 臨床試験の最も重要な部分はまずsensibleなClinical Questionであり,それに基づいた研究仮説を適切なデザインで検証することになります。そして,研究結果でその仮説が証明されたのか,そうではないのかが明瞭に記載されなければなりません。ところが,これが必ずしも適切に行われていないことが最近報告されています。特に最も重要な一次エンドポイントに有意差がみられなかった論文において,適切でない記述(SPIN)が多いのです()。

 は,2006年12月に発表され,2007年3月までにPubMedに収載されたRCTのうち,一次エンドポイントで統計学的な有意差が認められなかった(優越性試験で試験治療が対照治療よりも優れているという結果が得られなかった)研究の論文において,結果,考察,結論が適切に結果を反映しているかどうかを調査した結果です1)。要約すると,(1)二次エンドポイントで差が生じたことを強調する,(2)あるサブグループ解析に限って一次エンドポイントで差が生じたことを強調,あるいは差がないことをいつの間にか効果が同等だとすり替える,(3)群間比較なのに治療群の前後比較で効果を主張する,(4)危険性について言及していない,などが頻繁に認められるのです。

 一次エンドポイントに有意差が認められなかった臨床試験論文におけるSPIN(文献1より改変)

 最近の動脈硬化性疾患をめぐる臨床試験では,心筋梗塞や脳卒中,死亡などのはっきりしたエンドポイント(これらが一次エンドポイントとなることが多い)で差がつきにくいため,二次エンドポイントやサブグループ解析の結果を強調するなど,焦点のすり替えも行われているようです。やはりResearch Questionは客観性の高い一次エンドポイントに反映されますし,研究計画はそこをはっきり評価するために作成されていますから,結果を明確に記載し,解釈し考察すべきですね。

 二次エンドポイントの結果はある意味で探索的なもので,強調することで読者をミスリードする危険性があります。また,一次エンドポイントで治療効果が証明されなかったときにたまたま有意差が生じたサブグループ解析の結果の強調は,以前お話ししたように意味のないものです。特に製薬会社が資金提供している研究には注意が必要です。論文を読む際には,一次エンドポイントの結果のみを読んで差がなければ,どちらの治療法でも大差はないと考えていいと思います。考察の部分は読まないほうが賢明かもしれません。最近は大きな学会で臨床試験の結果が報告されると,ネット配信などで提灯持ちのような記事が掲載されることがあります。たいてい「一次エンドポイントでは差がなかったが,XXでは差があった」などと記載されています。まさにSPINの記事ですね。

薬剤承認時の試験結果の解釈

 研究結果の解釈を最も厳密に行わなければならないのは,薬剤の承認申請時の審査だと思います。非弁膜症の心房細動を有する患者を対象にトロンビン阻害薬であるダビガトラン(110mg×2/日または150mg×2/日)をワルファリンと比較したRELY試験(第3相の治験に当たり,もともと非劣性試験)を読んでみましょう2)

 に示すように,一次エンドポイントである脳卒中および全身性塞栓症発生は,ダビガトラン110mg×2/日(以下,110mg)群とワルファリン群では差がなく,150mg×2/日(以下,150mg)群ではワルファリンより少ないという結果が出ました。また,安全性エンドポイントの大出血リスクは,110mg群でワルファリンよりも有意に少なく,150mg群では同等でした。この結果,両用量で非劣性が証明され,150mgでは脳卒中,塞栓症の予防に関してワルファリンよりも優れている可能性が示唆されています。では,ダビガトランはワルファリンよりも優れていると言えるのか(すなわちすべてのワルファリン服用患者をダビガトランに変更すべきか),そしてダビガトランの用量としてどちらを承認すべきか(あるいは両方を承認すべきか),という2つの問題について考えてみましょう。

 RELY試験における一次エンドポイント(脳卒中および全身性塞栓症)の累積ハザード率(文献2より改変)
イベント発生は,ダビガトラン110mg×2/日群ではワルファリン群と同等,150mg×2/日群ではワルファリン群よりも少ない。

 まず,ワルファリンに対するダビガトランの優越性は,一見150mgで証明されているように見えます。しかしRELY試験では,ワルファリンの用量調節が必ずしも成功しているとは言えません。というのは,抗凝固能の指標であるINRが治療域に達していた期間は64%に過ぎないからです。論文には記載されていませんが,FDA(米国食品医薬品局)で公開されている資料では,用量調節が適切な(INRが治療域にある)患者では,「脳卒中,全身性塞栓症,大出血のいずれのリスクもワルファリン群とダビガトラン150mg群では差がない」とされています。

 確かに,ITT解析で現実のワルファリン使用患者のアウトカムを評価するという意味ではINRが治療域にない患者は存在するわけですから,集団としてのアウトカムはダビガトラン150mgのほうが優れていると言えます。しかし,個々の患者を診療する立場になると,ワルファリンでうまくコントロールできている患者までダビガトランに変更しなければならないような優越性はなかったと言えるのではないでしょうか。食物や薬物相互作用に関する注意喚起が必要なワルファリンは煩雑と感じられるかもしれませんが,一方で安価,薬効のモニタリングが可能,というメリットもあります。

 次にダビガトランの用量の問題ですが,米国では「150mg×2/日」のみ承認されています。「110mg×2/日」はなぜ承認されなかったのでしょうか? この件に関してはFDAのReviewerの間でも意見が分かれたようです。決め手になったのは,110mgは150mgと比較して明らかに脳卒中,塞栓症リスク低下に関して効果が劣るということだと思います。ここがまさにダビガトランをめぐる臨床試験や治療の問題点です。すなわちダビガトランはワルファリンと異なり,INRのようなマーカーがないため,集団としての150mg群と110mg群のアウトカムを基に用量設定をしなければならないのです。たとえ110mgで治療域になる患者がいても同定は困難です。日本では低用量も承認されていますが,用法・用量に記載されているような「1回150mgを1日2回経口投与する。必要に応じて,1回110mgを1日2回投与へ減量」という用量調節を何を指標に行うのか,RELY試験の結果からは読み取れません。INRの定期的なモニタリングと,それに応じた用量調節を必要としないことがダビガトランのメリットであると強調されていますが,それは集団の論理であり,個々の患者における治療ではむしろデメリットになることを,臨床医は忘れるべきではないと思います。

(了)

:SPINとは,結果を適切に反映せず,情報を都合のいいように解釈して記載することを指す。

参考文献
1)Boutron I, et al. Reporting and interpretation of randomized controlled trials with statistically nonsignificant results for primary outcomes. JAMA. 2010; 303(20): 2058-64.
2)Connolly SJ, et al. Dabigatran versus warfarin in patients with atrial fibrillation. N Engl J Med. 2009; 361(12): 1139-51.

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook