医学界新聞

医学界新聞プラス

『臨床研究 21の勘違い』より

連載 福原俊一/福間真悟/紙谷司

2021.12.03

 

「P値が小さいほど効果が大きい?」「RCTは常に最強のデザイン?」「多変量解析でバイアス対策は万全?」

 

臨床研究に取り組む医療者が抱きやすいこれらの「勘違い」を解きほぐす一冊が,このたび福原俊一先生・福間真悟先生・紙谷司先生によって上梓された『臨床研究 21の勘違い』です。本書では直面しやすい「21の勘違いポイント」をピックアップして解説しています。医学界新聞プラスでは,そのうち3つをご紹介。本連載を通じて,臨床研究の本質を学びましょう!

疑問(リサーチクエスチョン)の勘違い

アウトカムの数が多いほど,研究結果の意義に厚みが出る

 アウトカムの設定は研究のインパクトや切実さを決める重要なポイントです.
 ここでは,アウトカム設定に関するよくある勘違いについて考えてみます.

大風呂 はぁ眠たい….抄読会のある日は朝が早くて嫌いなんだよな.あれ,なんだこれ?

お疲れ様です.理学療法科の果楽知(カラクチ)です.直接お話ししたかったのですが,今日はずいぶんと早く帰られたようなので手紙を残しておきますね.

(早く帰ったとか一言多いな…)

今うちの科でRCTを計画しています.

(RCTとか簡単に言うなよな…)

先生にも協力してもらうつもりなので,介入の内容はまた今度詳細に説明します.

(勝手に巻き込むなよ!!)

相談したいのはアウトカムを何にするかですが,身体機能とかADLについてはこちらでいろいろと測定するつもりですが,ほかにもQOLとか術後の満足度とか,退院時の不安感とかたくさん測定しておきたいなと思ってます.もし整形外科医の視点から他にもおすすめのアウトカムがあれば提案してもらえますか? ちょっと急ぎで明日中にお願いします!

(つまり今日中にってこと!? おいおい,勝手に巻き込んでおいて,ずいぶん無茶なこと言ってくるな……でも確かにアウトカムはたくさん検証したほうが結果の厚みも出そうだし,効果を大きく主張できそうだな.論文も複数出せるかもしれない.実は美味しい話かも)

 どうやら大風呂医師はアウトカムの多さに魅了されて,協力する気になったようですね.実は大風呂医師は大きな勘違いをしています.本項ではアウトカムを複数設定する際の注意点について解説します.

「主要」アウトカムの重要性

 論文を読むと,“primary outcome”,“primary endpoint”という記載をよくみかけます.日本語にすると「主要アウトカム」や「主要エンドポイント」となり,どちらも意味は同じで,ある研究の中で複数のアウトカムを検証している場合に,「最も着目したいアウトカムはこれです」と宣言することです.このように主要アウトカムが何かを明確にすることで,読む側にこの研究の中で何をもって効果や関連があると定義し主張しようとしているのか,つまりこの研究で最も主張したいsignificance(意義)を伝えることができます.主要アウトカムが明確でないと,結局この研究結果から何を伝えたいのかが曖昧になり,本当に主張したいsignificanceがぼやけてしまいます.せっかく苦労して出した成果が意図とは違う解釈をされてしまう可能性があり,これは研究者として非常に残念なことです.

 また主要アウトカムを設定せずに複数のアウトカムを検証した研究では,背景から方法,考察,結論までの流れに軸ができず,議論があちこちに拡散してしまっている論文をよくみかけます.あるアウトカムでは介入は有効という結果になり,一方で別のアウトカムでは真逆の結果になる,などです.一貫した結果にならない場合でも,アウトカムを同列に扱っているのであれば,すべてを平等に解釈したうえで結論をまとめるのが誠実な姿勢です.しかし,現実的にはそれは至難の業ともいえるでしょう.多くの場合は都合のよい結果のみを解釈し,都合の悪い結果には適当に言及して済ます,というのが関の山です.これは全くもってフェアではありません.

複合アウトカム

 原則として,1つの研究において主要アウトカムは1つにするべきです.ストーリーに一貫性があり,結論としてうまく解釈がまとまれば複数のアウトカムでもよいかもしれませんが,稀なケースですし,その場合にもやはり注意点があります(後ほど解説します).

 複数のアウトカムを主要アウトカムとして扱う方法として「複合アウトカム」(composite outcome, composite endpoint)というものがあります.これは臨床上重要とされる複数のアウトカムをor(いずれかを満たす)で一括りにしたアウトカムのことです.たとえば大腿骨頚部骨折術後患者さんの退院後の転倒,転倒骨折による再入院,死亡のいずれかが発生することをアウトカムにするようなケースが該当します.死亡など,単独ではなかなか発生しないアウトカムに対しては,より大きなサンプルサイズや長期の観察期間が必要となりますが,複合アウトカムにすることで小規模,短期間でもアウトカムの発生数を確保できますので,研究の実施可能性を高めることができます.

 重要なのは,複合アウトカムに含まれる個々のアウトカムの重要性が臨床的に受け入れられるものであることです.何でもかんでも複合アウトカムとしてまとめればよいというものではありません.複合アウトカムの注意点として,発生しやすい,つまり,より軽症なアウトカムの数が多くなりますので,全体の結果がより軽症なアウトカムの結果のほうに引っ張られてしまいます.結果を解釈する際には,最も明らかにしたかった重要なアウトカムとの関連について,どこまで言及するか十分に検討が必要です.

副次アウトカムの役割

 ここまで,主要アウトカムの重要性について説明してきましたが,主要アウトカム以外のアウトカムは全く意味がないというわけではありません.主要アウトカム以外を副次アウトカム(secondary outcome, secondary endpoint)と呼びます.副次アウトカムの役割は大きく2つあります.

 1つ目は主要アウトカムから得られた結果の補強です.たとえば身体機能の指標として歩行速度を主要アウトカムにした研究で,有意な結果が認められたとします.しかし,この結果をみて,中には歩行速度でたまたま出た結果では?と疑念を持つ方も少なくないと思います.ここでもし,バランス機能や筋力などその他の身体機能についても副次アウトカムとして検証されており,歩行速度と一貫した結果が得られていたらどうでしょう? 歩行速度の結果に関する疑念が少し晴れませんか? このように,同じか,もしくは類似する概念をほかの指標で測定した結果として副次的に提示することで,結果の確からしさ(妥当性)を補強することができます.

 もう1つは,新たな仮説(RQ)のスクリーニングです.たとえば従来よりも侵襲範囲が小さい新しい手術手技の効果を,従来の手技と比較して検証するケースを考えてみます.侵襲範囲が小さくなることで術後の経過も良好になり,入院期間が短縮するのではないかと考え,主要アウトカムは入院期間としました.入院期間の短縮は臨床的にも社会的にも意義のある結果ですが,それだけでなく,患者さん自身が報告するアウトカム(patient reported outcome)にも効果があるかもしれないと考え,術後1週間時点での手術に対する満足度を副次アウトカムとして設定しました.結果的にどちらも有意な効果が認められたとします.「入院期間が短縮する」という非常に意義のある結果を得られると同時に,「患者さんの満足度にも効果がありそうだ」という結果も得られました.

 しかし,ここで注意しなければならないのが,満足度については効果が“ありそうだ”という表現です.満足度はあくまでも副次アウトカムですので,それに対する効果の検証は本来,別の研究として改めて行う必要があります.今回の研究では主要アウトカムに基づいて研究デザインやサンプルサイズが設計されていますので,結論づけられるのはあくまでも主要アウトカムについてのみです.これは決して無駄ということではなく,今後この新たな手術手技のさらなる効果検証を検討する,つまり次のRQを検討する際にとても重要な情報となります.

 

 いずれの役割として副次アウトカムを設定したとしても,その結果から何か重要なメッセージや強い結論を出せるわけでは決してない点に注意しなくてはいけません.確かに結果の図表の大きさや数は副次アウトカムの分だけ増えるかもしれませんが,その分だけ研究結果の厚みが増すわけではないのです.また,副次アウトカムだからといって,都合のよい結果だけ提示してあとは報告しなくてもよいわけでは決してありません.アウトカムとして設定したからには,都合がよくても悪くてもきちんと報告するのが研究者として誠実な姿勢です.

 副次アウトカムの結果やサブグループ解析のような副次的な解析結果を都合のよいように強調して報告することをSPINと呼びます.トップジャーナルの1つであるThe Journal of the American Medical Association(JAMA)誌の2010年発表の報告1)によると,抄録内のSPINは結果のセクションで37.5%,結論のセクションで58.3%と非常に高い割合で認められました.これは介入研究を対象とした分析でしたが,観察研究でも同様に副次アウトカムや多くの副次的な解析が行われます.副次アウトカムの役割を十分に認識したうえで,SPINが生じないように注意しましょう.

統計上の問題

 もう1つ,アウトカムを複数設定した場合に生じる重要な問題があります.それは統計学的検定のお約束に関する問題です.皆さんがよく目にする「P値が5%未満であれば有意差あり」の意味合いは,言い換えると「本当は差がないのに,偶然に差があると判断される確率は5%未満ありますが,それくらいは許容します」となります.20回に1回は本当は差がないのに,差があるという間違った結果が生じうるという条件のもとで統計学的検定は行われます.つまりは「アウトカムを20個検定すれば,確率的にはどれかが有意差ありとなる」ということです.

 主要アウトカムを設定せずに,複数のアウトカムの結果を同列に並べ,有意差のある結果だけを拾って介入の効果や要因とアウトカムの因果関係を論じている研究をよくみかけますが,それは生じた偶然の結果に基づいて主張しているだけかもしれません.どれだけ魅力的な結果や結論であっても,その結果自体が疑わしくなってしまいます.このように主要アウトカムを明確にせずに複数のアウトカムで結論を出そうとすると,かえって研究の価値を下げてしまうことになりかねませんので,注意が必要です.

POINT

❶主要アウトカムを設定することで,研究のsignificance(意義)を明確にすることができる.
❷副次アウトカムから得られる結果は,主要アウトカムの結果を補強したい場合や,新たなリサーチ・クエスチョンのスクリーニングとして,重要な情報となる.
❸副次アウトカムの結果だけでは強い結論を主張することはできない.

1)Boutron I, Dutton S, Ravaud P, Altman DG: Reporting and interpretation of randomized controlled trials with statistically nonsignificant results for primary outcomes. JAMA 303: 2058-2064, 2010

Quiz 1つのRQ内で複数のアウトカムを扱う場合の正しい考え方はどれでしょう?
1つ選択してください.

①結果の図表が増えるので研究としての厚みが増す
②主要アウトカム以外の結果は副次的なものなので,都合のよいものだけを提示すればよい
③複合アウトカムは頻度の高い,より軽症なアウトカムの影響を受けやすい
④統計解析においては複数のアウトカムを同時に検定することに問題は生じない

    Answer

    正解 ③

    ①複数のアウトカムに関してまとまりのない結果をたくさん報告しても,むしろ本当に伝えたかったことがぼやけてしまい,研究の重要性が伝わりにくくなります.主要アウトカムと,その結果を補足する副次アウトカムと,役割を明確にするだけでスッキリ明解なメッセージになります.
    ②研究の公正さという観点からも検証したアウトカムの結果はすべて提示するべきです.たとえ副次アウトカムであっても都合の悪い結果を意図的に提示しないことは不誠実な行為となります.
    ④20個のアウトカムを同時に検定すると,理論上はたとえ有意差がなくても偶然に有意となるアウトカムが1つは発生してしまいます.たとえP値が5%未満だとしても,本当に有意差があるのかどうか判断できなくなってしまいます.
     

109029.jpg
 

臨床研究はしくじりから学べ!
21の勘違いが教える臨床研究の極意

臨床研究のしくじりは「勘違い」が原因だった!? P値は小さいほどいい、多変量解析は万能など、ありがちな勘違いの具体例を使って、臨床研究の正しいお作法を京大チームが懇切丁寧に解説。なぜ臨床研究がうまくいかないのか、この研究結果は本当に信頼できるのか、なぜ論文がレジェクトされるのか、そんな疑問に答える1冊。

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook