医学界新聞

臨床研究の実践知

連載 小山田 隼佑

2020.05.11



臨床研究の実践知

臨床現場で得た洞察や直感をどう検証すればよいか。臨床研究の実践知を,生物統計家と共に実例ベースで紹介します。JORTCの活動概要や臨床研究検討会議の開催予定などは,JORTCのウェブサイトFacebookを参照してください。

[第14回]欠測の取り扱い

小山田 隼佑(JORTCデータセンター統計部門 部門長)


前回よりつづく

 第13回(3366号)の中で,「欠測が発生した場合,何らかの対処が必要となる可能性がある」ことをお伝えしました。今回は第6回(3336号)でも紹介した研究1)を基に,欠測の取り扱いを決定する際の考え方・プロセスについて紹介します。

欠測による検出力不足やバイアス混入を,どう回避する?

 本研究はがん患者の神経障害性疼痛に対する,デュロキセチンの疼痛軽減効果を検討するためのプラセボ対照のランダム化二重盲検比較試験です。評価は治療開始前(Day 0),治療開始後3日目(Day 3)および10日目(Day 10)に実施され,主要評価項目はDay 10におけるBrief Pain Inventoryのitem 5「評価前24時間の平均の痛み」(以降,BPI)です。

 主要評価項目の解析として,2標本t検定が計画段階から採用されています。また,本研究では片側検定を計画し,有意水準を片側5%(両側10%)と事前に設定したため,対応する信頼区間は「90%信頼区間」です。

 サンプルサイズ設計の結果,目標登録症例数は両群で70例と設定されました。本研究では実際に70例が登録され,解析対象集団(プロトコール治療を受けた症例)は両群で67例でした。しかし,解析対象集団のうち2例で,主要評価項目が欠測してしまいました。

 欠測が生じた場合,大きく2つの問題が発生します。1つ目は,欠測が生じた症例を除外した場合に検出力が低下してしまう点です。これは,欠測が生じない前提でサンプルサイズ設計を実施した場合には特に問題です。しかし本研究では,計画の段階で治療前や治療途中での中止などを考慮し,症例を上乗せしていました。その結果,当該2例を除外することで「検出力が足りなくなる」という事態は回避できました。

 問題は2つ目の,欠測が生じた症例を除外した場合にバイアスが混入する可能性がある点です。例えば,あるQOLのスコアは状態が悪いと欠測が生じやすい(状態が良好なほど欠測が生じにくい)とします。この場合,観測データのみに基づく推定値は過大評価となってしまうかもしれません()。

 欠測によるバイアスの混入の例

 欠測が生じた場合,まず「欠測した理由」を調査する必要があります。次に欠測理由とアウトカムの関連の程度を推測し,欠測の発生メカニズムとして何が妥当でありそうかを考えます。欠測の発生メカニズムはで示す通り,Missing Completely At Random(MCAR),Missing At Random(MAR),Missing Not At Random(MNAR)の3種類があります。

 欠測の発生メカニズム(クリックで拡大)

欠測の発生理由から対処法を検討する

 本研究ではデータ固定前に盲検化の下で症例検討会を実施しました。その中で,主要評価項目が欠測した2例について「欠測した理由」を調査したところ,共に「臨床症状の悪化による中止」が理由とのことでした。

 まず,「疼痛の強弱」によって「臨床症状の悪化」が生じているとは考えにくいことから,「BPIの欠測の発生は,BPIの欠測データそのものには依存していない」,つまりMNARではないと判断しました。一方,「BPIの欠測の発生が,観測データのみで説明可能」とは言い難く(MARの仮定が困難),MCARを仮定することも不可能と考えました。つまり,いずれの欠測発生メカニズムも積極的に仮定することは難しいという状況でした。

 協議の結果,MARを積極的に支持することは難しいものの,MNARを仮定するよりは妥当と判断し,本研究では欠測発生メカニズムの仮定にMARを採用しました。その上で欠測に対する対処法を模索し,正規の解析結果として採用する「主解析」と,結果の安定性を確認するための「感度解析」を決定する方針としました。

 一般に,欠測を含むデータを解析する際は,欠測発生メカニズムに関する仮定の下でバイアスのない推定値が得られる手法を主解析に採用します。今回仮定したMARの下で妥当な結果が得られる手法としては,多重補完法(Multiple Imputation)が挙げられます。これは観測データに基づく統計モデルを作成し,モデルから発生させた予測値を欠測に補完した完全データを複数個作成し,得られた複数個の解析結果を併合して1つの結果を得る手法です。これが最も良さそうな手法にも思えますが,作成した統計モデルが適切かどうかわからない点に懸念があります。

 また,従来よく利用されてきた手法として,LOCF(Last Observation Carried Forward)があります。これは欠測を直近の先行観測データ,つまりDay 3のBPIで補完して解析する手法です。「Day 3のBPIが中止後もDay 10まで続く」と仮定できる場合は妥当ですが,仮定が適切でない場合にはバイアスが入りますし,肯定することは非常に難しいと考えられます。

 他にもさまざまな手法を検討しましたが,最終的に本研究ではCC(Complete Case)を主解析に採用しました。これは欠測が生じなかった症例のみで解析する手法です。欠測が生じた症例を除外しているため,今回仮定したMARの下では解析結果にバイアスが混入する可能性が否めませんが,2例分のデータの有無が結果を大きく変えることは無いだろうと判断しました。

 また,感度解析としてはBOCF(Baseline Observation Carried Forward)を採用しました。これは「治療終了後,ベースラインの状態に戻る」という前提の下,欠測をベースライン値,つまりDay 0のBPIで補完して解析する手法です。研究対象である慢性疼痛の「自然治癒しない」という症状特性が,手法の前提に合うと判断しました。

 今回採用した解析の結果を「群間差 [90%信頼区間],p値」で示すと,主解析(CC)では「-0.84[-1.71,0.02],p=0.0533」,感度解析(BOCF)では「-0.85[-1.69,-0.01],p=0.0476」となり,2つの結果が有意水準5%をちょうど挟むような形となりました。サンプルサイズを上乗せしてもなお,主解析のp値が0.05を上回った事実は受け入れる必要がありますが,推定値としては2つの解析でほとんど差異が無く,「デュロキセチンに一定の効果がある」という傾向は確認されました。

 今回はあくまで「本研究ではこのような検討を経て方針を決めた」という紹介で,同じ状況でも研究チームが違えば結果は異なるものとなり得るでしょう。また,欠測の数がより多い状況では結果への影響も甚大なものとなりますし,欠測の発生メカニズムに対する仮定が真実とは異なる可能性も大いにあります。欠測に対する絶対的な対処法は存在しないため,欠測が発生しないよう予防策を検討することが最も重要で,やはり「臨床研究は計画が命」と言えるでしょう。

今回のポイント

・欠測が生じた症例を除外して解析した場合,検出力の低下やバイアスの混入が懸念される。
・欠測の発生メカニズムとして何が妥当かを考えた上で,対処法を模索する必要がある。
・欠測が発生しないよう予防策を検討することが最も重要。

つづく

謝辞:本研究の研究代表者である近畿大心療内科/緩和ケアセンターの松岡弘道氏に資料提供と助言をいただきました。感謝の意を表します。

参考文献
1)Matsuoka H, et al. J Pain Symptom Manage. 2019[PMID:31254640]

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook