医学書院

検索
HOME週刊医学界新聞 > 第3320号 2019年04月29日



第3320号 2019年4月29日


臨床研究の実践知

臨床現場で得た洞察や直感をどう検証すればよいか。臨床研究の実践知を,生物統計家と共に実例ベースで紹介します。JORTCの活動概要や臨床研究検討会議の開催予定などは,JORTCのウェブサイトFacebookを参照してください。

[第2回]臨床研究の質を高める3つの目標

小山田 隼佑(JORTCデータセンター統計部門 部門長)


前回よりつづく

臨床研究は計画が命

 研究を行う臨床医と,生物統計家やデータマネジャーを有する研究支援組織との,計画段階からの密接な連携は臨床研究を成功に導く上で重要です。なぜなら,誤った研究計画や不適切な研究実施を基に集めたデータから得られる結果は,どんなに優れた統計解析をしても,“Garbage in, garbage out”となってしまうからです(統計解析も計画の一部)。3312号の座談会第1回・3316号でもお伝えしてきました。

 しかし,「計画が大事」と一口に言っても実際に注意すべきことは非常に多い上,研究の目的やデザインなどによっても異なるため,いきなりたくさんのことを学ぼうとすると消化不良を起こしてしまいます。

 今回は,本連載の総論的な位置付けで,臨床研究を計画する前にまず知っておきたい,臨床研究の質を高めるための3つの目標(Clarityの確保,Comparabilityの保証,Generalizabilityの検討)について説明します1))。

表1 臨床研究における3 つの目標(文献1より)
1)Clarity:誤差的バラつきを小さくし,研究の精密度を向上させる
→サンプルサイズを増やす,測定誤差を減らす,他。

2)Comparability:群間の比較可能性(研究の正確度)を向上させる
→ランダム化(無作為割付),盲検化,他。

3)Generalizability:結論の一般化可能性を向上させる
→適格基準/除外基準の設定,サブグループ解析,他。

目標その1:Clarityの確保

 1つ目の目標であるClarityの確保は,研究の「精密度(Precision)」を向上させ,なるべく明白な結論が出るようにすることです。精密度は「誤差的バラつき」の度合いの尺度で,誤差的バラつきが小さいほど,精密度が高いと言えます。これに対し,「正確度(Accuracy)」とは,「真値(神様だけが知っている正しい値)」とのずれ(バイアス)の度合いの尺度で,バイアスが少ないほど正確度が高いと言えます。に示した通り,観測値は真値とバイアス,誤差的バラつきを合わせたものと考えることができ,真値からずれたデータを取得しても,そこから推定した値は真値を表現できません。そのことから,まずはバイアスを可能な限り除去した上で(=正確度を高めた上で),誤差的バラつきを小さくする(=精密度を高める)ことを考える必要があります。

 精密度(Precision)と正確度(Accuracy)(文献1のp.5より改変)(クリックで拡大)

 Clarityを確保するための工夫として最も有効な方法は,サンプルサイズ(症例数)を増やすことです。なぜなら統計学的に,サンプルサイズに比例してClarityが高まる(例えば,信頼区間が狭まる)からです。また,仮説検定には,サンプルサイズが大きいほど,検出力が大きくなり,p値が小さくなる(=統計学的有意になりやすくなる)という性質があるため,サンプルサイズが結果に大きな影響を与えます。しかし,サンプルサイズを増やすとそれだけ必要なコストも増しますし,不当に多くの患者を参加させることによって倫理的な問題も生じます。これらの観点から,必要なClarityを保証する最低限のサンプルサイズで臨床研究を実施するべきです。

 他の工夫として,測定者へのトレーニングを実施することで測定誤差を減らすことが挙げられます。また,がんの増悪判定や臨床検査値の測定などを1か所で実施することで,施設や機器,医師の違いによるバラつきが小さくなることが期待されます。

目標その2:Comparabilityの保証

 臨床研究では多くの場合,群間比較を行います。2つ目の目標であるComparabilityの保証は,この群間比較の妥当性(=比較可能性)を保証することです。治療Aと治療Bの正確な比較をするには,治療A群と治療B群との差が,治療A,Bの他には偶然,つまり誤差的バラつきだけしかない(=正確度が高く,バイアスがない)という状況を作り出す必要があります。そのためには,治療A,B以外の要因が群間で似通っていなければなりません。治療A群と治療B群の人たちがどのくらい「同じ人たち」と言えるかを,比較可能性と言います。別に,Internal validity(内的妥当性)と呼ぶこともあります。

 比較可能性を歪める例を2つ挙げて考えてみましょう。1つは交絡因子の存在が考えられます。交絡とは,患者反応に影響を及ぼす背景因子の分布が治療A群と治療B群の間でアンバランスな場合,治療への反応性が群間で異なる可能性が大きくなることです。交絡因子の影響を考慮するための工夫として,確率的に割り付けられる治療群を決定するランダム化(無作為割付)が挙げられます。ランダム化の優れているところは,それぞれの治療群で,未知の交絡因子を含む全ての背景因子の影響を「確率的に均一化」することができる点です。

 もう1つの例を挙げると,治療の内容を知ってしまうことで生じ得る評価バイアスが考えられます。試験治療に期待している医療者の場合は,効果を過大評価しやすいと言えますし,治療法に対する患者の期待や疑念が,日常生活や病気に対する意識や訴えを変えてしまうかもしれません。評価バイアスを制御する工夫には,いずれの治療を実施しているのかをわからなくする盲検化が挙げられます。特に,患者と医療者のいずれも治療の内容を知り得ない,二重盲検が望ましい手段です。

目標その3:Generalizabilityの検討

 Comparabilityの保証の説明で述べたように,研究の比較可能性(内的妥当性)を担保することは大前提です。その上で,3つ目の目標であるGeneralizabilityの検討は,比較可能性の担保によって得られた研究結果を,できるだけ広い範囲の患者に適応できるようにすることです(=一般化可能性)。内的妥当性に対抗して,外的妥当性(External validity)と呼ばれることもあります。

 便宜上,「母集団=対象疾患を持つ患者全体」,「標本=臨床研究に実際に参加した患者」とすると,仮説検定や信頼区間では,無作為抽出(母集団を構成する,全ての個体の選ばれる確率が等しい抽出法)によって得られた標本から母集団を推測できることを仮定します。臨床研究では,さまざまな観点から,施設の限定や除外基準の設定が行われ,さらに同意の得られた患者のみが対象となるため,目標集団と実際の対象集団には隔たりが生じ,無作為抽出された標本と見なすことは一般にはできません。その上で,臨床研究で得られた結果を一般化するためにはどのような検討をすべきか,という点が重要となってきます。

 一般化可能性を計画段階で検討する上では,適格基準/除外基準をどのように設定したかが重要です。これに対し,解析段階で一般化可能性を検討する手段として,サブグループ解析が挙げられます。

 今回は臨床研究の質を高めるための3つの目標(Clarityの確保,Comparabilityの保証,Generalizabilityの検討)について概念的な内容を紹介しました。今後の連載でも繰り返し登場する,臨床研究の重要なエッセンスです。3つの目標を前提に取り組んでいきましょう。

今回のポイント

・誤った研究計画に基づいて得られたデータを解析しても,質の高い結果は得られない。そのため臨床研究は「計画が命」。
・臨床研究の質を高める3つの目標,「Clarityの確保」「Comparabilityの保証」「Generalizabilityの検討」を必ず押さえる。

つづく

参考文献
1)大橋靖雄.別冊「医学のあゆみ」 医師のための臨床統計学 基礎編.医歯薬出版;2011.

連載一覧