医学界新聞

医学界新聞プラス

『臨床研究 21の勘違い』より

連載 福原俊一/福間真悟/紙谷司

2021.12.17

 

「P値が小さいほど効果が大きい?」「RCTは常に最強のデザイン?」「多変量解析でバイアス対策は万全?」

 

臨床研究に取り組む医療者が抱きやすいこれらの「勘違い」を解きほぐす一冊が,このたび福原俊一先生・福間真悟先生・紙谷司先生によって上梓された『臨床研究 21の勘違い』です。本書では直面しやすい「21の勘違いポイント」をピックアップして解説しています。医学界新聞プラスでは,そのうち3つをご紹介。本連載を通じて,臨床研究の本質を学びましょう!

比較の勘違い

P値の大きさで効果を比較する

P値が小さいから効果が大きい

抄録

背景・目的:腰痛は頻度の高い疾患であり,社会負担となっている.われわれは,腰痛に対する種々の薬物療法の効果について検討した.
方法:整形外科外来に慢性の腰痛下肢痛で通院する成人患者135名を対象とした.コシヨクナリンのみの服用,漢方薬の腰明丸のみの服用,コシヨクナリンと腰明丸の服用の患者群で,痛みの程度をVAS(visual analogue scale法)で測定した.またコシヨクナリンの平均1日服用量を測定した.
結果:コシヨクナリンのみ服用群では痛み(VASスコア0〜10)の平均スコア7.2点 (P値=0.06),腰明丸のみの服用群のVAS平均スコア6.5点(P値=0.001),コシヨクナリンと腰明丸の併用VAS平均スコア6.0点(P値=0.01)と,各群間で統計的に有意差を認めた.

 大風呂医師がリサーチ・カンファレンスでこの抄録を発表し終わった後,教授がおもむろに「それで君は,この結果をどう解釈するの? 第一,結論がないじゃないか.やりなおし!」

 おっしゃるとおり….さて困った.

 終了後,教員や同僚からコメントをもらった.持つべき者は先輩と同僚.しかし,3名とも解釈が異なっているじゃないか!

 この中で正しい解釈はどれだろう?(複数可)

●助教:結果は明確だね.腰明丸が最も効果がある.その次に併用療法.コシヨクナリンが最も効かないね.
●講師:コシヨクナリンが最も効かないのは同意見だが,併用療法が最も効果がある.次に腰明丸だね.
●同僚の院生:この結果からは何もわからないんじゃない?

大風呂 なぜこの助教はこう解釈したんだろう.
結果のP値に着目したからか? 各治療法でP値を比較してみよう.

■各治療法のP値

①コシヨクナリンのみP値=0.06
②腰明丸のみP値=0.001
③コシヨクナリンと腰明丸の併用P値=0.01

大風呂 やっぱりそうか,助教はP値の大きさを比べて,小さいものほど効果があると考えたんだな.この解釈でいいと思う.講師や同僚に悪いけど,これでいこう.

 皆さんはどう思いますか?

 筆者は,臨床医から彼らが行った研究結果を見せられ,「何とかP値を小さくしてもらえないだろうか?」という厚かましい相談を受けることがあります.これはその医師が「P値依存症(significantosis)」という病気に罹っている兆候です.皆さんは,まさかこのように「P値依存症」に陥ってはいませんよね?

 「自分はそんなことはない」と思っているあなた,では以下は正しいでしょうか?

 

 「P値が小さいほど,効果が大きい」

 

 これは誤りです.P値がどれほど小さくても,効果が大きくないことはよくあることです.たとえば,P値が0.001の場合,「統計的に有意」なので効果が大きい,P値が0.1の場合,「統計的に有意ではない」ので効果は小さい,と判断することはできないのです.

 では次はどうでしょうか?

 

 「効果が大きいほど,P値は小さい」

 

 これは正しいです.どうしてそうなるのでしょう.

P値とは何か?

 そもそも,P値とは何でしょうか? 疫学や統計学の成書で何度も学ばれたと思います.しかしこれほどわかりにくいものもないでしょう.
 教科書的にいえば,P値の定義は下記のようになります1)

■P値とは?

 差がないという帰無仮説が正しいと仮定したときに,1つの研究から得られた結果が,その値,あるいはそれ以上の極端な値をとる確率.

■P値を左右する2つの要因

 それでは,P値を左右する要因とは何でしょうか? 2点あります.

❶効果の大きさ:effect size=関連性(相関)の強さと同義

 効果の大きさは,P値を左右する最も重要な要素です.効果が大きいほど,あるいは関連性が強いほど,P値は小さくなります.効果の大きさのことをeffect sizeとも呼びます.しかしP値が小さいから効果が大きい,とは限らないのです.

❷推定の精度(偶然誤差)

 P値を左右するもう1つの要因は,推定の精度(偶然誤差)です.真の効果の大きさは誰にもわかりません.1回の研究で得られる結果は,母集団から抽出したサンプル内での値だけです.そこから真の効果の大きさを推定することとなります.その推定の精度を最も大きく左右するのが,サンプルの大きさです.

 P値は,上記❶,❷の2つの要素によって左右されるので,どちらが原因で小さいのか(あるいは大きいのか),P値をみただけでは判断できないと理解してください.これが最も重要です.「P値によって右往左往しない」と肝に銘じてほしいのです.

■どのように効果の大きさを判定する?

 大風呂医師はP値の大きさだけを比較して効果の大きさを判断してはいけないことを学びました.そこで,講師の意見を思い出しました.「コシヨクナリンが最も効かない.併用療法が最も効果があり,次に「腰明丸」,講師はどうしてそう解釈したのでしょう?

■各治療群の痛みスコア平均点(VAS 0〜10)

①コシヨクナリンのみ7.2点(P値=0.06)
②腰明丸のみ6.5点(P値=0.001)
③コシヨクナリンと腰明丸の併用6.0点(P値=0.01)

大風呂 なるほど,疑問の原点に戻ればよかったんだ.
RQは,「腰痛を有する患者の痛みに対して.最も効果のある薬物治療法は何かを知りたい」だから,痛みの程度をVASで測ったんじゃないか!
患者さんから答えてもらうのは大変だったなあ.よく協力してくださった(感謝).
そうすると講師の解釈は正しい.痛みのVASの平均スコアを比べればいいんだ.コシヨクナリンと腰明丸の併用が最も効果的で,その次が腰明丸のみ,コシヨクナリンのみが最も効果が小さいんだ.

 さて,皆さんはどう思われますか?

効果の指標

 ここで「効果をどのように測定し,推定するか?」を考えてみましょう.言葉を変えると,「効果の指標は何か?」ということです.

 初学者がつい陥りがちな間違いは.痛みの程度(ここではVASスコアの平均値)そのものを効果と勘違いしてしまうことです.抄録では,VASをどの時点で測定したのかさえ記述していないため問題となります.このように,治療後の痛みスコアのみを比較するというのは,臨床研究でよくみられる過ちです.これはほかの症状,検査,QOLでもすべて同じことです.

 

 では,どのような指標を用いて,どのように評価すればよいでしょうか?
効果を正しく評価するためには,それぞれの治療法の前後で痛みの変化量を,異なる治療群の間で比較する必要があります.以下にその手順を示します.

①各治療群で,治療前と治療後のVASスコアの差(痛みの変化量)を求める
②各群間でその変化量を比較する
③具体的には,特定の治療をコントロールとして設定し,それとの「比」(変化量比)あるいは「差」(変化量差)をとる.

大風呂 なるほど,そうだったのか.
自分の知りたいことに答えるためには.こういう手続きが必要だったんだ.とすると,この抄録のP値はどこから計算してきたんだろう?

そのP値は何と何を比較したの?

 大風呂医師の疑問に答えましょう.抄録のP値はどのように計算されたのでしょうか?

 各治療群のP値は,それぞれの治療前(ベースライン)のVASスコアと,治療後のVASスコアとが統計的に有意に異なるかどうかをみるために計算しただけでした.本当は,治療前後のVASスコアの差である「変化量」を各群間で比較し,特定の治療をコントロール群として,それとの「比」あるいは「差」を求め,帰無仮説(前者では1,後者では0)を検定(棄却する,あるいはしない)しなければならなかったのです.

POINT

❶P値が小さくても効果が大きいとは限らない.
❷P値は,効果の大きさと効果の推定精度の2つによって左右される.
❸治療効果の大きさを評価するためには,治療前後の効果の変化を求め,異なる治療群間で比較しなければならない.
❹効果の指標は,「比」か「差」を用いる.
❺「P値依存症」から脱却しよう.

1)福原俊一:臨床研究の道標─7つのステップで学ぶ研究デザイン.改訂第2版.健康医療評価研究機構,2017

2)竹内 啓:統計学辞典.東洋経済新報社,1989

Quiz P値を大きく,あるいは小さくするのはどのようなとき?
○……P値を大きくする ×……P値を小さくする △……どちらともいえない

①サンプルサイズが大きい.
②データのばらつき(SD)が大きい.
③推定の精度が高い.
④治療効果が大きい.
⑤要因とアウトカムの関連性(相関)が強い.
⑥交絡やバイアスの影響が大きい.

    Answer

    ◯:② 

    ✕:①,③,④,⑤ 

    △:⑥

109029.jpg
 

臨床研究はしくじりから学べ!
21の勘違いが教える臨床研究の極意

臨床研究のしくじりは「勘違い」が原因だった!? P値は小さいほどいい、多変量解析は万能など、ありがちな勘違いの具体例を使って、臨床研究の正しいお作法を京大チームが懇切丁寧に解説。なぜ臨床研究がうまくいかないのか、この研究結果は本当に信頼できるのか、なぜ論文がレジェクトされるのか、そんな疑問に答える1冊。