医学界新聞

連載

2009.04.06

論文解釈のピットフォール

第1回
臨床研究の論文を正しく読むことは大切だけど,けっこう難しい

植田真一郎(琉球大学大学院教授・臨床薬理学)


ランダム化臨床試験は,本来内的妥当性の高い結果を提供できるはずですが,実に多くのバイアスや交絡因子が適切に処理されていない,あるいは確信犯的に除 去されないままです。したがって解釈に際しては,“ 騙されないように” 読む必要があります。本連載では,治療介入に関する臨床研究の論文を「読み解き,使う」上での重要なポイントを解説します。


 「朝食を食べない子は学力が低い」あるいは「授業態度が悪い」なんていう記事を見たことがあると思います。「日経新聞を読んでいると成績が良い」「数学を勉強した人は収入が高い」とか何でもいいのですが,いかにも前者が後者の原因になっているような新聞記事はけっこう多いですね。荒唐無稽ではなく,適度にもっともらしいというか,そうかもしれないと思う人が出る程度の怪しさなので,受験が近づくと日経新聞を購読するような家庭も出てくるかもしれません。

 これらはある意味で事実なのですが,この記事は事実を淡々と述べているのではなく,そこに因果関係があると謳っています。しかしよく読むと,このような因果関係は決して証明されていないのです。朝食を食べない家庭,朝食を作らない親は別の何かの象徴かもしれませんし,日経新聞は単に経済的余裕を表している可能性もあります。むしろそんなはずはないと疑うほうが,受験そのものにも,そしてきっとその後の人生にも役に立つと思います。

医学研究論文は正しいのか

 では,医学研究はもう少し格調が高いのでしょうか? 学会や製薬会社の宣伝用記事にはけっこうこの手のものがあります。「AとBが相関する。したがってAはBの原因と考えられる」なんていう論文は多いですが,単なる相関はその因果関係を示唆するものではありません。

図1 利尿薬使用の増加は腎不全を増加させる?
著者らは利尿薬の使用率の推移と2年後の末期腎不全発生の推移が並行していることから,利尿薬使用と末期腎不全の発生は因果関係があるとの仮説を提唱した。
 騙されやすい図を最初に挙げましょう。図1は米国の腎不全の発生頻度と利尿薬使用の関連を見た論文から抜粋したものです(参考文献1)。著者らの名誉のために断っておきますが,これは一応「仮説」として医学雑誌に掲載されています。

 一見すると利尿薬の使用率と末期腎不全(透析導入や腎移植)の発生率は並行しているように見えます。統計学的にもこれが偶然起こる確率は0.8%に満たないと解析されています。論文の著者らはこの結果から利尿薬は腎不全リスクを増やす可能性が高いと述べています。これは正しいのでしょうか?

 残念ながら,これはおそらく正しくありません。その理由はいくつかありますが,まずこの解析が正当なのかどうか考えてみましょう。この母集団はどこから来ているのでしょうか? まず同じ集団の中での利尿薬が処方されたかどうか,腎機能の推移をみたものではありません。2年ずらすという一見もっともらしい方法をとっていますが,別の集団です。そもそも血清クレアチニンが2mg/dlを超えるとサイアザイド系利尿薬は処方されないので,関連を見ることは困難なのです。

 利尿薬の使用率の推移も,「高血圧でサイアザイド系利尿薬を投与されている患者の頻度」を表しているわけではありません。腎機能が下がればサイアザイドは減り,ループ利尿薬の使用は増加し,最終的に末期腎不全となれば必要なくなりますから処方されません。最大限譲歩して関連があるとしたら,利尿薬の処方が増え,血圧が下がり,脳卒中や心筋梗塞のリスクが下がったため,腎機能が悪化しても生き残る患者さんが増えたのかもしれません。実際末期腎不全の増加は腎不全そのものの増加と並行しないという報告があります。

 結局,患者さんを利尿薬を使用する群か使用しない群のどちらかに割り付け,末期腎不全への進展リスクを評価するランダム化臨床試験が必要になります。利尿薬と他の薬とを比較したランダム化比較試験はいくつかありますが,今のところ利尿薬が末期腎不全を増やすという報告はありません。ただ,著者らは「仮説」と一見謙虚な態度を見せつつ,自分たちの考えが正しいと読者を思わせるために,ランダム化臨床試験から「部分的に」引用をしているのです。

図の提示の仕方で結果の印象が変わる

 図2はALLHATというランダム化臨床試験の一部のデータを引用したものです。ALLHATは臓器障害のかなり進んだ高血圧患者を利尿薬群(クロルサリドン),ACE阻害薬群(リシノプリル),Ca拮抗薬群(アムロジピン),α遮断薬群に割り付け,予後を比較したものです。この図を見る限りでは,クロルサリドンという利尿薬はアムロジピンと比較すると腎機能を低下させるのではないかと思いませんか?

図2 ALLHAT研究における腎機能の推移(1)
ALLHAT研究での研究開始時から4年後の腎機能の%変化。-12%を最小値とした縦軸に注意。

 しかし図3をみてください(参考文献2)。同じALLHAT研究で腎機能を1年ごとに見たものですが,一時的に腎機能は利尿薬群とACE阻害薬群で落ちますが,その後はだいたい一定ですね。最終的なアウトカムで腎不全がどんどん増えているという結果も出ていません。しかも腎機能の悪化を遷延させることが証明されているACE阻害薬とあまり差がありません。ところが,これを図2のように抜き出すと,なんだかクロルサリドンは腎臓に悪いように見えます。これはx軸を短くし,y軸を伸ばすという古典的な誇張の方法なのです。気持ちはわかりますが,やるべきではないし,惑わされないようにしましょう。

図3 ALLHAT研究における腎機能の推移(2)
ALLHAT研究での研究開始時から1年ごとの腎機能の絶対値。開始時の腎機能別に3群に分けて表示されている。縦軸は推定GFR値で最小値は0。

臨床研究論文の落とし穴に気づこう

 目の前の患者さんについて困ったとき,何をするでしょうか? 指導医に尋ねる,(きっと専門医がこれまでの臨床試験を熟読玩味して作成したであろう)ガイドラインを読む,臨床試験の結果をまとめた二次資料を読む,問題点について研究した臨床研究論文を読む,などです。「エビデンスレベル」なんて言葉を知っている人は「メタ解析」や「システマティックレビュー」を読むと答えるかもしれません。これらはすべて正しいのですが,すべてに落とし穴があるのです。

 その領域に精通した指導医は,自分で論文を読み,それを経験やその患者さんの病態のみならず価値観まで考えた結果を教えてくれるかもしれません。これは早いし,単に辞書を引き引きメタ解析を読んでわかったつもりになるより,はるかに患者さんにとっても有益だと思います。しかし,正しく論文を読んでいるかどうかわかりませんし,指導医の価値観,経験,あるいは健康状態まで教えてくれる内容に影響するかもしれません。それはあなたの患者さんに使えるかどうかわかりません。二次資料は短くてわかりやすいですが,省かれた部分に大切なメッセージが隠れているかもしれません。またガイドラインも自分の患者さんにあてはめてよいのか,自信がないこともあるでしょう。臨床研究の論文,主として観察研究やランダム化比較試験の論文を読むときにも,落とし穴はたくさんあります。

 本連載では,いろいろな落とし穴について,実際に例を挙げながら考察していく予定です。

つづく

参考文献
1)Hawkins RG, Houston MC. Is population‐wide diuretic use directly associated with the incidence of end‐stage renal disease in the United States? A hypothesis. Am J Hypertens. 2005 Jun;18(6):744‐9.
2)Hsu CY, Vittinghoff E, Lin F, Shlipak MG. The incidence of end‐stage renal disease is increasing faster than the prevalence of chronic renal insufficiency. Ann Intern Med. 2004 Jul 20;141(2):95‐101.