医学書院／週刊医学界新聞【連載　実践統計学入門】（第２２４８号　1997年7月14日）

連載 Evidence-Based Medicineのための

実践統計学入門

山本和利　京都大学医学部附属病院総合診療部講師

(6)　治療効果の指標

●事例

　1970年，University Group Diabetes Program（UGDP）は血糖降下剤の有効性を評価するために，糖尿病患者に対して無作為対照試験を行ない，5年間経過観察し，表1のような結果を発表した^1）。

●治療効果の指標

　医学文献を正確に読むためには，治療効果の指標を知らなければならない。いくつかの指標の計算法を示す。
　相対リスク（relative risk:RR）は治療薬の偽薬（プラセボ）に対する比で，表1の文字を使って表すと（a／a＋b）／（c／c＋d）となる。前向き研究の時に用いる。
　オッズ比は（a／b）／（c／d）と表され，後ろ向き研究であるケース・コントロール研究の時に用いる（最近，前向き研究結果をメタアナリシスしてまとめた結果が，オッズ比と表示されていることが多い）。
　相対リスク減少率（relative risk reduction:RRR）は1からRRを引いた値である。表1の文字を使って表すと，1－｛（a／a＋b）／（c／c＋d）｝となる。
　絶対リスク減少率（absolute risk reduction:ARR）は，両群のリスクの差をとった（c／c＋d）－（a／a＋b）と表される。
　従来，臨床上の有用性を示す指標として，主にRRRとARRが用いられてきた。現在でも，多くの権威ある医学雑誌の論文ではRRRが用いられている。しかし，対照と比較した新しい治療法の有用性をRRRで表わすと，例えば，最終集計時の死亡率が10％対5％でも1％対0.5％でも，同じように50％と表され，臨床上はわずかな差であっても大きな数字に置き換えられるため，読者に誤解を招きやすい。一方，ARRは純小数で表現されるため，個々の患者に応用しようとする場合に理解しにくい。

●Number Needed to Treat

　それらの欠点を解決するための指標が（number needed to treat:NNT）である。NNTは1をARRで割った値をいう。「対照となる治療ないし自然経過に加えて，その治療の1例の効果を観察するためには，その治療を何人の患者に用いなければならないか」という指標に置き換えられたことになる。
　オッズ比や相対リスクよりも，ARRとNNTを使うよう勧められている^2）。そうすることにより，1人の患者を救うためにどれだけの費用と薬が必要なのかがより明確になる。NNTがマイナスのときは対照群より成績が悪いことを示している，全死亡について治療効果の指標で表示した（表2）。

●95％信頼区間

　母集団の未知の母数を標本の値から適当な幅をもたせて推定しようというのが区間推定である。区間推定の場合，推定の精度を100（1－α）％のようにパーセントで明記し，信頼係数と呼ぶ。95％信頼区間はα＝0.05としたときに得られる。95％信頼区間は上下の2.5％を除いた範囲である。
　臨床研究結果を個々の患者に応用するにはどうしたらよいか。RRRではbaselineのリスクがわからないため，患者のbaselineのリスクを確かめる（トルブタマイド群は30／204＝0.147，偽薬群は21／204＝0.102）。表示する指標は治療法の効果を評価できるARR（－0.045），NNT（－22.2）を用いるべきである^3）。
　この結果が統計的に有意であるかを検討するには95％信頼区間（ARR－1.96×標準誤差，ARR＋1.96×標準誤差）を示すのがよい。95％信頼区間が狭いほど信頼性が高い。ARRの場合は95％信頼区間が0をまたがなければp＜0.05で統計的に有意となる。

●事例の評価

　この場合のARRの95％信頼区間は（－0.109，0.019）である。糖尿病患者を血糖降下剤で5年間治療すると，しない者よりも22名に1名の割合で死亡しやすい（NNT＝－22.2）。しかし，ARRが0をまたいでいるので，これは統計的に有意な差ではない（同じやり方で症例を増やせば有意差が出る可能性はある）。
　この結論が，一時期，「血糖降下剤は糖尿病患者の死亡率を増加させる」として大問題になった。これより先は，統計学の問題ではなく，バイアスによって結果が歪められていないかどうかを別の面からアプローチする必要がある。実際には，「トルブタマイド群の治療の方法に問題があるために結果が歪められた」という結論に落ち着いた。

●有名雑誌でARRやNNTを見かけるか？

　New England Journal of Medicineには治療結果の評価をARR，NNTで表した論文をあまりみかけない。個人的な推測になるが，掲載するかどうかの決断についてもRRRで表したほうがインパクトが大きいことが影響していると思われる。その理由として，「研究結果を知らせるときに，単に表現法を変えるだけで決断者に影響を与える」事実があげられる。
　例えば，健康問題に関わる行政職182名に対して，無作為化して行なわれた冠動脈バイパス術と乳癌治療の結果を(1)RRR，(2)ARR，(3)イベントフリー（死亡や罹患がない）患者率，(4)NNTの4つの表現で記載して，質問表を郵送した。そしてこれまで出資していた他のプログラムの代わりにマンモグラフィ・プログラムまたは心臓リハビリ・プログラムを予算化する気になるかどうかをスコア（0～10）で示してもらい，表現の違いによる評価結果を比較検討した。すると，結果をRRRで表した場合には他の3つで表した場合に比べ，有意にスコアが高かった（p＜0.05）。
　これはRRRで表した場合には，同じ結果であっても情報を受け取る側が過大に評価する傾向があり，その傾向は政策決定者でも同様であることを示している^4）。このような錯覚を減らすためにはAPC Journalでの標記方針のように，RRRを用いる時には必ずARR，NNTを併記するなどの表現の統一が望まれる。

●ここまでわかるとどの程度論文が読めるか？

　これまで曖昧であった数字が具体的なものに変わり，結果を過大評価しなくなり，正確な判断ができるようになる。

●まとめ

■医学文献を正確に読むためには，治療効果の指標を知らなければならない。
■RRRだけで表示されている論文は，必ずARR，NNTを自分で出して評価する必要がある。
■統計的に有意であるかを検討するには95％信頼区間を示すのがよい。

参考文献
1）Feinstein AR: Statistical Index of Contrast, In Clinical Epidemiology The Architecture of Clinical Research, Philadelphia, Saunders, 118-129,1985.
2）Fahey T, Griffiths S, Peters TJ: Evidence based purchasing: understanding results of clinical trials and systematic reviews, BMJ, 311:1056-1059, 1995.
3）Guyatt GH, Cook DJ, Jaeschke RZ: How should clinicians use the results of randmized trials? ACP J Club, 122:A12-13, 1995 Jan-Feb.
4）Jaeschke R, Guyatt G, Shannon H, et al.: Basic statistics for clinicians: 3. Assessing the effects of treatment: measures of association, Can Med Assoc J, 152: 351-357, 1995.