医学書院

検索
HOME週刊医学界新聞 > 第2919号 2011年03月07日

第2919号 2011年3月7日


論文解釈のピットフォール

第24回
サブグループ解析と結果の個人への適用

植田真一郎(琉球大学大学院教授・臨床薬理学)


前回からつづく

 これまで,臨床試験のデザインの意義についてお話ししてきました。混沌とした診療の現場からより真実に近い結果を得るために,ランダム化割り付けによる交絡因子の影響を除去しバイアスの発生を少なくしたり,より客観性の高い評価項目を採用したり,ITT(intention to treat)解析を適用したりするなど,さまざまな工夫がなされています。

 しかし,どんなに内的妥当性(データの信頼性)を高めても,その結果を一般化できるかどうか(外的妥当性)は保証されないという側面もあります。そもそもいかに質の高い臨床試験であっても,明らかになるのは個人の結果ではなく,疾患を代表するとされる集団における結果なのです。

 試験の対象者が疾患を代表する集団かどうかも議論の分かれるところですが,薬剤,治療法への反応にしろ,エンドポイントとして評価するイベントリスクにしろ,患者や疾患が多様性に富む(均一ではない)ことは考慮されていません。すなわち,一人ひとりの患者に結果を当てはめることは簡単ではないのです。臨床試験は集団を対象にしますが,診療は個人に対して行うわけですから,個々の患者に試験の結果を当てはめることの困難さはもっと認識されるべきです。

 この問題の解決策を見いだすことは容易ではありませんが,臨床試験ではランダム化された集団全体の比較に加え,年齢や性別,その他の患者背景によるサブグループ解析が行われることがあります。この解析によって,個々の患者への結果の適用がより可能になるのではないかと考える方がいるかもしれません。しかし,実はここにも大きな落とし穴があるのです。

サブグループ解析の目的は一貫性の証明

 サブグループ解析の本来の目的は,「患者,疾患の多様性を克服し,個々の患者に結果を適用する」ことではありません。むしろそのような多様性を超えた結果の一貫性を示すことを目的にしています。

 図1は,英国で実施されたシンバスタチンの医師主導型研究,Heart Protection Study(HPS)のサブグループ解析の結果です1)。対象となったのは冠動脈疾患死亡のリスクが高いと推定された患者で,必ずしも高コレステロール血症ではありません。一次エンドポイントは総死亡ですが,血管イベントもsubcategory analysisとして含まれているようです。この研究でシンバスタチンはさまざまな背景を持つ冠動脈疾患ハイリスク患者の総死亡,血管死,心血管イベント(心筋梗塞,脳卒中,血行再建術)のリスクを減少させました。図1に示すように,シンバスタチンによる心血管イベントの減少は,年齢,性,コレステロール値,高血圧の有無,心筋梗塞の既往,併用薬などのさまざまな患者背景の差に影響されず,一貫して認められました。したがって,患者がHPSにおける「ハイリスク」の定義に当てはまるのであれば,シンバスタチンによる血管イベントリスクの減少を,多様性を考慮することなく期待できることになります。

図1 Heart Protection studyにおけるサブグループ解析(文献1より改変)
サブグループ解析により,冠動脈疾患の既往,コレステロール値,年齢,性などの違いを超えて一貫した効果が証明されている。

サブグループ解析の落とし穴

 このように,一貫性を示すことがサブグループ解析の目的なのですが,多くの論文においてサブグループ解析が正しく実施されていないことや,結果が適切に報告されていないことが指摘されています。もちろんある治療介入の効果が全体として証明され,さまざまな背景の違いを超えて効果の一貫性が証明されたのであれば問題にならないのですが,困るのは,「全体の解析では効果はなかったけれど,あるサブグループでは効果が認められた」あるいは「全体では効果があるけれど,ある背景を持つ患者では効果がなかった」などの場合でしょう。よく指摘されるのは,グループ化による検出力の低下(偽陰性が生じる)と,解析の繰り返しにより生じる偶然の"有意な"結果(偽陽性)です。

 そもそもサブグループ解析の対象となる集団は,正確にはランダム化割り付けをされた集団ではないため,比較することが保証されていません。患者数も当然少なくなりますから,検出力も十分ではありません。そのために,「全体では効果があってもある集団では効果がない」とみなされてしまうことが起こり得るのです。実際これまでにも,「女性ではアスピリンによる脳卒中二次予防はない」「女性では降圧による心血管イベントの減少は期待できない」などのサブグループ解析の結果が報告されてきましたが,いずれも後の研究で否定されています。確かに多くの動脈硬化性疾患発症のリスクには男女差があるため,サブグループ解析を実施する意義はあるのですが,女性はイベント数が少ない,参加した患者数が少ないなどの理由から,女性だけの解析では十分な検出力を有さない場合が多いのだと思います。

 図2は,日本人高脂血症患者におけるプラバスタチンと食事療法の比較試験,MEGA研究のサブグループ解析です2)。信頼区間を見ると,女性は「冠動脈疾患(一次エンドポイント)」「冠動脈疾患および脳血管疾患」でいずれもハザード比の信頼区間の上限が1を超えているので,プラバスタチンは「効果なし」とみなされるかもしれません。しかし,サブグループ解析においてそのように解釈するのは誤りです。ハザード比はそれぞれ0.75,0.74ですから,これは検出力の不足(冠動脈イベントが少ない)で信頼区間が広いと考えるべきです。

図2 MEGA研究における性差に関するサブグループ解析(文献2より改変)
多くのエンドポイントで女性のハザード比の信頼区間上限が1を超えているが,性差が交互作用を有するかどうかの解析では「交互作用なし」とされており,女性では無効とは言えない。しかし,絶対リスクの低下は明らかに女性で少ない(治療の効率が女性で明らかに劣ることを意味する)ため,量的な交互作用が存在すると言える。

 異質性に関する解析の結果,すなわち性差が結果と交互作用を有するかどうかの検定では,「交互作用なし」との結果が得られていますから,全体の解析で統計学的に有意なプラバスタチンの効果が証明されているなら,男女問わず有効である,と言えます。ただし,ここで効率が男女でまったく異なることを読み落としてはなりません。年間1000人当たりの数で見ると,女性での冠動脈疾患発生減少はわずか0.7(男性は3.2)であり,予防の効率においてはるかに劣ることを読み取るべきです。つまり質的な相互作用はないが,量的な相互作用はあるということですね。

つづく

参考文献
1)Heart Protection Study Collaborative Group. MRC/BHF Heart Protection Study of cholesterol lowering with simvastatin in 20,536 high-risk individuals: a randomised placebo-controlled trial. Lancet. 2002; 360 (9326): 7-22.
2)Mizuno K, et al; MEGA Study Group. Usefulness of pravastatin in primary prevention of cardiovascular events in women: analysis of the Management of Elevated Cholesterol in the Primary Prevention Group of Adult Japanese (MEGA study). Circulation. 2008; 117(4): 494-502.

連載一覧