医学界新聞

連載

2011.11.28

今日から使える
医療統計学講座

Lesson7
RCTにおけるデータ解析

新谷歩(米国ヴァンダービルト大学准教授・医療統計学)


2949号よりつづく

 臨床研究を行う際,あるいは論文等を読む際,統計学の知識を持つことは必須です。
 本連載では,統計学が敬遠される一因となっている数式をなるべく使わない形で,論文などに多用される統計,医学研究者が陥りがちなポイントとそれに対する考え方について紹介し,臨床研究分野のリテラシーの向上をめざします。


 ヴァンダービルト大学では,15施設が参加し,5年間に及ぶランダム化比較試験(RCT)を本年10月に開始すべく,ICUせん妄研究チームが一丸となって準備を進めてきました。この研究は,米国立衛生研究所(NIH)から1300万ドルの研究費を得て,ICUに入室中の患者1000人を抗精神病薬ハロペリドールとジプラシドン(本邦未発売),プラセボの3群に割り付け,ICU内でのせん妄の予防に効果があるかどうかを比較します。

 米国では,多くのRCTに対して研究前に研究プロトコルを開示することを義務付けており1),ここ数か月,研究チームおよびデータモニタリング安全委員会の間で,RCTの解析法を含めた研究手法に対する興味深い論議が行われました。今回はそれを踏まえ,RCTにおけるデータ解析の注意事項について紹介します。

ベースラインの特性比較表にP値は必要か?

 大多数のRCTでは,年齢,性別,喫煙の有無,研究開始時点の重篤度など,患者の特性を新薬群,プラセボ(または既存薬)群間で比較します。ランダム化を行う理由は,グループ間の特性をそろえることによって交絡を防ぐためであり(交絡については,第2933号を参照),グループ間がうまくそろったかどうかを,各変数について群間比較します。

 群間に差があるかどうかを判断するために多くの研究で使われるのは,スチューデントのt検定やカイ二乗検定などの統計テストです。しかし,RCTにおいてベースラインの特性の違いの判断にP値を用いることは統計的に正しい意味を持ちません2)。その理由を以下に挙げます。

1)サンプル数が大きければ大きいほどP値は小さくなるため,大規模研究ほど有意差が出やすくなります。例えば,サンプル数が各群10人の研究と各群1000人の研究では,平均年齢の群間差が両者ともに3歳であっても,小規模研究では有意差なし,大規模研究では有意差あり,という不公平な結果になってしまいます。ランダム化は大規模研究ほど効果的に群間の特性をそろえられるはずなので,何だかつじつまが合いませんね。

2)多重検定の回でも説明しましたが,P値を用いる解析はP値を多く計算すればするほど誤った有意差が出やすくなるので,ベースラインの特性比較表に加える項目が多ければ多いほど,少なくともどこか1つで有意差が出る確率が高くなります。特性を5つリストアップした場合と,20個リストアップした場合とでは,その確率は大きく異なります。項目をいくつ載せれば適切かについてのガイドラインは特に存在せず,研究者およびレビュアーの判断に任されているようです。

3)P値の統計的な意味は,"母集団で比較したい群間に差がないときに,ランダムに集めてきたデータで観測される差が偶然出る確率"という意味です。先ほどの例で,ランダムに割り付けした2群間の3歳という平均年齢の差について計算したP値が0.03だったとします。多くの読者は(もちろん研究者もですが),ここでこのP値が0.05より小さいという理由で,この3歳の群間差には統計的な違いがあるとみなすでしょう。実はここに大きな間違いが起こっていることに気付いた方はいるでしょうか?

 ここで有意差ありと判断することは,差がないという帰無仮説を棄却するということです。帰無仮説とは,「真の差がない」,言い換えると「サンプルをランダムに採ってきた母集団で比較したい群間に差がない」ということです。帰無仮説を棄却することは,ここで観測された3歳の群間差は偶然に観測されたものではなく,母集団でも群間に差があるということになります。母集団で差があるということは,同じ割り付け方法を用いると,他の研究者が行った研究でも年齢に違いが出ることになってしまいます。それではおかしいですよね。まったくランダムに割り付けられているのであれば,観測された3歳の差はたまたま"3%の確率で偶然"出てしまったことになり,帰無仮説を棄却するかどうかを検討するのはまったく論外とい...

この記事はログインすると全文を読むことができます。
医学書院IDをお持ちでない方は医学書院IDを取得(無料)ください。

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook