医学界新聞

寄稿

2011.01.17

寄稿

医療統計学の基礎
EBMの実現のために知っておきたいこと

新谷 歩(米国ヴァンダービルト大学准教授・医療統計学)


 私は現在,米国テネシー州のヴァンダービルト大学で,医療統計専門家として多くの医学研究のデータ解析に携わっています。私の所属する統計学部には32人の博士,30人の修士の計62名の統計専門家が在籍しており,大学内で行われる臨床,基礎研究をサポートしています。大学付属病院であるヴァンダービルトメディカルセンターでは,米国立衛生研究所(NIH)から年間約3億ドル余りのグラントを獲得しています。これはNIHから全米の大学に支給される年間支援金総額で,国内トップ10に入る規模です。

 NIHのほとんどすべてのグラントにおいて,博士号を持つ統計専門家の参加が義務付けられており,特に最近では主要な国際学術誌が統計専門家によるデータ解析を奨励していることもあって,私たち統計専門家の需要はますます増加しています。さらに,医療統計学の基礎知識が臨床研究を志す多くの医師の間で重要視されるようになり,本学では2000年に医師向けの臨床研究修士号コース(MSCI)を立ち上げました。このMSCIと公衆衛生修士号コース(MPH)の2つを合わせ,年間約30人の医師が臨床研究のエキスパートとして研究最前線へと送り出されています。

 通常,米国の大学付属病院では医師免許取得後,レジデントとフェローシップをそれぞれ2-3年経験すると,ファカルティ (大学教員)として迎えられる可能性が広がります。ここ数年,基礎と臨床をつなぐトランスレーショナルリサーチが盛んに唱えられていることもあり,臨床研究を志す医師(フィジシャンサイエンティスト)は急増しています。NIHグラントの取得は研究者として認められるための必須条件で,彼らはフェローシップの間に勤務時間の8割を研究活動に費やし,NIHグラントの取得をめざします。

 具体的には,若手臨床研究者のキャリア開発を目的としたグラントであるK23(Mentored Patient-Oriented Research Career Development Awards)を獲得することが最初のファカルティポストである助教授への登竜門となっています。また,さらに支給額が多いグラントであるRO1(毎年数千万円を計5年間)をその後獲得できるかどうかが,テニュア(終身雇用権)付きのポストへの昇進を大きく左右します。私が医療統計論を講義しているMSCIでは,必須科目として,基礎および臨床疫学,臨床試験方法論,基礎および応用統計学,グラントライティング(効果的な申請書の作成法)など,グラント取得に必要な知識全般を幅広く教えています。このように,現在の米国医学研究では医療統計の基礎知識を持ったトランスレーショナルリサーチの専門家の育成が必要不可欠であると認識されています。

 ところが実際には,多くの方々から統計学は難しい,今まで何冊も本を読んだけれど数式ばかりで少しも使い方がわからないなどのご意見を伺います。そこで本稿では,統計の基本知識の中からよく使われる概念をいくつか抜粋して解説したいと思います。

SD とSE,どちらを使うか?

 論文を執筆する際,「標準偏差(SD)と標準誤差(SE)のどちらを使うべきか」という質問をよく耳にします。SDとは集めたサンプル(標本)のばらつきを示します。データに示されているそれぞれの数値から平均値までの平均的な距離と考えてください。「平均±1×SDの区間に67%,2×SDの区間に95%のデータの数値が入る」というような使い方ができます。例えば,100人の被験者の平均年齢が50歳でSDが10歳の場合,「被験者の約67%が40-60歳,約95%が30-70歳である」ということが予想できます。

 一方,SEは推定(真の関係を表す値,母数に関する結論)の精度を示します。この精度とは,実際にデータとしては存在しない理論上の分布のばらつきなので,論文でよくTable 1に記載されているサンプルの描写説明には適していません。このような理由で,『Annals of Internal Medicine』などの学術誌では「平均±1×SE」というような表し方はしないようにとアドバイスされています1)

 論文において,SEに代わって登場するのが信頼区間(CI)です。信頼区間とは,上記に示した「平均±2×SE」で計算されますが,データの描写説明でなく推定結果としてこれを使った場合,「新薬投与群の真のコレステロールの値は95%の確率で160-180mg/dLの区間に入るような精度で予測でき,コントロール群では同様の信頼区間が190-210mg/dLだから,(2つの信頼区間が重ならないので)新薬は統計的に効果がある」と判断できます。

P値と信頼区間はどう違う?

 P値とは,例えば現実には試験薬に全く効果がないにもかかわらず,あたかも効果があるような結果になってしまう確率のことです。この場合,試験薬投与群と非投与群の真の結果の差はゼロになるはずですが,サンプルは無作為に集めてくることが前提なので,たまたま大きな差が確認され得ることがあるのです。

 このP値は,実は私たちが日常的に使っている概念です。例えば,私の娘たちは毎朝学校に行くのが遅刻寸前になるのですが,今朝は長女がいつもより30分も前に起きて支度を整えました。「何もないのにうちの子がこんなことをするなんてミラクルだ(=確率は皆無に近い,P<0.0001)。だから,何かあるに違いない」というのが主人の仮説でした。案の定,今日はクラスみんなで朝8時からお菓子...

この記事はログインすると全文を読むことができます。
医学書院IDをお持ちでない方は医学書院IDを取得(無料)ください。

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook