米国で生物統計家として20年の豊富なキャリアを持つ著者が、熟知した「医療系論文に多用される統計」「論文査読でチェックされる要点」「医療者が研究に際し陥りがちなポイント」を解説。“できるだけ数式を使わず”に今日から使える統計学の知識を、各章に例題/具体例/サマリーを折り込みつつ読み物形式で伝授。論文を紐解くための統計学の極意がここに。大きな反響を呼んだ
序
『週刊医学界新聞』で「今日から使える医療統計学講座」の連載を書かせていただいてから早3年が経とうとしております。この間に私の人生には大きな変化がありました。日本の臨床研究が危機的な状況なので,是非帰ってきてほしいと言われ,20年間のアメリカ生活にピリオドを打ち日本へ戻ったわ...
序
『週刊医学界新聞』で「今日から使える医療統計学講座」の連載を書かせていただいてから早3年が経とうとしております。この間に私の人生には大きな変化がありました。日本の臨床研究が危機的な状況なので,是非帰ってきてほしいと言われ,20年間のアメリカ生活にピリオドを打ち日本へ戻ったわけですが,聞いていた通り,臨床研究を取り巻く過酷な環境に大変驚いています。わが国の論文数でみた国際順位では基礎研究の4位に比べ,臨床研究では30位と大きく後退しています。トップは基礎研究も臨床研究も私が20年統計家として暮らしたアメリカですが,1位のアメリカと30位の日本の臨床研究を取り巻く環境の違いを日々痛感しています。
なかでも一番大きな違いは臨床研究を支える生物統計家がいないということです。アメリカの大きな大学病院では通常30~50人態勢の統計家が一丸となって臨床研究をはじめから終わりまで密にサポートしているわけですが,日本ではその数が1施設に1人,2人といった程度です。最強の武器といわれる統計学を使いこなせる人材がわが国の医学研究分野で皆無に近いという事実を私たちはもっと真摯に受け止めるべきでしょう。その結果起こった医学アカデミアにおけるデータサイエンスの空洞化により,さまざまな倫理問題などが引き起こされたといっても過言ではありません。日本の大学では医療統計を教えている講座も極端に少なく,この現状はしばらく続くと思われます。生物統計家がほとんどいないわが国で,臨床研究をやり遂げるためには,やはり現場で臨床研究に携わる方々にすそ野の広い統計教育を行っていくしか道はないと考えております。
本書の元となった『週刊医学界新聞』の記事も,私がウェブで配信しているビデオ講座でも,そんな気持ちを込めてお届けしております。
講演先で出会う多くの方々は口々に統計は難しいといわれますが,決してそんなことはありません。統計とは皆さんの身近にある,ごくごく日常的に私たちが頭で考えていることを,データを使ってコンピュータに計算させているだけのことなのです。
1つ例を挙げましょう。先日,日本に戻って半年ほどして健康診断を受けました。総コレステロールがちょっと高めだけど,HDLの値はとてもよいし,血圧は正常,日本人は食生活も運動習慣も西欧人よりかなりよいので,特に薬はいらないでしょうというありがたい診断でしたが,もし私がアメリカ人で,高血圧,運動もしない車ばかりの生活をしていたとしたら,ちょっと危ないので薬が必要ですという診断だったかもしれません。これら一連の計算を一瞬でやってのけた主治医はさすがだなと思いましたが,実はこの思考こそが統計のブラックボックスといわれる重回帰分析で行っていることと全く同じなのです。
この本を読んだ皆さんが,統計って案外簡単だと気づき,結局大事なのは臨床的なことがら,つまり何が患者さんにとって大事かということにほかならないことをわかっていただければ大変嬉しく思います。そしてそれを統計家よりよく理解している皆さんが解析を進めるうえでの中心人物であるべきだということに“納得”していただければ,著者として幸甚の至りです。
最後に私を『週刊医学界新聞』へと導いてくださった医学書院の前野みさきさん,ありがとうございました。本連載の執筆を通して大変多くの方々と出会い,それが日本へ帰るきっかけとなりました。そして家事を後回しにしながら働いている私をいつも応援してくれている主人と2人の愛娘,20年前私を信じてアメリカに送り出してくれた両親にも心からの感謝の意を込めて本書を捧げます。
平成27年2月
新谷 歩
Lesson 1 統計の基礎知識-統計ってなんだろう
標準偏差の意味と計算の仕方,使い方
データの傾向をとらえる平均と中央値-いつ平均・中央値を使う?
正規分布をとらない歪んだデータの記述の仕方
標準誤差
信頼区間
仮説検定-どうして「薬が効かない」からはじめるの?
P値-出会いが運命? ミラクルの起きる確率
信頼区間とP値
標準偏差と標準誤差,信頼区間,どちらを使うか
Lesson 2 グラフの読み方・使い方
研究で一番よく使われる棒グラフ,比較の精度はわからない
棒グラフにエラーバーを付けてみよう
データの分布を表すグラフ
箱ひげ図の読み取り方
平均値の群間比較のエラーバーとP値の関係
Lesson 3 単変量統計テストの選び方
異なる検定で,異なる結果が出る,どうして?
誤った解析結果は医療スキャンダル
Let's Try-研究に適した統計手法を選んでみよう!
差をみるのか,相関をみるのか?
比較データは対応しているか?
アウトカムは,連続変数,2値変数,順序変数,
名義変数のいずれに分類できるか?
アウトカムが連続変数の場合,その分布は正規分布であるか?
比較群間で比較を行うとき,比較群の数は2つか,3つ以上か?
データの総数は?
Lesson 4 交絡と回帰分析モデル
リンゴとミカンを比べない交絡のコンセプト
交絡をどう防ぐかで臨床研究の質が決まる-リンゴをリンゴと比べるために
回帰分析モデルの選択の仕方
Lesson 5 症例数とパワー計算
症例数を増やせばいつか必ず有意差がでる
研究を始める前に知っておいて欲しいこと
-解析プランはデータをみないですべて立てておく
1型エラーと2型エラー,無実の人が罪に問われるエラーと
真犯人が野に放たれているエラー
症例数計算に必要なデータ
さあ,症例数計算してみよう-PSソフトの使い方
アウトカムが生存,死亡のような2値変数の症例数の計算
-NEJM研究例を用いて,さあトライ!
よくある質問
Lesson 6 多重検定
ボンフェローニの呪い
見過ぎによる出過ぎ?
多重検定の種類
比較群が多い場合の補正法(偽発見率法)
補正すべきか,否か,今でも高まる論争の行く手は?
Lesson 7 中間解析
過剰な中間解析は誤った結果を導きかねない
“見過ぎによる出過ぎ”をいかに補正するか
中間解析について研究計画書に詳細な記載を
Lesson 8 多変量解析-説明変数の選び方
交絡因子をいかに取り除くか
説明変数は何個までモデルに入れられるか?
説明変数の選び方
交絡除去に対応できる症例数の確保を
傾向スコアとは?
Lesson 9 ランダム化比較試験(RCT)におけるデータ解析
表にP値は必要か?
ランダム化の本当の意味-全体的なバランスをみる
アウトカムの解析は補正すべき?
Lesson 10 インターアクション(交互作用)
インターアクションを交互作用と理解するとわかりづらい
インターアクションは交絡とは根本的に違う
Lesson 11 感度・特異度
解釈が難しい感度・特異度解析
陽性的中率は検査の理由によってここまで変わる?
感度・特異度の隠れた個人差
診断検査ツールを検証する際のチェックポイント
感度・特異度でよく使われるROC曲線
あまり使えないROC曲線に代わる統計量
Lesson 12 同等性・非劣性の解析
同等性を示すにはどのような手続きが必要か
信頼区間を使って,同等性,非劣性をみてみよう
信頼区間を用いた症例数の計算方法
Lesson 13 カプランマイヤー曲線
カプランマイヤー法の活用方法
累積の生存率とリスク
中途打ち切りのデータは計算上どう扱うか
索引