統計的検定を考えるヒント(加藤憲司)
連載
2014.09.22
量的研究エッセンシャル
「量的な看護研究ってなんとなく好きになれない」,「必要だとわかっているけれど,どう勉強したらいいの?」という方のために,本連載では量的研究を学ぶためのエッセンス(本質・真髄)をわかりやすく解説します。
■第9回:統計的検定を考えるヒント
加藤 憲司(神戸市看護大学看護学部 准教授)
(3089号よりつづく)
前回はやや抽象的な内容で,とっつきにくかったかもしれません。今回は少し肩の力を抜いて,統計談議を気軽に聞くつもりで読んでみてほしいと思います。
研究は刑事裁判に似ている
初学者が統計を学ぶ上でつまずきやすい事柄の一つに,統計的仮説検定があります。「帰無仮説」「対立仮説」「p値」「有意水準」といった用語や,「有意水準○%で帰無仮説を棄却する」といった独特の言い回しは,慣れるまでなかなか頭に入りづらいのではないでしょうか。私も大学・大学院で統計を教えていて,何とかわかりやすく教える方法はないものかといつも考えています。そんなとき,ふと統計学で出てくる「推定」とか「棄却」という言葉は,刑事裁判にも使われるな,ということに気が付きました。例えば,「被害者の死亡推定時刻は」などという会話が刑事ドラマでよく出てきますし,「高裁が被告の控訴を棄却した」というニュースの報道を聞くこともよくあります。そこで,ちょっとこじつけですが,統計的仮説検定という考え方を刑事裁判になぞらえてみようと思います(ただし筆者は法律については素人ですので,法律用語の使い方は厳密でないことをあらかじめお断りしておきます)。
最初に,刑事裁判のプレーヤーを確認しておきましょう。裁判には訴える側(原告)と訴えられる側(被告)がいます。刑事裁判で訴えるのは検察官,訴えられるのは容疑者(被疑者)です。容疑者は検察官から「罪を犯した」と嫌疑をかけられていますが,本当かどうか(つまり真犯人かどうか)はまだわかりません。そこで検察官はいろいろと証拠を提示して,「容疑者が真犯人である」という主張を立証しようとします。言い換えれば,検察官がやっていることは,初めに「こいつが犯人だ」という主張があって,それを証拠によって裏付けようとする営みです。これって,研究者が研究を通じて行おうとしていることと似ていませんか? 研究を刑事裁判に例えると,研究者は検察官であり,研究者が主張したいテーマや仮説が被告人に相当するということになります。したがって,あなたの仮説が正しいことを裏付ける客観的証拠を提示する責任(挙証責任)は,検察官であるあなた自身にあるのです。
帰無仮説は「推定無罪」
さて,裁判には検察官と被告人以外に,もう一群の登場人物がいますね。それは裁判官です。では研究を刑事裁判に例えた場合,裁判官に相当するものが何であるかと言えば,それは統計です。統計を用いた量的研究の利点は,検察官であるあなたの主張を,統計という中立的な立場にある裁判官によって,証拠と照らし合わせて判断してもらえるという点にあると言えるでしょう。
ここで,刑事裁判における裁判官が取るべき正しい態度として,「推定無罪(あるいは無罪の推定)」という考え方があることを知っている読者は少なくないと思います。同じ意味の言葉に,「疑わしきは罰せず」とか「疑わしきは被告人の利益に」というものもありますね。被告人が有罪になるのは,その被告人が真犯人でなければ得られないような証拠が得られ,合理的な疑いを差し挟む余地がないと裁判官に認められた場合に限られます。もし疑いの余地が残れば,有罪の判決を下すことはできません。この考え方は,人類が長い歴史の末にたどり着いた,人権擁護のためのとても重要なものです。
「裁判の開始時点では被告人を無罪と推定する」という態度は,「統計的仮説検定の最初に帰無仮説を立てる」こととよく似ています。例えば2つのグループにおけるある測定値の平均に差があるかどうかを検定する場合,「グループ間で平均に差がない」という帰無仮説を立てます。そしてその帰無仮説が成り立っているという前提のもとで,手元のデータを用いて検定統計量と呼ばれる数値を計算し,もし帰無仮説が誤りでなければ得られないような数値であった場合に限り,帰無仮説を棄却するのです。
「冤罪の確率」はp値に相当する
裁判というのは人間が行うものです。人間の能力には限界がある以上,裁判で示された判断が神のみぞ知る真実と食い違う可能性はゼロではありません。その食い違い方には2通りあって,一つは「被告人が真犯人ではないのに,有罪にしてしまう場合」,もう一つが「被告人が真犯人であるのに,無罪にしてしまう場合」です。前者がいわゆる冤罪に相当します。ここで表を見てください。今述べた判決と真実との関係を統計的仮説検定に置き換えて表現するならば,判決は検定結果に,有罪・無罪は結果が有意か否かに相当します。統計学では,帰無仮説が正しいにもかかわらず検定で有意だと判断してしまう(つまり帰無仮説を棄却してしまう)誤りをタイプIのエラー(第一種の過誤),逆に帰無仮説が間違っているにもかかわらず検定でそれを棄却しない誤りをタイプIIのエラー(第二種の過誤)と呼びます。したがって,統計で言うタイプIのエラーは,冤罪に相当するということになります。
表 統計的検定を刑事裁判で例える |
検察官であるあなたは,被告人が真犯人であるという主張を裏付けるさまざまな証拠を懸命に見つけようとします。証拠がその主張の裏付けとしてどれくらい役に立つかの程度を「証明力」と呼ぶならば,証明力が高い証拠を見つければ見つけるほど,裁判官が無実の被告人を有罪にしてしまう可能性(冤罪の確率)が低くなるわけです。逆の見方をすれば,被告人が無実であるにもかかわらず,あなたが手に入れた証拠が偶然にも高い証明力を持ってしまった場合には,冤罪を生んでしまう可能性があることになります。そしてこの冤罪の確率がちょうどp値に相当するのです。有意水準を5%とすれば,冤罪の確率が5%未満(p<0.05)であったら「有罪(有意)」と判定されます。このように考えてみると,5%というような機械的な線引きをすることがずいぶん乱暴というか,恣意的なものに思えてくるかもしれませんね。近年,統計的に有意か否かという検定結果だけを報告するのではなく,実際のp値をきちんと報告するべきであるという見解が推奨されるようになってきています1)。実際のp値を意識するということは,「自分の主張が誤りである可能性」がどれくらいであるかを意識するということです。「自分は冤罪を作り出してはいないか」と常に自身に問いかけながら自らのデータを扱う謙虚さが,研究者であるあなたに求められている,と言えるでしょう。
今回のエッセンス●統計的仮説検定は刑事裁判に似ている●帰無仮説は「推定無罪」に例えられる ●p値は「冤罪の確率」に相当する |
(つづく)
文献
1)アメリカ心理学会(APA)著,前田樹海他訳.APA論文作成マニュアル第2版.医学書院;2011.p124.
いま話題の記事
-
医学界新聞プラス
[第1回]心エコーレポートの見方をざっくり教えてください
『循環器病棟の業務が全然わからないので、うし先生に聞いてみた。』より連載 2024.04.26
-
PT(プロトロンビン時間)―APTT(活性化部分トロンボプラスチン時間)(佐守友博)
連載 2011.10.10
-
事例で学ぶくすりの落とし穴
[第7回] 薬物血中濃度モニタリングのタイミング連載 2021.01.25
-
寄稿 2016.03.07
-
人工呼吸器の使いかた(2) 初期設定と人工呼吸器モード(大野博司)
連載 2010.11.08
最新の記事
-
医学界新聞プラス
[第7回]SNS担当者の2大困りごと その2:ネタがない!
SNSで差をつけろ! 医療機関のための「新」広報戦略連載 2024.12.13
-
取材記事 2024.12.11
-
連載 2024.12.11
-
対談・座談会 2024.12.10
-
循環器集中治療がもたらす新たな潮流
日本発のエビデンス創出をめざして対談・座談会 2024.12.10
開く
医学書院IDの登録設定により、
更新通知をメールで受け取れます。