医学書院

検索
HOME週刊医学界新聞 > 第3081号 2014年06月23日

第3081号 2014年6月23日


量的研究エッセンシャル

「量的な看護研究ってなんとなく好きになれない」,「必要だとわかっているけれど,どう勉強したらいいの?」という方のために,本連載では量的研究を学ぶためのエッセンス(本質・真髄)をわかりやすく解説します。

■第6回:推測統計学の考え方

加藤 憲司(神戸市看護大学看護学部 准教授)


3077号よりつづく

 前回まで5回にわたり,量的研究の概要を説明してきました。今回からしばらくは,量的研究における統計の考え方・使い方に関する勘所や,理解を深めるためのヒントなどについて述べていきます。

点推定とサンプルサイズ“n”

 第1回にお話ししたように,私は北欧に留学していました。ご存じのように,北欧の人は男女ともにとても背が高いです。筆者の身長は178 cmなのですが,女性であっても,筆者が見上げなければならないこともさほど珍しくありません。そんなあるとき,初対面の女性と話をしていたところ,「あなたは日本人としては小さい方ですか?」と問われました。筆者は同年代の日本人集団の中で自分を小さいと思ったことはないので,不思議に思ってよくよく聞いてみると,この女性は過去に1人だけ日本人男性と会ったことがあるが,その男性は身長190 cm以上の大男だったそうです。つまりこの女性は,1人だけの「サンプル(標本)」から,日本人男性全体という「母集団」の身長について「推定」していたということになります。このように,母集団から取り出されたサンプルを用いて,もとの母集団の特徴や性質をあれこれ統計的に推定する学問を推測統計学(または推計学)と呼びます。

 この事例でもう少し考えてみましょう。上述の北欧女性が私と会った時点で,この女性は筆者を含む2人の日本人男性をサンプルとして知っていることになります。これを推測統計では,「サンプルサイズ(標本の大きさ)n=2」と表現します。さて,これら2人のサンプルのデータを用いて,この女性が日本人男性の身長を推定するとしたら,どうするでしょうか? どうもこの女性は日本人男性に関する予備知識がないようですから,過去に会った190cmの大男と,178cmの筆者のデータに基づいて,これらの平均をとってみるしかないでしょう。平均すると184 cmです。このように,サンプルのデータから得られる一つの数値(ここではサンプルの平均身長)を用いて,もとの母集団の特徴や性質(ここでは日本人男性の平均身長)を推定することを,「点推定」と呼びます。ちなみに日本人男性の平均身長は171.6 cmだそうです(OECDの資料による)が,ここでの点推定値とは大きな開きがありますね。なぜこんなに開きが生じてしまったのでしょうか? それはサンプルサイズが小さすぎるからです。n=2のように小さなサンプルで推定すると,偶然(たまたま背の高い人に会うこと)による変動に大きく影響されます。もし今後,この女性の知り合いの日本人男性がn=20とか200というように増えていけば,サンプルの平均から点推定した値は,母集団の平均に近付いていくことが容易に予想されます。つまり,サンプルサイズnが大きくなればなるほど,サンプルから得られる値(推定値)ともとの母集団の値(母数)との間のずれ(誤差)が小さくなる,ということです。

推定値はどれだけ真実に近いのか

 点推定はサンプルのデータから一つの値を「えいやっ」と決めて,それを推定に使うという考え方です。その推定値がどれくらいあてになるのか,どれくらい真実を言い当てているのか,といったことについては何も教えてくれません。そこで,ある推定値がどれくらい真実の値と近いか(どれくらい精度が高いか)の情報を込みで推定するのが,もう一つの推定方法である「区間推定」です。

 例えを一つ挙げましょう。今,日本に住んでいる読者の皆さんならば,多かれ少なかれ,大きな地震の予測に関する報道などに関心を持っていると思います。本稿執筆時点で,南海トラフを震源とするマグニチュード8-9の地震が今後30年以内に発生する確率は66.5%だそうです1)。結構高いですね。地震にはさまざまな要因が複合的に関与していますから,いつ起きるかというのは確率的なものだ,というのはイメージしやすいでしょう。したがって予測は点推定のようにピンポイントでなされるのではなく,「30年」といった幅を持たせたものになることも理解できるでしょう。もしも誰かがインターネットで「明日,南海トラフ地震が起きる!」と発言したら,あなたはどうしますか? 「こりゃ大変だ」と大慌てで国外脱出しますか? おそらくそうはしないでしょう。むしろ,「この発言は怪しいデマだ」と一蹴するのではないでしょうか。私たちは経験的に,未来の出来事をピンポイントで予測する言説を見聞きしたら「信用できない」「疑わしい」と感じます。なぜなら,未来の出来事を予測する場合には「誤差」が入ることを避けられず,確率的にしか論じることができない,と感覚的に知っているからです。その一方で,地震の予測を「今後100年以内に99.9%」などと示されたとしたらどうでしょう? 確率の数値は大きいけれども,地震に備えようという気持ちには当分なれないのではないでしょうか。予測の幅が広すぎても,それは予測としての価値が高くないということになってしまうのです。

より多くの情報を与えてくれる区間推定のススメ

 話を戻すと,母集団からどんなサンプルが得られるかは確率によって変動します。そのためにサンプルを用いた推定値にはどうしても誤差が入り込んでしまいます。そして,前述の点推定の事例から類推できるように,サンプルサイズの大きさが誤差の幅に影響します。そこで,誤差の幅の情報を含む形(通常,「95%信頼区間」と呼ばれる範囲を示す)で区間推定を行うことによって,その推定値がどの程度信用できるかの判断が可能となるのです。このように区間推定は点推定よりも多くの情報を与えてくれると言えます。実際,アメリカ心理学会(APA)の伝統ある論文作成マニュアル2)では,論文に区間推定を報告するよう強く推奨しています。

 点推定と区間推定の違いをで示してみましょう。この図は妊娠中に喫煙していた女性としなかった女性とで,児の出生時体重を比較した架空のデータです。A(左)とB(右)は全く同じグラフですが,Bには95%信頼区間のエラーバーが付いています。Aからわかることは,喫煙の有無で出生時体重の点推定値に違いがある(「喫煙あり」のほうが体重が少ない)ということだけです。この違いがサンプルの確率的な変動で偶然に生じたものなのか,本質的な意味のあるものなのか,これだけでは判断がつきません。それに対してBでは,「喫煙あり」群と「喫煙なし」群の95%信頼区間がかなり重複していることが示されています。つまりこれら2つのサンプルの確率的な変動がこの推定値の差をもたらした(言い換えれば,2群の真の値に差がない)可能性を無視できないということです。もしエラーバーがもっと短ければ,この判断は変わってくるでしょう。なお,エラーバーが指し示すものはいつも95%信頼区間とは限りませんので,その都度確認するようにしましょう。

 点推定と区間推定の違い・95%信頼区間を示すエラーバー(架空データ)

今回のエッセンス

●サンプルから母集団の値を推定する場合,必ず誤差が含まれる
●区間推定は点推定よりも情報が多いので,強くお薦めする

つづく

参考文献
1)文部科学省地震調査研究推進本部
2)アメリカ心理学会(APA)著,前田樹海他訳.APA論文作成マニュアル第2版.医学書院;2011.

連載一覧