医学界新聞

連載

2014.08.25



量的研究エッセンシャル

「量的な看護研究ってなんとなく好きになれない」,「必要だとわかっているけれど,どう勉強したらいいの?」という方のために,本連載では量的研究を学ぶためのエッセンス(本質・真髄)をわかりやすく解説します。

■第8回:モデル思考は統計の要

加藤 憲司(神戸市看護大学看護学部 准教授)


3085号よりつづく

 前回(第7回,第3085号)は,量的研究はループ構造をしているとお話ししました。今回はその図式をさらに拡張して,統計の考え方の根幹に迫ろうと思います。

統計学はバーチャルな世界を扱う

 今まで,母集団とサンプルの関係について次のように説明してきました。まず,あなたが知りたい対象である何らかの実在する集団があって,でもそれを全部調べることができないから,一部をサンプルとして取ってくる。そしてサンプルを用いて,元の母集団の特徴を推測するのだ,というものです。なぜ全部調べられないかと言えば,例えばコストがかかりすぎるといった問題があるからですね。これは推測統計学のわかりやすい理解の仕方の一つと言えます。でも,推測統計学をもっと便利に使うために,議論の抽象度のレベルを少し上げてみたいと思います。やや難解かもしれませんが,辛抱してついてきてくださいね。

 を見てください。前回の図とよく似ていることからわかるように,前回の図の考え方を拡張したものです(前回は左側の円内に「母集団」,右側の円には「サンプル」と書かれていました)。私たちは現実の世界,この図で言えば右側の世界にいます。現実の世界で観測できるもの,それがデータです。では,私たちはデータの観測を通じて何が知りたいのでしょうか?

 統計学はバーチャルと現実の世界をつなぐ(文献1を参考に筆者が作成)

 それは,現実世界のデータの背後にあって,データを生み出すもととなっている仕組みや規則です。第2回(第3065号)で述べたように,ある知見が一般化できるかどうかという問いに答えようとするのが量的研究だったことを思い出してください。量的研究における関心事は,個々のデータの背後に共通して存在する一般的な仕組みや規則がどのようなものかを明らかにすることです。こうした仕組みや規則は現実そのものではなく,現実を理想化・簡素化したものなので,「モデル」と呼びましょう。データが現実の世界に存在するのに対して,モデルはバーチャル(仮想現実)な世界に属すると言えます。

 個々のデータが持つ情報から,集団に関する情報へと一般化するのに重要な役割を担っているのが,統計学です1)。統計学の理論では,個々のデータは無限に大きい母集団の中からランダム(無作為)に抜き出されて偶然に生じたものととらえます。つまり統計学的には,母集団というのはバーチャルな存在だととらえるのです。そして一般化して得られた知見は,また個別の観察に適用することができます。このように統計学は,バーチャルな世界と現実の世界との橋渡しをしてくれるものです。

統計学は一般化された「モデル」で考える

 統計学で「モデル」という考え方をする目的は3つ挙げられます2)。第一に,観察によってデータ化された現象を説明するため,第二に,データに見られるばらつきを確率的に表現するため,そして第三に,モデルがデータにどれぐらい良く当てはまっているかを定量的に評価するため,です。

 一つずつ説明しましょう。世の中で起こる現象はさまざまな要因が複雑に絡み合って生じます。データというのはそうした絡み合いの結果として手元に得られたものなので,やはり複雑なままです。それを人間の頭で扱えるように,何らかのかたちで要約・整理したものがモデルです。モデルをデータに当てはめることによって情報が整理され,「こういう要因の作用でこう変化する」といった人間にとって理解しやすい部分と,それ以外の「ノイズ」と見なし得る部分に分離できるのです。なお,前回述べた「仮説」という言葉を使えば,仮説をデータに当てはめるために統計的な表現に置き換えたものがモデルだと言えます。あなたの仮説を明確に表現するモデルを作ることができれば,他の研究者とのアイデアの共有も容易になるでしょう。

 データをモデルで説明できる部分とノイズの部分とに分解すると,どんな良いことがあるでしょうか。それは,「確率」の考え方を用いてノイズの大きさや変動をうまく表現したり正確に管理したりできることです。人間にまつわる現象には常に不確実性がつきまといますから,得られるデータには必ず誤差やばらつきが含まれています。こうしたノイズの示す挙動を「確率」の考え方を用いて表現することにより,データの持つ意味を正しくとらえることができるのです。

 さらに,ノイズの大きさや変動を把握できるということは,データのうちモデルで説明できている割合がどの程度なのか,そのモデルはどれくらい信用できるのかについての情報も得られることを意味します。データからモデルを導き出す目的の一つは,モデルを用いて未来のできごとを予測したいからです。この場合の予測の確かさについても,程度を量的に示すことができます。

世界を確率的にとらえることで見えてくるもの

 先ほど,「量的研究の関心事は個々のデータの持つ情報でなく集団に関する情報だ」と述べました。人間を対象とする研究になぞらえれば,個人個人の違いや個性を「ノイズ」と見なしているということになります。「それはあんまりじゃないか」と言いたくなりますね。ここが量的研究に抵抗感を抱いてしまう部分だと思います。なぜ量的研究では,個人差をノイズ扱いするのでしょうか。その理由は,「集団で見ないと確率が計算できないから」です。

 繰り返しになりますが,世の中で起きている現象のほとんどは,多数の要因同士が複雑に絡み合った結果として起きているものです。だから未来について何か予測しようとする場合,「必ずこうなる」と断言することはできず,確率的に論じざるを得ません。明日の降水確率一つにしたって,過去何十年ものデータをもとに,モデルを使ってあれこれ計算して初めて求まります。それでも外れることがある,ということは私たちが日々実感していますね。

 また,ある癌患者さんが「5年生存率70%」というのは,過去にその癌を患った多数の患者さんのデータがあって初めて言えることです。その患者さん個人については,5年後に生きているか死んでいるかどちらかしかないのであって,「70%分だけ生きている」などというおかしなことはありませんね。個人個人の未来がどうなるかは,占い師でもない限り,誰にもわかりません。だからやむなく,集団のデータから確率を引っ張ってきて,あれこれ推測するしかないのです。量的研究を行うということは,そういうふうに割り切って世の中を見るということだと言えるでしょう。

今回のエッセンス

●統計学は,モデルとデータとをつなぐ役割を担う
●確率を用いることによって,見えないものが見えてくる

つづく

文献
1)津田敏秀.医学的根拠とは何か.岩波書店;2013.
2)久保拓弥.データ解析のための統計モデリング入門.岩波書店;2012.

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook