医学界新聞

 

[連載] 質的研究入門 第7回

質的研究と正確さ(1)


“Qualitative Research in Health Care”第2章より
:NICHOLAS MAYS, CATHERINE POPE (c)BMJ Publishing Group 1996

大滝純司(北大医学部付属病院総合診療部):監訳,黒川 健(同):訳
藤崎和彦(奈良医大衛生学):用訳翻訳指導


 質的研究には,バイアスを避け信頼性を高めるためのさまざまな方法がある。この章では,質的研究の論文を読む際に,その研究の質を評価するのに役立つ基本的な方法を例示し,チェックリストとしてまとめる。

質的研究への批判

 保健や医療の分野では,量的な介入研究方法が伝統的に重視され,質的研究には科学的正確さがないと言われてきた。科学的知識が,知的探求の方法として最もすぐれていると考えられている現代では,「非科学的」というレッテルを貼られることは価値がないと言われるに等しい。
 しばしば批判されることの第1点は,「質的研究は,どうにでも解釈のできる個人的な印象をただ寄せ集めただけなので,研究者のバイアスが大きい」というものであり,第2点は「再現性に乏しい――研究が主観に大きく左右されるために,他の研究者が同じことを行なっても同じ結論になるという保証がない」ということ。さらに第3としては,「一般性に乏しい――質的研究は限定的な状況の中の雑多な情報を大量に生み出しているだけではないか」という指摘である。

質的研究は量的研究と何が違うのか

 これらの批判の根底にあるのは,質的研究は量的研究に比べて妥当性や信頼性がまったく異なっているという誤解である。
 実はこの違いは根本的なものではない。ある「真実」について仮説を立て,それを検証しようとする場合に生じる問題は,あらゆる社会調査にも当てはまる。
 「この半世紀で,社会調査が犯した最も大きな過ちの1つは,科学を特別な一連の技法だとみなしていたことにある。科学とは,実は取り組む姿勢であり,その姿勢を支えるシステムにこそ,科学の本質がある」(R. Dingall)。
 量的なデータの分析では,ともかく現象を統計学的にまとめることは可能であるが,それらが正しく実証されるかどうかは,質的研究と同じように研究者の判断や手法,あるいはデータの妥当性によって決まってくる。
 すなわち,どのような調査も「選択的」であり,どのような研究者でも,どのような意味においてであれ,物事の文字どおりの真実を捉えることはできないのである。すべての研究は,さまざまな研究方法というプリズムを通して一連の事実を個々に集め,それぞれの方法には一長一短がある。
 例えば標本を抽出して行なう調査であれば,質問紙に書かれた設問や分類,用語というものを回答者が等しく理解しているのか,そして回答者の答えが同一の意味を持っているのかどうかを,調査者が確認することは難しい。また,1人だけの研究者の観察に頼った研究は,調査者の見方や自己批判能力に影響されやすく,その観察者がいることが,観察される側の行動や話し方に何らかの影響を与えるかもしれない。
 BrittenやFisherは,「量的研究は信頼性が高いが妥当性に乏しく質的研究には妥当性があるが信頼性は乏しい,と言うのはある程度当たっている」と指摘し,両者の関係を明快にまとめている。

質的研究の正確さを証明するための戦略

 量的研究と同様に,質的研究の正確さを証明する基本的戦略は,系統的で明確な意図を持った研究デザインであり,データ収集,解釈,そしてコミュニケーションである。これら以外に,質的研究がめざすべき大切なことがさらに2つある。
 1つは,方法と個々のデータの根拠を公開し,他の調査者が誰でも同じデータを同じ方法で分析でき,基本的には同じ結果が得られるようにすることである。2つ目は,状況を詳細に調査し,その現象について妥当で首尾一貫した説明を補足することである。しかし残念ながら,質的研究報告には推論や方法,特にデータ分析に関して適切な記述を怠っているものが多い。これが,質的研究に対する量的研究者からの批判の一因になっている。
 質的研究の過程全般を通じてその正確さを保ち続けることは,容易ではないが可能である。本章では,以下に質的研究がどのようにして,妥当性,信頼性,一般性に留意しているかを示す。

サンプリング(抽出法)
 社会学の多くは,「行動」というものをいろいろの型(タイプ)に分けて,「典型例」を「非典型例」の中から見つけ出すことに重点を置いてきた。量的研究では,こうした類型化の考え方をもとに,外的妥当性や一般性を最大限にするような統計学的抽出法を用いている。
 質的研究で無作為抽出法が使われることはまれである。しかし,特に意図的な方法を優先させる必要がないのであれば,生のデータを使って比較検討をする場合に統計学的抽出法を用いることは,基本的には差し支えない。
 例えば,プライマリ・ケアの現場においてチームワークがうまくいっていない状況や,その理由を無作為抽出法で調査することは可能である。しかし,質的なデータを集めることは,量的研究に比べると時間がかかり費用もかさむため,確率に基づいた抽出法は実際には使いにくい。そしてそれ以前の話として,社会現象を理解するには,統計学的な代表性は必ずしも必要とならないのである。
 他の抽出方法として質的研究で頻繁に用いられ,医療分野でしばしば誤解されるのが,系統的で非確率的な抽出方法である。
 これは,対象人口から無作為,あるいは代表性のある標本を選ぶということを目的として行なうものではない。調査しようとする社会現象に関連した特徴を持っていたり,またはそれと関連した状況の中で生活している,ある特殊なグループを選び出そうとする抽出法なのである。この場合,研究に関連したことを追究する上で役立つ人が情報提供者に選ばれる。この抽出法では,調査者はじっくりと腰を据えて幅広く検討した中から,重要な知見を得るカギになる情報提供者を選び出すことになる。
 「理論的サンプリング(Theoretical sampling)」とは,理論や解釈を作り出すという目的に沿って標本抽出やデータ収集を行なう,一種の非確率的サンプリングである。分析者はまず,最初の情報提供者を選択し,データを集めてコード化し分析,試行的な理論を作って解釈を加えてから,次のデータを誰から収集するかを決める。新たなデータを分析した上でまた理論を見直すが,それによってその後の標本抽出やデータの収集方法が変わっていくこともある。このようにして,標本抽出と解釈が互いに理論的につながりながら繰り返し行なわれるものである。
 プライマリ・ケアチームの活動に関する調査の例に話を戻すと,一般診療におけるチームワークに影響を与えているものとしては,チーム内の職種構成,チーム内でのコミュニケーションの頻度,地域サービス体系,そして地域が都市部なのか郊外なのか,それとも田舎なのか,などがあげられるだろう。これらの要因は,他の似通った研究でもチームワークの効率性に関する社会学理論でも指摘されていることから,標本抽出の区分として問題なく使えるということになる。統計的な意味では,一般診療を代表する標本にはならなくても,こうして選ぶサンプルは理論的で,かつまた研究の疑問に合ったものなのである。このようにすることが,安易な標本抽出によってバイアスが生じる可能性を減らすことにもつながる。

分析の信頼性を確保する
 質的研究の生のデータは,例えばテープレコーダーによる録音,会話の記録など,あまり構造化されていない形で集められる。質的研究者が自分たちの解析の信頼性を保つには,インタビューや観察の詳細な記録を残し,解析の過程を詳細に記述することが大切である。量的社会学ではより広く行なわれていることだが,分析から生じる曖昧なデータを類型化していく作業を(1人で行なうことも可能であるが)グループで行なうことが,質的研究でも盛んになってきている。データを分析するには,多くの場合まずデータを分析可能な形に換えなければならない。この時にコンピュータソフトを使うこともある。
 例えばインタビューの記録を解析するには,それぞれの発言の特徴を明らかにするために,コード化の枠組みを作る(発言者の年齢・性別・役割・話題など)。そして録音したテープから起こした文章を,2人以上の調査者がコード化していく。オーディオテープやビデオテープを使うと,後になってからでも,別の人が同じものを分析することが可能になるという利点がある。
 インタビューから起こした記録を,熟練した質的研究者たちがそれぞれ別々に解析し,さらにそれぞれの解析結果をつき合わせて共通点を見つけることで,その分析の信頼性を高めることができる。
 例えば,循環器科の医師とその患者が心臓超音波検査の結果をもとに鑑別診断について話し合っている様子を研究する場合,対話記録をもとに,まず主たる研究者がその内容や構造を分析し,その後に別の研究者が独自に分析をする。さらに両者の分析結果がどの程度共通しているかを検討するのである。

妥当性を守る
 質的研究をする人は,研究で得られる知見の信頼性はもとより,その妥当性についても注意をはらう。「Triangulation(トライアンギュレーション)」とは,広い視野でさまざまな異なった別々の情報源から,しばしば異なった方法(例えば口述記録と記述による記録を比べたり)を用いて,その根拠を確かめながらデータを集めるというやり方のことである。この方法は,NHS(National Health Service:英国の保健や医療全般に関わる広範な公的制度)に総合的管理を導入した効果を評価するための質的研究で用いられ,成果をあげた。管理者側にとって好ましく,医療従事者にとっては好ましくない方向に,両者の力関係が変化してきているのかどうかを確かめるために,医師,管理者,そして患者側の主張を探り,異なる情報源から得られたデータを集約したのである。
 質的研究で妥当性を得るためによく用いられる方法には,得られた知見を研究対象者に示して,それが彼らの経験を無理なく表しているかどうかを判断してもらったり,また,同じ人たちにインタビューやフォーカスグループに参加してもらい,その知見に対する反応を知ることで新たな研究データを得ることもある。このような方法を単独で用いる場合は,参加者の常識的な判断が的を得ているかどうかで結論の妥当性が決まってくる。実際には,妥当性についてのこの種の判断は,その研究で得られた知見についての根拠を説明する一部として位置づけられるようになってきている。なぜならば,研究対象のグルーブが違えば,そこで起こっていることに対する解釈もまた違ってくるからである。
 分析したり表現する過程で,調査者は考えている理論に逆らうような事例,あるいは当てはまらないような事例についても漏れなく検討する――つまり自分の解釈に弱点がないか,あるいは事実に反することがないかを判断する必要がある。調査者は,これらの事例に対してそれらがなぜ理論とは異なるのかを明確に説明する必要がある。逆に言えば,ある事例がそれ以前の理論に当てはまらなかった場合には,その理論を改訂することで,信頼性と妥当性を高められるのである。

妥当性と解釈
 質的研究,特に観察研究(観察研究については第3章を参照)では,研究者自身が観察用の道具とみなされることもある。社会科学において真の意味での客観的な観察はあり得ないということを認めるとして,観察者の解釈が信頼できるかどうかを見分けるには,どうすればよいのだろうか。例えばこんな質問をしてみるのも,1つの方法である。
 「人間がそのような行動をとってしまう理由を上手に説明できるか」
 「研究の対象となった当事者に十分に納得してもらえる包括的な解釈か」
 「その解釈を通じてわかることは既知のことと矛盾しないか」
 質的研究,特に観察研究を評価するには,その研究から得られた解釈によって,他者も,その研究対象となった状況の「法則性」や,そこで交わされている言葉の意味を十分に理解できるようになるかどうかで判断するとよい。別の言い方をすれば,研究報告書には,他の人が見てももとの研究者と同じことが経験できて,なおかつその解釈が正しいかどうかを判断できるだけの十分な内容がなくてはならない。そんな時間と熱意のある読者はほとんどいないだろうが,しかし,これが質的研究の質を評価する望ましいやり方の1つなのである。
 「grounded theory(グランデッドセオリー)」というやり方で解決できることもある。グランデッドセオリーという方法への批判に答えるためには,研究の対象になった人たちの詳細な記録(例えば,言葉や考え方や行動についての記述など)を整理し提示することが必要になる。また,研究に関わった人たちが自分で作り出したという次元に留まらず,より理論的で確固とした解釈に立ったものでなくてはならない。