医学書院／週刊医学界新聞【〔連載〕質的研究入門（17）（大滝純司，藤崎和彦，他）】（第２４３３号　2001年4月16日）

［連載］　質的研究入門　第17回

consensus methodによる研究(2)

“Qualitative Research in Health Care”第６章より
著：JEREMY JONES, DUNCAN HUNTER　(c)BMJ Publishing Group 1996

大滝純司（北大医学部附属病院総合診療部）：監訳，瀬畠克之（北大医学研究科）：訳
藤崎和彦（奈良医大衛生学）：用語翻訳指導

方法についての問題点

誰を参加者にするか
　consensus methodにおいて，検討する事柄に関して何らかの意味で「専門家」であるという条件以外には，参加者を選ぶのに厳密な基準はあまりない。診療行為の基準を作るのであれば，当然，その分野の臨床医が最適である。ただし，結果が特定の専門分野以外にも何らかの影響を及ぼすと予想されるならば，総合医のような他分野の臨床医も加えて，異なった臨床の観点を取り入れたほうがよいだろう。保健医療サービスを供給する上で何を優先すべきかといった，より幅広い内容を検討するのならば，臨床以外の分野の保健医療職にも参加してもらうべきで，専門家以外の意見も取り入れる必要がある。
　もちろん，参加者を選ぶ段階で選択バイアスが入る可能性はある。各分野を代表する医師が集まって会議（expert panels）をするにしても，その会議の具体的な人員構成が議論を左右する場合もある。また，会議が思いがけない方向に展開してしまうこともある。そのような事態になった場合には，参加者の構成を変えることで，修正を図ることもある。

得られた回答の精度をどのようにして確かめるか
　コンセンサスが得られたからと言っても，それだけで正しい回答が得られたことにはならない。つまり，新たな知見を作り出すのではなく，無知を寄せ集めるだけになってしまう危険性がある。nominal groupは，優れた総説や原著論文の代わりとなるものではなく，現在の医学において合意が得られていない考え方や領域について検討するための方法の1つなのである。Pillは，観察できる事象にデルファイ法の結果を当てはめてみることを勧めている。選挙前の世論調査と選挙結果を比べる場合と同じように，実際の出来事にあてはまるのならば，その見解は正しいということになる。

各段階の結果を参加者にどのようにフィードバックするか
　同意の程度は中央値で，コンセンサスの程度は四分位数間領域^＊3）で，いずれも連続した数値尺度（例えば0から9までの10段階の数字）の上に表すことが多い。consensus methodの段階ごとに，この統計学的な指標を参加者にフィードバックするが，各項目についてのより詳しい情報として，各点数をつけた人の数を表にして示したり（表2参照），度数分布のグラフをつけたり，分布幅を図示したり（図3参照）することもある。参加者全体の反応をフィードバックすることで，参加者は自分がはじめにつけた点数を他の参加者の点数と比較することができる。各参加者には，他の参加者の判断に迎合する必要はないことをはっきりと伝えておく必要がある。しかし，nominal group techniqueでは，他の参加者とかけ離れた意見を述べた場合，議論の中で批判にさらされる可能性はある。デルファイ法では，極端な数値（例えば上下4分の1に入るもの）の扱いについてあらかじめ取り決めておき，それをつけた人にはその理由を説明してもらう場合もある。
　nominal groupでは，各項目の記述についてどの程度同意できるかを1-9の点数で示す（図3参照）。この例では，点数を3つに区分し，1-3の点数がついた場合はTURP（経尿道的前立腺切除術）の適応はないと判断し，4-6点は判断に迷い，7-9点は適応があると考えているとした。結果をまとめるには，まずはじめに，各参加者の点数がこの1-9の点数の列のどこに分布するかを見る（図4参照）。前述した3点ごとの区間のどこか1つに参加者の点数の分布がすべて入るのであれば，明らかな合意が得られたと言える（例では，すべての参加者がTURPの適応ではないということに賛成している）。
　一方，すべての点数が3点以内の範囲に入っていれば，その範囲が前述の区間の2つにまたがっていても，ゆるやかな合意が形成されたと言える。しかしその場合は，その診療行為の適応があるかどうかについての結論は曖昧になる。
　その次の作業としては，一部の極端な点数が全体の結果に影響を与えていないかどうかを見る。つまり，極端に高いもしくは低い点数を除外したら，全体の合意の状況がどのくらい変わるかを検討する。図3の点数分布はすべての参加者の点数を示したもので，一部の項目では分布の範囲が1-9点となっており，参加者たちの意見が大きくばらついていることがわかる。

妥当性と応用性

　デルファイ法の妥当性については，これまでにも活発に議論されてきた。例えばHarold Sackmanは，科学的手法にはつきものの「標準」というものがデルファイ法には存在しないと指摘した。しかし，彼の批判の多くは手法そのものに対する批判というよりも質の低い過去の研究に向けられたものであった。彼は特に，「アンケート調査の質問項目がいいかげん」，「手法の信頼性や妥当性に関する検討が不適切」，「専門家の定義や選出方法」などについて批判している。さらに彼は，「この手法では同意を強要してしまう恐れがある」，「参加者に議論させないのが弱点になっている」と批判した。
　Pillの報告やGerthとSmithの報告によれば，会議を用いる研究手法でデルファイ法より優れた手法があることは証明されていない。しかし，Roweらは一般的にデルファイ法はnominal groupよりも劣る手法であると結論づける一方で，「劣っていると言ってもその差はわずかであり，理論的な面よりも実践する上で問題があるため」だと述べている。そして，デルファイ法の妥当性を高めるためには，専門家の意見の中身を慎重に検討する必要があるとも論じている。
　consensus method，特にデルファイ法を擁護する人たちは，この手法を買いかぶらないように警告し，回答を得るためというよりも参加者たちのコミュニケーションを作り上げるための手法と考えるべきであり，他に方法がない場合の「最後の手段」だとしている。これらの手法は形式が決まっている上に，数量的な予測を立てるために使われることが多いために，この研究方法を十分に理解していない研究者が，その結果を過剰に信頼してしまう危険性は確かにある。前述したように，この手法で得られた結果が「正しい」かどうかは，実際に観察されるデータに照らして検討しなければわからない。このことは，研究結果を報告する際に強調すべきである。
　デルファイ法とnominal groupの目的（2432号，表1参照）は，参加者に情報を与え熟慮を促して，その効果（これを“process gain”という）を最大限に引き出す一方で，意見を集約する際にからんでくる，参加者の利害などの悪影響（これを“process loss”という）を最小限にすることにある。そのためには，研究を運営する人が，これらの手法の特長を活用することが大切になる。nominal groupのファシリテーターは，参加者全員が各自の意見を述べ，それぞれの個人的な意見や専門職としての意見が話し合い全体の流れに引きずられないように配慮することが大切である。また，デルファイ法やnominal groupの参加者を選ぶ場合には，特定の利害や先入観に偏らないように注意しなければならない。

有用性

　consensus methodは，保健医療サービスの分野で曖昧なままになっていることを明確化したり，測定するのに有用な方法である。実際にこの分野でデルファイ法やnominal groupを用いて，専門家の役割を定義したり，教育計画を立てたり，わからないことの多い特殊な患者（例えばHIVやAIDS）のケアに関する長期的計画を立てたり，診療行為の適切さに関する基準を作って技術評価（technology assessment）に役立てるといったことが行なわれてきた。consensus methodによる研究が単独で行なわれる場合もあるが，大規模な調査研究の中でもこれらの手法が広く使われている。
　本論文で紹介した2つの研究のいずれもが，大規模研究の一部として実施されたものである。デルファイ法の例は，病院の医療従事者の適正な人員構成を検討する研究の中で，研修医を減らす場合の影響を明らかにしようと行なわれたものであり，またnominal groupの例は，NHS（イギリスの保健医療サービス制度）が住民の前立腺手術の必要性を調査した研究の一部として，適切な手術適応を明らかにするために行なわれたものである。

まとめ

　デルファイ法やnominal groupによる研究を発表する場合には，その方法を使った理由や具体的な方法論（専門家の選出方法や，目標とするコンセンサスの程度などを含む）を十分に説明し，得られた結果を適切な形で示し（今後は診療ガイドラインのように発表形式の標準化がなされるべきである），結果の妥当性とその結果がどのように役立つのかをきちんと提示することが重要である。
　consensus methodで結論が得られても，それですべてが完了することは稀で，それはconsensus development conferenceを行なった場合でも同じである。例えば大腸や直腸の癌についてなされたように，健康政策や診療や研究活動を誘導するようなコンセンサスを提言し，それを浸透させ実践に結びつけることがコンセンサスを研究する最終的な目的だからである。

（第7章了）

〔訳者注〕
＊３）四分位数間領域：
参加者がつけた点数を数値の大きさの順に並べた時に，度数が下から25％にあたる数値と上から25％にあたる数値の間の領域

〔編集部注〕
　本号の図表番号および訳者注は，前回連載第16回（4月9日付，2432号）と合わせ，通し番号とした

●お知らせならびにお詫び
　本連載は，「Qualitative Reserch in Health Care」（Catherine Pope，Nicholas Mays編集，BMJ Publishing Group発行，1996）を翻訳しているものです。
　なお，掲載につきましては不定期となり，翻訳者ならびに読者の方々にご迷惑をおかけしておりますこと，お詫び申し上げます。

「週刊医学界新聞」編集室

［連載］ 質的研究入門 第17回

consensus methodによる研究(2)

方法についての問題点

妥当性と応用性

有用性

まとめ

［連載］　質的研究入門　第17回