医学書院

検索
HOME週刊医学界新聞 > 第3054号 2013年12月02日

第3054号 2013年12月2日


【寄稿】

プロフェッショナリズム教育における評価ツールの活用
P-MEXを用いた経時的評価の方法について

高橋 理(聖路加国際病院一般内科/公益財団法人聖ルカ・ライフサイエンス研究所臨床疫学センター長)


プロフェッショナリズム教育の必要性とその評価法

 プロフェッショナリズムは医学教育の中で最も重要なトピックの一つである。米国の卒後医学教育認可機関 Accreditation Council for Graduate Medical Education(ACGME)は医師の身に着けるべき6つの能力を提示し,その中の1つにプロフェッショナリズムを挙げている。日本においてもプロフェッショナリズム教育への関心が高まっており,卒前・卒後を通して教育が行われる必要がある。医師のプロフェッショナリズム教育は医師-患者関係のみならず,患者アウトカム改善,医療の質向上,患者安全推進の観点からも重要であり,いつどのように教育するべきかの方向性を決めることが喫緊の課題である。

 そこで,プロフェッショナリズムを教育するためには,その定義と目的を明確にし,妥当性・信頼性の高い評価ツールを用いて継続的に測定し,その効果の確認が必要である。文献レビューによると,評価ツールはさまざまな国で開発され,利用目的によりいくつかのカテゴリーに分けられる。例えば,評価目的は認知レベルなのか,行動レベルかなどを明確にして利用するべきである(1)。また,プロフェッショナリズムの多層構造(個人レベル,個人間レベル,組織レベル)や文化的背景で異なることを考慮して評価ツールを選択するべきである。そこで,本稿では,日本国内でも妥当性・信頼性が示された日本語版Professionalism Mini-Evaluation Exercise(以下,P-MEX)の継続的活用法やその注意点を述べる。

 ミラーのピラミッドモデル3)とプロフェッショナリズム評価ツール
P-MEX:Professionalism Mini-Evaluation Exercise
OSCE:Objective Structured Clinical Examination,客観的臨床能力試験
SPs:Simulated Patients,模擬患者

経時的に,チーム全員で360度評価を行う

 P-MEXはカナダのMcGill大学でRichard Cruessらによって開発された医師のプロフェッショナリズム評価ツールである。「医師患者間関係能力」「省察能力」「時間管理能力」「医療者間関係能力」からなる4つの領域で評価される。カナダをはじめ数か国で妥当性,信頼性が証明され,わが国においても,Tsugawaら2)により,日本国内の7つの施設の前期研修医および専門研修医の評価において有用性が示されている。日本語版P-MEXは4領域23問からなり,各質問を5段階(0点:評価不能,1点:不適切,2点:期待以下,3点:ほぼ期待通り,4点:期待を超えてとてもよい)で評価し平均を計算することでプロフェッショナリズムを評価することが可能である。

 これまでも,医師のプロフェッショナリズム教育のためには,経時的に評価し,フィードバックを行うべきであるとされてきたが,評価ツールを用いた継続的な測定による変化と,その有用性について検討された例はあまりない。そこでわれわれは,内科専門研修医の医師のプロフェッショナリズムの経時的変化をP-MEXを用いて測定し,その変化と変化に影響を与える因子を検討した。

 研究デザインは,後ろ向きコホート研究。対象は,2009年より当院で2年以上研修した内科専門研修医。P-MEXの評価方法は,指導医・同僚・後輩医師・看護師から各2人以上が評価する360度評価を採用した。一般的に指導医からの評価は,過大または過小に評価され,バイアスがかかりやすいと言われている。指導医が研修医のすべての面を観察できるわけではないため,医療チームの全員が評価することが重要である。同僚は被評価者と同じ経験年数とし,後輩医師は1学年以上臨床経験の短い医師とした。P-MEX評価用紙よりデータを収集し,P-MEX得点を3年間フォローした経時的変化について線形混合モデル法を用いて分析した。評価者がスコアの経時的変化に影響を与えるかどうかも併せて検討した。

P-MEX測定後フィードバックの重要性と注意点

 対象は,22人(男性17人,女性5人)。P-MEXの初年度の総合計の平均は3.20点(SD:0.04点)と,“ほぼ期待通り”であった。4つの領域間で平均の差は認めなかった。指導医が評価したP-MEXの平均点は3.26点(SD:0.04),後輩医師3.19点(SD:0.04),同僚3.11点(SD:0.04),であるのに対して,看護師が評価した場合の平均点は3.09点(SD:0.04)とほかの評価者と比べやや低く評価する傾向が認められた。これは,以前の研究とほぼ同様であったが,今回の結果では統計学的有意差は認められなかった。

 P-MEXスコアの全平均は経時的に統計学的変化を認めず“ほぼ期待通り”を維持していた(p=0.18)。P-MEXの各領域でも,同様に経時的変化を認めなかった。しかし,各評価者別では経時的変化は異なり,上級医からの評価と下級医からの評価は統計学的有意差をもって上昇し(それぞれ,p=0.01とp=0.02),同僚からの評価は有意な変化を認めず(p=0.09),看護師からの評価は唯一統計学的有意に下降傾向を示した(p=0.04)。指導医からの評価で各領域別では,「医師患者間関係能力」「時間管理能力」「医療者間関係能力」は経時的に上昇したが,「省察能力」は変化が見られなかった。他方,看護師からの評価で各領域の特に「医師患者間関係能力」が3年間でもっとも下降傾向であった。これらの変化は,継時的に測定して初めて明らかになることであり,早期のフィードバック,介入の可能性がある。今後はどのようなフィードバックを行うべきか効果的フィードバックの標準化を検討する必要があるだろう。

 P-MEXは妥当性・信頼性が証明された評価ツールだが,注意も必要である。評価者に関して,その選定法や信頼性を高める上での人数の確保が必要である。先行研究によると,信頼性を確保するには,指導医では8人以上,看護師は6人以上必要と報告されている。常にこれだけの人数を選定するのは困難なことが多く,実際に本研究では2人で評価したため,結果が偏った可能性がある。また,フィードバック方法の標準化が必要であり,行われなかった場合,フィードバックの効果が一定しない場合がある。

 フィードバックに関しては,人間性など内面的な性質ではなく行動パターンへの介入が推奨される。実際,人格や人間性を否定されたと,この評価自体に怒りを表す被評価者もいた。人間性への介入や人事評価などではなく,フィードバックによる内的な振り返り(省察)を目的にしていることを,評価者と被評価者双方が共有することが重要である。また,研修医の行動パターンは個人の内的な問題以上に,周りの組織(病院など)や環境からの影響力が強いことが報告されており,組織が定期的な勉強会・ワークショップなどを行い,プロフェッショナリズム教育へのカルチャーづくりが重要である。

プロフェッショナリズム教育発展のために

 プロフェッショナリズム教育には一度だけの評価ではなく,経時的に達成度を測りながらフィードバックし,改善を目的にすることが必要である。そのためには妥当性・信頼性が十分証明された評価ツールを選択しなければ,教育どころか被評価者に間違ったフィードバックを与えてしまう可能性がある。また,評価者により評価が異なることが明らかとなり,360度評価を採用することが勧められ,早めの建設的介入・フィードバックが大切で,それを組織レベルで共有することが課題となろう。P-MEXは日本をはじめ多くの国で妥当性が証明された数少ない評価ツールであり,継続的に利用することで経験を蓄積し,わが国におけるプロフェッショナリズム教育が発展することを期待する。

◆参考文献
1)Goldie J. Assessment of professionalism : a consolidation of current thinking. Med Teach. 2013 ; 35(2) : e952-6.
2)Tsugawa Y,et al.Introducing the Professionalism Mini-Evaluation Exercise (P-MEX) in Japan : results from a multicenter, cross-sectional study. Acad Med. 2011 ; 86(8) : 1026-31.
3)Miller GE. The assessment of clinical skills/competence/performance. Acad Med. 1990 ; 65 (9 Suppl) : S63-7.


高橋理氏
1996年鳥取大医学部卒。2005年ハーバード大公衆衛生大学院修士課程修了。06年京大大学院博士課程修了。08年オックスフォード大EBMセンターを経て09年より現職。