医学界新聞

教えるを学ぶエッセンス

連載 杉森公一

2022.11.28 週刊医学界新聞(看護号):第3495号より

 評価という訳語には,計測(Measurement)と教育評価(Evaluation)の2つが混在している。私たちはしばしば,「結果をテストすること」と「結果を受けてフィードバックすること」を同じとみなし,間違えてしまう。前者は審査・格付け・選抜であり,後者は支援・教育・学習に当たる。

 150年前に登場した多肢選択式の客観テストは,口頭試問を一斉テストに置き換え,学校教育を産業化社会の担い手を生み出す工場のような装置に転換してしまった。経営学のセンゲは,自動機械のようにベルトコンベア上に生産され続ける学校教育への警鐘を鳴らした一人である1)。全ての子どもが同じ様式で学び,画一的な評価を受けることが正しいとされる無自覚な仮定が問題となる。

 歴史学のミュラーは,「問題は測定でなく,過剰な測定や不適切な測定だ。測定基準ではなく,測定基準への執着なのだ」と指摘している2)。では,測定基準への執着を乗り越え,学習を促す評価としてのアセスメントへ転換するために,私たち教育者はどうすればよいのだろうか。

 教育評価とは,教育がうまくいっているかを把握するために学生のデータを収集し,「目標として設定した知識や能力が身についているか?」という観点をもとに教育方法や内容,学習目標を問い直し,改善に結びつけるプロセスとされる3)。学生に学修を促す評価をするには,教育評価の中に3つの主体があることを意識したい。教師は,本連載第3回(3475号)で示した学習目標について,学生の理解度確認,フィードバック,動機づけ,授業の改善を行い,評定(成績づけ)を行う。組織(養成校)は,教育の質保証や説明責任を目的とし,授業を受けた学生の成績分布も参考にカリキュラム改善を行う。学生は,自己評価・相互評価を問わず,到達度の把握や今後の学習の調整を行う。教師・組織・学生の3つの主体はそれぞれ異なる目的を持っており,成績づけはその中の一部であることに留意する必要がある。

 また,「適切な成績づけを行いさえすれば学習を促せる・学習したとみなせる」との誤解もしばしばみられる。教育評価には3つのタイミング(機能)がある。学習の開始前に行われる「診断的評価」は,前提状態(既有の知識・能力・関心・経験)を把握するために行われ,クラス編成や授業設計の修正・改善に有効な情報となる。入学選抜試験やプレースメントテストが該当するだろう。学習の途中で行われる「形成的評価」は,学習の過程で実施される。学生の活動の様子や,小テスト・アンケートなどによって授業設計の修正や改善,また学生へのフィードバックによる学びの促しを目的とする。成績づけには用いないことが多い。そして,学習の後に実施されるのが「総括的評価」である。単元末の中間試験や学期末試験などで学習目標への到達度を測定し,成績づけや振り返りのための情報を得るために行う。

 これら3つの機能のうち,学習のための評価(Assessment for Learning)と言い換えられるものは「形成的評価」である。学期末試験や成績づけの後に授業は行われない。よって,総括的評価が学習プロセスに与える影響は非常に限定的であり,採点した後に学生自身が学習を振り返っても,過去のつまずきに気づくことは少ない。

 学習者が知識や技能などを使って,仕事場や市民生活など現実世界の課題と類似した本物らしさ(真正性)を持った課題に取り組むことを求める評価を「真正の評価」論と言う。近年では,シミュレーション教育や診療参加型実習の前後に行う客観的臨床能力試験(OSCE)など,シミュレーターや模擬患者を前にした実技試験が実施されるようになってきた。このような実技試験では,複数の教員が分担して評価を行う必要があるため,教員間での評価基準の共有や評価の整合性の確保が難しい4)

 評価方法には客観テスト以外に,自由記述式,パフォーマンス評価(エッセイや小論文などの完成作品の評価,実演の評価),観察や対話による評価やそれらをまとめたポートフォリオによる評価がある。どの評価方法を用いるかは,教員が学習の過程で何を重視しているかを暗黙のうちに学生へ伝えることになるため,十分な検討が必要だろう。評価方法を選ぶ際には,次の4つの観点を押さえておきたい5)

信頼性:同じ学生に対して同じ条件のもと複数回実施しても同じような結果が出るか。
客観性/比較可能性:複数の評価者間で(評価者が変わっても)結果が一致するか。

妥当性:評価方法は学習目標(評価しようとする成果)に照らして妥当か。
​​​​​​​効率性:評価の実施や採点が時間的・経済的に実用的であるか

 総括的評価は信頼性・客観性の確保をより重視し,形成的評価は多様な評価情報を得ることを重視する。パフォーマンス評価を実施する際には,4つの観点のバランスを保つために,評価観点を記述したルーブリックを用いることが推奨される()。

3495_0301.jpg
 「ファシリテーション入門」のレポート評価時におけるルーブリックの一例

 このようなルーブリックは評価のためのツールとして,①客観テストでは測りにくい知識・技能を評価する際の信頼性・客観性を高める,②評価にかかる時間の短縮につながり効率性が上がる,③複数の評価者間で評価基準について合意・調整(モデレーション)するためのツールとしても使用できる,という利点がある。さらには,深い学びを促すために,教師の期待(獲得してほしい知識や能力など)を明確にすることや,学生の作品や実演に対して長所や改善の必要な箇所といったより多くの情報を含んだフィードバックを与えられること,学生の自己評価・ピア評価にも使えることが期待される5)

 教育学のウォルワードは,「アセスメントは日常的な学術的活動である」と述べています6)。大学案内のパンフレットに「本学の学生は批判的思考力を身につける」とうたっていれば,「本当に身についているか」を何らかの形で確認するのは自然なことでしょう。一方でそうした確認(評価)は,測定可能なもののみでさまざまな意思決定が行われる危険性と,学生の学びと大学の質の向上をもたらす可能性の2面性を持っているのです。

 次回は,グループワークを機能させる仕掛けや形成的評価の実際を解説する。


1)PM.センゲ,他(著), リヒテルズ直子(訳).学習する学校. 英治出版;2014.
2)JZ.ミュラー(著),松本裕(訳).測りすぎ.みすず書房;2019.
3)西岡加名恵,他(編).新しい教育評価入門[増補版].有斐閣;2022.
4)中井俊樹,他(編).看護教育実践シリーズ2――授業設計と教育評価.医学書院;2018.
5)D.スティーブンス,他(著),佐藤浩章,他(訳).大学教員のためのルーブリック評価入門.玉川大学出版部;2014.
6)B.ウォルワード(著),山﨑めぐみ, 他(訳).大学教育アセスメント入門.ナカニシヤ出版;2013.

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook