医学界新聞

医学界新聞プラス

『数式不要! はめ込み統計学 EZRでできる保健医療統計これだけ』より

連載 加藤丈夫

2021.10.15

 

ビッグテータの考え方が広まり,近年ますます重要視されている統計学の知識。しかし,「統計学って複雑な数式を駆使するイメージがあって難しそう」と苦手意識を抱く方も多いのではないでしょうか? この度上梓された『数式不要! はめ込み統計学 EZRでできる保健医療統計これだけ』では数式を使わず,保健医療の現場で使う実践的な統計手法がわかりやすく解説されています。無料統計ソフト「EZR」を用いた解析の手法の一端を全4回にわたり覗いてみましょう。

第2回のつづき)


前章で「変数」の種類について勉強しました。そして,「変数」の種類によって,用いる統計解析の手法が異なることも勉強しました。

ここからは,いよいよ実際の統計解析を行います。

名義変数の解析

まずは,名義変数の解析を行ってみたいと思います。名義変数の解析には,「カイ2乗検定」や「フィッシャーの正確検定」(Fisher’s exact test)を用います。

パソコンや統計ソフトが普及する以前は,手計算で算出可能な「カイ2乗検定」しか使用できませんでした。しかし,「カイ2乗検定」で算出された値は近似値とのことですし,また,症例数や対象者数が少ない場合には「カイ2乗検定」を用いることはできないとされています。従って,パソコンや統計ソフトが普及している現在では「フィッシャーの正確検定」を用いることをお勧めします。

名義変数の検定法を習得すれば,保健医療統計データのほとんどは解析可能と言っても過言ではありません。なぜなら,第1章で学んだように連続変数は名義変数に変換できるからです。

 ポイント 
  • ①名義変数の解析は「フィッシャーの正確検定」を用いる

  • ②この検定法を習得すれば,保健医療統計データのほとんどは解析可能

 

2群(名義変数): フィッシャーの正確検定

まずは,練習問題2-1を解いて解析手順について理解しましょう。

練習問題2-1

肺がん患者100人と非肺がん患者200人の喫煙歴を調査しました。その結果,肺がん患者100人のうち喫煙者は60人(60%),非肺がん患者200人のうち喫煙者は80人(40%)でした。

非肺がん患者に比べて,肺がん患者の喫煙率は有意に高いと言ってよいでしょうか?


《肺がんあり》《肺がんなし》および《喫煙歴あり》《喫煙歴なし》は「名義変数」です。名義変数の解析ですので,「フィッシャーの正確検定」を用います。

変数を表にまとめると,表2-1のようになります。この表は2行(《肺がんあり》《肺がんなし》)と2列(《喫煙歴あり》《喫煙歴なし》)で構成されているので,2×2分割表と呼びます。

なお,「列」と「行」を混同することが時々ありますが,図2-1のように覚えると忘れません。

017-1.jpg
表2-1 肺がんと喫煙
017-2.jpg
図2-1 行と列の覚え方
 ポイント 
  • 名義変数の解析には,最初に分割表を作成する。

 

解析方法1:インターネットを利用
最も簡便な方法はインターネットにアップロードされている統計ソフトを使用することです。

例えば,Yahoo!やGoogleで「2×2分割表解析」と検索(もしくは「www.grade-jpn.com/2x2.html」と検索)すると図2-2の画面のページを見ることができます。これを用いて,フィッシャーの正確検定を行うことができます。

017-3.jpg
図2-2 インターネットを利用(2×2分割表,練習問題2-1)

「2×2分割表解析」の記入欄に数字を入れると,「合計」は自動的に計算されます(図2-3)。左列の「危険因子あり(なし)or診断検査陽性(陰性)」や上行の「アウトカム有り(無し)」の文言は無視して結構です。その代わりに,表2-1の左列の「《肺がんあり》《肺がんなし》」と上行の「《喫煙歴あり》《喫煙歴なし》」を覚えておいてください。

そして,「Compute」をクリックすると,右列にp値(p-value)が「0.001」と表示されます(図2-4)。

「p=0.001」は0.05未満(p<0.05)ですので,「肺がん患者は,非肺がん患者に比べて,有意に喫煙率が高い(p=0.001)」と結論できます。

018-1.jpg
図2-3 インターネットを利用(2×2分割表に数値入力,練習問題2-1)
018-2.jpg
図2-4 インターネットを利用(フィッシャーの正確検定,練習問題2-1)

解析方法2:EZRを利用
最も推奨できるのは,統計ソフト「EZR」を使用する方法です。この統計ソフトの使用法は簡単であり,これに慣れておけば,今回の初歩的な統計解析だけでなく,将来,より高度な統計解析をしたいときにも大いに役立ちます。

EZRはインターネットから無料でダウンロードでき,個人のパソコンにも職場のパソコンにもインストールできます。また,EZRは世界的に信頼された統計ソフトであり,国際学術論文でも「本研究の統計解析はEZRを用いて行った」と記載すれば,用いた統計ソフトについてはクレームがつきません。なお,「SPSS」や「SAS」も国際的に評価の高い統計ソフトですが,インストールに高額な費用が必要になります。

EZRのインストール方法については,コラムに示しましたのでそちらをご参照ください。

コラム 「EZR」をインストールしよう

Yahoo!やGoogleで「EZR」と検索し,「自治医科大学附属さいたま医療センター血液科>統計ソフトEZR」のページ(図ⅰ)を開いてください。

019-1.jpg
図ⅰ 「自治医科大学附属さいたま医療センター血液科>統計ソフトEZR」のページ
www.jichi.ac.jp/saitama-sct/SaitamaHP.files/statmed.html

019-2.jpg
図ⅱ 「Windows版のインストール」のページ

ほとんどの方はWindowsのパソコンを使用していると思いますので,ここではWindowsのパソコンへのダウンロードの方法について述べます。

図ⅰのページの画面左側「ダウンロード(Windows標準版)」を選択してください(Macのパソコンをご使用の方はその下を選択)。そうすると,図ⅱ(前頁)の画面が現れます。この画面の「Windows版はここをクリックしてダウンロードしてください」を選択し,画面に従って操作を進めるとEZRがダウンロードされ,デスクトップに2つのアイコンが表示されます(図ⅲ)。これで,EZRがインストールされました。

020-1.jpg
図ⅲ インストールされたEZR



それでは,インストールされたEZRを使用して「フィッシャーの正確検定」を行う方法を解説します。

まず,EZRを起動します(「32-bit」あるいは「64-bit」)。EZRを立ち上げると,「Rコマンダー」と「R Console」の2つの画面が現れます。このうちの「Rコマンダー」画面から,以下の順に選択します(図2-5)。

020-2.jpg
図2-5 EZR(検定法選択,練習問題2-1)
Rコマンダー タブ 「統計解析」 > 「名義変数の解析」 > 「分割表の直接入力と解析」

すると,図2-6の画面が現れます。この空欄の分割表に,表2-1の数値を入力(図2-7)し,「OK」とすると,「Rコマンダー」の「出力」画面の下端に,解析の結果として青字でp値が表示されます(図2-8)。

021-1.jpg
図2-6 EZR(分割表,練習問題2-1)
021-2.jpg
図2-7 EZR(分割表の直接入力と解析,練習問題2-1)
021-3.jpg
図2-8 EZR(結果,練習問題2-1)

p値は「0.00137」と算出され,0.05未満(p<0.05)ですので,「肺がん患者は,非肺がん患者に比べて,有意に喫煙率が高い(p=0.00137)」と結論できます。

EZRは多くの操作がマウス操作でできるため,直感的に理解しやすく,極めて簡便です。さらに,初歩から高度な解析まで行うことができ,学術的にも信頼性を備えたソフトであることから,最も推奨できる解析方法です。また,市販の統計解析ソフトは一般に高価ですが,EZRは誰でも無料で使用できる点も大きな利点です。従って,ここからの学習ではEZRを用いた解析方法について紹介していきます。

第4回へつづく)

04582_数式不要!はめ込み統計学_カバー_帯有.jpg
 

無料統計ソフトEZRを使って始める保健医療統計!
名義変数の解析から多変量解析まで

<内容紹介>保健医療の現場で実際に統計を「使える」ことを目指し,数式を使用せずに解説した実用統計書。運動習慣と糖尿病,喫煙と肺がんなどを題材にした練習問題を基に,無料統計ソフトEZRを操作しながら理解できる。名義変数の解析から,連続変数の解析,傾向・相関の解析,多変量解析,生存期間の比較までを解説。これから統計を使いたい方に最適の一冊。 

目次はこちらから