医学界新聞

臨床研究・疫学研究のための因果推論レクチャー

連載 後藤 温,井上 浩輔,杉山 雄大

2022.01.17 週刊医学界新聞(通常号):第3453号より


 コホート研究や症例対照研究などの観察研究では,未調整交絡や,情報バイアス,選択バイアスの存在は避けられないことがほとんどです。今回は,バイアスについて振り返り,バイアスを定量化する方法(バイアス分析)1)を紹介します。

 真の因果効果に近い推定値を得るには,研究デザインの段階で,観察される関連から潜在的なバイアスをできるだけ取り除くことが重要です。しかし,観察研究で扱うデータの多くは,図1のDAGのように,未調整交絡,情報バイアス,選択バイアスが存在します。

未調整交絡の例:曝露にもアウトカムにも影響する「疾患の重症度」が測定されておらず,調整できない場合。
情報バイアスの例:質問票などで測定された情報が,真の情報を正確に反映していない場合。
選択バイアスの例:一部の研究参加者が追跡できなくなったり,分析対象者の選択に偏りが生じたりする場合。

 これらの場合,バイアス分析を用いて想定されるバイアスの向きや大きさを補正すると,バイアスの存在を定量的に考慮した上で観察研究の結果を評価できます。未調整交絡に対するバイアス分析の具体例を見ていきましょう。

3453_04_01.jpg
図1  実際の研究で想定されるバイアスと交絡
・未調整交絡:交絡因子が未測定であるなどの理由で調整できていない交絡。
・曝露の誤分類:曝露そのものは未測定だが,曝露に関する情報が測定され曝露の代理指標として用いられることによる情報バイアス。
・アウトカムの誤分類:アウトカムそのものは未測定だが,アウトカムに関する情報が測定されアウトカムの代理指標として用いられることによる情報バイアス。
・選択バイアス:分析対象集団が母集団から系統的に偏ってしまうことによるバイアス。

 ここでは,2型糖尿病患者における重症低血糖(他者の介助を必要とする低血糖)が心血管疾患発生リスクを高めるかを検討した研究2)を紹介しながら,バイアス分析を説明します。

 2013年までに報告された観察研究の結果を統合すると,重症低血糖「あり群」では「なし群」と比べ,心血管疾患発生のリスク比(RR)は約2倍でした。この結果に対し一部の研究者は,重症低血糖は併存する重篤疾患の単にマーカーにすぎず,重症低血糖は心血管疾患の原因ではないだろうと考えました。

 まず,の架空データから考えましょう。全体で,重症低血糖(E)の心血管疾患発生(D)に対するリスク比(RRDE)は100/1,000÷5,000/100,000=2.0ですが,重篤疾患(Z)による未調整交絡で完全に説明できるでしょうか(図2-A)。Zは測定されていないので,Zで層別後の表中の値は欠測値「?」となります。しかし,もし「?」を埋められれば,Zで層別したRRDEが推定できます。Zの取り得る値はたくさんありますが,あるシナリオを表に[数値]として代入すると,Zで層別したRRDEが1.0となります。このように未測定のZが観察されたRRDE=2.0を完全に説明するには,極端なシナリオの設定が必要であるとわかります。

3453_04_02.jpg
 2型糖尿病患者における重症低血糖と心血管疾患発生(架空のデータ)
*データを用いた分析はRコマンドを参照

 ここでは一例を示しましたが,Zのさまざまなシナリオについて,欠測値を代入してRRDEを計算するのは労力がかかります。また一般に観察研究では,測定された交絡因子で調整後のRRDEの結果が得られていて,単純に表から計算できないことがほとんどです。そのような場合にBias formula3))を用いると,ZとDとのリスク比(RRDZ)がEの値によらず均一であるとき,E=1,E=0におけるZの頻度(PZ1,PZ0),ZとDとのリスク比(RRDZ)の3つのパラメータからバイアスの程度を表すBias factorを推定できます(図2-B)。観察したリスク化をBias factorで除することで,バイアス調整後のリスク化(RRDE)が推定されます。Bias formulaを用いると表中の「?」を穴埋めせずとも,3つのパラメータにさまざまな値を与えることで,多様なシナリオにおけるバイアス調整後の結果を計算できるようになります。

3453_04_03.jpg
図2  重症低血糖と心血管疾患発生の関係とバイアス分析(Cは文献4より改変)

 文献2の研究では実際にBias formulaを用いたバイアス分析が適用され,併存する重篤疾患による未調整交絡により,重症低血糖と心血管疾患発生との関連が説明できるのかが検討されました(図2-C)。その結果,重症低血糖と心血管疾患発生との関連を未調整交絡だけで説明するには,例えば,重症低血糖既往なし群で重篤疾患(=PZ0)が0.5%のとき,重症低血糖既往あり群で重篤疾患(=PZ1)が10%以上で,かつ重篤疾患と心血管疾患発生とのリスク比(RRDZ)が10倍以上である必要がありました。さまざまなシナリオにおける検討の結果,臨床的に想定可能な状況では,重症低血糖と心血管疾患発生との関連が完全に説明される可能性は低く,重症低血糖は重篤疾患の単なるマーカーとは考えにくいとの結論が得られました2)

 今回紹介したバイアス分析により,図1で表したようなバイアスの存在を考慮した効果推定値が得られます。バイアス分析は交絡に対して実施することが多いですが,選択バイアスや情報バイアスについても定量的に分析することが可能です1))。

 観察研究の論文では,「観察研究であり,因果関係には迫れない」と述べ,因果効果に言及しないこともできます。しかし,観察研究であっても,生じ得るバイアスを可能な限り取り除き,それでも残っていると想定されるバイアスの向きや大きさを論じることで,観察された関連から注意深く因果効果を推定できます。因果効果の言及には慎重を期す必要があるものの,観察研究から因果効果を「推定」する試みは,有意義なことと考えます。


:交絡に対するバイアス分析は近年,より簡素化された指標である「E-value」も提唱され,臨床疫学研究でも応用の機会が増えている4)。さらに,バイアスについてのシナリオの不確実性やランダムな誤差による不確実性を考慮して推定する方法,第7回で紹介した,時間とともに変化する曝露を扱うバイアス分析も開発されている。

謝辞:日本医薬品安全性研究ユニット理事長の久保田潔先生にご助言をいただきました。心より感謝申し上げます。

1)Int J Epidemiol. 2014[PMID:25080530]
2)BMJ. 2013[PMID:23900314]
3)Ann Epidemiol. 2008[PMID:18652982]
4)Ann Intern Med. 2017[PMID:28693043]