医療ビッグデータの活用（喜連川優）

インタビュー

2018.03.05

【interview】

個々の医師，病院の枠を超えて始まる
医療ビッグデータの活用

喜連川優氏（国立情報学研究所所長/東京大学生産技術研究所教授）に聞く

　2017年11月，国立情報学研究所（NII）に「医療ビッグデータ研究センター」（以下，研究センター）が新設された。医療ビッグデータを活用した人工知能（AI）開発は，診療補助，医療の均てん化，医療の質向上，エビデンスの創出に向け，近年大きな期待が寄せられている。中でも医療画像は，日本は他国と比較して画像機器の設置台数，撮影回数ともに多いこと，正しい診断名が付与された質の高い画像データの収集が学会によって進められていることなどから期待が高い。そこで本紙では，日本のビッグデータ研究をけん引してきた喜連川優氏に，活用に向けた展望を聞いた。

――研究センター設立の目的を教えてください。

喜連川　ネットワークやクラウド，セキュリティー，AIなどの最先端情報技術の活用により，医療分野の課題解決を推進することです。

　現在，大きく分けて2つの事業に取り組んでいます。1つは，医療画像ビッグデータを集積するクラウド基盤の構築（図）。もう1つは，収集した大量の医療画像を解析し医師の診断を助けるAI基盤の開発です。これらは，AMED「臨床研究等ICT基盤構築・人工知能実装研究事業」に採択された3学会（日本消化器内視鏡学会，日本病理学会，日本医学放射線学会）と連携して進めています。さらに，日本眼科学会とも協議を始めています。

図　医療画像ビッグデータクラウド基盤の概念図（クリックで拡大）

大学や病院で蓄積されたデータを各学会が集め，匿名化とフォーマット統一を行う。そのデータを各学会サーバーからNIIが構築する「医療画像ビッグデータクラウド基盤」へアップロードし，保存。研究者がクラウド上でデータを解析できるようにする。

――AIによる医療画像診断の研究開発は，すでに海外でも進んでいます。日本で取り組む意義は何ですか。

喜連川　AIの性能を決めるのはデータです。日本には質の高い大量の画像データが保存されています。その優位性を活用すれば，高い性能の画像認識AIを作ることをめざせます。また，疾病の傾向は人種ごとに異なり，生活環境も影響します。日本人の特性に合わせた早期の病変検出システム構築に向けて，自国データを用いて研究開発することは大きな意義があると考えます。もちろん，構築するフレームワークはグローバルを意識しています。

――厚労省「保健医療分野におけるAI活用推進懇談会」が17年6月に出した報告書では，AI開発を進めるべき重点領域に画像診断支援が挙げられていました。日本は診断系医療機器の開発能力が高く，同機器の貿易収支も黒字という面で強みがあります。

喜連川　産業への転換の道筋がつけやすいという点はその通りかと思いますが，まだまだ研究開発中です。

日本一の超高速回線により膨大な医療画像データを収集

――研究センターが現在取り組んでいる2つの事業について教えてください。まず，クラウド基盤構築とはどのようなものでしょうか。

喜連川　医療ビッグデータを活用するためには，当然ながらまずデータを収集し，格納する基盤が必要です。それにはデータを安全に転送・保存できなければなりません。さらに，膨大な量のデータの転送や利活用の際の取り出しが円滑にできることも求められます。

　本事業では，NIIが構築・運用する学術情報ネットワークSINET 5を活用します。100 Gbpsという超高速回線で日本全国，現在850以上の大学や研究機関が接続されています。この回線速度は家庭用光回線の約1000倍に相当します。

――医療ビッグデータを扱うにはそんなにも速い回線が必要なのですか。

喜連川　100 Gbpsは独り占めするものではなく，皆で使うものです。とりわけ最近は多くの学問でデータインテンシブになる傾向があります。ICTの歴史を振り返ると，文字列，音声，画像，動画と，よりリッチなメディアへと進化してきています。その背景には，通信だけでなく，プロセッサの高速化や大容量ストレージ技術の進展も同時にありました。ICT環境が成長すると，今度はその環境を利用した新しいアプリケーションや機器が生み出されます。

　今日の医療機器は著しくIT化され，現時点でも膨大なデータを生み出しています。上述の歴史が示すように今後ますます大量のデータを生み出すようになることは必至です。100 Gbpsを超える通信技術も生み出されつつあります。例えば，8K画像の活用は医療から始まるだろうと政府でも議論されました。手術映像の8K伝送や遠隔医療をはじめとした広域ネットワークが果たす役割は大きそうです。

――人間一人が一生に生み出すヘルスケアデータは100万ギガバイトとの分析もあります。ビッグデータ研究というと収集したデータの解析に注目しがちですが，環境整備も重要なのですね。

喜連川　人の活動をデジタルデータで記録することをLife Logと言います。健康に一生を過ごせることは大切ですが，人生の目標は健康だけではありません。匿名化した人生データの解析は国連の提唱する持続可能な開発目標（SDGs）実現のための，人類の究極のテーマだと私は考えています。膨大なデータとなりますが，挑戦可能な時代はそれほど遠くないかもしれません。“IT屋”の夢は大きく広がります。

約12万症例の画像データ登録予定。次年度以降さらに拡大

――次に，医療画像データ収集の現状を教えてください。

喜連川　2017年11月にクラウド基盤が整い，運用が可能になりました。画像データ登録開始は今年度中をめざしています。

――医療画像データはどれくらいの規模で収集する予定なのでしょうか。

喜連川　17年度中の画像データ登録症例数目標は，消化器内視鏡が1万症例，病理が11万症例と学会から聞いています。今後各学会がより多くの病院の協力を得て収集規模を拡大することを期待しています。

――AIの性能は教師付データ約5000の学習で許容できる性能に達し，1000万学習すれば人間の能力に匹敵するとの推計がありますね。

喜連川　AIの性能はデータの質と量に依存します。医療画像AIは昔から研究されていましたが，データ量の少なさが一番の課題でした。今回は学会によって従来では入手困難だった規模で収集できていますので，どこまで性能が上がるか楽しみです。

――今回の事業と近年のディープラーニング（深層学習）の進歩をどうご覧になっていますか。

喜連川　今回，画像に焦点が当てられ，学会との連携によりAI解析が事業として取り上げられたことは，大変時宜を得た，素晴らしいことです。近年急速に発達した深層学習技...

この記事はログインすると全文を読むことができます。
医学書院IDをお持ちでない方は医学書院IDを取得（無料）ください。

医療ビッグデータの活用（喜連川優）

【interview】

日本一の超高速回線により膨大な医療画像データを収集

約12万症例の画像データ登録予定。次年度以降さらに拡大

いま話題の記事

最新の記事

医学界新聞公式SNS

医療ビッグデータの活用（喜連川優）

シェアする

【interview】

日本一の超高速回線により膨大な医療画像データを収集

約12万症例の画像データ登録予定。次年度以降さらに拡大

シェアする

いま話題の記事

最新の記事

医学界新聞公式SNS