医学書院

検索
HOME週刊医学界新聞 > 第3340号 2019年09月30日



第3340号 2019年9月30日


【対談】

スパコン「京」が開いた分子シミュレーション研究の扉
研究から医療応用へ

河野 隆志氏(国立がん研究センター研究所ゲノム生物学研究分野長/先端医療開発センターゲノムTR分野分野長/がんゲノム情報管理センター情報利活用戦略室室長)
奥野 恭史氏(京都大学大学院医学研究科ビッグデータ医科学分野教授)


 2019年8月30日,スーパーコンピューター「京」(以下,「京」)が7年の歴史に幕を閉じた(写真)。事業仕分け,東日本大震災での部品工場被災などの困難を乗り越えて2012年から本格運用を開始。世界一の情報処理能力を誇った「京」は医療分野にも貢献を果たしてきた。

 本紙では,「京」の医療分野への利用を先駆的に行ってきた奥野恭史氏と,「京」とその後継機スーパーコンピューター「富岳」(以下,「富岳」)を利用してゲノム医療の発展をめざす河野隆志氏の対談を企画。「京」の貢献を振り返り,「富岳」利活用の展望を議論した。

写真 シャットダウンセレモニーにて電源が落とされた「京」(上)。撤去される「京」(下)。撤去後は,後継機「富岳」が設置される(いずれも,理化学研究所提供)。


奥野 先月,8月16日に「京」の運用が終了し,30日にはシャットダウンセレモニーが開かれました。今思えば,「京」との出会いがなければ私の研究者人生が今とは大きく変わっていたと言っても過言でなく,それだけに「京」とお別れするに当たり感謝と寂しい気持ちでいっぱいです。

河野 計算生命科学の第一人者である奥野先生に教えてもらいながら,「京」を使った分子動力学シミュレーションを数年前に始めて,「もっと多くのタンパク質に使えるぞ」と思っていたところなので,後継機が使えるようになるのが待ち遠しいです。

奥野 「京」の後継機「富岳」は2021年の使用開始をめざして製造が進んでいます。「富岳」の利用開始を待つこの間,この機会に,国内のスーパーコンピューター(以下,スパコン)の先駆け的存在であった「京」が医療にもたらした功績を振り返りながら,「富岳」への期待を話していきましょう。

シミュレーションは「本当に使える」という証明

河野 素人質問で恐縮ですが,「京」の計算能力のすごさを具体的に教えてください。スパコンなので,普通のコンピューターではできないほど膨大な計算ができるとは承知していますが。

奥野 「京」はその名の通り,1秒で1京(=1016)回以上もの計算ができます。私の専門である分子動力学シミュレーションで評価すると,原子数では最大1億個,時間で言えば数十マイクロ秒のシミュレーションが可能になる計算能力です。1億個の原子数というのは,細胞内の一部の環境を再現できる規模です。

河野 それはすごいですね。タンパク質分子と水分子の相互作用なども,実際の生体内では分子動態に影響を与えます。分子単体のシミュレーションでは生体を模倣したことにはならないという課題がありました。

奥野 その点でシミュレーション精度を高くできるのが「京」のすごさです。

河野 日本癌学会など,分子生物学的な研究発表を主とする学会でも分子シミュレーションの研究成果がだんだん発表されるようになりました。これも計算精度の高さゆえでしょう。

 奥野先生はいつから「京」を用いた研究をされているのですか?

奥野 2012年,「京」の本格始動時からです。

河野 私が,肺がん等を誘引するRET融合遺伝子を見つけて発表し,がんゲノム医療に携わり始めたのと同じ年ですね。とはいえ,この時にはスパコンを使ったシミュレーションをしようなんて思ったことはありませんでした。私の知らないところで,「京」を使ったシミュレーションの基盤が整えられていったのですね。

奥野 最初は分子動力学シミュレーションが実測値と遜色ない結果を導き出せるのかを検証するところからのスタートでした。実を言うと,当初はコンピューターのシミュレーションに自信がありませんでした。個々の原子に働く力を求め,原子のダイナミクスを計算する分子動力学法を用いて,タンパク質と薬剤との結合親和性を予測するMP―CAFEEと呼ばれる方法の精度が高いとの憶測が業界にあったものの,実際に計算できるだけの能力を持つコンピューターがなく,評価されていなかったからです。

河野 「京」という計算能力が桁違いのコンピューターが登場したことで,奥野先生が実際に試してみたと。

奥野 ええ。製薬企業もシミュレーションに興味があると聞いたので,私たちのチームでコードを書いてスパコンでの演算結果を評価してみたところ,思っていたよりも実測値と近い値が出ました。「京」を用いたシミュレーションへの手応えを感じた瞬間です。

 研究成果は使われてナンボなので,多くの人に利用してもらいたい。それ以降,どんな分子に対して適用できるかや,変異の入ったタンパク質でもシミュレーションできるかなどを試していくことで,「京」を用いたシミュレーションの有用性を示してきました。

河野 汎用性の高さは,実用化をめざす上で重要ですよね。今年6月に保険収載されたOncoGuide™ NCCオンコパネルシステムの開発に携わったので,実感があります。臨床での利用をめざす以上,多くの検体で遺伝子配列を読めなければなりません。パラフィンで何年も前に固定された質の悪いDNAも,肺がんのDNAも読めるか……と同じような実験を繰り返し行っては調整し,やっと有効性が認められました。

奥野 まさに同じ感覚です。初めは1個のタンパク質でのシミュレーションでした。成功したら,次は,次はと世界中で同様にコンピューターを用いたシミュレーションが行われ,有用性が多数報告されるようになってきたところです。今やっと,シミュレーション実験が,実験室で研究を行う研究者に信頼されるようになってきたと感じます。「京」が開いてくれたのは,シミュレーション実験という新たな実験系の扉ではないかと思います。

「京」の100倍の研究成果をめざして

河野 冒頭,「京」の計算能力について原子数とシミュレーション時間で説明していただきました。原子数の軸では,生体をシミュレーションするに足る計算能力を持っていたと言えそうです。では,時間についてはどうでしたか。

奥野 マイクロ秒単位とはいえ分子を経時的に見られた点で意義は大きかったと思います。経時的に変化をとらえることで,X線でとらえた一時点のスナップショットの立体構造だけでなく,また違った構造が見えるようになったからです。

河野 おかげで,私の研究グループではRET融合遺伝子のバンデタニブ耐性化機構に関する研究を発表できました(Nat Commun.2018[PMID:29434222])。バンデタニブ耐性化の原因と考えた変異が,耐性獲得した際に変異が入りやすい薬剤結合部位に位置していなかったため,真に耐性化の責任変異なのか確信を持てませんでした。そんなときに奥野先生の研究に出合って,経時的な分子動力学シミュレーションでタンパク質と薬の相互作用の変化をとらえられるかもしれないとの発想に至りました。

奥野 3マイクロ秒のシミュレーションを行ってみると,変異が入ったドメインがバンデタニブの結合部位にどんどん近づいていったのです。この不安定な構造によって薬の結合が妨げられるのだろうとの考察に至りました。

河野 経時的なシミュレーションができなければ,この構造変化はわからなかったことです。

奥野 とはいえ正直に言えば,「京」の計算能力では不十分だったと言わざるを得ないでしょう。「京」でできるマイクロ秒単位のシミュレーションでは,薬剤を投入したその瞬間,反応に至るまでの時間しかシミュレーションできません。生体内の反応を想定すると,ミリ秒単位のシミュレーションをしたい。それがかなえば,立体構造の変化に伴うタンパク質同士の相互作用や薬剤との結合構造の変化まで見られるようになり,実験代わりになるようなシミュレーションができると期待しています。これの実現が,私の研究グループにおける「富岳」で用いるアプリケーション開発の目標です。

河野 「富岳」ではミリ秒単位のシミュレーションができるのですか。それは期待が膨らみます。

奥野 「富岳」は「京」の100倍の計算能力(アプリケーション実効性能)をめざして開発が進んでいます。「富岳」という計算機そのものと,アプリケーションの工夫で実現可能な数字です。

 100倍の計算速度が実現すれば,シミュレーションを長く行えるだけでなく演算にかかる時間も短くなります。「京」ではタンパク質のモデル化などの前準備を含めてしまうと,1か月かかっても数百個程度しか1マイクロ秒の分子動力学シミュレーションを行えませんでした。創薬の現場は「そんなに待てない」のが現状です。「京」をもってしてもコンピューター創薬の実現には,計算速度はまだ遅過ぎました。

河野 100倍の計算速度が実現すれば,1か月で1万個のスクリーニング。in silico創薬実現も遠くない未来かもしれませんね。

 一方で薬のシーズとなる化合物の分子サイズが大きくなる傾向にあります。100倍の計算能力になれば,ペプチドや抗体などの大きな分子のスクリーニングにも対応できるのでしょうか。

奥野 ペプチドなどの中分子は「京」でもシミュレーションできましたが,抗体医薬は「富岳」でもまだ難しいかもしれません。抗体医薬は高分子なので結合パターンが増えてしまいますから。そこでAI的なアプローチの併用を検討しています。AIで分子動力学計算結果を予測し,結合能が低いと予測される構造への分子動力学計算は途中で終えて,次の構造候補に対する計算へ移行する。そうすることでスクリーニングに要する時間を削減できると考えています。「富岳」とAIを併用することで,「京」の100倍を超える研究成果を生み出せるかもしれません。

スパコンを研究から医療へ

河野 奥野先生が課題責任者を務めるポスト「京」重点課題では創薬を中心に研究が進められています。さらに「富岳」は,創薬以外の医療分野でも活躍できると思うんです。

奥野 「『富岳』を生命科学・医学に使わなくて何に使うんだ」くらいの気概を持って開発に携わっているので,その言葉は大変うれしいです。どんな分野での活躍を期待しているのですか。

河野 がんゲノム医療への貢献をぜひ検討できないでしょうか。

奥野 遺伝子パネル検査が保険収載されるなど,特にホットな分野ですね。

河野 保険診療での運用を始めてみて,期待が大きい一方で課題も多いのが実感です。その1つに,VUS(variant of unknown significance,意義不明変異)が多いことがあります。遺伝子パネル検査を行っても,次の治療法に結び付くのはわずか10%程度です。これは世界的に見ても変わりません。標準治療後の希望として遺伝子パネル検査を受ける患者・家族の方へ,次の治療につながる変異結果を返せないのは,開発に携わった者として胸が痛みます。

奥野 誰かが何かを報告しない限り個々の変異の意義は明らかにされませんから,VUSをなくすには地道に変異ごとの研究結果を発表するのが定法ですよね。

河野 それではがんゲノム医療の現場に追いつけず,VUSが多いという課題は解決しないと思います。ここにスパコンでの分子動力学シミュレーションを活用できないかという発想です。

奥野 なるほど。河野先生はどのような活用を想定していますか。

河野 VUSの意義を「富岳」で予測したものを臨床で利用できればと思っています。現在,いくつかの医療用ソフトウェアがプログラム医療機器として保険収載されています。最近では乳がん患者への治療薬適応判定プログラムBRACAnalysis®診断システムが保険収載されました。ですのでエキスパートパネルで,保険収載された「富岳」シミュレーションプログラムでの推定結果をもとに治療薬選択を議論することは決して夢の話ではないと思うのです。

 例えば,特定のタンパク質に限れば,変異の意義を予測できるのではないでしょうか。有名ながん遺伝子として広く研究されたEGFRにもなお,VUSが数千個レベルで存在します。そして「VUS」という理由でEGFR阻害薬は投与できず,別の抗がん薬が選択されています。もしEGFRのVUSそれぞれに対して,がん化の活性化変異であるか,既存の阻害薬で活性を抑えられるかを網羅的に予想できたら,それだけで多くの人に可能性が高い治療薬を届けることができるでしょう。

 実際にEGFRのまれな変異体に対して有効な阻害薬を予測できるとの小規模な結果を,「京」を用いたシミュレーションで得ています(PNAS.2019[PMID:31043566])。計算能力が100倍の「富岳」になれば,さらに多くの変異や別の変異タンパク質に対して,精度を高めたシミュレーションができるものと期待しています。

奥野 タンパク質のアミノ酸置換については,自動で計算して構造を予測できるプログラムを開発しました。タンパク質種を問わず,網羅的なシミュレーションをしようと思えばできるでしょう。ただ,どれほどの時間を要するか,実用化が現実的かは,実際に「富岳」を使ってみなければわかりません。

 加えて医療の,しかも患者さんの治療法を左右する演算の場合,果たしてどのくらいの予測精度を担保できるのかが実用化においては大事です。創薬と違ってtrial and errorを繰り返して成功をめざすわけにはいきません。

河野 患者さんにとっては「大部分の変異の意義を60%の精度で予測できること」ではなく「自分の変異の意義を100%の精度で予測できる」ことが大切ですからね。

奥野 とすると,全てのタンパク質の全ての変異を予測するのは現実的でないでしょう。

河野 ええ。ですから,特定のタンパク質やドメインについて推定を補助するもので十分だと思います。例えばキナーゼの構造はタンパク質間でよく似ていますよね。がんゲノム情報管理センター(C―CAT)に集まる膨大な変異データを解析・活用することで,がん化の責任変異であるか,治療標的であるかを演繹的に予測して返すこともできるのではないでしょうか。数個の遺伝子への予測が可能になるだけでも,かなりの数のVUSの意義を医療現場に示唆することができるはずです。

奥野 タンパク質の構造やグループに応じたモデルを構築して演算すれば,患者さんへ返せるデータが出てくる可能性はあります。ぜひ,患者さんの変異データと「富岳」をつなげていただき,解析してみたいです。こうして得たデータの研究者への還元も意義深いと考えます。がん化の責任変異の可能性が高いVUSを提示することで,治療法開発につながりやすいVUSから意義の解明をめざせるからです。

河野 それは有効な手ですね。今は,どの変異の研究をするかの決定には,その変異が何人に見つかっているかで決める場合が多いです。仮に責任変異だとわかれば,多くの人を治療につなげられる可能性があるので,当然の発想です。とはいえ,単一の患者さんに見つかる変異でも,治療上の意義があるものは存在すると考えられます。C―CATに集まるビッグデータと「富岳」の計算能力を活用し,少しでも多くの人を次の治療に結び付けられるようになると期待したいです。

奥野 「京」の運用が始まった当初は,計算生命科学を専門とする私ですら「京」を使ったシミュレーションに自信を持てませんでした。それがこうして,河野先生のような分子生物学実験の専門家にスパコンを用いた医療を期待してもらえるまでになったと思うと感慨深いです。「研究から医療へ」。「京」が開いた分子シミュレーション研究の扉を,今度は「富岳」でもってさらに多くの人に活用してもらい,多くの人へ研究成果を還元できるようにしていきたいです。

(了)


こうの・たかし氏
1989年京大薬学部卒。95年東大大学院医学系研究科博士課程修了。博士(医学)。95年より国立がんセンター研究員となり,2000年に同生物学部室長となる。10年から同研究所ゲノム生物学研究分野分野長,13年から先端医療開発センターゲノムTR分野長を併任。18年より現職。19年6月に保険収載された遺伝子パネル検査「OncoGuide™ NCCオンコパネルシステム」の設計開発責任者を務めた。

おくの・やすし氏
1993年京大薬学部卒。95年同大大学院薬学研究科修士課程修了。博士(薬学)。同大薬学研究科准教授,教授などを経て,2016年より現職。17年より理研医科学イノベーションハブ推進プログラム副プログラムディレクターを併任。スーパーコンピューターや人工知能を用いた創薬と医療のシミュレーション研究・ビッグデータ解析に取り組み,ポスト「京」重点課題1「生体分子システムの機能制御による革新的創薬基盤の構築」の課題責任者を務める。