医学界新聞

寄稿

2015.01.05



ライフサイエンス領域におけるビッグデータの利活用

山田 亮(京都大学大学院統計遺伝学分野教授)


 「ライフサイエンス」は「いきもの」を扱う諸科学(理学の中の生物学と,実学としての農学・医学・薬学)を合わせた領域として成立しているが,同時期に進んだマイクロ・ナノ技術とコンピューターの大発展とを取り込み,ビッグデータサイエンスとなったことも重要な特徴の一つである。そもそも生物現象が多様性の学問であることを考えると,ライフサイエンスのビッグデータ化は非常に重要な変化と言えよう。

ライフサイエンス領域におけるビッグデータとは

 では,ライフサイエンス領域ではどのようなビッグデータがどうやって得られるのだろうか。以下にいくつか紹介する。

(1)ゲノム・オミックスデータの 一括測定
 ヒトのゲノムDNA配列は約30億塩基対に及ぶ。その数パーセントにあたる2万数千個のコーディング遺伝子(機能するタンパク質を塩基配列で指定している遺伝子)を中心に,数千万以上のゲノム配列のバリアントを一気に測定したり,全遺伝子の発現量を一括して測定したり,試料中の全タンパク質や代謝物を一括して測定したりすることも,容易になった。こうした測定を数千人から数万人を対象に実施することで,非常に大きなデータが得られる。

 一方,これらの実験を個々の細胞ごとに実施すれば,身体を構成するさまざまな細胞について,臓器組織別の違いや,受精卵から死亡するまでという時期の違い,病的な変化の有無などについて個別に調べられる。つまり,一人ひとりの中に大きなデータリソースがあると言える。

(2)経時的・高容量の記録
 音声・映像記録のデジタル化も,大規模なデータをもたらす。記録方式がアナログからデジタルに変わることで,コンピューター解析と直結し,ライフサイエンスのその他のデータと同じ土俵で扱えるようになった。これにより,個体の動作や顕微鏡下の細胞・分子の動きを撮影し,ダイナミックな動きや変化を解析することが可能となった。このような音声・映像のビッグデータ化は,医療画像分野はもとより,日常生活でも容易に実感できるだろう。

(3)インターネットを活用した横断的データ利用
 個々のライフサイエンス研究が扱うデータがビッグデータ化している中,これらのデータを共同研究グループ間で共有したり,インターネット上に公開し広く研究コミュニティーの利用に供したりすることで,複数のビッグデータを組み合わせた研究も可能となった。公的研究資金によって得られたゲノムやオミックス(包括的生命情報)の生のデータは公共財と見なされ,公開が義務付けられることも多くなっている。なおデータの公開には,公共化という側面だけでなく,相互検証の道を開くことで研究不正を防ぐという重要な側面がある。

 ライフサイエンス領域のビッグデータにはさまざまなキーワードが関連する

電子カルテやウェアラブル・デバイスの活用も

 疾病を研究対象にする場合,疾病の有無や詳細情報は診療録(カルテ)から得ることになるため,その電子化はとても大きな利点となる。電子カルテからならば,多人数の検査値などのデータ抽出が容易に行えるため,複数の疾患の有無を同時に調べたり,多くの検査項目を一括して解析対象にすることが可能になった。また,ネットワークで結合された複数の電子カルテシステムを横断的に活用することも可能である。実際,そうして連結された電子カルテを大規模なデータベースとみなし,疾患関連遺伝子探索を行う研究スタイルも海外では展開されている。

 ICTを利用した個人のフェノタイプ(遺伝子型の...

この記事はログインすると全文を読むことができます。
医学書院IDをお持ちでない方は医学書院IDを取得(無料)ください。

開く

医学書院IDの登録設定により、
更新通知をメールで受け取れます。

医学界新聞公式SNS

  • Facebook