...

データプラットフォーム拠点形成事業 - ライフサイエンスの広場

by user

on
Category: Documents
11

views

Report

Comments

Transcript

データプラットフォーム拠点形成事業 - ライフサイエンスの広場
資料1
平成28年度 ライフサイエンス委員会
説明資料
データプラットフォーム拠点形成事業
(理化学研究所)について
平成28年11月
文部科学省 ・ 理化学研究所
0
データプラットフォーム拠点形成事業
平成29年度要求・要望額
:
5,734百万円(新規)
事業概要
○各研究分野において、我が国発の質の高い大量の研究データが日々産生され、蓄積。これら急速に増加するビッグデータが有
する価値を十分に利活用するために、AI等の手法によるデータ主導型研究の重要性が指摘されている。
○このため、特定国立研究開発法人をはじめとした国立研究開発法人において、我が国が強みを活かせるナノテク・材料、ライフ
サイエンス、防災分野で、膨大・高品質な研究データを利活用しやすい形で集積し、産学官で共有・解析することで、新たな価値
の創出につなげるデータプラットフォーム拠点を構築。
○当該拠点において、研究データを利活用するためのシステム及びデータを解析するための体制を整備することにより、我が国
のデータ主導型研究を飛躍的に発展させ、基礎から実用化研究までの新たな価値の創造を図る。
(参考1) 日本再興戦略2016: 「ナノテク・材料、地球環境分野など我が国が強みをいかせる分野においてビッグデータ等の戦略的な共有・利活用を可能にするための国際研究拠点を形成」
(参考2) 特定国立研究開発法人の役割: 「我が国のイノベーションシステムを強力に牽引する中核機関」「大学と民間企業等の橋渡し役として、オープンイノベーションの実践」 (「特定国立研究開発法
人による研究開発等を促進するための基本的な方針」より)
(参考3) データ利活用が求められる分野と、これによる社会への貢献の例
・ナノテク・材料分野 → 新材料開発 ・ライフサイエンス分野 → 健康予測・生命システムの理解 ・防災分野 → 地震被害把握・災害対応
文部科学省
ガバニングボードを設置し
全体計画の調整、進捗状況
の確認等を実施
・データの共有
・共同の基礎研究 等
大学等
国立研究開発法人
<データプラットフォーム拠点>
連携
・質の高い研究データを蓄積。
・データを利活用しやすい形で整理したデータベースを構築
・関係機関とも連携しながら、AIの手法等を用いたデータ解析システ
ムを整備
・データ等を産学官で共有・解析し、データ主導型研究を進展
・AI関連プロジェクト
・他府省の取組 等
・データの利用
・共同の産業化開発 等
産業界
データプラットフォーム拠点を中核とした
オープンイノベーション
基礎から実用化までのデータ主導型研究を加速し、新たな価値を創造
1
国立研究開発法人を中核としたビッグデータ研究拠点の構築
○将来の成長分野であるAI技術を活用し、我が国が世界の競争に打ち勝つためには、解析に用いるAI技術の高度化のみならず、
解析対象の分野において大量の高品質なデータを整備するとともに、それらを共有・解析するためのプラットフォームの構築が急務。
○国立研究開発法人等では様々な分野研究を通じて膨大・高品質なデータを蓄積しており、これらを産学官で活用し、新たな価
値の創造につながる解析を行うことができるプラットフォームを構築することで、データ解析による新材料設計や生命システムの
理解、個人の健康予測、防災技術開発等を強力に推進。
ポイント
○ライフ・健康・医療、ナノ・材料、防災
の各分野で中核となるデータプラット
フォームを5年で構築。
○各プラットフォームはデータ取得か
らデータベース化、解析にいたる各
段階で理研AIPセンターの革新的技
術を活用することにより相互に連携。
実
験
確
認
解析 解
釈
RIKEN
QST/AMED
ライフ
健康・医療分野
解
総務省・経産省との連携による
人工知能基盤技術の中核的な
研究センター
析・ 解 釈
実
NIMS
験
ナノ・材料分野
・
試
作
データ
提供
収集 加
○共同研究相手の意向に応じて
オープン・クローズ・シェアを検討。
○例えば、次世代の材料開発の起爆
剤となるアプリケーションを産学官連
携のもとで開発し、提供。
D
B
化
収
集 加工
○大学等研究機関及び民間企業等と
共同研究契約を結び、双方のデータ
を利用して新たな価値を創出。
○公開可能なデータベースについて
は広く利活用に供する。
理研AIPセンター
D
B
化
解
工
D
論文
大学
計測デ-タ
国立研究開発法人
産学官協働
によりビッグデータから
新たな価値を創出 !!
民間企業
解釈
析・
共同
研究
実
験
・
試
作
B
NIED
化
防災分野
収 集・ 加
工
2
健康・医療及びライフサイエンス統合型プラットフォームについて(理化学研究所)
平成29年度要求・要望額
:
2,500百万円(新規)
健康・医療及びライフサイエンス分野を中心として、理研は日本最先端の研究・分析基盤を有しており、種々の研究データを日々産生。また、日本国内
の研究データベースのハブとしての機能も有し、理研内外から最新の研究データが蓄積。
急速に増加するデータは人の認知限界を超えており、ビッグデータに含まれる情報を十分に利活用出来ていない状況にある。データ利活用のためには、
人工知能・機械学習・データ同化及び数理・理論科学の手法が重要であり、理研にはそのための優れた研究基盤・体制(AIPセンター、iTHES)が整備
されている。
理研はこれらビッグデータ及びその利活用技術基盤を同時に有する唯一の総合研究機関として、産学官が結集したビッグデータ利活用プラットフォーム
を構築するとともに、トップレベルのデータサイエンティストを育成する。まずは、理研が既にデータベース構築やデータ利活用の取組を進めている、
健康・医療、ライフサイエンス分野の研究開発を促進し、予防医療の実現や、ライフサイエンス研究の飛躍的進展を目指す。
医療機関の医療データ
阪大、京大、慶応、東大、国立がんセンター、先端医療センター
健康の予測
医療情報の計測(センサー)
匿名化等
健康・医療多層統合
桜田一洋
プラットフォーム
層別化された
臨床情報等
臨床情報の時系列デー
タ、病態推移モデル
疾患メカニズム、
疾患モデル
制御分子のデ
ザイン等
介入の最適化
医薬プロセス最適化
奥野恭史 プラットフォーム
理研等が保有するタンパク質やケミカルバイオロジー
等のデータと、製薬企業等が保有する基礎研究から臨
床試験にいたる創薬関連の多種多様なデータや医療機
関等が保有する臨床データとを統合したプラット
フォームを整備。これらを用いて創薬の最適プロセス
を提案するシステムを構築する。
制御分子のデザイン、
細胞内反応予測モデル
疾患メカニズム、
創薬ターゲット分子
生命現象の本質的な理解
細胞システム多層統合プラットフォーム
大浪修一
人工知能・スパコン
数理・理論
連携する医療機関から集められ匿名化された医療
データ(バイオマーカー等)の構造化・意味づけを
行う。併せて機械学習等を応用しバイオマーカー等
から疾患の予測を可能とする推論モデルを提供する。
等
分子~細胞~個体の多階層の生命現象をリアルタイムで統合し精緻な生
体の精緻な予測や制御を可能とするインフォマティクス基盤を構築。ライ
フサイエンス研究の発展への貢献と、医療への貢献等を実施。
これまでのライフサイエンス等で蓄積されたデータ
SSBD、タンパク質DB、化合物DB、オミクスDB 等
3
健康・医療多層統合プラットフォーム
【目標】
医療機関・産業界と連携し、標準化された計測手法による臨床や環境データを、人工知能・機械学習の手法を用い関連付けるモデルを開
発・構築する。これにより、個別医療・個別予防(精密医療※)実現に向けたオープンプラットフォームを構築する。
【取組み内容】
「人工知能」と「情報幾何学」等の技術を利用して臨床等から得られるマルチオミックスのデータを構造化・解析し、患者の変化を予測
するモデル(推論アルゴリズム)を開発する。
疾患領域は、免疫疾患、がん、発達障害、精神疾患の4領域とし、ライフコース全体に対して精密医療を実現する技術を開発し、社会実
装を念頭においたシステムを開発する。
※精密医療:遺伝子多型だけではなく、オミックスなど生体分子情報を含めた膨大なデータに基づいて、
患者のより精密な診断(疾患の層別化)を行い、治療や予防の確立を目指す医療
理化学研究所
健康・医療多層統合プラットフォーム
バイオマーカー、疾患形態、環境情報等のデータを構造化
解析に用いる臨床データ等は匿名化され
医療機関から理研(プラットフォーム)に提供
医療機関・
大学病院・
製薬企業・
診断会社
等と連携
(理研の
ハブ機能)
機械学習や情報幾何学等の手法を用い、マルチオミックスデータから
個人の疾患形態や健康状態を予測するモデルを開発・構築
関係機関への成果の還元
○疾患モデル動物を用いた研究等により、モデルの有効性の確認や疾患メカニズム解析を実施
(現状の提携先)
大阪大学
慶応義塾大学
慈恵会医科大学
東京大学
他
4
ライフコース
健康・医療多層統合プラットフォーム
1. 新しい推論の概要(情報幾何学:データ主導型推論の枠組み)
予測
=
現状態割り当て(Nowcasting)
経時的なマルチオミックスデータを取得
+
未来予測アルゴリズム(Forecasting)
経時変化を多次元空間の軌跡で表現
経時変化の相同性に基づき機械学習
で未来予測アルゴリズムを開発
マルチ・モーダル・データ
現状態
割り当て
次元圧縮
5
健康・医療多層統合プラットフォーム
2. 幾何学的(関数フリー)方法による新しい介入方法や介入標的の発見
医療データ
マルチオミックスデータ
開発するデータ主導型解析技術
① 現状態割り当て技術
② 未来予測アルゴリズム
③ 介入標的探索技術
6
健康・医療多層統合プラットフォーム
3. 健康・医療多層統合プラットフォームからの社会実装
健康・医療多層統合プラットフォームの研究フロー(データのVolumeよりもVarietyを重視)
経験のある医師によっ
て多様な患者候補をサ
ンプリング
マルチ
オミックス
解析を実施
機械学習によって
① 現状態割り振りに必要な最
小マーカを特定
② 未来予測アルゴリズム開発
③ 治療と予防の標的発見
本プロジェクトの波及効果
1. 生命科学・医科学の基礎研究者 情報幾何学/関数フリーの手法による生命科学の枠組みの提供
2. 精密医療を実現するためのエコシステムの構築
精密医療エコシステムの概要
大型の検査装置と同等の感度と精度を持ち、か
つ微量計測が可能な装置を開発する。
➡ クリニックでリアルタイムで計測と推論が可能
とする(エッジコンピューティング)
➡ 現場のデータによってアルゴリズムを改良す
る(マネージメントサーバー)
7
健康・医療多層統合プラットフォーム
4. 健康・医療多層統合プラットフォームにおけるイノベーション戦略
プロジェクトの運営体制:大学と企業の機密保持を担保した垂直統合オープンイノベーション
A疾患
マネジメント・オフィス
臨床研究
大学医学部
医療、医療情報、IT、
ビジネス等に精通した専
門スタッフを配置
診断技術
診断会社
解析技術
運営アドバイザー
理化学研究所
B疾患
C疾患
D疾患
E疾患
参加企業
シスメックス(株)
SBX
参加検討企業
製薬数社
化学品会社数社
エレクトロ二クス数社
ソリューションの開発
病院、製薬企業、ヘルスケア企業
プロジェクトの横展開:免疫を軸にがん(がん免疫)、発達障害、精神疾患(母体免疫活性化)へ展開
免疫疾患
がん
がん免疫
発達障害
母体免疫
活性化
が ん :東大病院、名古屋市大、がん研有明病院、川崎医大、
阪大病院、京大病院等、慈恵会医科大学
免疫疾患:慶応病院、阪大病院、東大病院
発達障害:九大病院、香川大病院、東北大学病院、京大病院、
広島大病院、京都府立医大等
精神疾患:名大病院、広大病院、東大病院、阪大病院 等
精神疾患
8
健康・医療多層統合プラットフォーム
5. 定量化した成果目標(精密医療技術の開発)
疾患分野
従来の慢性疾患に対する「重症化した後の治療」を「予防や早期診断・早
期治療」へ転換する医療を本プロジェクトでは精密医療と称する。
具体的な成果は以下の2つとなる。
① 10疾患に関して多様性を踏まえて発症動態ならびに治療効果を
予測する精密医療技術を確立する。
② 精密医療を実現するためのエコシステムを開発する。
A. 免疫疾患
➀アトピー性皮膚炎
②関節炎
③自己免疫疾患
B. がん
④卵巣がん
⑤消化器系がん
C. 発達障害
⑥自閉症スペクトラム障害
⑦注意欠陥多動性障害
D. 精神疾患
⑧統合失調症
⑨情動障害
⑩認知症
理化学研究所
健康・医療多層統合プラットフォーム
患者のQOLの向上と医療費の削減を実現
9
医薬プロセス最適化統合プラットフォーム
目標
機械学習とシミュレーションの両面を活用した人工知能により、創薬関連データを解析・利活用することで、基礎~臨床までの創薬プロ
セスの高効率化、新規医薬品等の創製に資することで、我が国の経済発展に貢献する。
取組内容
理研等が有する化合物・タンパク質の構造や活性といったケミカルバイオロジーのデータ、また製薬企業や医療機関が有する非臨床のみ
ならず臨床のデータを、活用しやすい形(機械可読化・数値化)で統合したデータプラットフォームを構築。
上記プラットホームに、システムズケミカルバイオロジー、合成反応予測、制御分子デザイン、臨床・基礎のトランスレーショナル予測
を可能にするシステムを実装。
製薬関連企業・IT企業との連携によるオープンイノベーション型のデータプラットホーム、人工知能開発
機械学習とシミュレーションの
ハイブリット創薬プロセス人工知能
製薬企業
各社
予測
「京」・ポスト「京」
学習
IT企業
人工知能オープンイノベーション
産学官コンソーシアムによるデータ統合、モ
デル共有、AI共同研究開発
最適化
機械学習
AIによる医薬、機能性分子の効率的創成
10
医薬プロセス最適化統合プラットフォームの具体的内容
1.創薬プロセスに関連する化合物やタンパク質等の関連データを集積
理研
医薬プロセス最適化統合プラットフォーム
【蓄積するデータ】
①化合物の構造
②化合物の非臨床段階での活性データ等
(化合物と各種タンパク質等との結合、細胞・動物に投与した際の効果等)
③化合物の臨床段階での活性データ等
(臨床段階での化合物の効果、代謝データ、毒性データ等)
④創薬ターゲットとなるタンパク質の構造や機能のデータ
○化合物の構造と非臨床段階での活性データ等
(数万エントリーを各種ライフサイエンス研究で蓄積)
○タンパク質の構造データ-
(数千エントリーをタンパク3000プロジェクト等で蓄積)
○スーパーコンピューターを活用したシミュレーションで
創出されるデータ
製薬業界・連携する医療機関
製薬会社や医療機関が保有する
○化合物の構造と非臨床、臨床段階での活性データ等
【データ統合のポイント】
医薬品開発プロセスに重要な、非臨床から臨床段階にわたる上記データに
ついて、利活用出来るよう、機械可読化(分子の構造等も数式化)した形で
集積
オープンリソース
○化合物の構造と活性データ等(1億エントリー以上)
○タンパク質の構造・機能データ等(10万エントリー以上)
2.人工知能等の手法を活用し、創薬プロセスを予測するモデルを構築
医薬品等の化合物の構造
創薬ターゲットとなる
タンパク質の構造
非臨床・臨床段階での活性
臨床試験における代謝・毒性等
人工知能等
で解析
○化合物の構造からタンパク質との相互作用、非臨床・臨
床段階での活性や毒性を予測するモデルを構築
○これにより、例えば、創薬ターゲットとなるタンパク質の
構造から、最も強い効果を発揮し、かつ毒性が無い化
合物を自動的にデザインするシステムの開発等に発展
【本プラットフォームの意義 】
○製薬業界を含めた基礎から臨床までの創薬関連のデータを蓄積し、共有。
○関係機関と連携し、本データを人工知能等の手法で解析し、治療に最適な化合物を自動的にデザインするシステム等を開発。
11
○これにより、我が国の創薬成功確率の向上と開発費の抑制、製薬業界の国際競争力向上等に貢献。
ハイブリッド型人工知能と産学連携オープンイノベーション
ハイブリッド型人工知能
従来型人工知能
•
•
予測精度や探索空間が学習データの質と量に依存し
ていた。
非線形予測モデルは特徴量の抽出が困難であり、因
果関係の推論もほぼ不可能。
機械学習
•
•
シミュレーションでの学習データ生成による予測精度
向上や未知空間の探索が可能
シミュレーションとの融合による特徴量の具現化や因
果推論を実現
ハイブリッド型人工知能
シミュレーション
仮想実験
データ生成
人工知能オープンイノベーション
製薬関連企業32社、IT企業18社からなるAIコンソーシアム設立
産学コンソーシアムによるデータ共有、モデル共有、AI共同研究開発
ビッグデータ
化合物DB
タンパク
3000DB
ケミカルバ
イオロジー
臨床DB
オミクス
DB
COI
コホート
バイオバン
ク
臨床(個体)と基礎(分子)のトランスレーション予測
分子から臨床に至る多種多様なDBや文献情報のAI化による臨床と基礎の橋渡しを実現
12
医薬・機能性分子の戦略的創製を実現する3つの人工知能
システムズケミカルバイオロジー
人工制御分子デザイン
メドケムAI
低分子-タンパク質間相互作用予測
低分子・中分子・高分子デザイン
中分子-タンパク質間相互作用予測
バイオロジクス、バイオシミラー、バイオベター
タンパク質-タンパク質間相互作用予測
天然物・中分子・高分子-低分子変換
生体反応予測
ADMET・物性予測
合成反応予測
作用メカニズム予測
ADMET・物性予測の総合的予測
新規骨格分子の自動反応設計
体内動態予測による薬物治療の最適化
新規合成反応経路の探索
分子-細胞-動物-ヒトの橋渡し
開発プロセス意思決定支援、医療薬剤経済推定
ターゲットタンパク探索
バイオマーカー探索
ドラッグリポジショニング
疾患サンプル選択
オミクス実験デザイン
ネットワーク解析法
ゲノム医療・薬理ゲノミクス予測
医薬・機能性分子開発プロセスAI
治験デザイン
被験者スクリーニング法
実臨床データからの治験推定
前臨床データからの治験推定
薬物治療最適化
患者状態の推定
薬効予測
副作用予測
体内動態予測
臨床(個体)と基礎(分子)の橋渡し予測
薬物治療AI
13
製薬業界と薬剤経済が抱える課題とAIによる解決
課題1. テーマの複雑化による創薬ターゲットの枯渇
•
•
創薬プロセス人工知能において、システムズケミカル
バイオロジー、人工制御分子デザインの技術開発
を行うことにより、創薬手法の新規コンセプトを創出
する。
さらに、臨床(個体)と基礎(分子)の橋渡し
予測を可能にし、臨床データからのアンメットニーズ
の創出を目指す。
課題2. 開発成功確率の低下と開発費の高騰
•
•
創薬プロセス人工知能で開発するシステムズケミカ
ルバイオロジー、合成反応予測、ADMET・物性予
測によって実験回数を減らし、開発費の高騰を防
ぐ。
さらに、臨床(個体)と基礎(分子)の橋渡し
予測を可能にし、早期臨床開発の精度向上を図
ることにより、開発成功確率の向上と開発費の抑
制を目指す。
課題3. バイオ医薬等の貿易赤字と医療費の上昇
•
•
創薬プロセス人工知能において、バイオロジクス、バ
イオシミラー、バイオベターなどの人工制御分子デザ
インの技術開発を行うことにより、バイオ医薬の貿易
赤字を解消する。さらに、バイオ医薬の低分子化を
図り、医療費の抑制を目指す。
さらに、患者状態の推定、薬効・副作用予測、体
内動態予測により薬物治療の最適化を行うことで
医療費の抑制を目指す。
従前の創薬関連プロジェクト(タンパク3000、スパコン「京」、IT創薬等)の限界
従来プロジェクトは、タンパク質と低分子などの分子レベルの構造や活性に着目した研究しかなされておらず、
ヒトの個体レベルの作用を反映した予測研究は皆無であった。本研究では、臨床情報から分子情報にいたる
までの多種多様なビッグデータを人工知能化することで、臨床(個体)と基礎(分子)の橋渡し予測を実
現し、ヒトの個体レベルの作用を反映した分子デザインが可能となる。
14
細胞システム多層統合プラットフォーム
目標
分子から個体レベルまでの多階層のイメージングデータ、表現型データ、オミックスデータを統合し、生体内の細胞や生きている個体の
状態の精緻な予測や操作を可能にする。ビッグデータの活用による最適化された研究ナビゲーションを実現し、生命科学の研究スタイル
を革新するとともに、がん等の疾患の診断・治療に貢献する。
取組内容
同じ臓器の細胞でも時間とともに個々に多様に変化する。しかしこれまで細胞の解析は細胞集団を用いたものが中心。一方で、近年の研究
の進展等により、一細胞レベルでの計測技術・各種データ(イメージング、表現型、オミックス)が蓄積してきている。
そこで、細胞の特徴量を指標に人工知能・機械学習の手法によって層別化する技術を開発することで、身体内の細胞や試験管内の細胞の状
態を定量的に表現し予測するシステムを構築。これにより、細胞レベルでの秩序形成の原理を明らかにする。
さらに、分子~細胞~個体を統合する研究を進めることで、生命科学研究の革新を起こすとともに、例えばがんの診断・予防や、移植細
胞・組織の高品質化など、革新的な医療応用に貢献する。
QBiC
大浪修一
JSTライフサイエンスデータベース統合
推進事業「生命動態情報と細胞・発生画
像情報の統合データベース」研究代表
者(平成24年〜)
JST CRESTビッグデータ応用「データ駆
動型解析による多細胞生物の発生メカ
ニズムの解明」研究代表者
JST
ライフサイエンス
データベース
統合推進事業
東京大
大阪大
京都大
神戸大
我が国の生命科学におけ
るオープンサイエンス、デー
タ主導型サイエンスを先導
人材育成プラットフォーム
バイオインフォマティクスPF
イメージングデータ
分子〜細胞〜個体
統合
AI、機械学習
細胞・個体の状態の
予測・操作を可能に
表現型データ
分子〜細胞〜個体
オミックスデータ
細胞〜個体
PDBj, KEGG etc…
健康医療多層型統合
PF
企業
(医薬品、農業、バイオ等)
先駆的ITインフラ
生命科学の革新
ITにより最適化された研
究ナビゲーション
細胞イメージングと一細胞オミックスの相
関を利用した細胞分化の解明
ライブイメージングを利用したオミックスの時
空間計測を実現。例えば、ヒトの認知能力
では難しい初期がんの早期発見に貢献。
細胞の品質評価法の開発と操作技術の
開発
ライブイメージング画像の僅かな違いを機械
学習により判別し、細胞の品質評価法の
開発に貢献。例えば、体外受精卵、移植
用人工組織・臓器等に応用。
イメージング、表現型、オミックス情報を統
合した個体・器官発生のモデル化
ビッグデータの機械学習によりオミックス動態
と細胞動態の相互作用を解明。次世代型
の発生の統合的理解を実現。
医薬プロセス最適化統合
PF
15
細胞システム多層統合プラットフォームの具体的内容
1.分子~細胞~個体に至るイメージング、オミックス、表現型の生命情報データを集積
理研
細胞システム多層統合プラットフォーム
理研は、イメージング・オミックスに関する国内外の
データベースネットワークの拠点を担っている。
【蓄積するデータ】
○細胞等の動態イメージングデータ(約6700万エントリー)
○画像イメージングデータ(200万エントリー)
○マウス表現型データ(50万エントリー)
○オミックスデータ(10万エントリー)
① 分子~細胞~個体に至るイメージングデータ
② 1細胞〜個体に至るオミックスデータ(細胞の状態)
③ 分子〜個体に至る表現型データ
オープンリソース等
【データ統合のポイント】
超解像ライブイメージングと1細胞オミクスの同時計測システム
などの最先端計測技術を用いてデータ統合に適した条件で取得
したデータを活用し、多階層データを統合し、機械可読化の状態
で公開する。
○細胞等の動態イメージングデータ(600万エントリー以上)
○画像イメージングデータ(200万エントリー以上)
○マウス表現型データ(4300万エントリー以上)
○ヒト疾患オミックスデータ(東大) 等
連携
2.人工知能・機械学習の手法を用い、身体内や試験管内の細胞の状態を定量的に表現し予測するシステムを構築
1細胞〜個体に
至るオミックス
データ
分子~細胞~個体
に至るイメージング
データ
統合に適した条件
で取得したデータ
○細胞等の画像データから細胞の状態や遺伝子発現状
態を推測するシステムを構築
分子〜個体に
至る表現型
データ
人工知能等
で解析
○これにより、生命科学研究の次世代の基盤技術となる
だけでなく、例えば、体外受精卵や移植用人工組織・臓
器の品質評価、初期がんの早期発見などの革新的な
医療法が実現できる。
【本プラットフォームの意義 】
○内外の分子~細胞~個体に至る各種データを機械可読化の状態で集積し、使いやすい形で公開。
○本データを人工知能等の手法で解析し、データ統合により細胞等の画像データから細胞の状態を精緻に認識するシステムを開発。
16
○これにより、生命科学研究の進展や、移植組織・細胞の品質向上、初期がんの早期発見等につながる。
細胞や個体の状態の精緻な予測と操作を実現する3つのシステム
1. 細胞の画像から細胞のオミッ
クス状態を推定するシステム
• 超解像ライブイメージングデータから、細
胞のオミックス状態(トランスクリプトー
ム、エピゲノム)を推定するシステム。
• 細胞のオミクス状態の時空間計測を実現。
一細胞トランス
クリプトーム
細胞核の超解像
イメージング
2. 細胞の画像から細胞の品質を
評価するシステム
• 無染色・非侵襲イメージングデータから、
細胞の状態、品質を推定するシステム。
• 人体に移植する細胞や組織の客観的かつ高
感度、高スループットな品質評価を実現。
相関
ATLの血液画像からATLの病状、病型をエ
ピゲノム異常に基づいて診断するシステム
感染
キャリア
多階層の
オミックスデータ
統合
機械学習
因果推論
機械学習
成人T細胞白血病診断システム
• ライブイメージングデータとオミクスデー
タ、表現型データを統合し、生命動態の数
理モデルを構築するシステム。
• 組織発生や細胞活動への操作の効果の定量
的な予測を実現。
4D全細胞ライブ
イメージング
無染色・非侵襲
イメージング
培養結果
移植結果
相関
機械学習
3. イメージング、オミックス、
表現型情報から生命システム
の機構を推定するシステム
体外受精卵の品質評価システム
体外受精の
成功率の改善
オルガノイドの発生の統合モデル
発症
エピゲ
ノム異
常
感染細胞
クローナ
ル増殖
→細胞システムの理解に基づいた医療、創薬
17
ライフサイエンスデータの統合の実現に向けて
細胞システム多層統合
プラットフォーム
JSTライフサイエンスデータベース
統合化推進プログラム
分子から細胞、個体に至るイメージングデータ、
表現型データ、オミックスデータを、データ統
合による生体の精緻な予測や制御に適した条件
で大規模に蓄積し、機械可読化して使いやすい
形で公開。
国内外に散在しているデータやデータベースを
統合し、誰もが自由に活用できるようにするこ
とを目的とする。これまでに、生物種やプロ
ジェクト毎に整備されたデータの横断検索を実
現。
細胞システム多層統合PFのデータを核に、ライフサイエンスデータの統合が進展
蛋白質
植物
コホート
脳科学
フェノーム 統合に適したデータを
用いた統合
微生物
バイオイメージ
メタボローム
糖鎖
ゲノム
多階層オミックス
医薬品
国内外に散在する
データの統合
18
データ主導科学とAIがもたらす未来のライフサイエンス研究
•
AIのナビゲーションによる最適化された研究
– 既存の全ての知識、研究データをAIに格納
•
文献情報、大規模実験データ、小規模個別研究のデータ
•
研究目的に応じて最適な「次の一手」を提示
•
新たに取得したデータ、新たに公開された知識、データ
•
実験ロボット
– 最適化された研究戦略をAIが提示
– 新たに取得したデータに基づいた、次の最適化された研究戦略をAIが提示
– AIが制御する自律的な自動研究
これまでのライフサイエンス
未来のライフサイエンス
利用する知識とデータ
研究者が選択した限られた知識とデータ
研究者がアクセス可能な全ての知識とデータ
研究戦略の決定
人間の認知能力の範囲内で最良であると判
断した戦略
全ての情報とデータに基づいて導出した理論
的に最適な戦略戦略
実験
研究室毎、実験毎にバラバラな条件
標準化された実験、ロボット実験
実験計画の提案
オープンデータ
文献情報
DB統合
データベース
公開データ
データフォーマット
AI
自動化
実験
最適な実験
データ
ロボット実験
知識
19
Fly UP