はじめに
最近、とくにこの数年、ICT技術が急激に進歩し、社会構造全体に大きな変化をもたらしているように感じられます。その変化が、健康や医療のサービスにも及んでいることを、多くの人達が実感しはじめているのではないかと推測します。AIという言葉が巷に溢れ、なんでもかんでもAIという言葉を使い始めています。しかしながら真のAIを理解し、応用と計画を正確に設計しているものは現実にはまだ少ないと思います。また日本と海外の差異も大きいように感じられます。医療は医師が病気と判断した後に存在するエリアで、投薬も医療行為の一部であるとすれば、“薬”という概念が最近の科学の進歩によって大きく変化してしまう可能性が出てきました。また、再生医療や細胞治療のどこまでが医薬の範囲にあるのか、定義が難しい新しい世界が始まったようにも思われます。その新しい世界では、コンピュータサイエンスという、データで科学する新しい世界で活躍する人材の育成が重要かと考えます。日本において、このようなデータサイエンティストをどのように育成し、彼らが社会変革や様々なビジネスに関わり、世界に羽ばたくような環境をどう整備したらよいか、今回は長年にわたり計算科学、あるいは情報学の視点から、医療、生命科学、創薬、環境化学物質の世界に関わられてこられた神沼先生にお話しを伺いました。
人工知能、パターン認識の黎明期


私はちょうど前回の東京オリンピックの年(1964年)に大学を卒業し、その夏に米国の大学院に入り、1971年夏に帰国して日本企業の研究所に入りました。米国では、理論物理学から、パターン認識に転じられたハワイ大学の渡辺慧(さとし)教授の下で、その手伝をして給与をもらっていました1)。理論物理学の計算で学位をとりましたが、それよりパターン認識の仕事が多かったです。この時期、1960年代の後半の同じ研究室の仲間だったのがクリコフスキー(C. A. Kulikowski)です。彼は甲状腺疾患へのパターン認識の応用で学位をとって、ラトガース大学の人工知能の研究科に行きました。私は、機械学習の技法と応用研究や、レーザー光を用いた画像変換装置の開発など、いろいろやっていました。
日本に帰国した1971年夏から、設立されたばかりの日立の情報システム系の研究所に入りました。そこでたまたま心臓病の(精密な)鑑別診断を計算機にやらせようという、専門医(町井潔医師、当時三井記念病院、後に東邦医大教授)とその研究所の若手研究者との共同研究を応援することになりました。そこで医師という人間の専門家の経験的な知識を計算機に移行して、診断をより精密にする過程を自動化する、今日でいうエキスパート・システムの開発をしました。これは1970年代の前半のことです。また、虎ノ門病院で蓄積されていた痛風患者の診療データを使って、薬の投与を最適にするためにベルマン(R. Bellman)の動的計画法を使うやり方も考えました。ちなみに「エキスパート・システム」という言葉は、クリコフスキーの造語です。彼は、ラトガース大学に移ってから緑内障の診断のために専門医の経験知識を計算機の判断に使うシステムを開発しています。それは後に日本のいわゆる第五世代コンピュータの宣伝にも使われています。
私はその後、1976年から、当時創設された東京都臨床医学総合研究所に移りました。そこで初めて「医学において遭遇するあらゆるデータを計算機で扱えるようにする」ことをめざして文書、数値、波形、画像、3D画像、地図などのデータを扱える、今日で言えばプラットフォーム的な環境をつくろうとしました2)。ここで1970年の後半には、統計パケージづくりを基礎にした医療情報学Medical Informaticsのグループをつくりましたが、臨床診断の研究は、やっていません。ただクリコフスキーやスタンフォードで抗生物質の使い方を支援する対話型システムであるマイシンMYCINを開発したショートリフ(E. H. Shortliffe)や、MITの人工知能研究所で臨床応用研究をしていたソロビッツ(P. Szolovits)など、当時30そこそこの若い研究者たちと知り合いになり、彼らを主役とする講演会を開催したり、MYCINの本を訳したりしました3)。彼らは米国で医学人工知能のグループを立ち上げていました。これは今日のAMIAにつながる動きです4)。その動きに敏感に反応されたのが当時東大病院の情報処理部におられた開原成允先生(当時助教授?)です。開原先生が主導し、私も多少の応援をした米国の医学人工知能の若手たちによる講演会の開催を機として、日本医療情報学会が設立されました(正式には1983年)。ただ、私たちの研究グループは、その後、臨床診断研究にはあまり関わっておりません。
勢いがあり夢が語られた80年代の日本


私は1980年代には、生命情報工学(Bioinformatics)の研究室を主宰しながら、臨床疫学(Clinical Epidemiology)のグループ設立に協力していました。1981年には、NIHとEPAのChemical Information Systemの中核部分を我々のところに移植する仕事をベースとして、現在のCBI(Chem-Bio Informatics)学会の前身にあたる研究会を立ち上げました。また、1983年からは計算機室の中にクリーンベンチや光学顕微鏡などの実験機器を持ち込んで、線虫(C.elegans)を用いた胚発生の観察や化合物スクリーニングの実験を始めました。その縁で、80年代の通産省(現、経産省)の第五世代コンピュータ計画、分子・バイオ素子(さらにバイオコンピュータ)、ニューラル(ニューロ)ネットなどのプロジェクトやブームに立ち会い、その一部の応援もしました。第五世代コンピュータがエキスパート・システムの実装環境づくりをめざしたことは、よく知られています。ただ、私は「専門医の知識をそのまま計算機に入れても信頼のおける結果を出せない。そうした知識システムは現場において、実データで学習しながら改良するスタートにすべきだ」、という「半経験的方法論」を提唱していました。
現在のCBI学会は、薬づくりへの関心が高いのですが、最初は化合物のデータベースや計算化学の統合的なシステム構築をめざしていました。1980年代末、現在の国立医薬品食品衛生研究所に移りましたが、ここではちょうど開放されたインターネットの環境づくりと、WHO, UNEPなど国連の機関が連携した「化学物質の安全な管理のための地球規模ネットワーク(Global Information Network on Chemicals, GINC )」プロジェクトや、現在関心が高まっている海を漂う微細プラスチックゴミの対策研究の立ち上げなどに関わっていました。 定年になった2001年からは、研究活動から離れておりますが、今振り返ってみると、私が研究的な活動をしていた時代は、日本が科学技術も企業の活動(経済)も、まさに陽が昇っているような時代で、研究所の会合でも「アメリカに学ぶものはない」などと言っていた研究者がいたくらいでした。


データサイエンスの理解



図1 計算機を基盤とした思考の技法。データから知識を生成する科学的な研究(D2Kサイエンス)における思考は、 普遍的な理論や技法と、分野に依存した個別的な知識や理論と技法との組み合わせに依存している。データは、既存 のデータベースの検索や実験室における計測や調査、医療サービスの(診療)記録から生成される。計算機には発想 ができないが、データの視覚化により、専門家の発想を助けることができる。


医薬、健康科学の発展とゲノム解読の進歩




バイオ医薬開発と戦略的なデータサイエンス


成功の報道などを読むと希望があると思います。ただ、日本はひどく遅れているような印象を受けています。日本(人)には、優れた免疫学研究の伝統があるようですが、薬づくりにつなげるところが問題なのではないでしょうか。 これも極めて個人的な印象ですが、1970年代から計算機応用の立場から(B型肝炎や補体のような)免疫学に多少とも付き合った経験では、免疫学は(工学的な)システム論では、とても扱い難いという印象をもっています。それは対象が、つまり細胞や分子(補体)が、どんどんその実態を変化させてしまうからです。この問題は、再生医療にも関係していると思います。つまり「細胞の運命と制御」の問題で、計算機を活用するには、一工夫いるのではないか、という印象をもっています。しかし、それだけに、情報計算技法の視点からも挑戦する甲斐がある魅力的な領域だと思います。ただし、そこに挑戦するためには、生物医学の専門家と情報計算技法を専門に学んだ若手世代とのチームが必要と考えています。そのようなチームの例としては、ネットだけの情報ですが、たとえば欧州(独仏)が立ち上げたLifeTime Initiativeがあります12)。 いずれにせよ、がんも免疫学も、また研究も臨床も加速度的に進歩しているようですが、それらのデータを十分咀嚼できる体制がつくられていないように思われます。がんとか、自己免疫疾患とか、目標を絞って臨床データを揃えるところから取り組む必要があるのではないでしょうか。
戦略性のある公的資金の投入


バイオバンクやコホート研究に直接関係することですが、この「創薬のひろば」の第10号ではベースライン研究がとりあげられています。今、必要なのは、病気の状態に対する正常な状態の数値的な把握ではないでしょうか。また実際の診療記録、いわゆる実世界データ(Real World Data, RWD)から、特定の疾患に関する知識を生成できるような診療記録管理技法とデータベースの重要性をもっと認識すべきではないでしょうか。例えば米国のFlatiron社が大手製薬企業によって巨額の資金で買収をされて話題になりました。同社の診療(支援)データの記録技法が評価されたのだと思います。つまりそれを解析すれば、がん診療に関する有用な知見が得られると期待されたからでしょう。関節リウマチなどの自己免疫性疾患に関する診療記録法とデータベース構築についても同じようなことが言えるように思われます。「発見的なデータベース」というわけです。バイオバンクも同様ではないでしょうか。こうしたシステムを日本で開発するのはとても難しいと思いますが、それがなぜなのかを分析してみると、新しい挑戦課題が見えてくるでしょう。


データサイエンス専門家育成の難しさ




図2 学問領域の関係図。人工知能は思考過程を計算(Algorithm,アルゴリズム)に対応させる研究である。その基礎になるのは様々な学問領域に共通する数学あるいは計算の技法である。図中の理論や計算技法には共通の概念がある。こうした関係を見れば、パターン認識、人工知能、機械学習、さらにD2Kサイエンスなどは、既存の数学、自然科学、(計算機のハードウェアを含む)機械技術や工学とも深く関係しているが、それらとは独立の学問領域に発展すると思われる。


参考文献
- Satoshi Watanabe, Knowing & Guessing, John Wiley & Sons, 1969(村上洋一郎、丹治信春訳『知識と推測 : 科学的認識論』全4巻 東京図書 1975年);渡辺慧、認識とパタン、岩波新書、1978。
- 神沼二真、医療革新とコンピュータ、岩波新書、1985.
- 神沼二真、倉科周介訳、診療コンピュータシステム(E. H. Shortliffe, Computer-Based Medical Consultations: MYCIN, Elsevier, 1976) 文光堂、1981.
- AMIA : American Medical Informatics Association
- C. A Kulikowski, E. H Shortliffe et al. AMIA Board white paper: definition of biomedical informatics and specification of core competencies for graduate education in the discipline, J Am Med Inform Assoc (2012). doi:10.1136/amiajnl-2012-001053
- R. Feynman, Feynman Lectures on Computer, Addison-Wesley, 1996.
- 神沼 二眞 訳/多田 幸雄、堀内 正 監修、「薬づくりの真実~臨床から投資まで」(増刷版、日経 BP社、2014年):原著、Bartfai T and Lees GV (2006) Drug Discovery: from Bedside to Wall Street. Elsevier/Academic Press: Amsterdam。
- 臼井珠美、米国医療の状況、医学教育へのLifestyle Intervention教育導入、バイオフィードバック研究, 45, 1: 19-23, 2018。
- A. Zhavoronkov and P. Mamoshina, Deep Aging Clocks: The Emergence of AI-Based Biomarkers of Aging and Longevity, Trends in Pharmacological Sciences, 40(8): 546-549, 2019。
- F. S. Collins and H. Varmus, A New Initiative on Precision Medicine, The New England Journal of Medicine, 372(9): 793-795, 2015。
- CAR-T療法:患者自身の免疫に関わるT細胞を取り出し、それを改変して本人に戻す治療法。
- 欧州のLifeTimeプロジェクト(https://lifetime-fetflagship.eu/)。
- 多田幸雄、ロンサール開発物語、CBI学会誌、7:13-39, 2019。
- NIH STRATEGIC PLAN FOR DATA SCIENCE (https://datascience.nih.gov/sites/default/files/NIH_Strategic_Plan_for_Data_Science_Final_508.pdf); C. Mura, E. J. Draizen, and P. E. Bourne, Structural biology meets data science: Does anything change? Current Opinion in Structural Biology, October 2018。
- D. A. B. Lindberg, MD, the National Library of Medicine、198416) NCATSのDrug Discovery, Development and Deployment Mapsは、次のサイトにある:(https://ncats.nih.gov/translation/maps)。

神沼 二眞 氏
1940年神奈川県に生まれる。国際基督教大学、イェール大学、ハワイ大学に学ぶ。物理学でPh.D.(博士号)。1971年から、日立情報システム研、東京都臨床研、国立医薬品食品衛生研究所に勤務。パターン認識、医学人工知能、医療情報システム、生命情報工学、化学物質の安全性などの研究に従事。1981年には理論的な薬のデザインなどをめざす産官学の研究交流組織(現在のCBI学会)を設立。その後、広島大学および東京医科歯科大学で学際領域の人材養成に当たる。2011年にNPO法人サイバー絆研究所を設立。

岩瀬 壽 氏
一般社団法人日本分析機器工業会(JAIMA)ライフサイエンスイノベーション担当アドバイザー、
バイオディスカバリー株式会社 代表取締役社長&CEO。
1951年東京都生まれ。日本大学理工学部工業化学科卒。メルクジャパン、日本ウォータズ、日本ミリポア、日本パーセプティブ、アプライドバイオシステムズ、バリアンテクノロジーズ、アジレントテクノロジーなどで分析機器・バイオサイエンス機器の経営・マーケティングを経験。2001年バイオディスカバリー(株)設立。2013年より日本分析機器工業会(JAIMA)ライフサイエンスイノベーション担当アドバイザー兼任。