この連載では、2010年頃からの薬づくりの研究開発環境の激変を俯瞰してきた。前号では、「製薬企業においては、薬という『もの』を売るだけでなく、健康の『ソリューション』を提供するビジネスを模索する動きが顕著になってきた」、と述べた1)。
製薬会社は、そうした環境に適応するための自己改革の努力をすでに始めている。一方で、多くのICT企業が、次世代ヘルスケアに進出しようとしている。両者のコラボレーションの事例も増えてきている。そこでは人工知能(あるいはAI,Artificial Intelligence)や機械学習(Machine Learning, ML)への期待が高い。そうした環境にインターネットのさらなる大波がかぶさってきている。
この小論では、インターネットと人工知能の新しい波が薬づくりと次世代ヘルスケアに及ぼす衝撃と、それにどう対処したらよいかについて考察してみたい。
ICTに関連した新しい波
最初に、表題のネット第2革命と人工知能について、簡単に説明しておく。ネットとは、もちろんインターネットのことである。インターネットは1960年代の末、米国の国防上の理由で構築されたパケット通信を基礎にした分散型の広域ネットである。最初は政府関係の研究機関や大学を含む閉じられた世界であった。
その環境がビル・クリントン大統領の時(1994年頃)に一般に開放されたことで爆発的に普及し2)、短期間のうちに百花繚乱のように若く活力がある新しい企業やサービスが立ち上がった。これが第1の革命である3)。
その後、携帯電話がスマートフォン、つまりは「通信機能付きの掌(たなごころ)コンピュータ」に進化した。このことと大容量回線の普及によって、一般消費者向けのネットサービスが急拡大し、利用者も急増した。また、立ち上げが簡単なタブレットPCが普及するとともに、ネット経由で活用できる低価格のクラウドサービスも広がった。さらに文字だけでなく音や音声あるいは動画を含めた画像センサーなど、人間の感覚器官を凌駕するような機器の進歩と価格低下が進行した。それがネットを活用したさらに新しいビジネスを生み、利用人口をも爆発的に増大させている。それが現在進行しているネットの第2革命である。
しかし変化はさらに加速度的になり、さらなる大波が第2革命にかぶさってきている。その象徴のひとつが、情報の世界ともの(づくり)の世界との結合IoT(Internet of Things)の発想だ。もうひとつの象徴は人工知能である。以上3つの大波が渦になった変化が、ネットの第3革命だ。それは、これから10年から15年後ぐらいに本格化するように感じられる。それによってものづくりや社会のサービスも大きく変貌すると予測される。その変化を象徴するキラーアプリケーションが、自動運転車である。その象徴であるテスラ・モーターズの時価総額は、この4月にGMを上回ったという。だが、同社の年間の販売台数は、まだたった10万だ。もうひとつ変革が期待されているのが、がん治療薬開発や認知症予防などに象徴されるヘルスケアだ。
人工知能とパターン認識
それでは、ネットの新しい大波に相乗した技術潮流である「人工知能、AI」とは何かを探ってみたい。今や人工知能は、薬づくり、健康や医療あるは介護サービス革命、さらには仕事革命や産業革命4)など、野心的、魅惑的、未来指向的な話題としてマスメディアを賑している。
簡単に言えば、現在の人工知能の衝撃の本質は、あらゆる分野で進むディジタル化とそこから生成されるデータを活用する計算技法(アルゴリズム)の進歩と、それを実行する計算機環境の進歩だ5)。したがって、その健康医療や薬づくりへのインパクトも非常に幅が広く、これからの発展が大いに期待されている。だが部外者にはその実態がわかり難い。その原因の一つは、計算機による単なる自動化を、時流に乗って「AIを使っている」と宣伝している企業の姿勢であり、また、それをそのまま流しているメディアにある。そこでヘルスケア領域の「人工知能」の歴史を簡単に紹介しておきたい。

図1 計算機によるデータ扱いの出発点:対象の観測値を多次元(線型)空間の点(ベクトル)に対応させる。ここでは2群のデータを2色の点に対応させている。ここでは例として3次元としている。データサイエンスの出発点となる表現。
今日人工知能と呼ばれている研究は、科学の研究者一般が使える実用的な計算機がつくられるようになった1950年代から始まった。それからすぐ、機械(計算機)に何ができて、人間と較べると何ができないか、という哲学的な論争が始まった。
1960年代になると医学診断への応用や文字認識、衛星写真解析など、パターン認識(Pattern Recognition)の研究が始まった。ここでは認識の対象を観測して得たデータを集めて、判断のための論理を作成する(図1)。
当然、統計学、確率論を基礎にした多変量解析の様々な技法が試された。例えば、主成分分析、パーセプトロン、線形判別法、今日ではSupport Vector Machine(SVM)と呼ばれているDZM(Dead Zone Maximization)技法、より一般的なクラスタリング技法など、幅広い研究がなされているが、それらは今日でも使われている。当時ハワイ大学の渡辺慧教授の研究室にいた私もそうした研究の世界にいた。
1970年の初めには、米国の計算機と医学分野の若手研究者たちが、人間の経験的な知識を機械的に実行できるように論理的な形式に整理して推論を実行する計算機システムの研究を始めた6)。それは人工知能の一部で、エキスパートシステム(Expert System)とも呼ばれた(命名したのは渡辺研究室からRutgers大学に移ったC. A. Kulikowski)。1971年に帰国して日立の研究所にいた私のグループも、心臓病の専門医の経験知識をルールベースで表現する鑑別診断システムを開発していた。このシステムは、知識をデータのように取り扱い、そのまま判定に使うという知識システムの走りでもあった(図2)。

図2 診断の論理の同等な表現法.データが十分ない場合、人間の経験的な判断を論理的に表現する。3つの方法は同等。エキスパートシステムの基本モデル。
医学診療システム開発の難点は、データが不足していることである。そこで私が考えたのは、臨床医の経験知識を活用して、まず診断論理の枠組みをつくり、それを載せた実験システムを臨床の場に設置して、実際のデータを収集しながら判断規則を改良していくという研究戦略だった6)。この考えは、病理の専門医の経験的な判断規則を計算機に載せて細胞や組織を診断するようなシステムに使える。
米国の若手たちの仕事は、通産省(現在の経産省)のいわゆる第五世代コンピュータ計画でも注目され、一般にも広く知られるようになった。かくしてエキスパートシステムは当時の人工知能の花形になり、その応用分野としては医学診断への期待が高まった。それは1980年代の前半のことである。だが同じ1980年代でも、後半になると生物の神経回路網を参考にしたニューロコンピュータ(Neurocomputer)あるいはニューラルネットワーク(Neural Network)の人気が高くなった。その応用例としては印刷英文を声読するデックトーク(DECtalk)や画像認識が注目された。
かくして人工知能は、1980年代には話題と投資資金を大いに集めていたが、その後は研究計画で掲げられていた魅惑的な目標が達成できないプロジェクトが多いと評価され、研究者にとっては冬の時代となった。ところが、この数年、ICTの世界を越えた一般のメディアでも空前というほどの注目を集めるようになった7)。人工知能の3次ブームが到来したともいえる。その契機になったのは知的な応答をするIBMのWatsonと、パターン認識の技法としての深層学習(Deep Learning)の出現だ。
IBMのWatson
IBMがディープブルー(ブルーはIBM社のカラー)と呼んで実験的に開発していた高性能コンピュータは、1997年5月、チェスの当時の世界チャンピオンを破った。同社は、さらに巨費を投じ
てWatsonと名づけたコンピュータを開発し、2011年にはテレビのクイズ番組Jeopardy!(ジョパディ!)で人間のチャンピオンを破った。このシステムは、人間との対話が行える自然言語処理
や、ある領域に関する文書や辞書的知識やデータの格納、それらを使った質問に対する答え候補の生成、複数の答えの確からしさの推定、それらを総合した推論など、高次の認知機能を備えている8)。
現在でこそWatsonは、外部の人間でも部分的な機能なら試せるようだが、最初は、肝心なところが発表されていないと研究者から文句を言われていた。だがマスメディアは、将棋や碁やクイズのような、ルールと勝敗(成績)がハッキリしている課題で好成績を挙げられる計算機には、碁や将棋の名人に匹敵する知性があり、そのような知性は軍事の達人(名将)や名医のそれに通ずると思わせるような報道をしがちである。IBMは、そうしたメディアの特性を見抜いてか、あたかもWatsonという知的な汎用応答システムが開発されたという印象を世間に与えるような発表をしていた。しかし現在のIBMは、ある目的の人工知能システムを売り込むのではなく、顧客が欲しいと思う人工知能システムを共同で開発することにビジネスの機会を求め、(資金のある)顧客の獲得に成功しているようだ。
深層学習Deep Learning
一方、深層学習は、1980年代に人気を集めた神経回路Neural Netの流れを踏襲した、パターン認識を実行する計算モデルのひとつである(図3)。

図3 深層学習の基本モデル。実際には、中間層は多層もあり、入力線の数もいろいろであり、結合の強さも多様にできる。図1、図2の表現にも対応できる。
このモデルは2006年トロント大学のヒントン(G. Hinton)らによって発表されたが9)、応用実験成績の良さが認められ、画像解析をはじめとする多くの応用課題に活用された10)。大規模な、したがって高額な計算システムであるIBM Watsonと違って、ヒントンらの深層学習は一般の研究者が自分たちの環境や資金の範囲で容易に試してみられる計算を実行するモデル(アルゴリズム)だ。だから深層学習は多くの研究グループによって試され、それにヒントを得た新しいモデルが続々と発表されるようになった。
なかでも話題になったのは2012年の学会でGoogleの研究者たちが発表した、「画像の教師なし学習(Un-supervisedLearning)を目的とした深層学習モデル」である11)。彼らは「多くの写真を計算機に読み込ませて、そこから猫のイメージを発見(認知)させることに成功した」と言っている。その後、同社のAlphaGo(アルファ碁)と呼ぶ計算システムが人間の碁の世界的名人を破った。我が国でも、将棋で名人を脅かすシステムが開発されている。いまや、広い意味での深層学習モデルは、人工知能の代名詞になった感がある。
薬づくりにおける人工知能あるいは機械学習のインパクト
現在、規模は違うがWatsonや深層学習などの新しい人工知能は、製薬会社や病院や医学研究所、生命保険会社などの関心を惹いている。そこにICT企業も参入しようとしている。
実際、深層学習モデルは薬づくりにも威力を発揮したとメディアでも話題になった。このことは、ヒントンらの深層学習についてのまとまった報告でも言及されている10)。それはメルクがスポンサーになった2012年のQSARのコンテスト(Kaggle competition)に応募したMaらのグループの仕事のことで、後に詳しい報告がなされている12)。
医薬品の研究開発においては、化学と生物医学に関わる計算機の応用に関する膨大な技法やデータベースや知識ベースがすでに整備されている13-15)。1970年代から人気があったのは、化学の基本である各種の分子計算や分子を3次元で捉える分子グラフィックス、化合物の構造とその(単純化された指標による)生体作用との関係を予測するパターン認識の技法である構造活性相関(Quantitative Structure Activity Relation、QSAR)、化学者の経験則を生かしたエキスパートシステムである合成経路探索システムなどである。これらは主にChem(o)informaticsと呼ばれる領域である。この領域では、すでに機械学習が応用されてきたが16)、最近ではそこに深層学習を使う例が増えている17)。
1980年代からは、分子生物学の進歩が医学を革新し、遺伝子やゲノム、経路網の知識が蓄積されるようになった。それによって薬づくりも、疾患の分子的機序を解明し、薬物が作用する(主に生体内のタンパク質である)標的を同定することが、出発点になってきた。その前提となるディジタル化された生物医学においては、バイオインフォマティクス(Bioinformatics)が不可欠の技法となった。この流れが加速されたのはヒトゲノム解読計画が成功裡に完了を宣言された今世紀に入ってからのことである。この領域でも深層学習の技法が使われる例が多くなっている18)。
薬の研究開発にICTを活用する究極の目的は、研究開発の生産性の向上であろう。この領域には、例えば実験室へのロボット(自動機械)や計測機器からのデータを扱うLIMS(Laboratory Information Management System)の導入があり、さらに研究者の思考を支援するChem-Bio Informatics技法もすでに40年近く親しまれている。それが今、IoTや新しい人工知能的な計算技法によって、さらに革新されようとしている。
だが、新しい人工知能的な計算技法を揃えれば、それでよい薬が開発できるわけではない。研究者にはそれらの技法を使いこなす深い専門知識(Domain Specific Expertise)と経験と洞察力が求められる。そうしたことはQSAR研究でも、精密な分子計算による結合解析Docking Studyでも、専門家にはよく知られたことだ。この意味でこれからの人工知能も専門家を助ける存在であることに変わりはない(図4)。

図4 科学的な思考は、普遍的な理論と技法と、個別的な理論と技法との組み合わせとなる
一方で、IBMのWatson(Cognitive Computing)型のシステムを活用して、膨大な文献やデータベースを蓄積して、研究者の情報知識の収集と、自ら生成しているデータや情報知識の整理ができれば、薬づくりの研究開発のパイプラインの様々な仕事の効率は飛躍的に向上させられよう。だが、それには仕事の基盤環境を大改革する必要があり、場合によっては研究所あるいは会社の業務全体の見直しが必要になる。その経費も膨大になるが、継続的に発展するシステムでなければ、すぐ古くなってしまうだろう。
次世代ヘルスケアと人工知能
人工知能の新しい波は薬づくりだけでなくヘルスケア全体に広がっている19)。昨年、大塚製薬とIBMが合資会社を設立すると発表した。それによれば、大塚製薬が蓄積してきた中枢神経領域の知見をもとに、IBMがWatson開発で蓄積してきた技術を活用して「MENTAT(メンタット)」と呼ぶソリューションを開発するという。実際の協力の最初の実施機関は桶狭間病院である。
このプロジェクトの肝は、膨大な医療記録の自動的な整理であり、とくに数値化しにくい症状や病歴などの記述を自動的に統合・分析してデータベースとし、それを医療従事者が有効に活用できる環境をつくることだとされている。また第一生命保険は、藤田保健衛生大学の協力をえて、IBMのWatsonを使った糖尿病のような慢性疾患患者のカルテ情報を分析して医療や保険に役立てようとする研究を始めると発表している。
これらはいずれも、ヘルスケアにおけるサービスの提供者側の生産性の向上をめざした試みだ。一方、ヘルスケアのサービスの受け手に焦点を合わせれば、ICT活用の基本的な目標は、よりよいサービスを、より低い負担で受けられることだ。具体的には、「限られた資源の下で、サービスの受け手(患者)にとってよりよい対処法が、より低い経費で提供されるようになること」だ。
そうしたICTの活用には2つの課題がある。ひとつは、目標を数学的なモデルとして定式化し、それを解くことである。もうひとつは、そこで得られた知見を活用するために実際のデータを集め、実践することである。どのようなデータを集めたらよいかは、定式化とも関係している。だから、この2つの課題は互いに不可分の関係にある。ICTは、そのいずれにおいてもカギを握っている。
この定式化に関わる学問は制御理論(Control Theory)になる20)。動的計画法の開発者として著名なベルマン(RichardBellman)は、“医療はすべて制御理論の対象になる(All medicine is control theory!)”という至言を残している。パターン認識や人工知能の課題と制御理論の違いは、後者が「最適あるいは、できるだけそれに近い対策を考える」という意味で、人間の価値観と不可分に結びついていることだ。だからまったく機械的に実行することはできない。このことは医療の本質に関係している。極端なことを言えば、最適な対処(サービス)は個人(の価値観)に依存するから、最適な治療をめざすという思想は個別化医療(Personalized Medicine)につながることになる。
こうした考えが現実的に展開できるのは薬物治療においてである。例えば、患者の薬への応答をゲノム解読でしらべ危険なものを避け、効果の期待できるものだけを使うというPGx(Pharmacogenomics)がその例である。しかし問題は適切な薬の選択だけでなく、適切な投与をすることだ。最近の研究では、個人の薬への応答は、患者の置かれた環境でも、食事でも、腸内細菌でも、体内時計のリズムでも違ってくる。ゆえに、もし製薬会社が本当にソリューションの提供をめざすなら、薬が使われる状況を考慮して薬の適切な使い方に関する背景知識を提供するように努力する必要がある。
だが、薬を適切に使う責任は医師にある。ただし、それは医師の仕事の一部に過ぎない。一般に医師にはもっと複雑な状況判断と意思決定が求められる。米国のメイヨクリニック(Mayo Clinic)は、医師を始めとするサービス提供者がよりよい意思決定ができるように支援するシステム(Decision Support System, DSS)の開発を試みている21)。DSSは80年代のエキスパートシステムの研究課題であった。それが今、規模を大きくして再挑戦されるようになってきたと言える。
もう一つの注目すべき研究領域はがん医療である。ここでも先行しているのは米国である。米国臨床腫瘍学会(ASCO)は、学会としてがんの診療記録を収集し、よりよい診療を模索する試みをCancerLinQというプロジェクトとして取り組んでいる22)。そのための基盤システムの構築に、最初はIBMのWatsonを検討していたが、結局ドイツのソフトウエア会社SAPのHANAをプラットフォームに選んだ。
こうしたプロジェクトで注意すべきことは、基盤となる知識が急激に拡大、変化していくことである。それはがん研究の進歩を考えれば当然であろう。何が適切な診療かも、それによって迅速に進化していく必要がある。それがRapid Learning Health Care Systemの概念だ。こうした思想はすでに次世代ヘルスケアを先導する基本理念になっている(図5)。上で紹介したメイヨクリニックのシステムはこの理念を先取りしている。

図5 ヘルスケアにおけるデータから知識を生成する研究基盤の発展
健康医療における人工知能研究の難しさ
我が国でも、2015年に東大医科学研究所(病院)にIBMのWatsonが実験的に納入され、専門医に役立つ知見を提供したと話題になった。昨年末、国立がんセンターと産総研の人工知能研究センターと株式会社Preferred Networksは、人工知能を活用したがん医療システムを開発すると発表した。同じく京大病院と富士通ががん医療へのAIの活用研究を、がん研究会がん研究所と株式会社FRONTEOとが人工知能を活用した「がんプレシジョン医療」の開発を始めると発表している。
このように我が国でも、がん診療への人工知能の活用という野心的な試みが続々と誕生している。大いに期待したいが、懸念もある。それは臨床データを収集することが難しいこと
と、データの扱いに関わる倫理的、社会的、法律的な制約が厳しくなってきたことである。また基礎になる医学用語の辞書類Thesaurusの整備が日本語では十分ではないと思われることだ。さらにシステムの更新を恒常的に行えるような、迅速学習の仕組みの組み込みが必要なはずだが、継続的な予算の獲得はかなり難しいと思われる。
おそまきながら厚生労働省も、AIの活用を支援するための「保健医療分野におけるAI活用推進懇談会」を、本年1月に設置した。だが、これから遭遇するであろう未知の困難を乗越えるためには相当な基盤的な努力が必要だろう。
おわりに
以上、薬づくりと次世代ヘルスケアへの応用を念頭に置きながら、人工知能の昔と今の話をしてきた。新しい人工知能として紹介したのはWatsonと深層学習であるが、それ以外の多様な動きがあることは想像に難くない。ただ、これまでの事例では、現在の人工知能の新しい波の驚異の実態は、理論やモデルの斬新さではなく、センサーや計算機の進歩にある。また、「相変わらず」と感じられるのは、ICTのとくにD2K(data to knowledge)サイエンスの若手の人材養成と仕事の機会が乏しいことだ。さらに彼らがこれまでの薬づくりや健康医療の専門家たちとイコールパートナーシップの下で力を発揮できるような職場環境づくりが絶対に必要だが、そのことがあまり認識されていないことだ。新しい人工知能の研究のための(国際的な競争の視点では)貧しい計算環境を改善することも緊急の課題だ。
もう少し未来を覗けば、深層学習のようなモデルとヒトの脳神経系の回路との対応がだんだんつくようになってきているようだ。そこでは、ウエットな研究者や臨床医と計算技法の研究者たちとの共同研究の機会が増えている23)。とくに認知障害などの研究では、そうしたチームによる成果が期待される。また、さらなる未来では量子情報、量子計算とのつながりが期待される24),25)。そこでは自然科学、情報学、工学が渾然一体化した世界になる(図6)。今は、そうした未来を切り開いていく若手が育つような教育支援を充実すべき時だろう。
このように話題は広がっていくが、ネット第2革命と人工知能の新しい大波への対処の第1は、幅広い領域の専門家の未来指向の対話の機会を増やすことだろう。

図6 人工知能は思考を計算に対応させる研究である。その基礎になるのは様々な学問領域に共通する数学あるいは計算の技法である。図中の理論、計算技法はすべて共通する。
参考文献
- 神沼二眞、変わる薬づくり~2020年までを視野に入れて、創薬のひろば、3:3-7, 2016.
- The Internet Unleashed, Sams Publishing, 1994.
- 神沼二眞、第三の開国、インターネットの衝撃、紀伊国屋書店、1994.
- 山際大志郎、人工知能と産業・社会~第4次産業革命をどう勝ち抜くか、一般財団法人、経済産業調査会、2015.
- 櫛田健児、シリコンバレー発 アルゴリズム革命の衝撃、朝日新聞出版、2016.
- 神沼二眞、倉科周介訳:診療コンピュータシステム,文光堂、1981。(原著E.H.Shortliffe: Computer-Based Medical Consultations: MYCIN, Elsevier,1976;とくに翻訳者のあとがき参照)
- 甘利俊一、脳・心・人工知能、講談社、2016.
- D. Ferrucci, Watson: Beyond Jeopardy! Artificial Intelligence 199–200:93–105, 2013.
- G. E.Hinton, S. Osindero, and Y.-W. Teh, A fast learning algorithm for deep belief nets. Neural Comp. 18, 1527–1554, 2006.
- Y. LeCun, Y. Bengio, and G. Hinton, Deep learning, Nature, 521:436-444, 2015.
11) Q. V. Le et al. Building High-level Features Using Large Scale Unsupervised Learning, Proceedings of the 29th International Conference on Machine Learning, Edinburgh, Scotland, UK, 2012. - J. Ma et al. Deep neural nets as a method for quantitative structureactivity relationships. J. Chem. Inf. Model. 55: 263–274, 2015.
- P. Csermelya et al. Structure and dynamics of molecular networks: A novel paradigm of drug discovery; A comprehensive review, Pharmacology & Therapeutics 138: 333–408, 2013.
- R. Todeschini et al., Data Analysis in Chemistry and Bio-Medical Sciences, Int J Mol Sci, 17(12): E2105, 2016.
- I. V. Tetko et al., BIGCHEM: Challenges and Opportunities for Big Data Analysis in Chemistry, Mol Inform, 35(11-12):615-621, 2016.
- F. Cheng et al., Machine learning-based prediction of drug–drug interactions by integrating drug phenotypic, therapeutic, chemical, and genomic properties, J Am Med Inform Assoc, 21: e278–e286, 2014.
- E. Gawehn et al., Deep Learning in Drug Discovery, Mol Inform, 35(1):3-14, 2016.
- C. Angermuller et al. Deep learning for computational biology, Molecular Systems Biology, 12:878, 2016.
- D. Ravì et al., Deep Learning for Health Informatics, IEEE J Biomed Health Inform, 21(1):4-21, 2017.
- 神沼二眞、制御理論の治療への応用(日本医師会編、ライフセイエンスの進歩 第5集、春秋社、1978年)、pp.26-46.
- V. C. Kaggal et al, Toward a Learning Health-care System – Knowledge Delivery at the Point of Care Empowered by Big Data and NLP, Biomed Inform Insights8(Suppl 1): 13–2, 2016.
- R. S. Miller, CancerLinQ Update, Journal of Oncology Practice, 12(10), 2016.
- 理化学研究所脳科学研究センター編、つながる脳科学、講談社、2016.
- 西森秀稔、大関真之、量子コンピュータが人工知能を加速する、日経BP社、2016.
- M. Schuld, I. Sinayskiy, and F. Petruccione, An introduction to quantum machine learning, Physical Review A 94, 022342, 2016.

神沼 二眞 氏
1940年神奈川県に生まれる。国際基督教大学、イェール大学、ハワイ大学に学ぶ。物理学でPh.D.(博士号)。1971年から、日立情報システム研、東京都臨床研、国立医薬品食品衛生研究所に勤務。パターン認識、医学人工知能、医療情報システム、生命情報工学、化学物質の安全性などの研究に従事。1981年には理論的な薬のデザインなどをめざす産官学の研究交流組織(現在のCBI学会)を設立。その後、広島大学および東京医科歯科大学で学際領域の人材養成に当たる。2011年にNPO法人サイバー絆研究所を設立。