目次
機械学習がもたらす創薬への変革
2020年8月、パンデミックが発生してから8カ月ほど経った頃、大手製薬会社の先行きはかなり暗いものになっていました。75万人以上の命を奪ったCOVID-19は一向に収束せず、世界的にワクチンの製造が急がれていましたが、実を結ぶことはありませんでした。犠牲者の数が増加し、経済が破綻する中、科学者たちは、ウイルスが生命を脅かす効果を緩和する強力な抗ウイルス剤を探すことに全力を注ぎました。刻々と変化する時間の中で、科学者たちは研究開発(R&D)をスピードアップするために機械学習ベースのモデルを導入し、複雑なアルゴリズムに頼ってウイルス治療法を実現しました。
機械学習は地球を救えるのでしょうか。
特定の生体分子に基づくデータを機械学習モデルに入力することで、データ内のパターンを特定し、COVID-19の有効な医薬品の探索を進めることが期待されました。そして2021年2月、その期待は科学的なブレークスルーをもたらしました。マサチューセッツ工科大学の研究者たちは、ウイルスに対抗するために再利用できる薬を特定したのです。人工知能がこの驚くべき成果をもたらしました。これは、機械学習がポストCOVID時代の創薬をどのように変えたかを示す多くの例の一つです。
機械学習と医薬品開発の歴史
機械学習は、パンデミック以前から研究開発に活用されており、大量のデータをコンピュータシステムに入力することで、医薬品の開発、試験、再利用に役立つ結果を予測していました。機械学習モデルは、データセット間のパターンを識別する能力に優れ、研究者たちはこの技術を、臨床試験のデータ分析から製品の特性評価やバイオ分析試験まで、創薬のあらゆる段階に応用しています。
しかし、機械学習モデルによる創薬プロセスの予測には、複雑なアルゴリズムを誤って解釈したり、機械学習から得られるデータの検証ができないなどの課題があります。しかし、機械学習は、大手製薬会社が開発パイプラインを実行する方式、そして新薬が研究室から薬局の棚に並ぶまでの方式に革命をもたらしました。
2021年の時点で、71%の科学者が構造に基づく創薬や新規化学物質の探索に、57%がイメージングやデータ分析に機械学習を利用しています。また、研究者の79%は、機械学習の使用が薬物スクリーニングにおいて増加すると見込んでいます。
ビッグファーマは機械学習をどのように創薬に利用しているのか
機械学習とは、演繹的推論、統計的推論、教師付き学習などの様々な手法からなる包括的な用語です。これらの手法を医薬品開発に応用すると、新薬の発見、薬効の検証、薬物とタンパク質の相互作用の予測、安全性の向上、製品化までの時間の短縮、さらには分子の生物活性の向上などが可能になります。
この技術の最大の推進者の一人であるアストラゼネカ社は、オックスフォード大学と共同で、最も成功したワクチンの一つであるCOVID-19を開発しました。この製薬会社は、パンデミックが地域社会を席巻し、21世紀初頭の最大の世界的健康危機となる以前から、機械学習を利用していました。
アストラゼネカ社は、その研究開発プロセス全体において、機械学習ベースのモデルを利用して、新薬のターゲットを特定し、治療したい病気をより深く理解し、より良い臨床試験を設計し、個別化医療技術を推進し、医薬品開発を加速してきました。
「データサイエンスとAIは、新薬の発見と開発の方法を変革する可能性を秘めています。革新的な科学を人生を変えるような医薬品に変換することを可能にするために、昨日のSFを今日の現実に変えるのです」と、同社のデータサイエンス・AI担当副社長のJim Weatherallは述べています。
他の産業における機械学習と創薬
機械学習を創薬に活用しているのは、大手製薬会社だけではありません。科学者たちはこの技術を医学、バイオテクノロジー、薬理学などの分野の研究開発に活用し、人々の生活を変え、救う新薬や治療法の発見を目指しています。例えば、スキンケア業界では、研究者が機械学習に基づいたモデルを使用して、特定の美容やヘルスケアのニーズに対応する製品を開発しています。今では、新しいフェイスクリームや口紅が肌にどのように映るか(反応するか)を、科学者が人間で試すことなく、人工知能が判断することが可能になりました。
「現在、多くのデータサイエンティストが、人間の顔を理解できるAIシステムの開発に取り組んでいます。習得すると、新しい外観や製品をテストする機能が非常に簡単で現実的になります」と、機械学習が美容業界にどのような変化をもたらしているかを探る記事の中で、Sciforceは述べています。
創薬のための機械学習の挑戦
データ品質は、機械学習における最大の課題の一つです。モデルはそのモデルを構成するデータに依存しており、科学者は質の低いデータセットを解釈する際に様々な問題に遭遇する可能性があります。アルゴリズムは年を追うごとに賢くなり、大手製薬会社は最先端のデータ駆動型モデリング技術を促進する技術に多くの資金を投じています。しかし、障害は依然として存在します。
“機械学習を適用する上での課題は、主に機械学習で生成された結果の解釈性と再現性の欠如にあり、その適用が制限される可能性があります。すべての分野において、系統的で包括的な高次元データをまだ生成する必要があるのです。”とNature.comは述べています。
科学者にとってのもう一つの課題は、データの入手可能性です。機械学習モデルでは、電子カルテ(EHR)を含む患者データベースからのデータを必要とすることが多く、倫理的な問題やプライバシーの問題が生じます。その一方で、HIPAA、GDPR、CCPAなどの厳格なデータガバナンスフレームワークにより、科学者が生データを使用して価値あるモデルのインプットを生成することは難しくなっています。研究者が創薬や試験にモデリング技術を使用する際には、データプライバシーの原則を遵守する必要があります。
最後に
命を救うCOVID-19治療法は、機械学習ベースのモデルを取り入れた創薬方法から誕生しました。この技術は、科学者がデータセットのパターンを特定し、ウイルス療法や美容業界を含むその他の治療法を迅速に実施するための研究開発を促進するのに役立ちます。データの質と利用可能性をめぐる課題は存在しますが、機械学習は創薬を変革し、今後も医療成果を向上させていくでしょう。
intech.mediaでは、グローバルなヘルステックのトレンドを紹介しています。