今朝あなたが飲んだ薬は、研究室から錠剤パックに届くまで長い道のりを歩んできました。まず、大規模な実験室での研究がある。そして、動物実験。しかし、薬の使用が承認される前に、臨床試験と呼ばれる高価で複雑なプロセスで、人間に対してテストされなければならない。
基礎編
最も単純な臨床試験は、次のようなものです。研究者は、実験薬が対象とする疾患を持つ患者を募集する。ボランティアは無作為に2つのグループに分けられる。一方のグループには実験薬が投与され、もう一方は対照群と呼ばれ、プラセボ(実験薬と同じように見えるが、何の効果もない治療法)が投与される。有効な薬を投与された患者さんが、プラセボを投与された患者さんよりも改善が見られたら、それはその薬が有効であることの証拠となるのです。
臨床試験を計画する上で最も困難なことの一つは、試験の正確な基準を満たす十分なボランティアを見つけることです。医師は自分の患者に合うような臨床試験を知らないかもしれないし、登録する意思のある患者が特定の臨床試験に必要な特性を持っていないかもしれない。しかし、人工知能があれば、その仕事はずっと楽になるかもしれません。
双子との出会い
デジタルツインは、現実世界の物体やシステムをシミュレートしたコンピュータモデルである。デジタルツインは、現実の物体やシステムをシミュレートしたコンピュータモデルであり、統計的に物理的なものとほぼ同じ振る舞いをする。NASAは、アポロ13号の酸素タンクが爆発し、地球上のエンジニアが20万マイル離れた場所から修理に奔走した際、その修理にデジタルツインを使用しました。
十分なデータがあれば、人工知能の一種である機械学習を使って、人間のデジタルツイン(双子)を作ることができます。臨床試験中の患者のデジタルツインは、過去の臨床試験や個々の患者の記録から得た患者のデータで機械学習モデルをトレーニングすることによって作成されます。このモデルは、プラセボを投与した場合の患者の健康状態が治験期間中にどのように推移するかを予測し、特定の患者に対する模擬対照群を作成する。
つまり、特定の患者を対象とした模擬対照群を作るということです。ある人(仮にサリーと呼ぶ)が、活性炭を投与されるグループに振り分けられる。サリーの双子(コンピュータモデル)は、対照群に属する。サリーの双子(コンピュータモデル)は対照群に属し、サリーが治療を受けなかった場合にどうなるかを予測する。サリーの薬物に対する反応と、プラセボを服用した場合のサリーの反応の予測との差が、サリーにとって治療がどの程度効果的であるかの推定値となるのです。
対照群の患者さんについても、デジタルツインが作成されます。プラシーボを飲んだデジタルツインと、実際にプラシーボを飲んだ人間を比較することで、研究者はモデルの問題点を発見し、より正確なものにすることができるのです。
対照群をデジタル・ツインに置き換えたり、補強したりすれば、研究者だけでなく、患者ボランティアも助かるだろう。治験に参加する人の多くは、すでに承認されている薬がダメだったときに、自分を助けてくれるかもしれない新薬を手に入れることを望んでいます。しかし、半々の確率で対照群に入れられ、実験的な治療を受けられない可能性があります。対照群をデジタルツインに置き換えることで、より多くの人が実験的な薬にアクセスできるようになるかもしれません。
予期せぬ事態
この技術は有望かもしれないが、まだ広く使われているわけではない-多分、それなりの理由があるのだろう。ダニエル・ニール博士は、ニューヨーク大学で、ヘルスケアへの応用を含む機械学習の専門家です。ニール氏は、機械学習モデルは多くのデータを持っていることが重要であり、個人に関する質の高いデータを得ることは困難であると指摘しています。食事や運動などの情報は自己申告が多く、人は必ずしも正直ではありません。人々は運動量を過大評価し、ジャンクフードの量を過小評価する傾向がある、と彼は言う。
また、稀な有害事象を考慮することも問題であると、彼は付け加えています。「ほとんどの場合、そのような有害事象は、対照群ではモデル化されていないものです。例えば、ある薬に予期せぬ副作用が出るかもしれないのです。
しかし、ニールの最大の懸念は、予測モデルが彼の言う「通常通り」を反映していることである。例えば、COVID-19のような予期せぬ大流行が起こり、人々の行動パターンが変化し、人々が病気になったとする。「そのような事態は、コントロールモデルでは考慮されません」と彼は言う。対照群では考慮されないこれらの予期せぬ出来事は、試験の結果を歪めてしまうかもしれない。
Scripps Research Translational Instituteの創設者兼所長で、医療におけるデジタル技術の活用の専門家であるEric Topol氏は、このアイデアは素晴らしいが、まだゴールデンタイムには早いと考えています。"臨床試験が短期間で変わるとは思いません。" なぜなら、これには健康記録以外にも、ゲノム配列、腸内マイクロバイオーム、環境データなど、何重ものデータが必要だからです。 特に複数の病気について、AIを使った大規模な治験ができるようになるには何年もかかると予測しています。(トポルは、医師の姉妹サイト「Medscape」の編集長でもある)。
臨床試験のためのデジタルツインを開拓するスタートアップ、Unlearn.AIの創設者兼CEOであるチャールズ・フィッシャー博士は、十分な質の高いデータを集めることが課題であると言う。しかし、このような問題への対処は、同社の長期目標の一部であるという。
機械学習モデルに関して最もよく挙げられる2つの懸念事項、プライバシーとバイアスは、すでに考慮されているとフィッシャーは言う。「プライバシーは簡単です。すでに匿名化されたデータだけを扱うのですから」。
バイアスに関しては、問題は解決されていませんが、少なくとも裁判の結果には無関係である、とフィッシャーは言います。機械学習ツールの問題点としてよく知られているのは、偏ったデータセットで学習してしまうことだ。例えば、ある特定のグループを十分に反映していないデータセットで学習してしまうのだ。しかし、Fisher氏によれば、この試験は無作為化されているため、データの偏りには影響されないという。試験は、対照群との比較に基づいて、試験中の薬剤が試験参加者にどのような影響を与えるかを測定し、実際の対照群により近くなるようにモデルを調整するのです。ですから、フィッシャーによれば、たとえ治験の被験者の選択に偏りがあり、元のデータセットに偏りがあったとしても、「その偏りに影響を受けないように治験をデザインすることができる」のだそうです。
Neillはこれを納得していません。狭い意味では、無作為化試験のバイアスを除去することは可能です。Unlearn.AIは、「治療した人と対照者を比較しているのではありません」とNeill氏は言う。 「治療した人と、その人が対照群にいたらどうなっていたかというモデルベースの推定値とを比較するのです。 これらのモデルに誤差があったり、予測できなかった事象があると、系統的な偏り、つまり治療効果の過大評価や過小評価につながる可能性があります」。
しかし、unlearn.AIは前進しています。すでに製薬会社と協力して、アルツハイマー病、パーキンソン病、多発性硬化症などの神経系疾患の臨床試験を設計している。これらの病気は、他の病気よりもデータが豊富なので、手始めとして最適だったのです」。フィッシャーによれば、この方法はいずれあらゆる病気に適用でき、新薬の上市までの時間を大幅に短縮することができるという。
この技術が有用であることが証明されれば、この見えない兄弟は患者にも研究者にも同様に利益をもたらすだろう。