最近とみに感じるのですが、生成AIが社会に急速に浸透してきています。私の周りを見てみても、昨年ブレイクしたChatGPTのような対話型AIは文章の翻訳・推敲・要約などに広く使われていますし、アイデアをまとめたり、考えを深めたりするときの「壁打ち相手」や、プログラムを作成する際のコーディング補助ツールとして使っている人もいるようです。
今年1月、芥川賞を受賞した九段理江さんは、受賞作の「東京都同情塔」について「全体の5%くらいは生成AIの文章をそのまま使っているところがある」と記者会見で明かし、話題になりました。
画像生成AIの認知も広がっており、SNS上にはAIが作成した画像を投稿する人がかなり増えました。文章や画像だけなく、音楽や動画を生成してくれるツールも出てきています。スマートフォンで気軽に利用できる無料のサービスやアプリも増え、生成AIは今後、ますます私たちの身近なものになっていくことは容易に想像できます。
というわけで、今回は生成AIの話です。製薬企業の中でも生成AIはかなり注目されています。私がフィールドとしている創薬研究の分野を中心に、生成AIとの付き合い方について考えてみました。
注目集める構造予測・提案
まずは対話型生成AIですが、こちらはすでにいくつかの製薬企業が全社的な運用を開始したことを発表しています。論文情報の要約は製薬企業の社員であれば多くの人が求めるところでしょうし、自社データを学習させることで社内の状況を踏まえて資料作成などの業務を効率化できたり、アイデア出しの壁打ちができたりするのは、とても恵まれた環境だと私は思います。
創薬研究の分野で広く注目を集めているのが、AIによる構造の予測・提案です。
米Alphabet傘下の英DeepMindが2021年に公開したAlphafold2は、タンパク質の立体構造を高精度で予測できるとして一般メディアでも大きく取り上げられました。従来、タンパク構造が未知のターゲットに対しては、HTS(ハイスループットスクリーニング)と呼ばれる大規模な化合物スクリーニングを行うなど、いわば力技や研究者の経験と感覚で効果がありそうな化合物を見つけ出すのが一般的でした。しかし、Alphafold2の登場により、構造が未知のターゲットであっても、予測をもとに化合物を設計するための仮説を構築できるようになりました。
AIに化合物の構造を提案させる試みも数多く報告されるようになってきています。低分子化合物の構造は10の60乗とも言われる広大な可能性を持っており、これを人の手だけで網羅するのは到底、不可能です。私の能力を超えるので詳細の説明はできませんが、▽学習したデータから大元の化合物構造を少しずつ変換していくことで似た構造を提案させる手法▽より本物らしい分子を生成するようAIを訓練する方法▽分子構造をグラフとしてとらえて特徴量を更新する方法▽3D座標中に原子を生成/すでにある原子群に原子の追加を検討する方法――などなど、さまざまな方法があります。
さらに、タンパク質と化合物の3D配座を予測・発生させ、それらのドッキングを評価する手法も日々進化しています。
こうした検討を現実的なスピードで行っていくには、高性能なGPUがたくさん必要になることが多く、計算リソースが研究に影響を与える時代になってきているようにも感じます。
最近では、米NVIDIAや同IBMといった大手半導体メーカーが製薬業界向けの生成AIサービスの基盤を展開しており、効率的なインシリコ研究に業界をまたいだ動きが広がってきています。
構造式から合成方法を提案
作りたい化合物の構造式を入力するだけで、どんな原料、どんな反応を使えば目的物に到達できるかを、詳細な実験手法も含めて提示してくれる多機能なAIも登場しています。
有機化学の分野では古くから、目的物までの合成経路を考案するためのツール(逆合成解析ソフトウェア)の検討が進められてきました。しかし、ケミストが扱う化学物質は多岐にわたり、しかも化学反応のメカニズムは非常に複雑で、扱う原料の化学構造が少し違うだけでシステムが提案してきた手法が使えない、といったことはザラにありました。そのため、現場のケミストからすると微妙に使い勝手の悪いものが多く、近年登場してきている新しいAIシステムを含め、専門的な知識を持たない人には正誤の判断が難しいツールです。
実験プロトコルの立案も同様で、扱う原料の化学構造が変わると実験方法も変わることがある現実にどこまで対応できるのか気になります。ここは、今後の成長に期待したい分野です。
生成AIは便利だけれど
生成AIは製薬企業のさまざまな領域で業務を効率化・加速化する技術として非常に期待されています。ひとりの人間だけでは思いつかなかったような提案をしてくれる可能性がありますし、それによって新たな価値が生まれてくるかもしれません。
ただ、1番の問題は、AIの提案を受けて人間は何をするのか、ということです。AIはまだまだ発展途上であり、提案を正しいものと鵜呑みにしてしまうのは危険です。私たちは薬という人の命に関わる物を扱っており、最終的には人間が責任を負う覚悟が必要です。
そうなると、AIの活用には提案内容の正誤や妥当性を判断するためのドメイン知識が絶対に欠かせません。あなたがAIにまとめてもらった論文情報や翻訳してもらった文章は本当に正しいですか?
つまるところ、「AIが高速かつ大量に提案してくる」ということは「人間がチェックすべきことも大量になる」ということとほぼイコールです。(正直、実験プロトコルの提案など、一体何に使うのでしょうね。使用する反応の妥当性に加えて、安全に実験が可能かとか、いちいち細かくチェックしなければならないので仕事が増えるだけのような気がするのですが)
さらには、提案された内容が妥当だったとして、誰がその提案を実際に検討するのか(例えば、提案された化合物を誰がつくるのか)、その予算はあるのか、その検討は組織の戦略や方向性と合致しているのか、していなければどのように上司や組織を説得するのか、他組織の力を借りる必要があるなら協力体制をどのように構築するのか、どのくらいのスケジュール感で検討するのか、検討に対する成功/失敗の判断基準は何か、などなど新たに考えなければならないことが山のように出てきます。
生成AIは非常に便利です。ただ、その使い方は模索段階ですし、性能にもまだまだ改善の余地が大いに残されています。私たちもうまく付き合っていく方法を探していかなければいけませんし、そうした状況なので仕事を奪われる心配はまだしなくても良さそうです。最近、忙しすぎて目が回りそうな私の仕事をAIが奪ってくれる日はいつになるのやら。
ノブ。国内某製薬企業の化学者。日々、創薬研究に取り組む傍らで、研究を効率化するための仕組みづくりにも奔走。Twitterやブログで研究者の生き方について考える活動を展開。 X(旧Twitter):@chemordie ブログ:http://chemdie.net/ |