Biohubは、タンパク質の構造予測や設計、候補探索に活用できるAIツール群を研究コミュニティ向けに無償公開した。配列解析から生体分子複合体の3次元構造予測、大規模データ探索までを一体で提供し、タンパク質ベースの治療薬候補の発掘を加速させる狙いだ。
Gigazineが28日(米国時間)に報じた。Biohubは、創薬候補の探索プロセスの多くを計算で置き換えることで、新薬開発のスピード向上につなげたい考えだ。
今回公開したのは、「ESMC」「ESMFold2」「ESM Atlas」の3つ。いずれもBiohubのプラットフォームを通じて、世界の研究者に無償で提供する。Biohubは、AIと生物学を組み合わせて疾患解決に向けた研究を進める組織で、MetaのCEOであるマーク・ザッカーバーグ氏の支援を受けている。
特徴は、タンパク質研究の各工程を一連のワークフローとしてつなげた点にある。ESMCは、生物全般から収集した約28億件のタンパク質配列で学習した言語モデルで、配列の特徴や性質を捉える基盤モデルに位置付けられる。
ESMFold2は、その配列情報を基に生体分子複合体の3次元構造を予測するモデルだ。腫瘍など特定の標的と強く結合する可能性があるタンパク質構造の探索を主な用途としている。
ESM Atlasは、ESMCの表現を活用し、68億件のタンパク質配列と11億件の予測構造を探索できるようにした。既存データベースでは捉えにくい関連性を見つけ出し、新たな候補物質の発掘に役立てられるとしている。Biohubは、タンパク質の発見から構造設計、候補探索までの研究プロセスを統合する考えだ。
性能面では、GoogleのAlphaFold 3との比較結果も示した。Biohubによると、ESMFold2はタンパク質間相互作用と抗体-抗原相互作用の予測で、AlphaFold 3を上回る、または同等の性能を示したという。構造予測にとどまらず、創薬設計の段階で活用を広げる狙いがあるとみられる。
今回の公開は、抗体医薬の開発でボトルネックとなっている探索期間の短縮も意識したものだ。Biohubは、がんや自己免疫疾患で抗体治療の重要性が高まる一方、有望な候補の探索には通常3〜4年かかると説明する。ESMFold2を使えば、初期探索の多くを計算で進め、数日で実験可能な設計案を導き出せるとしている。
共同創設者のプリシラ・チャン氏は、「これらのツールを無料で公開することで、世界中の研究者が、それぞれの患者により適した治療法の実現に向けて、より速く前進できる」と述べた。研究者のアクセス障壁を下げ、実験設計と候補発掘のスピードを高める考えを示した。
AIを活用したタンパク質研究を巡る競争は、今後さらに激しくなりそうだ。Biohubは今回の公開を通じて、研究用途での性能競争に加え、実際の治療候補探索を支援するツール分野でも存在感を高めたい考えだ。抗体-抗原相互作用など創薬の中核領域で性能を打ち出しただけに、研究現場でどこまで活用事例を広げられるかが焦点となる。