生命科学の最前線において、AI技術は革命を起こしつつあります。最近、バイオコンピューティング企業ProFluentは、強力な生成系タンパク質言語モデル(PLM)であるProGen3を発表しました。これは、抗体、工業用酵素、遺伝子編集の分野で大きな飛躍をもたらすと期待されています。研究によると、ProGen3の規模と設計の最適化により、機能性の高い新しいタンパク質を生成し、生物学に対する私たちの理解を塗り替える可能性さえあります。

タンパク質は生命体内の重要な分子であり、様々な生理機能を担っています。触媒反応から病原体の認識まで、その役割は無視できません。しかし、新しい薬剤や超安定な工業用酵素など、これまで存在しなかった機能を実現するための新しいアミノ酸配列を設計することは、大きな課題でした。ProGen3の登場は、この問題解決のための新たな道を切り開きました。

タンパク質組織 生物

画像出典:画像はAIによって生成され、画像ライセンスサービスプロバイダーMidjourneyによって提供されています。

ProGen3のトレーニングデータは、Profluent Protein Atlas v1というデータセットから得られており、34億個の全長タンパク質と1.1兆個のアミノ酸マーカーが含まれており、現在最も包括的なタンパク質データセットの一つとなっています。研究によると、モデルの規模が大きくなるにつれて、ProGen3はより多様で機能的なタンパク質を生成できるようになります。例えば、ProGen3-46Bが生成するタンパク質の多様性は、小型モデルと比べて約2倍高く、より広範な生物学的可能性を示しています。

実際の応用において、研究チームはProGen3を用いて一連の高品質な抗体を設計しました。これらの抗体は、複数の特性において承認済みの薬剤と同等であり、優れた開発性を示し、従来の抗体設計の限界に挑戦しています。さらに、チームはわずか592個のアミノ酸で構成されるコンパクトな遺伝子編集ツールを開発し、正確な遺伝子編集を実現しました。これは、ProGen3の実用的な可能性を強く示しています。

ProGen3の発表は、タンパク質設計が新たな時代に入ったことを意味します。研究者たちは、このモデルの拡張を続けることで、創薬、酵素工学、工業生産などの分野でさらなる進歩が得られると考えています。