先月開催された2025年 I/O デベロッパーカンファレンスにおいて、グーグルは新たな医療AIモデル「MedGemma」をオープンソースとして発表しました。このモデルはGemma3アーキテクチャに基づいており、医療分野専用に設計されており、強力なマルチモーダル画像とテキストの理解能力を持っています。その目的は、医療診断と治療効率の向上にあります。
MedGemmaには、4Bと27Bパラメータの2つの構成オプションがあります。4Bパラメータモデルは主に医療画像の分類と解釈に使われ、詳細な診断レポートを作成したり、画像に関連する質問に答えたりすることができます。一方、27Bパラメータモデルは臨床テキストの処理に特化しており、特に患者のトリアージや意思決定支援に適しています。これにより、医師は患者の状態に関する価値ある情報をより迅速に得ることができ、治療計画をより効果的に立てることができます。
画像出典:AI生成、画像提供サービスMidjourney
4Bモデルの画像エンコーダーはSigLIP技術を使用しており、胸部X線、皮膚科学、眼科、組織病理学などの分野の画像を含む事前学習データが使用されています。これにより、複雑な医療画像の処理において優れた性能を発揮します。一方、27Bモデルは270億パラメータをベースにし、医療テキストの深い理解に焦点を当て、臨床推論をサポートし、医療従事者の意思決定を迅速に行う助けとなります。
さらに柔軟性があり、開発者はこれらのモデルをローカルで実験するために使用するか、グーグルクラウドのVertex AIプラットフォームを通じてHTTPSエンドポイントとして展開して大規模なアプリケーションに活用することもできます。グーグルはまた、Colabノートブックなど豊富なリソースを提供し、開発者がモデルの微調整や統合を行うのを助けています。
さらに、グーグルは開発者が特定のユースケースに対してモデルを検証し、微調整することを奨励しており、関連するガイドラインやツールを提供しています。このプロセスでは、プロンプトエンジニアリング、コンテキストラーニング、LoRAといった手法を使って効率的なパラメータ微調整を行うことができます。これにより、MedGemmaは単なる高度なAIツールではなく、開発者や医療従事者が日常業務で効率を上げる重要な支援ツールとして活用されることが期待されます。
MedGemmaの登場は、医療AI分野におけるさらなる進展を示すものであり、未来の医療実践に無限の可能性をもたらします。