OpenAI が医療分野の AI 評価基準データセット HealthBench を公開

AIbase基地

公開日AIニュース · 1 分で読めます · May 27, 2025

OpenAIは、医療分野での大規模言語モデルの質問応答能力を評価するための大型データセットを正式に公開しました。このプロジェクトは「HealthBench」と名付けられ、専門家たちはこのオープンソースデータと詳細な評価基準を高く評価し、「その規模と範囲において前例がない」と呼んでいます。

AI医療（2）

出典メモ: 画像はAIによって生成され、MidJourneyによる許可のもと使用されています。

HealthBenchプロジェクトは、OpenAIが医療分野に初めて挑戦した取り組みであり、特に外部パートナーなしで独自に進行している革新的な探求です。OpenAIのヘルスAIチームの責任者であるカラーン・シンガル氏は次のように述べています。「私たちの使命は、人工汎用知能（AGI）が人類に利益をもたらすことです。」彼は、技術の開発・展開だけでなく、医療のようなポジティブな応用が健全に発展することも同様に重要であると指摘し、これらのモデルが医療環境で安全かつ信頼できるものになるよう努めると強調しました。

この公開されたデータセットには、多くの医療に関する質問と回答が含まれており、研究者や開発者がAIモデルを実際に医療シナリオで評価・最適化する手助けをします。この包括的な評価方法により、医療AI技術の進歩と改良が促進され、医療サービスの効率と安全性が向上すると期待されます。

OpenAIの新たな取り組みは、技術革新における野心と、医療分野の改善への注目を示しています。オープンなデータセットや評価ツールを提供することで、OpenAIは多くの研究者や開発者が医療AIの開発と応用に参加し、医療技術の共同進展を促すことを目指しています。

ポイント:

🌟 OpenAIは、医療分野におけるAIモデルの質問応答能力を評価するHealthBenchというデータセットを公開しました。

💡 専門家たちによれば、このデータセットは規模と評価基準において前例がないものであり、非常に重要な先駆的な意義を持っています。

🏥 このプロジェクトは、OpenAIが独自に医療分野に踏み込んだ最初の試みであり、AIの安全性と信頼性を医療用途に保つことにコミットしています。

OpenAI HealthBench Midjourney 人工一般知能(AGI)

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

Aibidiaが2800万米ドルのシリーズBラウンドを調達 AIテクノロジーでアメリカ市場に進出

フィンランドのフィンテック企業であるAibidiaは最近、2800万米ドルのシリーズBラウンドを成功裏に完了しました。この資金は、同社のAI駆動型税務技術プラットフォームをアメリカ市場に拡大するために使用されます。今回のラウンドはActivantがリードし、既存投資家であるDN Capital、FPV、およびIcebreaker.vcが参加しました。これは、Aibidiaがグローバルな企業向けに先進的な税務コンプライアンスと移転価格ソリューションを提供することを示す重要なステップです。画像提供元: A

Jun 6, 2025

阿里がQwen3-Embeddingというベクトルモデルをオープンソース化し、パフォーマンスが大幅に向上グーグルやOpenAIに挑戦

今日、人工知能技術の急速な発展の中で、アリババは2023年6月6日に新たなQwen3-Embeddingというベクトルモデルシリーズを正式にオープンソースしました。このモデルはQwen3ベースに基づいており、テキスト表現、検索、ソートなどに特化して最適化されています。これはアリババがAI分野でまたもや重要なステップを踏んだことを示しています。前バージョンと比較して、Qwen3-Embeddingはテキスト検索、クラスタリング、分類などのコアタスクにおいてパフォーマンスを40％以上向上させました。この進歩により、同モデルは技術面でもますます競争力を増しています。

Jun 6, 2025

智源研究院がEmu3を含む悟界シリーズの大規模モデルを発表

先ほど閉幕した第七回北京智源カンファレンスでは、智源研究院が「悟界」と名付けられた一連の大規模モデルを発表しました。これらのモデルの登場は人工知能分野における技術的な飛躍を示しており、多くのテクノロジー愛好家の注目を集めています。今回発表されたモデルには、オリジナルのマルチモーダルワールドモデル Emu3、脳科学に基づくマルチモーダル汎用基礎モデル見微 Brainμ、クロスオントロジーの具現化モデルで大脳と小脳の協調フレームワーク RoboOS2.0、および具現化された大脳 RoboBrain2.0 が含まれます。さらに、完全な

Jun 6, 2025

OpenAIとインド政府がAI教育の協力を開始/OpenAIアカデミーが初めての国際展開

Jun 6, 2025

マイクロソフトとOpenAIの協力関係はさらに深まっている今後の展望は非常に有望

最近の公開での発言において、マイクロソフトのCEOであるサティア・ナ德拉（Satya Nadella）氏は、マイクロソフトと人工知能会社のOpenAIとの緊密な協力関係を再確認しました。ナ德拉氏は、このパートナーシップが双方の発展過程でいくつかの変化があったものの、常に堅固な基礎を保っていることを強調しました。彼は、OpenAIが研究から商業応用への移行を果たす一方で、両者の協力モデルも継続的に進化していることに言及しました。今後の展望として、OpenAIはより多くのパートナーと協業する可能性が高まっています。

Jun 6, 2025

富国銀行の大胆な予測：2030年までにChatGPTの広告収益が千億ドルに達する

ウェルズ・ファーゴの証券アナリスト、ケン・ガヴレスキ氏は最新のレポートで注目すべき予測を発表した:2030年までにChatGPTは世界の検索広告市場の30%のシェアを占め、年間収益がほぼ1000億ドルに達すると見込まれている。この予測は、OpenAIとグーグルの検索市場での競争がますます激化することを意味する。レポートによると、全体としての検索広告市場は今後数年で年率8%の成長率で拡大し、2030年には3400億ドルに達すると予想されている

Jun 6, 2025

AI業界の人材獲得戦争：AnthropicがOpenAIやGoogleの executivesを大規模に引き抜く

現在、熾烈な競争が続く人工知能（AI）分野において、スタートアップ企業のAnthropicは急速に頭角を現し、多くのトップ人材が集結しています。『ビジネスインサイダー』の報道によると、リスク投資会社シグナルファイアの最新研究では、OpenAIからAnthropicに移籍したエンジニアの比率は8:1であることがわかりました。また、それよりもさらに顕著なのが、GoogleのDeepMind部門からの人材流出で、その比率は11:1に達しています。この傾向は、Anthropicが…

Jun 5, 2025

AIデイリーニュース: ChatGPTがMCPと会議記録機能をサポート; Cursor 1.0バージョンが正式発表; Midjourneyのビデオ機能が今月登場

Jun 5, 2025

ChatGPTの新しい機能がアップデートされました：外部サービスと連携し、企業の効率的なオフィスワークを支援

人工知能技術の急速な発展に伴い、ChatGPTの企業ユーザーに対する影響力も日々増しています。OpenAIは最近、ChatGPTが複数の外部サービスと連携できるようになり、商業分野での応用効果がさらに向上することを発表しました。この取り組みは、ユーザーにますます豊富でリアルタイムの文脈情報を提供し、より正確で役立つレスポンスを実現することを目指します。現在、ChatGPTがサポートする外部接続サービスにはMicrosoft Outlook、Microsoft Teamsなどがあります。

Jun 5, 2025

Midjourneyのビデオ機能が遂に登場！V8モデルがいよいよ準備完了、AIクリエイティブの新たな時代が到来間近！

最新情報によると、Midjourneyのビデオ機能は今月リリース予定です。同時に、V7.1およびV8モデルの開発も加速しています。本記事では、Midjourneyの最新動向を詳しく解説し、ビデオ機能の突破、サーバーのアップグレード、スタイル参照（sref）の最適化、そして将来のモデル計画について取り上げ、AI画像生成の最先端の進展をお届けします。ビデオ機能が間もなくリリースされ、来週には評価パーティーが開始されます。AIbaseによれば、Midjourneyのビデオ生成機能は最終段階に達しています。

Jun 5, 2025

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

OpenAI が医療分野の AI 評価基準データセット HealthBench を公開

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

Aibidiaが2800万米ドルのシリーズBラウンドを調達 AIテクノロジーでアメリカ市場に進出

阿里がQwen3-Embeddingというベクトルモデルをオープンソース 化し、パフォーマンスが大幅に向上 グーグルやOpenAIに挑戦

智源研究院がEmu3を含む悟界シリーズの大規模モデルを発表

OpenAIとインド政府がAI教育の協力を開始/OpenAIアカデミーが初めての国際展開

マイクロソフトとOpenAIの協力関係はさらに深まっている 今後の展望は非常に有望

富国銀行の大胆な予測：2030年までにChatGPTの広告収益が千億ドルに達する

AI業界の人材獲得戦争：AnthropicがOpenAIやGoogleの executivesを大規模に引き抜く

AIデイリーニュース: ChatGPTがMCPと会議記録機能をサポート; Cursor 1.0バージョンが正式発表; Midjourneyのビデオ機能が今月登場

ChatGPTの新しい機能がアップデートされました：外部サービスと連携し、企業の効率的なオフィスワークを支援

Midjourneyのビデオ機能が遂に登場！V8モデルがいよいよ準備完了、AIクリエイティブの新たな時代が到来間近！

阿里がQwen3-Embeddingというベクトルモデルをオープンソース化し、パフォーマンスが大幅に向上グーグルやOpenAIに挑戦

マイクロソフトとOpenAIの協力関係はさらに深まっている今後の展望は非常に有望