最高のAIモデル評価 AIツールモデル_厳選AIモデル評価情報

AIニュース

グーグルのAIモデルVeo-3が現実的な手術動画を生成できるが、医学的な論理理解には欠ける

グーグルのVeo-3モデルは現実的な手術動画を生成できるが、医療操作の理解に不足がある。テストでは、AIが手術画像から8秒先の進行を予測し、SurgVeo基準で50本の本物の手術動画を評価した。4人の外科医が評価に参加し、モデルが重要な医学的ステップで欠陥があることを発見した。

6.2k 12 分前

グーグルのAIモデルVeo-3が現実的な手術動画を生成できるが、医学的な論理理解には欠ける

グーグルとAnthropicが再び交渉を開始、AIスタートアップの評価額が350億ドルを超える可能性！

グーグルがAI企業Anthropicへの追加投資を協議中。成立すれば同社の評価額は3500億ドル超に。Anthropicは元OpenAIメンバーが設立し、Claude言語モデルで知られる。過去にグーグルから30億ドル超の投資を受けた実績あり。....

8.7k 17 時間前

グーグルとAnthropicが再び交渉を開始、AIスタートアップの評価額が350億ドルを超える可能性！

王興興：ロボットの大型モデルはまだ初期段階で、ChatGPTの時刻からはまだ距離がある

宇樹科技CEO王興興氏は虹橋フォーラムで、ロボット大規模モデルがまだ初期段階（ChatGPT発表前1-3年程度）と指摘。生成AIの言語・視覚分野の進展を評価しつつ、人型ロボット分野の更なる革新突破を強調。....

8.8k 昨日

王興興：ロボットの大型モデルはまだ初期段階で、ChatGPTの時刻からはまだ距離がある

AIのセキュリティと効果性のテストに重大な欠陥があり、専門家から注目されている

英研究チームが440以上のAIモデル安全評価ベンチマークを分析した結果、ほぼ全てに欠陥があり、結果の有効性を弱め、誤解を招く評価につながる可能性が判明。AI安全性評価の信頼性に影響。....

7.2k 1 日前

AI製品

SWE-bench Verified

AIモデルのソフトウェアエンジニアリング能力評価ツール

AIモデル評価

9.2k

Scale Leaderboard

AIモデルのパフォーマンス評価プラットフォーム

AIモデル評価

9.5k

SuperCLUE

AIモデルの性能を測定?比較するための最先端の評価ベンチマークです。

AIモデル

9.9k

Openlayer

AIモデルのテストと評価ツール

モデルの訓練とデプロイ

6.6k

モデル

Solar Pro 2

upstage

入力トークン/百万

出力トークン/百万

65.5k

コンテキスト長

MCP

NMAP Scanner

MCP NMAPサーバーは、AIアシスタントにネットワークスキャン機能を提供するプロトコルサーバーです。標準化されたインターフェースを通じて、AIモデルがNMAPを使用してネットワーク分析とセキュリティ評価を行うことができます。

typescript

6.2k

2.5ポイント

Mcp Thought Server

MCP Thought Serverは、AIエージェントに高度な思考ツールを提供するサービスで、モデルコンテキストプロトコル（MCP）を通じて推論、計画、反復最適化能力を強化します。構造化思考、反復草稿、および統合思考などのツールを含み、SQLiteの永続化と高度な信頼度評価システムをサポートし、さまざまなニーズに合わせて環境変数を構成できます。

typescript

6.9k

2.5ポイント

PhialsBasement_Pagespeed MCP Server

PageSpeed MCPサーバーは、AIアシスタントとGoogle PageSpeed Insights APIをつなぐブリッジで、AIモデルにウェブサイトのパフォーマンス分析機能を提供します。核心的なパフォーマンス指標、SEO評価、アクセシビリティ監査、リソース最適化提案などが含まれます。

javascript

5.1k

2.5ポイント

Lisply Mcp

このプロジェクトは、大規模言語モデル（LLM）とLisp開発環境を接続するためのモデルコンテキストプロトコル（MCP）アダプターで、軽量なLisplyプロトコルを介したやり取りをサポートします。主な機能には、Lispコードの評価、HTTPリクエスト、デバッグサポートが含まれ、AI支援によるシンボルプログラミング、CAD設計の自動化などのシーンに適しています。

javascript

5.1k

2.5ポイント

Socket Mcp

Socket MCPサーバーは、依存関係のセキュリティスキャン用のモデルコンテキストプロトコルサービスで、npm、PyPIなどのソフトウェアパッケージエコシステムのセキュリティ評価と脆弱性検出機能を提供し、AIアシスタントとの統合と複数のデプロイ方法をサポートします。

typescript

2.5ポイント

Youtube Mcp Server

YouTube MCPサーバーは、YouTube Data API v3を通じてYouTubeのリアルタイムデータアクセスを提供する総合的なモデルコンテキストプロトコルサーバーで、動画詳細情報の取得、チャンネル分析、コンテンツ評価、字幕抽出など14種類の機能をサポートし、AIアシスタントへの統合に適しています。

python

7.1k

2.5ポイント

Mcp Code Indexer

MCPコードインデクサーは、AI大規模言語モデル向けに設計されたインテリジェントコード検索ツールで、意味理解とベクトル化インデックスを通じてコード処理の効率と精度を向上させ、コード分析、品質評価、依存関係管理などの機能をサポートしています。

python

5.8k

2.5ポイント

Enemyrr_mcp Server Pagespeed

Model Context Protocolに基づくサービスで、Google PageSpeed Insightsのウェブページパフォーマンス分析機能を提供し、AIモデルが標準化されたインターフェースを通じてウェブページの読み込み性能を評価できるようにします。

typescript

7.2k

2.0ポイント

Mcphubs

MCPHubsはNext.jsをベースに構築されたウェブサイトで、AnthropicのModel Context Protocol (MCP)に関連するオープンソースプロジェクトを展示します。GitHub APIを通じてプロジェクト情報を取得し、Google Gemini Proモデルを使用してAI分析を行い、プロジェクトとMCPの関連性を評価し、プロジェクトリスト、詳細展示、READMEレンダリング機能を提供します。

typescript

6.9k

2.0ポイント