AIスタートアップArthur、オープンソースAIモデル評価ツールBenchを発表

站长之家

公開日AIニュース · 1 分で読めます · Aug 18, 2023

ArthurBench: 大規模言語モデルの性能評価ツール

ニューヨークの人工知能スタートアップ企業Arthurは、大規模言語モデルの性能を評価・比較するためのオープンソースツール「ArthurBench」をリリースしました。

ArthurBenchは、企業が特定のユースケースにおいて様々な言語モデルの性能をテストし、正確性、可読性、リスク回避などの指標を用いて比較することを支援します。

既に金融サービス企業、自動車メーカー、メディアプラットフォームなどの企業がArthurBenchを利用し、分析の迅速化とより正確な回答の提供を実現しています。

Arthur オープンソースツール大規模言語モデル

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

アナリスト：AIへの投資バブルの規模は驚くほどで、インターネットバブルの17倍

現在、AI技術の発展が急速に進んでおり、市場にバブル懸念をもたらしている。独立研究機関の分析によると、AIバブルの規模は驚くほど大きく、90年代後半のインターネットバブルの17倍である。アナリストは、低金利環境がAIへの投資ブームを促進していると強調している。

Oct 14, 2025

半年間で評価額が3倍に！Cursorが270億ドルへ AIプログラミングツールが投資家の新トレンド

AIコーディングアシスタントCursorの親会社Anysphereが、CoatueとAccelと10億ドル超の資金調達を協議中。投前評価額は270億ドル。前回調達時の99億ドルから約3倍に急騰。AccelはAIインフラプロジェクトへの投資を強化。Anysphereは資金十分だが新規調達を検討。....

Oct 14, 2025

グーグルがサウスカロライナ州に90億ドルを投資し、人工知能の未来を推進

Googleはサウスカロライナ州に90億ドル追加投資し、AIインフラ需要に対応するデータセンター拡張を発表。同州のデジタル経済転換を推進、雇用創出も見込む。....

Oct 14, 2025

テンセントがYoutu-Embeddingをリリース：企業向けスマートサービスを支援

テンセントユトゥラボはYoutu-Embeddingテキスト表現モデルを開源し、企業のスマートカスタマーサービスや知識ベース管理の効率を向上させます。このモデルは正確な情報抽出により、特定の分野での大規模モデルによる誤った回答の生成を避けており、一般的な語料による関係のない返答の問題を解決し、多分野にわたるパフォーマンスの悪化にも有効に対応します。

Oct 14, 2025

AI日報：マイクロソフ트が初の自社開発画像生成モデル「MAI-Image-1」をリリース；バイドゥの世界会議の開催日が発表；AIの専門家がnanochat学習ツールをオープンソース化

マイクロソフトは初めて自社開発した画像生成モデル「MAI-Image-1」をリリースし、LMArenaでトップ10にランクインし、優れた画像生成能力を示した。このモデルはマイクロソフト独自で開発したものであり、AI画像生成分野における重要な進展を意味している。

Oct 14, 2025

農業の知能化新進展！中国農業大学が神農モデル3.0を発表

中国農業大学が神農モデル3.0を発表し、全国の農業分野と応用シナリオをカバーし、農業AIを新たな段階に突き進めました。モデルは36個の農業インテリジェントエージェントに焦点を当て、コンパクトなボディ、高知能、低コストの目標を達成し、32B、7Bおよび1Bの3つのバージョンを提供します。動的スパース性と増分圧縮技術を採用しており、計算力は50％削減されています。

Oct 14, 2025

HKUとメイドゥが協力してAI数学の難題を解き明かす：CodePlot-CoTにより大規模モデルがコードを用いて図を描くように思考し、性能が21％向上

GPT-4.1やGemini-2.5-Proなどの大規模言語モデルは数学の幾何問題が苦手。文章作成やプログラミングは得意だが、補助線や関数グラフが必要な問題では誤答が多い。テキスト推論は得意だが、空間認識能力が不足し、正確なイメージ構築ができないため。....

Oct 14, 2025

グーグルLensとAIモードがNano Bananaの画像編集機能をリリース

グーグルはNano Bananaの画像編集機能をリリースし、GeminiアプリおよびGoogle Lensに統合されています。AIモードでの操作が可能です。この機能は10月13日にリリースされ、現在アメリカとインドのAndroidおよびiOSユーザーに公開されており、今後はさらに多くの地域へ拡大する予定です。ユーザーは簡単な操作で効率的な画像処理および生成が可能です。

Oct 14, 2025

アップルが2025年の国際コンピュータビジョン会議で登場予定

アップル社は、2025年10月ハワイ（ホノルル）で開催される国際コンピュータビジョン会議（ICCV）において8本の論文を発表する予定で、マルチモーダルモデルや動画生成などの最先端技術に焦点を当て、コンピュータビジョン分野での最新研究成果を共有する。

Oct 14, 2025

ソフトバンクがオープンAIとの協力に追加投資、アームがカスタムCPUを開発

ソフトバンクとOpenAIが協力を強化。OpenAIはArmとCPUを共同開発し、ブロードコムとAI XPUを開発、独自のチップアーキテクチャを構築し、強力なAIハードウェアシステムを目指す。....

Oct 14, 2025

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

AIモデルファインダー

LLMランキング

LLMプロバイダー

AIモデル登録

LLM比較選定

LLMコスト計算機

LLMアリーナ

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

GEO順位最適化サービス

GEOランキング照会ツール

AIモデル互換性チェッカー

AIデータセット

インテリジェント文書認識

AIスタートアップArthur、オープンソースAIモデル評価ツールBenchを発表

站长之家

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

アナリスト：AIへの投資バブルの規模は驚くほどで、インターネットバブルの17倍

半年間で評価額が3倍に！Cursorが270億ドルへ AIプログラミングツールが投資家の新トレンド

グーグルがサウスカロライナ州に90億ドルを投資し、人工知能の未来を推進

テンセントがYoutu-Embeddingをリリース：企業向けスマートサービスを支援

AI日報：マイクロソフ트が初の自社開発画像生成モデル「MAI-Image-1」をリリース；バイドゥの世界会議の開催日が発表；AIの専門家がnanochat学習ツールをオープンソース化

農業の知能化新進展！中国農業大学が神農モデル3.0を発表

HKUとメイドゥが協力してAI数学の難題を解き明かす：CodePlot-CoTにより大規模モデルがコードを用いて図を描くように思考し、性能が21％向上

グーグルLensとAIモードがNano Bananaの画像編集機能をリリース

アップルが2025年の国際コンピュータビジョン会議で登場予定

ソフトバンクがオープンAIとの協力に追加投資、アームがカスタムCPUを開発