情報

AIニュース

AIの最先端を探索、業界トレンドを完全マスター

AIニュース日報

毎日更新！AIホットトピックス＆業界最前線

情報

AIツールを探す

精確な製品選定＆多角的市場調査

AI製品ランキング

話題のAI製品総合力＆バズ度ランキング（年間/月間/デイリー）

AIプロダクト登録

AI製品を登録して、認知度アップ＆ユーザー獲得を加速！

ツール

AIツールディレクトリ

AIツール総合ナビ！あなたにピッタリのツールが見つかる

情報

AIモデルファインダー

全種類AIモデル完備！開発から研究まで、あなたのニーズを完全サポート

LLMランキング

人気AI大規模モデル性能・注目度・年/月/日ランキング

LLMプロバイダー

信頼できるAIモデルパートナーを見つけよう！安心のサポート体制

ツール

LLM比較選定

AI大規模モデル徹底比較！あなたにピッタリのモデルが見つかる

LLMコスト計算機

AIモデルのコストを正確に把握！スマートな予算計画で無駄を削減

LLMアリーナ

マルチモデルリアルタイム評価、モデル出力結果迅速比較

情報

MCPサーバー

人気AI-MCPサービスを集約、あなたに適したサービスを迅速発見

MCPクライアント

MCPクライアントに簡単接続、強力なAI機能を呼び出し

MCPケースチュートリアル

MCP使用テクニックを学習、入門から上級まで

MCPランキング

人気MCPサービス性能ランキング、最適選択をサポート

MCPサービス提出

あなたのMCPサービスを公開・プロモーション

ツール

MCP実験場

MCPサービスを自由にテスト、オンラインで迅速体験

MCPインスペクター

MCPサービス迅速テスト、迅速リリース

ツール

AIブランドモニタリング

AIモデルによるブランド引用の分析と追跡

GEOランキング照会ツール

AIプラットフォーム上のブランド認知度を測定する

サービス

GEO順位最適化サービス

GEOサービスにより、御社の企業やブランドのAI検索における支配的な表示を実現

ツール

AIモデル互換性チェッカー

PC環境でDeepSeek・Llamaが動作するか無料診断

モデル展開サーバー構成計算機

大規模モデルの計算力要件を入力すると、最適なGPU・メモリ・サーバー構成を即座に推薦

AIチュートリアル

清華大学チームが主導、初のAIエージェントの体系的ベンチマークテストが登場

学生头条

公開日AIニュース · 1 分で読めます · Aug 9, 2023

AIエージェントシステムのベンチマークテスト結果

清華大学などの研究チームが、AIエージェントの包括的なベンチマークテストであるAgentBenchを発表し、25種類の異なる言語モデルを包括的に評価しました。

研究結果によると、GPT-4は複雑な環境下で優れた性能を示し、最先端の商用言語モデルはオープンソースモデルに比べて顕著な優位性を有することが明らかになりました。

研究チームは、オープンソースモデルの学習能力の更なる向上を推奨しています。

AIエージェントベンチマークテスト清華大学

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

イスラエルのAI企業AI21Labsが、NVIDIAとの取引契約について誤解を訂正

Dec 31, 2025

小米の大モデル MiMo のパブリックベータテスト延長ユーザーは2026年まで無料体験が可能！

小米は、自社開発の大規模モデル「MiMo-V2-Flash」のパブリックベータテストの無料期間を20日間延長し、2026年1月20日までに変更した。このモデルのパラメーター数は3090億で、アクティブなパラメーターは150億であり、推論やコード生成において優れた性能を発揮している。この措置はユーザーにさらに長い体験時間を提供することを目的としており、小米がAI分野における継続的な投資と自信を示すためでもある。

Dec 31, 2025

インドのデータセンターが急速に発展しているが、実施は遅れている

インドのデータセンター業界は急速に成長しているが、政策の遅れや電力制約、人材不足などの課題に直面している。....

Dec 31, 2025

MiniMaxがM2.1プログラミングモデルを発表、AI開発の新時代が始まる！

MiniMaxはM2.1プログラミングモデルをオープンソースでリリースしました。このモデルはHugging Face、ModelScope、GitHubで利用可能となっており、開発者が簡単に導入できます。このモデルはvLLMDay-0のサポートを受け、効率的な推論を即座に実現でき、KTransformers技術によってパフォーマンスが最適化されています。

Dec 31, 2025

月の暗面が5億ドルのCラウンド資金調達を達成：百億元の現金を保有し、IPOに急ぐことなし AGI世界の頂点を目指す

月の暗面は5億ドルのCラウンド資金調達を完了し、現金準備は100億元を超えている。創業者はIPOに急ぐことはなく、長期的な技術開発と人材奨励に注力するとしている。

Dec 31, 2025

蘇州ラックスエイが身体知能ブランド「ユーディアンスマート」を発表し、全サイズロボットのプロトタイプが初登場

ラックスエイテクノロジーは新たな身体知能ブランド「ユーディアンスマート」を発表し、初めての全サイズ人型ロボットのプロトタイプを紹介しました。これにより、汎用ロボット分野に正式に参入します。ブランドは户外や家庭などのシーンをカバーする製品マトリクスを構築しており、履帯式屋外ロボットW1なども含まれています。すべてのシナリオにおけるスマートロボットソリューションの構築を目指しています。

Dec 31, 2025

AI日報：テンセントが3Dアクションツール「ホンユアンMotion1.0」をオープンソース公開；ロングヨンハオがAI講書アプリ「かつき」をリリース；クォークのAIメガネが初のOTA配信

【AI日報】へようこそ！ここは毎日人工知能世界を探求するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当てて、技術トレンドや革新的なAI製品の応用を理解にお手伝いします。新鮮なAI製品についてはこちらから確認してください：https://app.aibase.com/zh1、テンセントが登場！8、スマートグラスや腕時計も旧機種を交換する補助金を受けられます！2026年の「二新（新製品・新サービス）」政策にAI製品が新たに加わりました。2026年の「二新」政策が重要なアップグレードを実施し、初めてスマートグラスと

Dec 31, 2025

2030年までに20万のヨーロッパの銀行職がAIによる脅威にさらされる

モーガン・スタンリーより、2030年までに人工知能がヨーロッパ金融業界で約20万の銀行職を脅かすと予測されている。主にバックオフィスとミッドオフィスの職種に影響を及ぼし、データ処理や文書作業などが該当する。フィンテックの発展により、伝統的な銀行は効率向上とコスト削減のためにスマートなソリューションを採用している。

Dec 31, 2025

Yuan3.0Flash：オープンソースのマルチモーダル基礎大モデルがAIの新トレンドをリード

YuanLab.aiはオープンソースのマルチモーダル大モデルYuan3.0Flashを発表しました。パラメータ規模は40Bで、スパースミックス・オブ・エキスパート構造を採用し、推論時には約3.7Bのパラメータのみがアクティブになります。これは効率を顕著に向上させます。モデルには16ビットおよび4ビットの重み、技術報告書およびトレーニング方法が含まれており、二次開発や業界カスタマイズをサポートし、AI技術の普及を促進します。

Dec 31, 2025

クーアクAIメガネの初回OTA：AI能力がさらに強化され、図文ノートなどの5つの新機能が追加

クーアクAIメガネは12月31日に初回OTAアップデートを完了し、録音メモ、図文ノート、多意的認識と実行、ブルーリング決済およびコミュニティサービスの5つの新機能を追加しました。また、翻訳やスケジュール照会などの既存機能も最適化されました。自社開発の音声強化モデルとハードウェア構成により、録音機能は10メートル範囲での明確な収音と効果的なノイズキャンセリングを実現しています。

Dec 31, 2025

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

AIモデルファインダー

LLMランキング

LLMプロバイダー

LLM比較選定

LLMコスト計算機

LLMアリーナ

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

AIブランドモニタリング

GEOランキング照会ツール

GEO順位最適化サービス

AIモデル互換性チェッカー

モデル展開サーバー構成計算機

清華大学チームが主導、初のAIエージェントの体系的ベンチマークテストが登場

学生头条

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

イスラエルのAI企業AI21Labsが、NVIDIAとの取引契約について誤解を訂正

小米の大モデル MiMo のパブリックベータテスト延長 ユーザーは2026年まで無料体験が可能！

インドのデータセンターが急速に発展しているが、実施は遅れている

MiniMaxがM2.1プログラミングモデルを発表、AI開発の新時代が始まる！

月の暗面が5億ドルのCラウンド資金調達を達成：百億元の現金を保有し、IPOに急ぐことなし AGI世界の頂点を目指す

蘇州ラックスエイが身体知能ブランド「ユーディアンスマート」を発表し、全サイズロボットのプロトタイプが初登場

AI日報：テンセントが3Dアクションツール「ホンユアンMotion1.0」をオープンソース公開；ロングヨンハオがAI講書アプリ「かつき」をリリース；クォークのAIメガネが初のOTA配信

2030年までに20万のヨーロッパの銀行職がAIによる脅威にさらされる

Yuan3.0Flash：オープンソースのマルチモーダル基礎大モデルがAIの新トレンドをリード

クーアクAIメガネの初回OTA：AI能力がさらに強化され、図文ノートなどの5つの新機能が追加

関連AIニュースの推奨

イスラエルのAI企業AI21Labsが、NVIDIAとの取引契約について誤解を訂正

小米の大モデル MiMo のパブリックベータテスト延長 ユーザーは2026年まで無料体験が可能！

インドのデータセンターが急速に発展しているが、実施は遅れている

MiniMaxがM2.1プログラミングモデルを発表、AI開発の新時代が始まる！

月の暗面が5億ドルのCラウンド資金調達を達成：百億元の現金を保有し、IPOに急ぐことなし AGI世界の頂点を目指す

蘇州ラックスエイが身体知能ブランド「ユーディアンスマート」を発表し、全サイズロボットのプロトタイプが初登場

AI日報：テンセントが3Dアクションツール「ホンユアンMotion1.0」をオープンソース公開；ロングヨンハオがAI講書アプリ「かつき」をリリース；クォークのAIメガネが初のOTA配信

2030年までに20万のヨーロッパの銀行職がAIによる脅威にさらされる

Yuan3.0Flash：オープンソースのマルチモーダル基礎大モデルがAIの新トレンドをリード

クーアクAIメガネの初回OTA：AI能力がさらに強化され、図文ノートなどの5つの新機能が追加

小米の大モデル MiMo のパブリックベータテスト延長ユーザーは2026年まで無料体験が可能！

小米の大モデル MiMo のパブリックベータテスト延長ユーザーは2026年まで無料体験が可能！