高解像度AIモデルGriffon v2：テキストとビジュアル参照の柔軟性

站长之家

公開日AIニュース · 1 分で読めます · Mar 19, 2024

145

Griffon v2 AIモデル

最新の超高解像度AIモデル、Griffon v2は、テキストと視覚的な手がかりを組み合わせることで、柔軟なオブジェクト参照を実現しました。チームは、ダウンサンプリングプロジェクターを用いることで、マルチモーダルな認識能力を向上させました。このモデルは、参照表現生成、フレーズ位置特定、参照表現理解といったタスクにおいて、専門家モデルを上回る優れた性能を示しています。視覚言語コアファレンス構造を備え、物体検出や物体カウントにおいても卓越した能力を発揮します。

Griffon AIモデル参照

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

バイトダンスAIのコア人事情報：ビジュアルマルチモーダル責任者である楊建朝が一時的な休暇を発表

字节跳動のAI責任者楊建朝が個人事情で退任、後任は元Alibabaの周暢。楊氏は2018年からAI開発を主導、後任の周氏は復旦・北大出身の専門家。チーム安定性への懸念も、Seedチームのグローバル体制は継続。....

Jul 17, 2025

Anthropicの評価が倍増し、千億円を突破。AI収入が4倍に急増

Anthropicの評価額は1000億ドルに急騰、4ヶ月でほぼ倍増。年収40億ドル突破、収益成長率は4倍。35億ドル調達済みでさらに55億ドル計画。収益の60%はAIモデルとClaudeチャットボットから、粗利益率50-55%。Claude Codeは300万DL。OpenAIより効率的な成長モデルを示す。....

Jul 17, 2025

AIニュース: 12306 MCP Serverがリリース；BaiduがAI検索アシスタントTizzy.aiを発表；ChatGPTの音声録音モードがPlusユーザー向けに解放

1.百度が無広告AI検索「Tizzy.ai」をリリース。2.12306が列車検索エンジンをオープンソース化。3.ChatGPT音声機能をPlusユーザーに開放。4.5分でWebアプリ構築可能なSaaSテンプレート「FireGEO」登場。5.GitHubドキュメント生成ツール「ReadMeX」無料公開。6.百度AIにビデオ通話機能追加。7.成長型AIデジタルパートナー「ベラ」発表。8.OpenAIがレポート自動作成機能を準備中。9.MidJourneyが企業向けAPI提供予定。10.MiniMaxが自然言語でECサイト構築可能に。11.Claude Sonnet4モデルが再リリース。....

Jul 17, 2025

AIが言語のコミュニケーションに与える影響！私たちの日常的な会話はますますGPT用語が増えている

ドイツ研究で、AIが人間の言語に影響を与え、ChatGPTなどのツールが「GPT語彙」を生み出していることが判明。AIが好む語彙の使用増加が確認され、人間は無意識にAIの言語パターンを模倣していることが示された。....

Jul 17, 2025

AIユニコーンのMiniMaxが香港株式市場向けにIPO申請を秘密裡に提出、目標評価額は40億ドルを超えている

中国AI企業MiniMaxが香港IPOを秘密裏に申請、目標評価額40億ドル超。上海国有基金主導で3億ドル調達済み。汎用AIプラットフォーム開発に注力。....

Jul 17, 2025

WindsurfがClaude Sonnet 4モデルを再リリース

AIコードツールのWindsurfは、AnthropicのClaude Sonnet 4モデルを再リリースしたことを発表しました。Proユーザーには月に250回の呼び出し権限（2倍のクレジット消費）が提供されます。このモデルはSWE-benchテストで72.7%の成績を誇り、200Kトークンのコンテキストウィンドウをサポートし、コード生成や複雑なリファクタリングなどの機能が可能です。以前はAnthropicによる直接アクセスの制限により、WindsurfはBYOK方案を導入していました。今回の協力再開は、

Jul 17, 2025

小米の新機能　素早く車を探す：自動撮影 + AI認識

小米自動車は「クイック車検索」機能を発表、YU7モデルに初適用。AI画像認識で駐車位置を自動記録し、アプリや音声で検索可能。大型駐車場での車探しを解決。....

Jul 17, 2025

Anthropic の評価が100億ドルに急騰、年収は4倍に増加

AIスタートアップAnthropicの評価額が1000億ドル突破、4ヶ月で2倍に。年収40億ドル超（Claudeチャットボット等、粗利益率60%）。資金調達55億ドル計画中だが、クラウド事業は赤字。投資家から高い評価を受ける。....

Jul 17, 2025

グーグル DeepMind が MoR アーキテクチャを発表：大規模言語モデルの効率を大幅に向上させる可能性

DeepMindがMoRアーキテクチャを開発。動的トークンルーティングと再帰的深さ割り当てで効率化し、360M規模以上でTransformerを上回る性能を達成。選択的キャッシュでメモリ負荷低減、大規模言語モデル向け効率的ソリューションを提供。....

Jul 17, 2025

ChatGPTに音声変換機能が追加！オフィスの強力なツールで会議の要点を簡単に記録

OpenAIはmacOS有料ユーザー向けにChatGPT音声文字起こし機能をリリース。120分の録音を文字化し、タイムスタンプ付きの記録と要約を自動生成。GPT-4o契約者のみ利用可能で、録音データは自動削除される（改善オプション有効時を除く）。企業/教育ユーザーはデフォルトでトレーニング対象外。Windows/Android/Web版は未対応。....

Jul 17, 2025

AIツールを探す

AIツールを提出

AI モデル検索

MCPサーバー

MCPクライアント

MCPインスペクター

ケーススタディ

最新AIニュース

AI日刊要約

高解像度AIモデルGriffon v2：テキストとビジュアル参照の柔軟性

站长之家

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

バイトダンスAIのコア人事情報：ビジュアルマルチモーダル責任者である楊建朝が一時的な休暇を発表

Anthropicの評価が倍増し、千億円を突破。AI収入が4倍に急増

AIニュース: 12306 MCP Serverがリリース；BaiduがAI検索アシスタントTizzy.aiを発表；ChatGPTの音声録音モードがPlusユーザー向けに解放

AIが言語のコミュニケーションに与える影響！私たちの日常的な会話はますますGPT用語が増えている

AIユニコーンのMiniMaxが香港株式市場向けにIPO申請を秘密裡に提出、目標評価額は40億ドルを超えている

WindsurfがClaude Sonnet 4モデルを再リリース

小米の新機能　素早く車を探す：自動撮影 + AI認識

Anthropic の評価が100億ドルに急騰、年収は4倍に増加

グーグル DeepMind が MoR アーキテクチャを発表：大規模言語モデルの効率を大幅に向上させる可能性

ChatGPTに音声変換機能が追加！オフィスの強力なツールで会議の要点を簡単に記録

AIツールを探す

AIツールを提出

AI モデル検索

MCPサーバー

MCPクライアント

MCPインスペクター

ケーススタディ

最新AIニュース

AI日刊要約

高解像度AIモデルGriffon v2：テキストとビジュアル参照の柔軟性

站长之家

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

バイトダンスAIのコア人事情報：ビジュアルマルチモーダル責任者である楊建朝が一時的な休暇を発表

Anthropicの評価が倍増し、千億円を突破。AI収入が4倍に急増

AIニュース: 12306 MCP Serverがリリース；BaiduがAI検索アシスタントTizzy.aiを発表；ChatGPTの音声録音モードがPlusユーザー向けに解放

AIが言語のコミュニケーションに与える影響！私たちの日常的な会話はますますGPT用語が増えている

AIユニコーンのMiniMaxが香港株式市場向けにIPO申請を秘密裡に提出、目標評価額は40億ドルを超えている

WindsurfがClaude Sonnet 4モデルを再リリース

小米の新機能 素早く車を探す：自動撮影 + AI認識

Anthropic の評価が100億ドルに急騰、年収は4倍に増加

グーグル DeepMind が MoR アーキテクチャを発表：大規模言語モデルの効率を大幅に向上させる可能性

ChatGPTに音声変換機能が追加！オフィスの強力なツールで会議の要点を簡単に記録

小米の新機能　素早く車を探す：自動撮影 + AI認識