Google DeepMindがGemini 3.5 Flashにネイティブなコンピューター操作能力を統合。単一モデルでブラウザ、スマホ、デスクトップを横断し画面を見て自律操作するAIエージェントを構築可能に。モデル切り替えや文脈受け渡しが不要になり、クロスプラットフォームの長いタスク実行を簡素化。....
グーグルDeepMindが7500万ドルを投じ、独立系製作会社A24と提携。企画段階から映像制作AIツールを共同開発し、テック大手とトップクリエイターの直接協業を初めて実現。『エブリシング・エブリウェア・オール・アット・ワンス』で知られるA24と共に、クリエイター支援の新AI機能創出を目指す。....
グーグルのAI研究所DeepMindは、独立系映画会社A24と7500万ドルの戦略的提携を発表。映画製作向けAIツールを共同開発し、最前線のAI技術をハリウッドの創作現場に導入。DeepMindは開発に深く関与し、トップアーティストから直接フィードバックを得る。....
6月20日、ノーベル賞受賞者のジョン・ジャンパーがグーグルDeepMindを退職し、Anthropicに移籍。ハサビスと共にAlphaFoldを開発し、タンパク質構造予測に革命を起こした。AI人材争奪戦の激化が浮き彫りに。....
Veo 4 は Google DeepMind の AI 動画生成と画像編集プラットフォームです。
Google DeepMindの旗艦的なマルチモーダルAIで、100万トークンのコンテキストを持ち、博士レベルの推論能力と高度なコーディング能力を備えています。
Nano Banana 2 は Google DeepMind が開発したプロフェッショナルな AI 画像編集ツールです。
Google DeepMindが開発した、最先端のAI天気予報技術です。
Google
-
入力トークン/百万
出力トークン/百万
コンテキスト長
$0.14
$0.28
131
$1
$17.5
$70
2.1k
brittlewis12
Gemma 3 4B IT GGUFはGoogle DeepMindが開発した軽量オープンソース言語モデルで、Geminiモデルと同じ研究と技術に基づいて構築されています。このモデルは128Kの大きなコンテキストウィンドウを持ち、140種類以上の言語をサポートし、GGUF形式を採用しているため、さまざまなデバイスでの展開と実行が容易です。
Gemma 3 1B IT GGUFは、Google DeepMindが開発した軽量オープンソース言語モデルのGGUF形式のバージョンです。このモデルは、Gemma 3 1B IT(命令微調整)モデルを基に変換され、128Kの大きなコンテキストウィンドウを持ち、140種類以上の言語をサポートし、リソースが限られた環境でのデプロイに適しています。
Crystalcareai
GemMoEは、Deepmindのジェンマアーキテクチャに基づく専門家混合(MoE)モデルであり、8つの個別に微調整されたジェンマモデルを融合し、各トークンに2人の専門家を備えており、強力でトレーニングと推論が容易です。
HuggingFaceM4
IDEFICSはDeepmindが開発したクローズドソースの視覚言語モデルFlamingoのオープンソース再現版で、マルチモーダル入力(画像+テキスト)をサポートし、テキスト出力を生成します。
IDEFICSはDeepmindが開発したクローズドソースの視覚言語モデルFlamingoのオープンソース再現版で、任意のシーケンスの画像とテキスト入力を受け取り、テキスト出力を生成できるマルチモーダルモデルです。
IDEFICSはオープンソースのマルチモーダルモデルで、画像とテキスト入力を処理しテキスト出力を生成できます。Deepmind Flamingoモデルのオープンソース再現版です。
IDEFICS-9Bは90億パラメータのマルチモーダルモデルで、画像とテキスト入力を処理しテキスト出力を生成できます。DeepmindのFlamingoモデルのオープンソース再現版です。
oandreae
このモデルはdeepmind/language-perceiverをfinancial_phrasebankデータセットでファインチューニングした金融テキスト感情分類モデルです。
deepmind
BERTに基づくマスク言語モデリングタスクで事前学習され、UTF - 8バイト入力をサポートするマルチモーダルTransformerモデル
ImageNetで事前学習された汎用ビジュアルパーサーバーモデルで、学習型位置埋め込みを用いて画像入力を処理します。
ImageNetで事前学習された汎用視覚パーシバーモデルで、畳み込み前処理とトランスフォーマーアーキテクチャを採用し、画像分類タスクをサポート
Perceiver IOは、複数のモーダルデータを処理できる汎用Transformerアーキテクチャです。このモデルは画像分類タスク用に設計され、ImageNetデータセットで事前学習されています。