谷歌即將在未來幾周發佈AI圖像生成模型Nano Banana2(代號GEMPIX2),其官網公告顯示該模型由DeepMind團隊開發,旨在提升圖像創作效率和精準度,加速谷歌在生成式AI領域的創新進程。
谷歌Labs與DeepMind聯合推出AI工具Pomelli,在美國、加拿大、澳大利亞和新西蘭公開測試。該工具面向中小型企業,通過智能分析網站內容,快速生成符合品牌調性的社交媒體營銷活動,降低營銷門檻,實現專業內容創作。核心功能爲三步構建“商業DNA”。
谷歌推出"Google Skills"學習平臺,開放內部AI實訓資源,整合DeepMind、Google Cloud等團隊精華內容,旨在彌合AI技能鴻溝,提供零門檻學習機會。
谷歌DeepMind推出Veo視頻生成模型的“精確編輯”功能,用戶可通過文本提示添加或刪除視頻元素,智能重建場景保持真實性和連貫性。此次更新推動AI視頻編輯向精細化轉型,提升創作者在Flow平臺的效率。
Google DeepMind推出的最先進的AI天氣預報技術。
Gemini Pro 是 Google DeepMind 推出的高性能 AI 模型,專注於複雜任務處理和編程性能。
Google DeepMind開發的高性能AI模型
用於評估大型語言模型事實性的最新基準
brittlewis12
Gemma 3 4B IT GGUF 是 Google DeepMind 推出的輕量級開源語言模型,基於與 Gemini 模型相同的研究和技術構建。該模型具有 128K 的大上下文窗口,支持超過 140 種語言,採用 GGUF 格式便於在各種設備上部署運行。
Gemma 3 1B IT GGUF 是 Google DeepMind 開發的輕量級開源語言模型的 GGUF 格式版本。該模型基於 Gemma 3 1B IT(指令微調)模型轉換而來,具有 128K 的大上下文窗口,支持超過 140 種語言,適合在資源有限的環境中部署。
Crystalcareai
GemMoE 是基於 Deepmind 的 Gemma 架構的專家混合(MoE)模型,融合了 8 個單獨微調的 Gemma 模型,每個令牌配備 2 個專家,功能強大且易於訓練和推理。
HuggingFaceM4
IDEFICS是Deepmind開發的閉源視覺語言模型Flamingo的開源復現版本,支持多模態輸入(圖像+文本)並生成文本輸出。
IDEFICS 是 Deepmind 開發的閉源視覺語言模型 Flamingo 的開源復現版本,是一個多模態模型,可以接受任意序列的圖像和文本輸入,並生成文本輸出。
IDEFICS是一個開源的多模態模型,能夠處理圖像和文本輸入並生成文本輸出,是Deepmind Flamingo模型的開源復現版本。
IDEFICS-9B是一個90億參數的多模態模型,能夠處理圖像和文本輸入並生成文本輸出,是Deepmind Flamingo模型的開源復現版本。
deepmind
Perceiver IO是一種通用Transformer架構,可處理多種模態數據,本模型專為圖像分類任務設計,在ImageNet數據集上預訓練。
基於ImageNet預訓練的通用視覺感知器模型,採用卷積預處理和Transformer架構,支持圖像分類任務
oandreae
該模型是基於deepmind/language-perceiver在financial_phrasebank數據集上微調的金融文本情感分類模型。
基於BERT的掩碼語言建模任務預訓練,支持處理UTF-8字節輸入的多模態Transformer模型
基於ImageNet預訓練的通用視覺感知器模型,採用學習型位置嵌入處理圖像輸入