谷歌Labs与DeepMind联合推出AI工具Pomelli,在美国、加拿大、澳大利亚和新西兰公开测试。该工具面向中小型企业,通过智能分析网站内容,快速生成符合品牌调性的社交媒体营销活动,降低营销门槛,实现专业内容创作。核心功能为三步构建“商业DNA”。
谷歌推出"Google Skills"学习平台,开放内部AI实训资源,整合DeepMind、Google Cloud等团队精华内容,旨在弥合AI技能鸿沟,提供零门槛学习机会。
谷歌DeepMind推出Veo视频生成模型的“精确编辑”功能,用户可通过文本提示添加或删除视频元素,智能重建场景保持真实性和连贯性。此次更新推动AI视频编辑向精细化转型,提升创作者在Flow平台的效率。
OpenAI副总裁Kevin Weil称GPT-5解决了10个未解Erdős数学问题并推进11个,引发争议。Meta首席AI科学家Yann LeCun批评此为“自作自受”,Google DeepMind CEO Demis Hassabis表示“尴尬”。事件凸显AI能力宣称需谨慎验证。
Google DeepMind推出的最先进的AI天气预报技术。
Gemini Pro 是 Google DeepMind 推出的高性能 AI 模型,专注于复杂任务处理和编程性能。
Google DeepMind开发的高性能AI模型
用于评估大型语言模型事实性的最新基准
brittlewis12
Gemma 3 4B IT GGUF 是 Google DeepMind 推出的轻量级开源语言模型,基于与 Gemini 模型相同的研究和技术构建。该模型具有 128K 的大上下文窗口,支持超过 140 种语言,采用 GGUF 格式便于在各种设备上部署运行。
Gemma 3 1B IT GGUF 是 Google DeepMind 开发的轻量级开源语言模型的 GGUF 格式版本。该模型基于 Gemma 3 1B IT(指令微调)模型转换而来,具有 128K 的大上下文窗口,支持超过 140 种语言,适合在资源有限的环境中部署。
Crystalcareai
GemMoE 是基于 Deepmind 的 Gemma 架构的专家混合(MoE)模型,融合了 8 个单独微调的 Gemma 模型,每个令牌配备 2 个专家,功能强大且易于训练和推理。
HuggingFaceM4
IDEFICS是Deepmind开发的闭源视觉语言模型Flamingo的开源复现版本,支持多模态输入(图像+文本)并生成文本输出。
IDEFICS 是 Deepmind 开发的闭源视觉语言模型 Flamingo 的开源复现版本,是一个多模态模型,可以接受任意序列的图像和文本输入,并生成文本输出。
IDEFICS是一个开源的多模态模型,能够处理图像和文本输入并生成文本输出,是Deepmind Flamingo模型的开源复现版本。
IDEFICS-9B是一个90亿参数的多模态模型,能够处理图像和文本输入并生成文本输出,是Deepmind Flamingo模型的开源复现版本。
deepmind
基于BERT的掩码语言建模任务预训练,支持处理UTF-8字节输入的多模态Transformer模型
基于ImageNet预训练的通用视觉感知器模型,采用卷积预处理和Transformer架构,支持图像分类任务
基于ImageNet预训练的通用视觉感知器模型,采用学习型位置嵌入处理图像输入
oandreae
该模型是基于deepmind/language-perceiver在financial_phrasebank数据集上微调的金融文本情感分类模型。
Perceiver IO是一种通用Transformer架构,可处理多种模态数据,本模型专为图像分类任务设计,在ImageNet数据集上预训练。