谷歌DeepMind CEO警告AI创业泡沫,指出初创公司未开展业务就获数百亿美元估值不可持续,应与大型科技公司的基础设施投资区别看待。
DeepMind联合创始人肖恩・莱格预测,未来两年内实现“最小AGI”的概率为50%。最小AGI指能完成多数人类认知任务,而“全AGI”则涵盖人类全部认知能力,包括科学创新与艺术创作。
谷歌DeepMind与英国政府签署协议,将在英国建立材料科学实验室,利用人工智能技术推动该领域研究,应对科学挑战。合作旨在加强双方关系,促进AI在公共部门的应用,提升医疗、教育、交通等领域的创新。
谷歌DeepMind CEO哈萨比斯在Axios AI+峰会上预测,2026年将是多模态AI、互动视频世界和可靠AI代理快速发展的关键一年。他特别提到,其最新模型Gemini在多模态能力上已取得显著进展,不仅能描述情节,还能深入理解场景深层含义。
Google DeepMind旗舰多模态AI,1M上下文,具备博士级推理与高级编码能力
Nano Banana 2 是由 Google DeepMind 开发的专业 AI 图像编辑器。
Google DeepMind推出的最先进的AI天气预报技术。
Gemini Pro 是 Google DeepMind 推出的高性能 AI 模型,专注于复杂任务处理和编程性能。
Google
-
输入tokens/百万
输出tokens/百万
上下文长度
$0.14
$0.28
131
$1
$17.5
$70
2.1k
brittlewis12
Gemma 3 4B IT GGUF 是 Google DeepMind 推出的轻量级开源语言模型,基于与 Gemini 模型相同的研究和技术构建。该模型具有 128K 的大上下文窗口,支持超过 140 种语言,采用 GGUF 格式便于在各种设备上部署运行。
Gemma 3 1B IT GGUF 是 Google DeepMind 开发的轻量级开源语言模型的 GGUF 格式版本。该模型基于 Gemma 3 1B IT(指令微调)模型转换而来,具有 128K 的大上下文窗口,支持超过 140 种语言,适合在资源有限的环境中部署。
Crystalcareai
GemMoE 是基于 Deepmind 的 Gemma 架构的专家混合(MoE)模型,融合了 8 个单独微调的 Gemma 模型,每个令牌配备 2 个专家,功能强大且易于训练和推理。
HuggingFaceM4
IDEFICS是Deepmind开发的闭源视觉语言模型Flamingo的开源复现版本,支持多模态输入(图像+文本)并生成文本输出。
IDEFICS 是 Deepmind 开发的闭源视觉语言模型 Flamingo 的开源复现版本,是一个多模态模型,可以接受任意序列的图像和文本输入,并生成文本输出。
IDEFICS是一个开源的多模态模型,能够处理图像和文本输入并生成文本输出,是Deepmind Flamingo模型的开源复现版本。
IDEFICS-9B是一个90亿参数的多模态模型,能够处理图像和文本输入并生成文本输出,是Deepmind Flamingo模型的开源复现版本。
deepmind
基于BERT的掩码语言建模任务预训练,支持处理UTF-8字节输入的多模态Transformer模型
基于ImageNet预训练的通用视觉感知器模型,采用卷积预处理和Transformer架构,支持图像分类任务
基于ImageNet预训练的通用视觉感知器模型,采用学习型位置嵌入处理图像输入
oandreae
该模型是基于deepmind/language-perceiver在financial_phrasebank数据集上微调的金融文本情感分类模型。
Perceiver IO是一种通用Transformer架构,可处理多种模态数据,本模型专为图像分类任务设计,在ImageNet数据集上预训练。