谷歌发布基于Gemma3架构的TranslateGemma翻译模型系列,提供4B、12B、27B三种参数规模,支持55种核心语言翻译,并具备多模态图像翻译能力,实现文本与图片文字的无缝翻译。
近日,谷歌在人工智能领域再掀波澜,宣布推出基于Gemma模型的三款全新变体:MedGemma、SignGemma和DolphinGemma。这些模型分别针对医疗、手语翻译和海豚语言研究领域,展现了AI技术在跨领域应用的巨大潜力。以下,AIbase为您详细解读这三款模型的亮点与应用前景。MedGemma:革新医疗AI,助力精准诊疗MedGemma是谷歌专为医疗领域打造的AI模型,提供两个版本以满足不同需求。4B多模态模型能够处理图像与文本的组合任务,经过针对胸部X光片、皮肤科图像、眼科图像和病理切片等医疗数据的预训练,展
["Meta公司最新宣布在Ray-Ban智能眼镜上推出多模态AI功能。","通过眼镜的摄像头和麦克风,实现对用户周围环境的视听感知。","功能包括衣物搭配建议、文本翻译、图像说明等多方面应用。","Beta测试将在美国展开,涵盖照片标注、翻译和摘要等AI功能。"]
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
-
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
$8
$240
52