欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、淘宝天猫出重拳!新版Siri将支持语音与文本双输入,并集成于iOS27及其全线操作系统中,同时借助谷歌Gemini模型提升性能。
谷歌更新“趋势探索”工具,引入Gemini AI技术,实现从手动搜索到智能洞察的转变。新版工具能自动识别和深度关联热门话题,帮助用户更高效地探索趋势。更新已在桌面端全球逐步推出。
苹果计划今年春季升级Siri,引入谷歌Gemini技术,使其更智能、个性化。新功能包括情感支持、行程预订和故事讲述,Siri将以更自然的对话方式回答各类问题。
苹果选定谷歌Gemini大模型作为下一代Siri核心引擎,预计2026年下半年随iOS20推出。此举标志着苹果在生成式AI落地迈出关键一步,并打破两家公司在核心AI技术上长期各自为营的局面。消息公布后,谷歌股价盘中涨幅超1%,总市值首次突破4万亿美元,苹果股价亦受提振。
基于Gemini 3 Pro图像预览技术的专业AI图像生成器,免费上手
LNBP由Nano Banana Pro驱动,可创建2K、4K图像,借助Gemini 3.0 Pro技术。
Gemma 3 是基于 Gemini 2.0 技术的轻量级、高性能开源模型,专为单 GPU 或 TPU 设备设计。
一个集成了Gemini多模态直播和WebRTC技术的单文件应用
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
$7.7
$30.8
200
$0.7
$17.5
Alibaba
$8
$240
52
Tencent
-
$0.4
128
$1.75
$14
400
Anthropic
$105
$525
Iflytek
$2
$140
$280
32
$3
$9
16
prithivMLmods
Gemma 3 270M是谷歌推出的轻量级多模态模型,基于与Gemini系列相同的研究技术,支持文本和图像输入,具有32K上下文窗口,在问答、总结、图像理解和代码生成等任务上提供高质量输出。
unsloth
Gemma 3是Google推出的轻量级、最先进的开源模型家族,基于与Gemini模型相同的研究和技术构建。该模型具有多模态处理能力,支持文本和图像输入,并生成文本输出,适用于各种文本生成和图像理解任务。
Gemma 3是谷歌推出的轻量级、最先进的开放模型家族,基于与Gemini模型相同的研究和技术构建。具有多模态处理能力,支持文本和图像输入,并生成文本输出,适用于各种文本生成和图像理解任务。
Gemma 3是谷歌推出的轻量级、最先进的开源多模态模型家族,基于与Gemini模型相同的研究和技术构建。该270M版本是经过指令调优的模型,采用量化感知训练(QAT),能够在显著降低内存需求的同时保持与bfloat16相近的质量。
Gemma 3是谷歌推出的轻量级开源多模态模型系列,基于与Gemini相同技术构建。270M版本是其中最小规模模型,支持文本和图像输入,具备128K上下文窗口,适用于资源受限环境部署。
Gemma 3是谷歌推出的轻量级开源多模态模型家族,基于与Gemini相同的研究技术构建。270M版本是其中最小的指令微调模型,支持140多种语言,具有32K上下文长度,适用于资源受限环境下的文本生成任务。
Gemma 3是谷歌推出的轻量级、最先进的开源多模态模型家族,基于与Gemini模型相同的研究和技术构建。270M版本是其中最小的模型,能够处理文本和图像输入并生成文本输出,适用于多种文本生成和图像理解任务。
google
Gemma 3是Google推出的轻量级、最先进的多模态开放模型家族,基于与Gemini模型相同的研究和技术构建。该模型能够处理文本和图像输入并生成文本输出,具有128K的大上下文窗口,支持超过140种语言,提供从270M到27B的多种尺寸选择。
Gemma 3n是谷歌推出的轻量级、最先进的多模态开放模型,基于Gemini技术构建。专为低资源设备设计,支持文本、图像、视频和音频输入,生成文本输出。采用选择性参数激活技术,在4B参数规模下高效运行。
Gemma 3n-E2B-it 是 Google 推出的轻量级开源多模态模型,基于与 Gemini 相同技术构建,专为低资源设备优化。
Gemma 3n是Google推出的轻量级、最先进的开源多模态模型家族,基于与Gemini模型相同的研究和技术构建。支持文本、音频和视觉输入,适用于多种任务。
Gemma 3n是Google推出的轻量级、最先进的开源多模态模型家族,基于与Gemini模型相同的研究和技术构建,支持文本、音频和视觉输入。
iqbalamo93
Gemma 3是谷歌推出的轻量级多模态模型,基于与Gemini相同的技术构建。它支持文本和图像输入,输出文本,适用于文本生成和图像理解等多种任务,且模型尺寸多样,能在资源有限的环境中部署。
Gemma 3是Google推出的轻量级开放模型系列,基于Gemini技术构建,支持多模态输入和文本输出。
Gemma 3是谷歌基于Gemini技术构建的轻量级开放模型系列,12B版本采用量化感知训练(QAT)技术,支持多模态输入和128K上下文窗口。
Gemma 3是谷歌推出的轻量级、最先进的开放模型家族,基于与Gemini模型相同的研究和技术构建。该27B版本采用量化感知训练(QAT),能够在显著降低内存需求的同时保持与bfloat16相近的质量,具备多模态处理能力和128K大上下文窗口。
Gemma 3是Google基于Gemini技术构建的轻量级开放模型系列,支持多模态输入和文本输出,具有128K大上下文窗口和140+语言支持。
Gemma 3是谷歌推出的轻量级前沿开放模型系列,基于Gemini模型技术构建,支持多模态输入和文本输出。
Gemma 3是谷歌推出的轻量级先进开放模型系列,基于创建Gemini模型的相同研究和技术构建。该模型是多模态的,能够处理文本和图像输入并生成文本输出。
Gemma 3是Google推出的轻量级开放模型系列,基于创建Gemini模型的研究和技术构建。12B版本是经过指令调优的多模态模型,支持文本和图像输入,生成文本输出。
基于Gemini API的文档查询MCP服务器,提供技术文档的智能问答服务。
该项目实现了一个基于Gemini API的MCP服务器,提供对多种技术文档的访问能力。通过2M tokens的大上下文窗口,无需传统RAG系统的分块或检索步骤,直接处理完整文档。支持查询文档、检查代码规范、解决问题提示等功能,适用于Roo/Cline环境。
一个包含多种AI代理和RAG技术的示例项目,涵盖Gemini应用、MCP服务、Flutter应用及Vertex AI集成,提供从基础到高级的AI开发示例。
一个结合Gemini AI、Stack Overflow和Perplexity AI的代码问题智能辅助解决方案服务器,提供多源技术分析和代码修复建议
基于Gemini API的深度思考与分析服务器,提供多角度问题分析、批判性与创造性思维整合、代码质量评估及优化建议,支持技术决策与解决方案设计。
该项目利用高级AI提示技术,通过Model Context Protocol (MCP)让AI代理(基于Google Gemini模型)与Windows传统应用MSPaint交互,解决复杂数学问题并在画布上绘制解决方案。