谷歌于12月1日推出Gemini 3大模型,接入搜索AI模式,覆盖近120个国家地区,向AI Pro与Ultra订阅用户开放。同时上线Nano Banana Pro图像模型,支持2K/4K分辨率、精准文本渲染及专业级摄影控制,定价1080p为0.139美元、4K为0.24美元。Gemini 3采用原生多模态架构,统一处理文本、图像、音频和视频。
中国推出多模态AI模型DeepEyesV2,能分析图像、执行代码和网络搜索。它通过智能利用外部工具,而非依赖训练数据,性能超越大型模型。早期实验显示,仅靠强化学习无法稳定完成多模态任务,模型曾尝试编写Python代码分析图像但效果不佳。
百度推出“百度猎户座”AI引擎,首次全面开放其25年搜索技术与AI能力。该引擎整合搜索AI API、多模态计算平台及行业优势,为企业与开发者提供丰富工具资源,简化接入流程,实现原生能力调用,标志着百度AI技术应用的重要进展。
美团正式发布自研LongCat大模型官方App,支持安卓和iOS系统下载。该应用具备联网搜索、语音通话功能,未来还将加入视频通话。通过文本处理和多模态理解技术,帮助用户高效获取信息,体现美团在人工智能领域的重要进展。
AI多模态搜索,将你的想法变为互动结果。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
-
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$2
$20
$6
$24
$8
$240
52
pySilver
Marqo-FashionSigLIP 是一款多模态嵌入模型,专为时尚产品搜索优化,相比 FashionCLIP 在 MRR 和召回率上提升了57%。
Styld
基于ViT-B-16-SigLIP微调的时尚多模态检索模型,专注于时尚产品搜索
Marqo
Marqo-FashionSigLIP 是一种多模态嵌入模型,专为时尚产品搜索优化,相比 FashionCLIP 在 MRR 和召回率上提升了57%。
Marqo-FashionCLIP 是一个基于 CLIP 架构的时尚领域多模态检索模型,通过广义对比学习在时尚产品搜索任务上达到最先进性能。
Video Editor MCP是一个视频编辑服务器,提供视频上传、搜索、生成和编辑功能,支持通过LLM和Video Jungle平台进行操作。
联网搜索MCP是基于腾讯云联网搜索API封装的服务,提供毫秒级响应、分钟级更新的智能搜索能力,支持自然结果检索、多模态VR卡等多种功能,帮助开发者快速集成互联网搜索能力。
ChainFETCH MCP服务器提供对以太坊区块链智能平台的API访问,集成AI语义搜索、实时区块流和多模态查询功能,支持地址、交易、区块、代币和智能合约的全面分析。