Best 多模态支持 AI Tools & Models - Premium 多模态支持 News

AI News

AI日报：MiniMax Code 2.0桌面端发布；Kimi K3模型预热视频流出；通义千问正式接入苹果生态

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、灵光App“灵光圈”社区焕新:上线热榜、关注等功能，PC端支持导入文档及音视频素材灵光App对灵光圈社区进行功能升级，新增热榜、编辑精选和关注创作者等功能，同时在PC端支持多模态文件的上传与应用生成，提升了AI应用的发现效率和创作体验。8、OpenAI发布首款联名硬件CodexMicro键盘230美元还会发光OpenAI正式进军硬件领域，推出首款联名产品CodexMicro键盘，同时透露正在研发一款便携智能音箱，进一步展示其在AI硬件上的布局和野心。

11.3k 4 minutes ago

AI日报：MiniMax Code 2.0桌面端发布；Kimi K3模型预热视频流出；通义千问正式接入苹果生态

灵光App“灵光圈”社区焕新:上线热榜、关注等功能，PC端支持导入文档及音视频素材

蚂蚁集团灵光App旗下社区“灵光圈”近日升级，新增热榜、精选及关注功能，PC端支持文档、图片等多模态文件上传，用户可基于本地内容生成智能问答或AI应用，显著提升应用发现效率与创作体验。

11.6k 7 minutes ago

灵光App“灵光圈”社区焕新:上线热榜、关注等功能，PC端支持导入文档及音视频素材

Meta被曝研发全天候AI眼镜：支持超级感知与无感音视频捕捉

Meta正研发一款全天候多模态感知智能眼镜原型，支持“超级感知”，每隔几秒自动录音和拍照，用户可通过Meta AI对获取内容即时提问。为消除隐私顾虑，设备不保存原始音视频，只提取元数据上传。

14.4k 57 minutes ago

字节跳动火山引擎 2026 大会重磅发布：Seedance 2.5 直出 30 秒视频，豆包 2.1 Pro 对标 Opus 4.6

字节跳动发布视频生成模型Seedance2.5，支持单次直出30秒完整视频，标志视频生成迈入长序列时代。同时推出多模态模型豆包Seed2.1及图像模型Seeddream5.0，提升其在AI领域的竞争力。

73.8k 7 minutes ago

字节跳动火山引擎 2026 大会重磅发布：Seedance 2.5 直出 30 秒视频，豆包 2.1 Pro 对标 Opus 4.6

AI Products

Seedance 2.5 bingo

一款支持多模态输入、可单次生成30秒原生4K画质及同步音频的AI视频生成器。

视频生成

Camika

AI驱动的多模态内容创作平台，支持漫画、漫剧、MV等创作。

AI设计工具

4.6k

Seedance 2.5 AI

Seedance 2.5 是一款支持多模态输入、可生成带原生同步音效的 4K 超清 AI 视频生成器。

视频生成

3.9k

Gemini Omni Flash

谷歌原生多模态AI视频生成与编辑工具，支持文本、图像和音频一键同步创作。

视频生成

7.9k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

MCPollinations

MCPollinations是一个基于Model Context Protocol（MCP）的多模态AI服务，支持通过Pollinations API生成图像、文本和音频。它提供无需认证的轻量级服务，兼容多种AI模型，并支持图像保存和Base64编码返回。

javascript

11k

2.5points

Websearchmcp

联网搜索MCP是基于腾讯云联网搜索API封装的服务，提供毫秒级响应、分钟级更新的智能搜索能力，支持自然结果检索、多模态VR卡等多种功能，帮助开发者快速集成互联网搜索能力。

11.7k

2.5points

Ai Vision Mcp

一个基于Google Gemini和Vertex AI的AI视觉分析MCP服务器，支持图像和视频的多模态分析，提供对象检测、图像比较等功能，可集成到多种MCP客户端中。

typescript

10k

2.5points

Context_engineering_mcp

Context Engineering MCP平台是一个AI上下文管理与优化平台，通过系统化的方法设计、管理和优化AI模型的输入信息，实现提示工程的工程化。平台提供智能分析引擎、优化算法、模板管理等功能，显著提升AI响应质量、降低API成本，并支持多模态内容处理。

python

8.8k

2.5points

Ollama Mcp Server

Ollama MCP Server是一个连接Ollama本地大语言模型和模型上下文协议(MCP)的桥梁工具，提供完整的API集成、模型管理和执行功能，支持OpenAI兼容的聊天接口和视觉多模态模型。

typescript

14.1k

2.5points

Pollinations Multimodal

一个基于Pollinations API的多模态MCP服务器，支持生成图像、文本和音频内容

javascript

2.5points

Frame0 Mcp Server

Frame0 MCP Server是一个为Frame0线框图工具提供的多模态控制协议服务，支持通过自然语言指令创建和修改线框图。

typescript

10.3k

2.5points

DataBridge

Morphik MCP是一个多模态数据库交互协议服务器，支持文档管理、检索和文件系统操作

typescript

10.2k

2.5points

Mcp Portal

MCP门户是Model Context Protocol的官方社区平台，提供文档、实践指南、服务器实现、工具集成等资源，支持AI模型通过MCP协议访问外部工具，涵盖从数据库连接到多模态应用等丰富场景。

javascript

10.5k

2.5points

Openrouter Mcp Multimodal

OpenRouter MCP多模态服务器是一个通过OpenRouter.ai提供文本聊天和图像分析功能的协议服务器，支持多种模型选择和性能优化。

typescript

9.7k

2.5points

Acp Mcp Server

ACP-MCP-Server是一个桥接服务器，连接代理通信协议(ACP)代理和模型上下文协议(MCP)客户端，实现AI代理与MCP兼容工具(如Claude Desktop)的无缝集成。

python

9.9k

2.0points

Mcp Context Server

一个高性能的MCP服务器，为LLM代理提供持久化的多模态上下文存储，支持线程隔离、元数据过滤、全文搜索和语义搜索，兼容SQLite和PostgreSQL后端。

python

6.1k

2.0points

Whatsapp Bot Mcp

NiagaBot是基于Qwen3-Omni AI的智能WhatsApp商业自动化机器人，支持多模态消息处理、群组管理、批量广播和数据分析等功能

javascript

11.2k

2.0points

MCP To Langchain Addapter

该项目提供了一个适配器，用于将MCP（多模态对话程序）服务器的工具无缝集成到LangChain和LangGraph应用中，支持在AI应用管道中使用MCP工具。

python

9.4k

2.0points

Mcp Server Pixeltable

该项目为Pixeltable的多模态模型上下文协议服务器集合，提供音频、视频、图像和文档的索引与查询服务，支持Docker本地部署。

python

12k

2.0points

Chainfetch Mcp Server

ChainFETCH MCP服务器提供对以太坊区块链智能平台的API访问，集成AI语义搜索、实时区块流和多模态查询功能，支持地址、交易、区块、代币和智能合约的全面分析。

javascript

2.0points

Toolchat

ToolChat是一个通过MCP服务器与大型语言模型(LLM)交互的工具，支持配置多工具服务器并调用特定功能，还能处理多模态输入如图片和文档。

python

10.6k

2.0points

Rag Anything Mcp

RAG Anything MCP Server是一个提供全面检索增强生成(RAG)能力的模型上下文协议服务器，支持多模态文档处理与查询，具备端到端文档解析、批量处理、高级查询及持久化存储等功能。

python

12.5k

2.0points

Geminimcpserver

GeminiMcpServer是一个连接LM Studio与Google Gemini API的MCP服务器，支持图像生成和多模态任务处理。

javascript

19.4k

2.0points

MaxKB

MaxKB是一款开源的AI助手，专为企业设计，支持RAG流程、工作流引擎和多模态交互，适用于智能客服、知识库等场景。

python

32k

No rating available

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

AI日报：MiniMax Code 2.0桌面端发布；Kimi K3模型预热视频流出；通义千问正式接入苹果生态

灵光App“灵光圈”社区焕新:上线热榜、关注等功能，PC端支持导入文档及音视频素材

Meta被曝研发全天候AI眼镜：支持超级感知与无感音视频捕捉

字节跳动火山引擎 2026 大会重磅发布：Seedance 2.5 直出 30 秒视频，豆包 2.1 Pro 对标 Opus 4.6

AI Products

Seedance 2.5 bingo

Camika

Seedance 2.5 AI

Gemini Omni Flash

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

wan2.5-i2i-preview

Qianfan-Lightning

qwen-image-edit

Qwen3 VL 4B Thinking Gguf

Gemma 3n E4B It Heretic GGUF

Qwen3 VL 4B Instruct 4bit GPTQ

Gemma 3 12b It Qat Mlx Mxfp4

Sarashina2.2 Vision 3b

Qwen3 VL 30B A3B Instruct Q8_0 GGUF

Huihui Mistral Small 3.2 24B Instruct 2506 Abliterated V2 GGUF

Huihui Qwen3 VL 4B Instruct Abliterated GGUF

Qwen3 VL 2B Thinking MLX 8bit

Qwen3 VL 2B Thinking GGUF

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 4B Instruct GGUF

Qwen3 VL 2B Instruct GGUF

Qwen3 VL 4B Instruct GGUF

Qwen_Qwen3 VL 2B Instruct GGUF

Qwen3 VL 2B Instruct GGUF

Gemma 3 27b It Qat Mlx Mxfp4

Next 12b

Everos

Unsloth Magistral Small 2509 Mlx Mxfp4

MCP

MCPollinations

Websearchmcp

Ai Vision Mcp

Context_engineering_mcp

Ollama Mcp Server

Pollinations Multimodal

Frame0 Mcp Server

DataBridge

Mcp Portal

Openrouter Mcp Multimodal

Acp Mcp Server

Mcp Context Server

Whatsapp Bot Mcp

MCP To Langchain Addapter

Mcp Server Pixeltable

Chainfetch Mcp Server

Toolchat

Rag Anything Mcp

Geminimcpserver

MaxKB