Best 多模态AI模型 AI Tools & Models - Premium 多模态AI模型 News

AI News

百度重磅推出文心 5.0 大模型，2.4 万亿参数引领全模态 AI 新纪元！

百度发布文心5.0全模态大模型，参数达2.4万亿，具备强大语言理解与生成能力。其采用全模态统一建模技术，可同时处理文本、图像、音频和视频，实现多类型数据的融合优化，标志着AI领域的重要进展。

11.1k 20 minutes ago

从Agent到DeepSeek:英伟达CEO谈AI模型的三大里程碑突破

英伟达CEO黄仁勋在达沃斯论坛上表示，过去一年AI模型层取得三大突破：一是代理式AI的崛起，模型具备复杂推理与计划能力；二是开源模型生态繁荣，如DeepSeek等降低了技术门槛；三是多模态AI的快速发展，推动AI应用更广泛落地。

10.4k 33 minutes ago

视频 AI 迎来“临界点”:可灵 AI 霸榜40国，2025年收入狂揽1.4亿美元

快手旗下可灵AI在2026年初实现爆发式增长，月活跃用户突破1200万，App付费用户环比激增350%。增长主要得益于产品快速迭代，包括2025年底发布的多模态视频模型O1和“音画同出”功能，以及2026年1月推出的“动作控制”新功能，用户可通过图片和动作参考生成视频。

11.9k 5 hours ago

视频 AI 迎来“临界点”:可灵 AI 霸榜40国，2025年收入狂揽1.4亿美元

AI日报：千问全面接入阿里生态；百度文心ERNIE-5.0-0110正式发布；机器人租赁平台擎天租完成融资

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、百度文心ERNIE-5.0-0110正式发布，数学能力全球第二百度最新发布的文心大模型ERNIE-5.0-0110在多项权威评测中表现出色，尤其在数学处理能力上位列全球第二。该工具支持多模态输入、意译优先以及对话式微调，展现了OpenAI在消费者产品领域的战略转型。

23.9k 8 hours ago

AI日报：千问全面接入阿里生态；百度文心ERNIE-5.0-0110正式发布；机器人租赁平台擎天租完成融资

AI Products

LTX-2

LTX-2 是代多模态 AI 视频生成模型。

视频生成

6.2k

Dreamomni2

统一的多模态AI，支持基于指令的图像编辑与生成，超越商业模型。

图片生成

7.6k

Grok 4

Grok 4是xAI推出的革命性AI模型，具备先进的推理能力、多模态功能和专业编码特性。

AI模型

13.3k

OmniGen2

一个强大的统一多模态模型，支持文本到图像生成及图像编辑。

图片生成

13.5k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

MCPollinations

MCPollinations是一个基于Model Context Protocol（MCP）的多模态AI服务，支持通过Pollinations API生成图像、文本和音频。它提供无需认证的轻量级服务，兼容多种AI模型，并支持图像保存和Base64编码返回。

javascript

9.9k

2.5points

Context_engineering_mcp

Context Engineering MCP平台是一个AI上下文管理与优化平台，通过系统化的方法设计、管理和优化AI模型的输入信息，实现提示工程的工程化。平台提供智能分析引擎、优化算法、模板管理等功能，显著提升AI响应质量、降低API成本，并支持多模态内容处理。

python

7.8k

2.5points

Mcp Portal

MCP门户是Model Context Protocol的官方社区平台，提供文档、实践指南、服务器实现、工具集成等资源，支持AI模型通过MCP协议访问外部工具，涵盖从数据库连接到多模态应用等丰富场景。

javascript

8.7k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

百度重磅推出文心 5.0 大模型，2.4 万亿参数引领全模态 AI 新纪元！

从Agent到DeepSeek:英伟达CEO谈AI模型的三大里程碑突破

视频 AI 迎来“临界点”:可灵 AI 霸榜40国，2025年收入狂揽1.4亿美元

AI日报：千问全面接入阿里生态；百度文心ERNIE-5.0-0110正式发布；机器人租赁平台擎天租完成融资

AI Products

LTX-2

Dreamomni2

Grok 4

OmniGen2

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen3-max

wan2.5-i2i-preview

qwen-image-edit

Qwen3 VL 2B Instruct GGUF

LFM2 VL 3B

Qwen2.5 VL 7B Instruct NVFP4

GLM 4.1V 9B Base

Medgemma 4b It GGUF

Cosmos Reason1 7B

Medgemma 4b Pt

Medgemma 27b Text It Unsloth Bnb 4bit

Medgemma 4b It

Llama 4 Maverick 17B 128E Instruct FP8

Llama 4 Scout 17B 16E Instruct

Gemma 3 R1984 4B

Llama 4 Scout 17B 16E Instruct INT4

Llama 4 Scout 17B 16E Instruct FP8

Debiased Llama 4 Scout 17B 16E Instruct

Llama 4 Scout 17B 16E Instruct Bnb 8bit

Llama 4 Scout 17B 16E Unsloth

Llama 4 Maverick 17B 128E Instruct FP8

Meta Llama_Llama 4 Maverick 17B 128E Instruct

Llama 4 Scout 17B 16E Instruct

MCP

MCPollinations

Context_engineering_mcp

Mcp Portal