Best 多模态AI模型 AI Tools & Models - Premium 多模态AI模型 News

AI News

AI日报：黑森林实验室放出Flux3；Claude Opus现已支持语音模式；快手入局AI互动内容赛道

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、黑森林实验室放出Flux3：首个原生生成音频的多模态基础模型，20秒音画同步一次成型黑森林实验室发布的Flux3多模态基础模型，首次实现了原生音频生成，并在音视频同步、图像生成和动作控制方面表现出色，展现了其在人工智能领域的领先地位。8、阿里开源0.8B文档解析模型OvisOCR2，端到端方案登顶OmniDocBench阿里开源的OvisOCR2模型在文档解析领域取得重大突破，以0.8B参数规模实现端到端解析，超越传统流水线方法，为RAG检索、智能问答和企业知识库提供高效支持。

19.2k 16 minutes ago

AI日报：黑森林实验室放出Flux3；Claude Opus现已支持语音模式；快手入局AI互动内容赛道

腾讯混元"合二为一"：多模态与大语言模型部门合并，姚顺雨统管冲全模态上限

据7月24日报道，腾讯于7月23日宣布将混元多模态模型部门与大语言模型部门合并，组建基础模型部，由首席AI科学家姚顺雨统率。此举旨在提升研发与协同效率，全力冲刺全模态模型的智能上限。整合早有伏笔，去年12月姚顺雨已接管大语言模型团队，如今双边归一，意味着腾讯集中资源推动多模态与语言深度融合，加速构建新一代统一基础模型，向全模态智能更高峰迈进。

17k 6 minutes ago

腾讯混元"合二为一"：多模态与大语言模型部门合并，姚顺雨统管冲全模态上限

国产端侧大模型第一次登上全球旗舰：面壁 MiniCPM 装进三星 Galaxy Z Fold8 系列

三星发布三款折叠新机，面壁智能 MiniCPM 端侧大模型首次进入其全球旗舰产品线 Galaxy AI，提供文本理解与多模态感知能力，标志着国产端侧大模型正式跻身国际头部手机厂商核心供应链。

69.4k 4 minutes ago

国产端侧大模型第一次登上全球旗舰：面壁 MiniCPM 装进三星 Galaxy Z Fold8 系列

三星把Gemini戴上了脸： 50 克Galaxy Glasses亮相，没有屏幕却装进了全天候AI眼睛

三星终于动手，将大模型从手机塞进眼镜。7月22日，三星携手谷歌、Gentle Monster与Warby Parker，发布首款AI智能眼镜Galaxy Glasses。它运行Android XR系统，原生集成Gemini多模态大模型，目标打造全天候免提的视觉智能助手。

14.7k 36 minutes ago

三星把Gemini戴上了脸： 50 克Galaxy Glasses亮相，没有屏幕却装进了全天候AI眼睛

AI Products

Catnip AI

Catnip AI

Catnip AI专注实时多模态智能，Cat MaineCoon追求实时视听社交世界模型

Agnes AI

Agnes AI

Agnes AI是AI网关、免费API平台，提供多模态AI模型与应用。

HiAPI

HiAPI

一站式多模态AI API平台，单个密钥即可调用图像、视频、音乐及文本等前沿大模型。

LTX-2

LTX-2

LTX-2 是代多模态 AI 视频生成模型。

Models

GPT-4.1 mini

Openai

GPT-4.1 mini

$2.8

Input tokens/M

$11.2

Output tokens/M

1k

Context Length

Gemini 2.0 Flash-Lite

Google

Gemini 2.0 Flash-Lite

$0.49

Input tokens/M

$2.1

Output tokens/M

1k

Context Length

Grok 4 Fast

Xai

Grok 4 Fast

$1.4

Input tokens/M

$3.5

Output tokens/M

2k

Context Length

o3-mini

Openai

o3-mini

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

GPT-5 Codex

-

Input tokens/M

-

Output tokens/M

-

Context Length

Claude 3 Opus

Anthropic

Claude 3 Opus

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

Gemini 2.0 Flash

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

Input tokens/M

$17.5

Output tokens/M

1k

Context Length

Claude Sonnet 4.5

Anthropic

Claude Sonnet 4.5

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

Claude 3 Sonnet

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

Gemini 2.5 Flash-Lite

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

qwen-image-plus

Alibaba

qwen-image-plus

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen3-coder-plus

Alibaba

qwen3-coder-plus

$4

Input tokens/M

$16

Output tokens/M

1k

Context Length

qwen3-vl-plus

Alibaba

qwen3-vl-plus

$1

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

qwen3-vl-235b-a22b-thinking

$2

Input tokens/M

$20

Output tokens/M

-

Context Length

Qianfan-Lightning

Baidu

Qianfan-Lightning

-

Input tokens/M

-

Output tokens/M

128

Context Length

qwen3-max

Alibaba

qwen3-max

$6

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

wan2.5-i2i-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen-image-edit

Alibaba

qwen-image-edit

-

Input tokens/M

-

Output tokens/M

-

Context Length

MCP

MCPollinations

MCPollinations

MCPollinations是一个基于Model Context Protocol（MCP）的多模态AI服务，支持通过Pollinations API生成图像、文本和音频。它提供无需认证的轻量级服务，兼容多种AI模型，并支持图像保存和Base64编码返回。

context_engineering_mcp

Context_engineering_mcp

Context Engineering MCP平台是一个AI上下文管理与优化平台，通过系统化的方法设计、管理和优化AI模型的输入信息，实现提示工程的工程化。平台提供智能分析引擎、优化算法、模板管理等功能，显著提升AI响应质量、降低API成本，并支持多模态内容处理。

mcp-portal

Mcp Portal

MCP门户是Model Context Protocol的官方社区平台，提供文档、实践指南、服务器实现、工具集成等资源，支持AI模型通过MCP协议访问外部工具，涵盖从数据库连接到多模态应用等丰富场景。

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

© 2026AIBase

Business Cooperation Site Map