Best 多模态大模型 AI Tools & Models - Premium 多模态大模型 News

AI News

蚂蚁集团开启“抢人”模式：技术岗占8. 5 成，AI 浓度直接拉满！

蚂蚁集团2026年春招启动，技术岗占比85%，其中超七成聚焦人工智能领域，重点招聘大模型算法、多模态生成等方向，彰显全面向AI进发的战略布局。

11k 5 minutes ago

蚂蚁集团启动2026春季校园招聘：技术岗占比达85%，超七成聚焦AI领域

蚂蚁集团启动2026年度春季校园招聘，技术类岗位占比达85%，其中超70%与人工智能直接相关，聚焦大模型算法、多模态生成、数据智能及AI安全等核心领域。工作地点覆盖全球多个城市。蚂蚁连续六年春招技术类岗位占比超80%，显示其持续加码AI。

10.7k 5 minutes ago

港股 AI 投资进入“收割期”：中美大模型差距缩短至 6 个月，京东、B 站财报揭示商业化爆发路径

中美大模型差距缩小至3-6个月，国产模型正从参数竞赛转向效率优化与多模态融合。行业呈现战略分化：智谱AI专注国产化全栈ToB服务，打造产业AI底座；MiniMax则凭借高营收增速，通过AI原生内容平台布局全球化ToC市场。

11k 7 minutes ago

能自主决定何时“思考”！微软发布 Phi-4 15B 开源模型，主打小型化多模态

微软发布开源多模态大模型Phi-4-reasoning-vision-15B，具备150亿参数。其核心突破是能自主判断任务难度，智能选择快速响应或深度推理，这在轻量级开源模型中罕见。该模型专攻图像描述、界面元素定位和复杂数学推理等高难度任务。

9.3k 6 hours ago

AI Products

MNN-LLM Android App

一款轻量级的多模态语言模型安卓应用。

模型训练与部署

11.7k

Kimi-VL

高效的开源专家混合视觉语言模型，具备多模态推理能力。

AI模型

9.4k

Migician

Migician 是一个专注于多图像定位的多模态大语言模型，能够实现自由形式的多图像精确定位。

AI模型

ChatWise

一款支持多种语言模型的高性能AI聊天工具，提供本地隐私保护和多模态交互功能。

聊天机器人

16.9k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Toolchat

ToolChat是一个通过MCP服务器与大型语言模型(LLM)交互的工具，支持配置多工具服务器并调用特定功能，还能处理多模态输入如图片和文档。

python

6.9k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

蚂蚁集团开启“抢人”模式：技术岗占8. 5 成，AI 浓度直接拉满！

蚂蚁集团启动2026春季校园招聘：技术岗占比达85%，超七成聚焦AI领域

港股 AI 投资进入“收割期”：中美大模型差距缩短至 6 个月，京东、B 站财报揭示商业化爆发路径

​能自主决定何时“思考”！微软发布 Phi-4 15B 开源模型，主打小型化多模态

AI Products

MNN-LLM Android App

Kimi-VL

Migician

ChatWise

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

wan2.5-i2i-preview

qwen3-vl-235b-a22b-thinking

qwen3-max

Qianfan-Lightning

qwen-image-edit

OpenMMReasoner RL

Sarashina2.2 Vision 3b

ERNIE 4.5 VL 28B A3B Thinking AWQ 8bit

SenseNova SI InternVL3 8B

Emu3.5

Gemma 3 27b It Qat Mlx Mxfp4

NVIDIA Nemotron Nano 12B V2 VL NVFP4 QAD

Pacific Prime

Qwen3 VL 8B Thinking AWQ 8bit

Ming Flash Omni Preview

Qwen3vl 8B Thinking 4bit Mlx

Qwen3 VL 4B Instruct NPU

Bee 8B RL

Apriel 1.5 15b Thinker GGUF

Apriel 1.5 15b Thinker AWQ 8bit

Apriel 1.5 15b Thinker GGUF

PaDT_Pro_3B

Ming UniVision 16B A3B

Qwen3 Omni 30B A3B Thinking INT8FP16

Apriel 1.5 15b Thinker

MCP

Toolchat

能自主决定何时“思考”！微软发布 Phi-4 15B 开源模型，主打小型化多模态