Best 多模态任务 AI Tools & Models - Premium 多模态任务 News

AI News

豆包大模型 2.0 正式上线推理成本降一个数量级 API 同步开放

火山引擎推出豆包大模型2.0系列，面向企业和开发者提供API服务，个人用户可通过指定平台体验。该版本针对生产环境优化，具备高效推理、多模态理解与复杂指令执行能力，能更好处理真实世界任务，推理成本显著降低，日均使用量已大幅增长。

18.1k 6 hours ago

AI基础设施变天了！质变科技发布首个多模态记忆湖MemoryLake：模型不再“健忘”，决策更有底气

质变科技发布多模态记忆平台MemoryLake，推动AI基础设施从“以数据为中心”转向“以记忆为中心”。该平台旨在解决大模型在复杂任务中知识缺失、幻觉等问题，通过记忆机制提升AI的认知与决策能力，标志着AI向认知智能演进的关键一步。

12.3k 23 hours ago

君逸数码推出全新 AI 智能体平台，助力政务与交通行业智能化升级！

君逸数码推出自研AI智能体平台，面向政企客户。平台集成多模态数据分析、智能知识库、精准问答与任务自主执行等功能，旨在提升行业智能化水平。该平台与Deepseek等主流大模型深度结合，可应用于智慧城市、政府事务及交通管理等领域。

9.5k 3 days ago

Kimi 进化！发布 K2.5 模型：视觉理解、代码复现与“Agent 集群”协同

月之暗面开源Kimi K2.5模型，该模型在视觉、代码及通用任务上达到开源领先水平，通过原生多模态设计实现从对话到复杂任务执行的进化。其突破在于低交互门槛，用户可通过上传拍照、截图或录屏让模型直接理解背后逻辑，例如在前端开发中仅凭录屏即可完成任务。

22.4k 22 hours ago

Kimi 进化！发布 K2.5 模型：视觉理解、代码复现与“Agent 集群”协同

AI Products

Sup AI

消除幻觉，多模态RAG不忘信息，智能编排前沿模型，任务表现卓越

开发平台

4.1k

Magma

Magma 是一个能够理解和执行多模态输入的基础模型，可用于复杂任务和环境。

智能体

9.9k

Ferret-UI-Llama8b

基于Llama-3-8B的多模态大型语言模型，专注于UI任务。

AI模型

9.7k

NVLM

前沿级多模态大型语言模型，实现视觉-语言任务的先进性能。

AI模型

10k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

MCP

Geminimcpserver

GeminiMcpServer是一个连接LM Studio与Google Gemini API的MCP服务器，支持图像生成和多模态任务处理。

javascript

13.3k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

豆包大模型 2.0 正式上线 推理成本降一个数量级 API 同步开放

AI基础设施变天了！质变科技发布首个多模态记忆湖MemoryLake：模型不再“健忘”，决策更有底气

君逸数码推出全新 AI 智能体平台，助力政务与交通行业智能化升级！

​Kimi 进化！发布 K2.5 模型：视觉理解、代码复现与“Agent 集群”协同

AI Products

Sup AI

Magma

Ferret-UI-Llama8b

NVLM

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

wan2.5-i2i-preview

Qianfan-Lightning

qwen3-max

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Gemma 3n E4B It Heretic GGUF

Qwen3 VL 4B Instruct 4bit GPTQ

Vae Lyra

Nutrient Gram Qwen 3 Vl 2b

Qwen3 VL 30B A3B Instruct Q8_0 GGUF

Huihui Mistral Small 3.2 24B Instruct 2506 Abliterated V2 GGUF

Huihui Qwen3 VL 4B Instruct Abliterated GGUF

Qwen3 VL 2B Thinking MLX 8bit

JanusCoder 14B GGUF

JanusCoder 8B GGUF

Emu3.5

Emu3.5 Image

Fara 7B

Gemma 3 27b It Qat Mlx Mxfp4

Everos

Dots.ocr Base Fix

Qwen3 VL 235B A22B Thinking MXFP4_MOE GGUF

Qwen3 VL 30B A3B Instruct GGUF

LFM2 VL 3B

Qwen3 VL 30B A3B Instruct AWQ

MCP

Geminimcpserver

豆包大模型 2.0 正式上线推理成本降一个数量级 API 同步开放

Kimi 进化！发布 K2.5 模型：视觉理解、代码复现与“Agent 集群”协同