Best 图像分割 AI Tools & Models - Premium 图像分割 News

AI News

中山大学联合美团打造X-SAM模型，单次操作可分割多个对象，20项测试全面领先

中山大学、鹏城实验室与美团联合发布X-SAM图像分割模型，突破传统"分割万物"限制，实现"任意分割"能力。该模型解决了传统SAM仅支持单一视觉提示的局限，显著提升适应性和应用范围，为图像分割领域带来重要创新。

10.9k yesterday

X-SAM：打破图像分割的界限，实现任意分割的新突破

中山大学、鹏城实验室与美团联合发布X-SAM图像分割多模态大模型，实现了从“分割万物”到“任意分割”的技术飞跃。该模型通过统一输入输出格式，支持文本或视觉查询，显著提升了分割精度和灵活性。

10.9k 2 hours ago

谷歌 Gemini2.5革新图像处理:不止识别物体，更能理解抽象概念与关系

谷歌推出Gemini2.5AI"对话式图像分割"功能，用户可通过自然语言指令精准分析图像内容。该技术突破传统分割局限，能理解复杂语义指令，包括关系查询、逻辑指令和抽象概念识别，并支持多语言提示。应用场景涵盖图像编辑、工作场所安全检查和保险理赔等，开发者可通过API直接调用该功能，返回结果包含坐标、像素掩码等数据。谷歌建议使用特定模型参数以获得最佳效果。

7k 47 minutes ago

字节跳动开源新模型VINCIE-3B：3亿参数，支持上下文连续图像编辑

字节跳动宣布开源VINCIE-3B，一款支持上下文连续图像编辑的3亿参数模型，基于其内部MM-DiT架构开发。这款模型突破了传统图像编辑的局限，首次实现从单一视频数据中学习上下文感知的图像编辑能力，无需依赖复杂的分割或修复模型生成训练数据。VINCIE-3B的发布为创意设计、影视后期及内容生成领域带来了全新的可能性。AIbase深入剖析其技术亮点、应用场景及行业影响。技术突破:从视频到上下文编辑传统图像编辑模型通常依赖任务特定的数据管道，需通过专家模型（如分割、修复）生成

5.9k 5 days ago

AI Products

Sam3D

Meta的单图像3D重建模型，融合SAM 3分割与几何纹理布局预测生成3D资产

3D建模

6.5k

BEN2

BEN2是一个基于深度学习的图像分割模型，专注于背景擦除和前景提取。

图片编辑

10.7k

WePOINTS

WePOINTS项目，提供多模态模型的统一框架

AI模型

8.6k

RMBG-2.0

高效分离图像前景与背景的模型

AI模型

12.4k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Mcp Server Cvdlt

基于Ultralytics和MCP协议实现的计算机视觉服务器，支持目标检测、图像分割和姿态估计等功能

python

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

中山大学联合美团打造X-SAM模型，单次操作可分割多个对象，20项测试全面领先

​X-SAM：打破图像分割的界限，实现任意分割的新突破

谷歌 Gemini2.5革新图像处理:不止识别物体，更能理解抽象概念与关系

​字节跳动开源新模型VINCIE-3B：3亿参数，支持上下文连续图像编辑

AI Products

Sam3D

BEN2

WePOINTS

RMBG-2.0

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

wan2.5-i2i-preview

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

wan2.5-t2i-preview

wan2.5-t2v-preview

wan2.5-i2v-preview

Sam3

Sam3 Tracker ONNX

Sam3

Ming Flash Omni Preview

UniPixel 3B

Dinov3 Vits16plus Pretrain Lvd1689m

Dinov3 Vitb16 Pretrain Lvd1689m

BiRefNet GGUF

MobileSAM GGUF

VisionReasoner 7B

MODNet

RailNet Tooth Segmentation In CBCT Image

Swf_trained_model

Segformer B0 Finetuned Morphpadver1 Hgo Coord V3_1

Segformer_b1 Nlver_finetuned 1024 1024

Segformer B0 Finetuned Morphpadver1 Hgo Coord V1

SESAME

Segformer B0 Finetuned Morphpadver1 Hgo Coord V3

Segformer B0 Finetuned Morphpadver1 Hgo Coord V2

BiRefNet_lite Matting

MCP

Mcp Server Cvdlt

X-SAM：打破图像分割的界限，实现任意分割的新突破

字节跳动开源新模型VINCIE-3B：3亿参数，支持上下文连续图像编辑