Rokid正与顶尖大模型公司合作开发新一代AI智能眼镜,以生成式AI和AI智能体为核心,打造革命性操作系统和界面。该眼镜采用端侧多模态模型,支持语音、视觉和触控等多种交互方式,旨在提供全新用户体验。
玩美移动升级时尚API,新增手表、手链等九类虚拟试穿功能,利用生成式AI和计算机视觉技术,精准识别人体结构,为品牌和开发者提供全面的AI穿搭体验,推动时尚行业发展。
AI视频企业爱诗科技与港股上市公司中国儒意达成深度战略合作,获1420万美元战略投资。双方将在影视视觉设计、视效制作、智能生成宣传素材及流媒体资产优化等领域合作,中国儒意还将开放版权资源,助力爱诗科技释放IP创作潜力。
森马服饰正全面推进AI在时尚产业全链路应用,覆盖创意设计到终端服务,强调系统性布局,已应用于知识库构建、营销文案生成、视觉内容拍摄、短视频制作及服装设计辅助等多个环节。
Caimera利用AI生成时尚、电商和广告模型,提升视觉效果促进销售。
NewYouGo是免费AI图像与视频生成平台,用先进模型秒速创建高质量视觉内容。
Nano Banana AI是先进图像生成与编辑器,用文本提示瞬间创惊艳视觉。
CUTY AI 是一体化视觉内容生成平台,用 AI 创图和视频
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$6
$24
$2
$20
DevQuasar
这是一个基于Moonshot AI技术的量化版本模型,专注于视觉语言理解与生成任务,致力于降低知识获取门槛,让知识为每个人所用。
SadraCoding
SDXL-Deepfake-Detector 是一款精准检测 AI 生成人脸的工具,专注于维护数字世界的真实性,为抵御视觉虚假信息提供隐私保护且开源的解决方案。该模型通过微调预训练模型实现轻量级且高准确率的检测。
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的空间和视频动态理解能力。该模型采用2B参数规模,支持指令交互,适用于多模态AI应用。
facebook
DINOv3是Meta AI开发的一系列通用视觉基础模型,无需微调即可在广泛的视觉任务中超越专门的先进模型。该模型采用自监督学习方式,生成高质量的密集特征,在图像分类、分割、深度估计等多种任务中表现出色。
DINOv3是Meta AI开发的多功能视觉基础模型,无需微调就能在广泛视觉任务中超越专业模型。该模型能生成高质量密集特征,在各种视觉任务中表现出色,显著超越了以往的自监督和弱监督基础模型。
DINOv3是Meta AI开发的一系列通用视觉基础模型,无需微调就能在多种视觉任务中超越专门的先进模型。该模型采用Vision Transformer架构,在16.89亿张网络图像上预训练,能生成高质量的密集特征,在图像分类、分割、检索等任务中表现出色。
deepseek-community
DeepSeek-VL是由DeepSeek AI团队开发的开源视觉语言模型,能够同时处理文本和图像信息,生成上下文相关的回复。该模型采用混合视觉编码器,支持高分辨率图像处理,在真实世界的视觉语言理解应用中表现出色。
aiwithoutborders-xyz
这是一个在法医应用中检测AI生成图像的视觉Transformer模型,训练于迄今为止最大的数据集。
buildborderless
这是一个基于视觉Transformer架构的图像分类模型,专门用于检测AI生成的图像,为法医应用提供支持。模型在包含270万张图像的大规模数据集上训练,涵盖15+个生成器和4600+个模型。
unum-cloud
UForm是一款小巧的多模态AI模型,可将视觉和英文文本映射到共享向量空间,支持内容理解与生成。该模型采用轻量级设计,文本编码器为4层BERT,视觉编码器为ViT-S/16,可生成256维嵌入向量。
HelpingAI
PixelGen是由HelpingAI开发的先进文本到图像生成模型,拥有34.7亿参数,能够根据文本描述生成高质量的视觉图像,为创意设计和实际应用提供强大的AI工具。
stablediffusionapi
Juggernaut Reborn 是一款基于扩散模型的文本到图像生成AI模型,能够根据文本描述生成超逼真的图像。该模型专注于创建高质量的肖像和场景图像,特别擅长处理人物肖像、赛博朋克风格等复杂视觉内容。
NehaBardeDUKE
基于AutoTrain框架训练的视觉图像二分类模型,在AI生成图像分类任务中表现优异
mcp-hfspace是一个连接Hugging Face Spaces的MCP服务器,支持图像生成、语音处理、视觉模型等多种AI功能,简化了与Claude Desktop的集成。
Korx Share MCP Server是一个多功能MCP协议服务器,通过与korx.org API集成,为AI生成的视觉内容(如图表、仪表盘和HTML页面)创建安全可分享的URL,同时保持内容交互性并进行风险过滤。
Moondream MCP Server是一个基于Moondream视觉模型的图像分析服务,提供图像描述生成、物体检测和视觉问答功能,可轻松集成到Claude和Cline等AI助手中。
一个提供AI视觉分析能力的MCP服务器,支持网页截图、视觉分析、文件操作和报告生成等功能。
一个提供AI视觉分析能力的MCP服务器,支持网页截图、视觉分析、文件操作和报告生成等功能,适用于Claude等AI助手。
MCP-hfspace是一个简化连接Hugging Face Spaces的服务器工具,支持图像生成、语音处理、视觉模型等多种AI功能,与Claude Desktop无缝集成。