马斯克旗下xAI公司发布视频生成工具Grok Imagine 1.0,支持生成10秒720p高清视频,音频质量大幅优化,标志着其在多媒体AI生成领域迈出关键一步。
马斯克旗下xAI公司发布Grok Imagine 1.0,实现AI视频生成技术重大突破。该版本支持生成10秒720p高清视频,音频质量显著提升,大幅缩短高质量视频创作时间,标志着AI视频生成领域的重要进展。
xAI旗下Grok Imagine新增10秒视频生成功能,视频质量显著提升,画面稳定、细节丰富,音频清晰同步。目前生成过程仍较随机,缺乏计时器选项,输出长度和一致性有待优化,但相关功能预计将很快完善。
腾讯AI工作台ima.copilot上线“生成PPT”功能,用户可调用个人知识库素材一键生成逻辑清晰、排版美观的幻灯片,标志着其多模态输出能力取得重要突破。
强大的AI批量图像生成器,支持单提示或CSV上传,快速生成大量图像。
Nana Banana AI:先进图像生成与编辑器,用文本指令轻松编辑图像。
Whisk AI可融合主题、场景和风格图像,快速生成4K高质量AI图像。
Sea Imagine AI 一站式平台,可将文本/图像转为视频,适合专业与业余人士。
Alibaba
-
输入tokens/百万
输出tokens/百万
上下文长度
$2
Huawei
Minimax
bartowski
这是对TheDrummer的Magidonia-24B-v4.3大语言模型进行量化处理后的版本。通过使用llama.cpp的imatrix量化技术,生成了从BF16到IQ2_XS等多种精度的GGUF格式文件,旨在不同硬件条件下(尤其是资源受限环境)更高效地运行模型,同时尽可能保持模型性能。
DavidAU
Qwen3-4B-Hivemind-Instruct-NEO-MAX-Imatrix-GGUF 是一款基于 Qwen3 架构的 4B 参数指令微调大语言模型,采用 NEO Imatrix 与 MAX 量化技术,具备 256k 的超长上下文处理能力。该模型在多个基准测试中表现出色,是一款性能强劲的通用型模型。
这是由Mistral AI开发的大型语言模型Mistral-Large-3-675B-Instruct-2512的GGUF量化版本。原始模型拥有6750亿参数,专为指令遵循任务设计。本项目使用llama.cpp工具,结合imatrix校准数据集,生成了从Q8_0到IQ1_S共20多种不同精度的量化模型文件,旨在平衡模型性能、推理速度与存储/内存占用,使其能在更广泛的硬件上运行。
NewBie-AI
NewBie image Exp0.1 是一个基于 Next-DiT 架构开发的高效图像生成基础模型,专门用于生成高质量的动漫风格图像。它融合了先进的文本编码器和视觉组件,支持自然语言和结构化标签输入,是多角色动漫图像生成的强大工具。
这是微软Fara-7B模型的量化版本,使用llama.cpp的imatrix技术进行优化。该模型支持多种量化级别,从高精度的bf16到极低精度的IQ2_M,满足不同硬件配置和性能需求。
这是ArliAI的GLM-4.5-Air-Derestricted模型的GGUF量化版本,使用llama.cpp和imatrix技术进行优化量化处理,提供多种量化级别选择,适用于不同硬件配置和性能需求。
noctrex
这是一个基于Huihui-MiroThinker-v1.0-30B模型进行的MXFP4_MOE imatrix量化版本,专门针对文本生成任务优化,在保持模型性能的同时显著减小了模型体积和推理成本。
这是TheDrummer的Snowpiercer-15B-v4模型的量化版本,使用llama.cpp和imatrix技术进行量化处理。该版本提供了从BF16到IQ2_S等多种量化级别,满足不同硬件条件和性能需求的用户。模型使用特定数据集进行校准优化,支持在线重打包功能以提升在ARM和AVX硬件上的性能。
这是对ai-sage的GigaChat3-10B-A1.8B模型进行的量化处理版本,采用llama.cpp的imatrix量化技术,可在不同硬件条件下更高效地运行。模型支持俄语和英语,主要用于文本生成任务。
drbaph
这是一个基于Qwen Image Edit 2509的LoRA模型,专门用于将输入图像转换为带有夸张特征的素描漫画艺术作品。模型能够为人物和动物主体创作出幽默且富有艺术感的漫画形象,突出面部特征和特点。
这是kldzj的GPT-OSS-120B-Heretic-v2模型的量化版本,使用llama.cpp的imatrix技术进行量化处理。该模型通过量化技术显著减少了存储和计算资源需求,同时保持了较好的模型性能,便于在各种设备上部署运行。
这是对MiroThinker-v1.0-30B模型进行MXFP4_MOE imatrix量化的版本,基于mradermacher的imatrix实现。该量化模型保持了原模型的文本生成能力,同时通过量化技术提高了推理效率,适用于需要高效文本生成的各种应用场景。
这是对Qwen3-4B-Instruct-2507-heretic模型进行的量化处理版本,使用llama.cpp工具和imatrix数据集生成了多种量化类型的模型文件,可在多种环境下运行,为用户提供了更多选择。
这是基于p-e-w发布的Llama-3.1-8B-Instruct-heretic模型的量化版本,使用llama.cpp b7049版本进行imatrix量化。提供了多种量化选项以适应不同硬件和性能需求,支持在LM Studio或llama.cpp中运行。
这是p-e-w/gpt-oss-20b-heretic模型的量化版本,使用llama.cpp的imatrix技术进行量化处理。该模型是一个200亿参数的大语言模型,提供了多种量化选项,从高质量到低质量不等,文件大小从41.86GB到11.52GB,适用于不同硬件条件。
基于Qwen 3微调的12B参数大语言模型,具备256k超长上下文处理能力,专门针对长文本生成任务进行优化。该模型结合了VLTO 8B模型基础、Brainstorm 20x调优和NEO Imatrix数据集量化技术,能够生成高质量的长文本内容。
这是一个增强版的多模态视觉语言模型,基于Qwen3-VL-8B-Thinking模型,通过Brainstorm 20x技术扩展至12B参数,采用NEO Imatrix增强的GGUF量化。模型具备强大的图像理解、文本生成和多模态推理能力,在视觉感知、文本质量和创意场景方面都有显著提升。
anikifoss
本项目是对MiniMax-M2模型进行的高质量HQ4_K量化,专门针对文本生成任务优化,特别适用于对话场景。该量化版本未使用imatrix,保持了模型的性能表现。
这是基于TheDrummer/Rivermind-24B-v1模型的llama.cpp量化版本,使用imatrix技术进行优化量化,提供多种量化级别以适应不同硬件配置,可在多种环境下高效运行。
本项目是基于Qwen3-VL-32B-Instruct模型的llama.cpp GGUF量化版本,提供多种量化类型以满足不同硬件和性能需求。使用特定数据集结合imatrix选项进行量化,保证量化质量,支持在线重新打包权重以提高ARM和AVX机器的性能。
一个基于FAL AI的Logo生成服务器,提供图像生成、背景去除和自动缩放功能。
基于即梦AI的图像生成服务,专为Cursor IDE设计,实现文本描述到图像的生成与保存。
一个基于xAI Grok API的MCP服务器,提供AI图像分析功能,支持URL和本地文件的图像描述、元数据提取和OCR文字识别
一个基于IMAP和SMTP协议的电子邮件集成MCP服务器,支持读取、发送、搜索邮件及管理邮箱文件夹功能。
一个基于MCP协议的图像生成服务器,使用Replicate的flux-schnell模型,支持通过文本提示生成图像,并可配置多种参数。
一个基于TypeScript的MCP服务器,使用OPENAI的dall-e-3模型根据文本提示生成图像,并支持将生成的图像保存到本地指定目录。
一个支持图片下载和处理的MCP服务器,提供批量下载、格式转换、尺寸调整和压缩等功能
Image Generation MCP Server是一个为Claude Desktop提供图像生成功能的MCP服务器,使用Replicate Flux模型,支持通过文本提示生成图像,并可通过Smithery或npm安装配置。
一个基于MCP协议的IMAP邮件服务器,为AI助手提供邮件检查、处理和用户偏好学习功能。
一个基于GPT-4o-mini模型的图像分析MCP服务器,可处理URL或本地路径的图像内容分析
一个基于OpenAI GPT-4o/gpt-image-1模型的图像生成与编辑工具,支持通过文本提示生成图像、编辑图像(如修复、扩展、合成等),并兼容多种MCP客户端。
一个用于获取剪贴板内容的MCP服务器,目前仅支持MacOS系统上的图像内容。
Banana Image MCP是一个基于MCP协议的AI图像生成服务器,让Claude等助手能够使用Google Gemini模型生成高质量图像,支持4K分辨率和智能模型选择。
一个基于模型上下文协议的IMAP/SMTP邮件服务器,支持通过自然语言指令让AI助手(如Claude、Cursor)进行邮件搜索、阅读、发送和管理操作。
Imagician是一个基于Model Context Protocol(MCP)的图像处理服务器,提供包括调整大小、格式转换、裁剪、压缩等多种图像编辑功能。
一个允许Claude与OpenAI对话并使用gpt-image-1生成图像资产的工具,适用于游戏或网页开发中需要生成单个资产的场景。
一个基于Stable Diffusion WebUI API的文本生成图像MCP服务器
ImageGen MCP Server是一个支持多种AI图像生成模型(包括GPT-Image-1、Google Imagen 4、Flux 1.1等)的MCP服务器,提供灵活的图像生成、尺寸调整和输出格式选项,可无缝集成到各种MCP客户端中。
一个基于IMAP协议的Gmail集成MCP服务器,提供邮件阅读、搜索、发送和管理功能,支持多账户和AI助手集成。
一个提供图像获取和处理功能的MCP服务器,支持从URL、本地路径和numpy数组加载图像,并返回base64编码的字符串和MIME类型。