最好的स्वचालितपरीक्षण AI工具模型_精选स्वचालितपरीक्षण资讯

AI资讯

谷歌发布 FACTS 基准测试:揭示 AI “事实墙” 所有顶尖模型准确率均低于70%

谷歌FACTS团队与Kaggle联合发布FACTS基准测试套件，旨在评估生成式AI模型在企业任务中的事实性和真实性。该框架弥补了现有基准只关注问题解决能力、忽略输出信息与真实世界数据一致性的缺陷，尤其针对图像或图表中的信息嵌入，对法律、金融等关键领域尤为重要。

0 1 分钟前

谷歌发布 FACTS 基准测试:揭示 AI “事实墙” 所有顶尖模型准确率均低于70%

阿里发布超强语音合成模型 Qwen3-TTS，49 种音色满足你的声音需求！

阿里通义千问发布新一代语音合成模型Qwen3-TTS，免费向全球开发者开放。该模型提供49种多角色音色，支持10种主流语言及10种中国方言，在词错误率上表现优于同类产品，拟人化程度高。音色库涵盖多样角色设定，如“撒娇搞怪茉兔”等，即选即用。

5.8k 5 分钟前

Spotify 推出个性化 AI “推荐播放列表”，让用户掌控音乐体验

Spotify推出新功能，用户可通过文字描述生成个性化播放列表。该功能目前仅对新西兰高级用户开放测试，未来将逐步推广。播放列表不仅基于当前喜好，还结合用户完整听歌历史。

6.5k 5 分钟前

“Vibe”一下就能生成App！Cloudflare开源VibeSDK：零代码秒部署全栈应用，GitHub星标破4k

Cloudflare推出开源工具VibeSDK，支持开发者用自然语言描述零成本生成、测试和部署全栈应用。该平台简化开发流程，让普通用户也能快速创建网站或工具，实现“直觉式编码”。

7.9k 5 分钟前

“Vibe”一下就能生成App！Cloudflare开源VibeSDK：零代码秒部署全栈应用，GitHub星标破4k

AI产品

Cloudflare Vibe SDK

一个开源的全栈 AI 网页应用生成器，帮助您构建自己的平台。

开发平台

rewrite my essay

一个智能的论文重写工具，帮助您优化草稿。

改写润色

Seedance 1.5

使用 Seedance 1.5 轻松创建专业视频，提供高级 AI 技术支持。

视频生成

7.7k

Nano Banana AI

一款免费的 AI 照片编辑器，快速实现创意编辑。

图片编辑

6.6k

模型

Qwen.Qwen3 VL 32B Thinking GGUF

DevQuasar

本项目提供了 Qwen/Qwen3-VL-32B-Thinking 的量化版本（Int4），致力于降低模型部署的硬件门槛，让先进的视觉语言模型知识为每个人所用。

Qwen2.5 Coder 1.5B Instruct Gensyn Swarm Graceful_slender_toucan

chunchiliu

这是一个已发布在 Hugging Face Hub 上的 🤗 Transformers 模型，其模型卡片由系统自动生成。目前卡片中大部分详细信息（如开发者、模型类型、语言、许可证等）均处于待补充状态。

Gemmamed_cardio

uaritm

Gemma-UA-Cardio 是两款专为乌克兰语心脏病学领域设计的专业大语言模型。它们基于 Google 的 Gemma 和 MedGemma 模型，经过两阶段微调（语言适配与领域专业化），能够以乌克兰语精准提供心血管医学信息、解答临床问题，是面向医疗专业人士的辅助工具。

Qwen Edit 2509 Light Migration

dx8152

这是一个基于Qwen-Image-Edit-2509的LoRA微调模型，专门用于解决图像二次光照处理问题。它能够移除原始图像的光照效果，并根据参考图像的光照和色调，为目标图像重新生成逼真的照明和阴影，实现图像风格的迁移与融合。

CodeV GGUF

prithivMLmods

CodeV是基于Qwen2.5-VL-7B-Instruct微调得到的70亿参数视觉语言模型，通过监督微调（SFT）和基于工具感知策略优化（TAPO）的强化学习（RL）两阶段训练，旨在实现可靠、可解释的视觉推理。它将视觉工具表示为可执行的Python代码，并通过奖励机制确保工具使用与问题证据一致，解决了高准确率下工具调用不相关的问题。

Actio Ui 7b Rlvr GGUF

prithivMLmods

ActIO-UI-7B-RLVR 是由 Uniphore 发布的 70 亿参数视觉语言模型，专门用于计算机界面自动化任务。它基于 Qwen2.5-VL-7B-Instruct，通过监督微调和可验证奖励的强化学习进行优化，在 GUI 导航、元素定位和交互规划等任务上表现出色，在 WARC-Bench 基准测试中达到了开源 7B 模型的领先水平。

GPT OSS Cybersecurity 20B Merged I1 GGUF

mradermacher

这是一个专注于网络安全领域的20B参数开源大语言模型，基于GPT-OSS架构，并融合了多个网络安全指令数据集进行微调。模型提供了多种量化版本，便于在资源受限的环境中部署，可用于生成网络安全相关的文本、代码和分析报告。

TheDrummer_Magidonia 24B V4.3 GGUF

bartowski

这是对TheDrummer的Magidonia-24B-v4.3大语言模型进行量化处理后的版本。通过使用llama.cpp的imatrix量化技术，生成了从BF16到IQ2_XS等多种精度的GGUF格式文件，旨在不同硬件条件下（尤其是资源受限环境）更高效地运行模型，同时尽可能保持模型性能。

TheDrummer_Cydonia 24B V4.3 GGUF

bartowski

本项目是TheDrummer的Cydonia-24B-v4.3模型的量化版本，使用llama.cpp进行量化处理，旨在提供不同量化类型的模型文件，以满足不同硬件和性能需求。它是一个24B参数的大语言模型，主要用于文本生成任务。

Z Image Re Turbo LoRA

GuangyuanSD

Z-Image-Re-Turbo 是一个基于文本生成图像的模型，它在 Z-Image-De-Turbo 模型的基础上进行了去还原和重新加速优化。该模型旨在兼顾训练时的便利性与推理时的速度，恢复了接近原始 Turbo 模型的快速生成能力，同时保持了与 Z-Image-De-Turbo 相同的训练友好特性，使其能够完美兼容 Z-Image 生态系统中已训练的大量 LoRA 模型。

INTELLECT 3 MXFP4_MOE GGUF

noctrex

INTELLECT-3 是一个由 Prime Intellect 开发的、参数规模达 106B（激活参数 12B）的混合专家（MoE）推理模型。它基于 GLM-4.5-Air-Base 进行监督微调，并经过大规模强化学习训练，在数学、编码和推理任务上表现优异。

Hermes 4.3 36B GGUF

MaziyarPanahi

这是NousResearch/Hermes-4.3-36B模型的GGUF量化格式版本，由MaziyarPanahi进行量化处理。GGUF是一种高效的模型格式，旨在优化本地部署和推理性能，支持多种量化级别（2位至8位），适用于广泛的文本生成任务。

Langcache Reranker V2 Softmnrl Triplet

redis

这是一个基于Alibaba-NLP/gte-reranker-modernbert-base模型，在LangCache句子对数据集上使用sentence-transformers库微调的跨编码器模型。它专门用于计算文本对之间的语义相似度得分，旨在为LangCache语义缓存系统提供高效的文本匹配和重排序能力。

自然语言处理

Sentence-transformers英语

redis

314

Langcache Reranker V1 Experimental

redis

这是一个由Redis微调的交叉编码器模型，专门用于语义缓存场景下的句子对重排序。它基于Alibaba-NLP的gte-reranker-modernbert-base模型，在LangCache句子对数据集上进行训练，能够高效计算两个文本之间的语义相似度得分，用于判断它们是否表达相同或相似的含义。

自然语言处理

Sentence-transformers英语

redis

156

OpenThinker Agent V1 SFT

open-thoughts

OpenThinker-Agent-v1-SFT 是基于 Qwen/Qwen3-8B 进行有监督微调（SFT）得到的智能体模型。它是 OpenThinker-Agent-v1 完整训练流程（SFT + RL）的第一阶段模型，专门针对智能体任务（如终端操作和代码修复）进行优化。

OpenThinker Agent V1

open-thoughts

OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型，专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练，然后通过强化学习进一步优化，在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。

Langcache Reranker V1 MiniL6

redis

这是一个由Redis开发的、针对LangCache语义缓存任务进行微调的CrossEncoder模型。它基于成熟的`cross-encoder/ms-marco-MiniLM-L6-v2`模型，在超过100万对LangCache句子对数据集上训练，专门用于计算两个文本之间的语义相关性得分，以优化缓存命中率。

自然语言处理

Sentence-transformers英语

redis

155

GigaChat3 10B A1.8B GGUF

ai-sage

GigaChat3-10B-A1.8B 是 GigaChat 系列的高效对话模型，基于混合专家（MoE）架构，拥有 100 亿总参数和 18 亿活跃参数。它采用了创新的多头潜在注意力（MLA）和多令牌预测（MTP）技术，旨在优化推理吞吐量和生成速度。模型在 20T 令牌的多样化数据上训练，支持包括中文在内的 10 种语言，适用于需要快速响应的对话场景。