最好的सोफ्टबैंक AI工具模型_精选सोफ्टबैंक资讯

AI资讯

StackGen 入选2025Gartner 酷供应商名单，AI 自主基础架构重塑 IT 运营

StackGen入选Gartner 2025年IT运营AI领域“酷供应商”报告，其自主基础架构平台(AIP)因显著推动IT自动化与提升开发者体验获行业认可。面对基础架构复杂、技术人才短缺及交付速度压力，超半数I&O领导者正加速采用AI技术。

7k 17 分钟前

ChatGPT可手动“调温”了！OpenAI上线热情度滑块，用户可自定义AI的“情绪浓度”

OpenAI为ChatGPT新增“热情度”调节功能，用户可在个性化设置中选择“更多”“更少”或“默认”三档，精细控制AI的温暖程度、兴奋感及表情符号使用频率。这标志着AI交互从预设人格迈向更细致的情绪微调阶段。

8.2k 7 分钟前

前特斯拉高管加盟，Pickle Robot 迎来首位 CFO，合作 UPS 再升级！

机器人公司Pickle Robot迎来前特斯拉高管埃万森担任CFO，正值与UPS合作关键期。埃万森自去年9月起提供咨询后全职加盟，此前在特斯拉负责投资者关系与战略。

5.7k 14 分钟前

前特斯拉高管加盟，Pickle Robot 迎来首位 CFO，合作 UPS 再升级！

像租充电宝一样租机器人！全国首个开放式平台“擎天租”在沪发布

全国首个开放式机器人租赁平台“擎天租”在上海发布，推动机器人服务从零散租赁迈向生态化。平台通过创新模式降低使用门槛，提供类似共享充电宝的便捷体验，已覆盖50个核心城市，接入超600家服务商，提供多品牌、多型号机器人租赁服务。

6.4k 5 分钟前

AI产品

Yollo AI

无限制的 AI 聊天与角色扮演平台。

聊天机器人

Joyfun AI

免费 AI 视频生成器，支持人脸互换与动画效果。

视频生成

4.7k

GPT Image 1.5 Generator

OpenAI于2025年12月16日发布，4倍速，成本降20%，适用于营销电商

OpenAI

3.9k

Free upi ai

探索UPI AI于2026年如何变革印度数字支付，含多种AI支付方案

6.6k

模型

Qwen.Qwen3 VL 32B Thinking GGUF

DevQuasar

本项目提供了 Qwen/Qwen3-VL-32B-Thinking 的量化版本（Int4），致力于降低模型部署的硬件门槛，让先进的视觉语言模型知识为每个人所用。

Qwen2.5 Coder 1.5B Instruct Gensyn Swarm Graceful_slender_toucan

chunchiliu

这是一个已发布在 Hugging Face Hub 上的 🤗 Transformers 模型，其模型卡片由系统自动生成。目前卡片中大部分详细信息（如开发者、模型类型、语言、许可证等）均处于待补充状态。

Gemmamed_cardio

uaritm

Gemma-UA-Cardio 是两款专为乌克兰语心脏病学领域设计的专业大语言模型。它们基于 Google 的 Gemma 和 MedGemma 模型，经过两阶段微调（语言适配与领域专业化），能够以乌克兰语精准提供心血管医学信息、解答临床问题，是面向医疗专业人士的辅助工具。

Qwen Edit 2509 Light Migration

dx8152

这是一个基于Qwen-Image-Edit-2509的LoRA微调模型，专门用于解决图像二次光照处理问题。它能够移除原始图像的光照效果，并根据参考图像的光照和色调，为目标图像重新生成逼真的照明和阴影，实现图像风格的迁移与融合。

CodeV GGUF

prithivMLmods

CodeV是基于Qwen2.5-VL-7B-Instruct微调得到的70亿参数视觉语言模型，通过监督微调（SFT）和基于工具感知策略优化（TAPO）的强化学习（RL）两阶段训练，旨在实现可靠、可解释的视觉推理。它将视觉工具表示为可执行的Python代码，并通过奖励机制确保工具使用与问题证据一致，解决了高准确率下工具调用不相关的问题。

Actio Ui 7b Rlvr GGUF

prithivMLmods

ActIO-UI-7B-RLVR 是由 Uniphore 发布的 70 亿参数视觉语言模型，专门用于计算机界面自动化任务。它基于 Qwen2.5-VL-7B-Instruct，通过监督微调和可验证奖励的强化学习进行优化，在 GUI 导航、元素定位和交互规划等任务上表现出色，在 WARC-Bench 基准测试中达到了开源 7B 模型的领先水平。

GPT OSS Cybersecurity 20B Merged I1 GGUF

mradermacher

这是一个专注于网络安全领域的20B参数开源大语言模型，基于GPT-OSS架构，并融合了多个网络安全指令数据集进行微调。模型提供了多种量化版本，便于在资源受限的环境中部署，可用于生成网络安全相关的文本、代码和分析报告。

TheDrummer_Magidonia 24B V4.3 GGUF

bartowski

这是对TheDrummer的Magidonia-24B-v4.3大语言模型进行量化处理后的版本。通过使用llama.cpp的imatrix量化技术，生成了从BF16到IQ2_XS等多种精度的GGUF格式文件，旨在不同硬件条件下（尤其是资源受限环境）更高效地运行模型，同时尽可能保持模型性能。

TheDrummer_Cydonia 24B V4.3 GGUF

bartowski

本项目是TheDrummer的Cydonia-24B-v4.3模型的量化版本，使用llama.cpp进行量化处理，旨在提供不同量化类型的模型文件，以满足不同硬件和性能需求。它是一个24B参数的大语言模型，主要用于文本生成任务。

Z Image Re Turbo LoRA

GuangyuanSD

Z-Image-Re-Turbo 是一个基于文本生成图像的模型，它在 Z-Image-De-Turbo 模型的基础上进行了去还原和重新加速优化。该模型旨在兼顾训练时的便利性与推理时的速度，恢复了接近原始 Turbo 模型的快速生成能力，同时保持了与 Z-Image-De-Turbo 相同的训练友好特性，使其能够完美兼容 Z-Image 生态系统中已训练的大量 LoRA 模型。

INTELLECT 3 MXFP4_MOE GGUF

noctrex

INTELLECT-3 是一个由 Prime Intellect 开发的、参数规模达 106B（激活参数 12B）的混合专家（MoE）推理模型。它基于 GLM-4.5-Air-Base 进行监督微调，并经过大规模强化学习训练，在数学、编码和推理任务上表现优异。

Hermes 4.3 36B GGUF

MaziyarPanahi

这是NousResearch/Hermes-4.3-36B模型的GGUF量化格式版本，由MaziyarPanahi进行量化处理。GGUF是一种高效的模型格式，旨在优化本地部署和推理性能，支持多种量化级别（2位至8位），适用于广泛的文本生成任务。

Langcache Reranker V2 Softmnrl Triplet

redis

这是一个基于Alibaba-NLP/gte-reranker-modernbert-base模型，在LangCache句子对数据集上使用sentence-transformers库微调的跨编码器模型。它专门用于计算文本对之间的语义相似度得分，旨在为LangCache语义缓存系统提供高效的文本匹配和重排序能力。

自然语言处理

Sentence-transformers英语

redis

314

Langcache Reranker V1 Experimental

redis

这是一个由Redis微调的交叉编码器模型，专门用于语义缓存场景下的句子对重排序。它基于Alibaba-NLP的gte-reranker-modernbert-base模型，在LangCache句子对数据集上进行训练，能够高效计算两个文本之间的语义相似度得分，用于判断它们是否表达相同或相似的含义。

自然语言处理

Sentence-transformers英语

redis

156

OpenThinker Agent V1 SFT

open-thoughts

OpenThinker-Agent-v1-SFT 是基于 Qwen/Qwen3-8B 进行有监督微调（SFT）得到的智能体模型。它是 OpenThinker-Agent-v1 完整训练流程（SFT + RL）的第一阶段模型，专门针对智能体任务（如终端操作和代码修复）进行优化。

OpenThinker Agent V1

open-thoughts

OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型，专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练，然后通过强化学习进一步优化，在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。

Langcache Reranker V1 MiniL6

redis

这是一个由Redis开发的、针对LangCache语义缓存任务进行微调的CrossEncoder模型。它基于成熟的`cross-encoder/ms-marco-MiniLM-L6-v2`模型，在超过100万对LangCache句子对数据集上训练，专门用于计算两个文本之间的语义相关性得分，以优化缓存命中率。

自然语言处理

Sentence-transformers英语

redis

155

GigaChat3 10B A1.8B GGUF

ai-sage

GigaChat3-10B-A1.8B 是 GigaChat 系列的高效对话模型，基于混合专家（MoE）架构，拥有 100 亿总参数和 18 亿活跃参数。它采用了创新的多头潜在注意力（MLA）和多令牌预测（MTP）技术，旨在优化推理吞吐量和生成速度。模型在 20T 令牌的多样化数据上训练，支持包括中文在内的 10 种语言，适用于需要快速响应的对话场景。