Best 微调 AI Tools & Models - Premium 微调 News

AI News

OpenAI发布GPT-Rosalind：首款生命科学大模型助力新药研发

OpenAI发布生命科学专用AI模型GPT-Rosalind，以DNA结构发现者罗莎琳德·富兰克林命名，正式进军生物化学与基因组学领域。该模型针对生物研究需求深度微调，旨在帮助科学家缩短药物研发周期，将数据分析转化为高效智能科研流程，具备卓越科学推理能力。

14.9k 10 hours ago

苹果发布 AI 原型工具 SQUIRE，旨在重塑 UI 设计流程

苹果发布两项机器学习研究：SQUIRE系统利用GPT-4o和槽查询中间表示，提升AI生成UI的可控性与微调效率；另一项研究则强化图像安全审查能力，旨在解决现有技术痛点。

14.2k yesterday

日本乐天 AI 3.0 陷入开源争议：违规删除 DeepSeek 许可证后紧急补救

日本乐天集团发布AI模型乐天AI 3.0，宣称是“日本规模最大”，但被指违规删除原始开源许可证，引发开源社区批评。该模型实为基于深度求索的DeepSeek-V3微调而成，虽属行业常态，但其处理方式涉及合规争议。

36.5k 15 hours ago

Unsloth Studio 发布：首个本地可视化大模型微调平台，显存占用降低 70%

Unsloth AI推出开源无代码可视化工具Unsloth Studio，旨在简化大语言模型微调流程，降低开发门槛。该工具通过定制化反向传播内核实现训练速度翻倍和显存节省70%，无需复杂环境配置和高昂硬件成本。

26k yesterday

Unsloth Studio 发布：首个本地可视化大模型微调平台，显存占用降低 70%

AI Products

Free AI Background Remover

先进AI背景移除工具，自动去背景，可微调，适用于多类型图像。

图片编辑

6.9k

LLaMA-Factory Online

一站式大模型微调平台，支持多种主流模型。

模型训练与部署

9.6k

TeleChat3

由中国电信人工智能研究院研发的语言模型。

AI模型

7.2k

LLaMA

与LLaMA-Factory官方合作，一站式低代码大模型微调平台，支持超百种模型。

模型训练与部署

5.1k

Models

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

Input tokens/M

$12.7

Output tokens/M

Context Length

Pangu-NLP-N2-32K-5.0.1.1

Huawei

Input tokens/M

Output tokens/M

Context Length

Qwen3-14B

Alibaba

Input tokens/M

Output tokens/M

Context Length

QianfanHuijin-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-QI-VL

Baidu

Input tokens/M

Output tokens/M

Context Length

Pangu-AgentExpert-N1-0.0.2

Huawei

Input tokens/M

Output tokens/M

Context Length

Qianfan-Llama-VL-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qwen2-72B-Instruct

Alibaba

Input tokens/M

Output tokens/M

131

Context Length

DeepSeek-R1-Distill-Llama-8B

Deepseek

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_14b_Instruct

Alibaba

Input tokens/M

Output tokens/M

128

Context Length

Pangu-NLP-N1-128K-3.2.36

Huawei

Input tokens/M

Output tokens/M

128

Context Length

Pangu-NLP-N2-32K-3.1.35

Huawei

Input tokens/M

Output tokens/M

Context Length

Pangu-NLP-N4-32K-2.5.35

Huawei

Input tokens/M

Output tokens/M

Context Length

Qwen_v2_0.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_0.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

128

Context Length

Qwen_v2_1.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

internlm2.5_1.8b_chat

Shanghai-ai-lab

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_1.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_3b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Openmanus

OpenManus是一个无需邀请码即可实现各种想法的开源项目，由MetaGPT团队成员在3小时内构建完成。它提供了一个简单的实现，允许用户创建自己的智能代理，并支持多种语言和配置。项目欢迎建议、贡献和反馈，未来计划包括更好的规划、实时演示、回放功能、RL微调模型和全面的基准测试。

python

11.4k

2.5points

Agentic AI Projects

项目涉及LangChain框架的文档、示例代码库及社区资源，包括Python编程、AI代理开发、FastAPI集成、LLM微调等技术内容。

人工智能聊天机器人

9.5k

2.5points

Unsloth Mcp Server

Unsloth MCP Server是一个用于高效微调大语言模型的服务器，通过优化算法和4位量化技术，实现2倍训练速度提升和80%显存节省，支持多种主流模型。

typescript

9.3k

2.5points

Unsloth

Unsloth MCP Server是一个用于高效微调大语言模型的服务器，通过优化技术实现2倍速度提升和80%内存节省。

typescript

10.2k

2.5points

OtotaO_unsloth Mcp Server

Unsloth MCP Server是一个用于高效微调大语言模型的服务，基于Unsloth库实现2倍加速和80%内存节省，支持多种模型和量化技术。

typescript

8.6k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

OpenAI发布GPT-Rosalind：首款生命科学大模型助力新药研发

苹果发布 AI 原型工具 SQUIRE，旨在重塑 UI 设计流程

​日本乐天 AI 3.0 陷入开源争议：违规删除 DeepSeek 许可证后紧急补救

​Unsloth Studio 发布：首个本地可视化大模型微调平台，显存占用降低 70%

AI Products

Free AI Background Remover

LLaMA-Factory Online

TeleChat3

LLaMA

Models

Qwen3-Next-80B-A3B-Instruct

qwen3-omni-30b-a3b-captioner

Pangu-NLP-N2-32K-5.0.1.1

Qwen3-14B

QianfanHuijin-8B

Qianfan-QI-VL

Pangu-AgentExpert-N1-0.0.2

Qianfan-Llama-VL-8B

Qwen2-72B-Instruct

DeepSeek-R1-Distill-Llama-8B

Qwen_v2.5_14b_Instruct

Pangu-NLP-N1-128K-3.2.36

Pangu-NLP-N2-32K-3.1.35

Pangu-NLP-N4-32K-2.5.35

Qwen_v2_0.5b_Instruct

Qwen_v2.5_0.5b_Instruct

Qwen_v2_1.5b_Instruct

internlm2.5_1.8b_chat

Qwen_v2.5_1.5b_Instruct

Qwen_v2.5_3b_Instruct

Gemmamed_cardio

Qwen Edit 2509 Light Migration

CodeV GGUF

GPT OSS Cybersecurity 20B Merged I1 GGUF

INTELLECT 3 MXFP4_MOE GGUF

Langcache Reranker V2 Softmnrl Triplet

Langcache Reranker V1 Experimental

OpenThinker Agent V1 SFT

OpenThinker Agent V1

Langcache Reranker V1 MiniL6

Qwen3 4B Hivemind Instruct NEO MAX Imatrix GGUF

Yolo12 Drone Detection 0205 100m

Ministral 3 3B Instruct 2512

Llama 3 8b Bnb 4bit GGUF

Phi 3.5 Mini Instruct GGUF

VideoMAE_kinetics_wlasl_100__signer_20ep_coR

Timesformer_wlasl100_200epoch_Signers

VideoMAE_base_wlasl100_200epoch_Signers

Qwen2.5 1.5B Instruct Transcript Analytics

VideoMAE_base_wlasl100_20epoch_Signers

MCP

Openmanus

Agentic AI Projects

Unsloth Mcp Server

Unsloth

OtotaO_unsloth Mcp Server

日本乐天 AI 3.0 陷入开源争议：违规删除 DeepSeek 许可证后紧急补救

Unsloth Studio 发布：首个本地可视化大模型微调平台，显存占用降低 70%