Best 大模型微调 AI Tools & Models - Premium 大模型微调 News

AI News

AI日报：千问全面接入阿里生态；百度文心ERNIE-5.0-0110正式发布；机器人租赁平台擎天租完成融资

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、百度文心ERNIE-5.0-0110正式发布，数学能力全球第二百度最新发布的文心大模型ERNIE-5.0-0110在多项权威评测中表现出色，尤其在数学处理能力上位列全球第二。该工具支持多模态输入、意译优先以及对话式微调，展现了OpenAI在消费者产品领域的战略转型。

25.8k 1 days ago

AI日报：千问全面接入阿里生态；百度文心ERNIE-5.0-0110正式发布；机器人租赁平台擎天租完成融资

定制专属大模型，还要手撕代码？这才是微调的正确打开方式！

大模型虽已普及，但通用模型常无法精准满足特定业务需求。要让模型深入理解行业知识，微调是关键步骤。然而，传统微调方法仍存在门槛高、成本大等挑战。

11.6k 6 days ago

定制专属大模型，还要手撕代码？这才是微调的正确打开方式！

DeepSeek 发布重大研究:仅靠优化架构即可显著提升 AI 推理能力

DeepSeek研究发现，通过优化神经网络架构而非单纯扩大模型规模，可显著提升大语言模型推理能力。其“流形约束超连接”技术对现有架构进行微调，为AI发展提供了不依赖无限增加参数的新路径。

15.9k 4 days ago

DeepSeek 发布重大研究:仅靠优化架构即可显著提升 AI 推理能力

英伟达推LLM微调“新手友好指南”！集成Unsloth框架，RTX笔记本性能提升2.5倍，本地微调门槛大幅降低

英伟达发布大模型微调指南，降低技术门槛，让普通开发者也能在消费级设备上高效完成模型定制。该指南详解如何在NVIDIA全系硬件上利用开源框架Unsloth实现专业级微调。Unsloth专为NVIDIA GPU打造，优化训练全流程，提升性能。

10.9k 3 days ago

英伟达推LLM微调“新手友好指南”！集成Unsloth框架，RTX笔记本性能提升2.5倍，本地微调门槛大幅降低

AI Products

LLaMA-Factory Online

LLaMA-Factory Online

一站式大模型微调平台，支持多种主流模型。

模型训练与部署

LLaMA

LLaMA

与LLaMA-Factory官方合作，一站式低代码大模型微调平台，支持超百种模型。

模型训练与部署

Radal

Radal

Radal是一个无代码平台，可使用您自己的数据微调小型语言模型。连接数据集，通过可视化配置训练，并在几分钟内部署模型。

模型训练与部署

Isahit

Isahit

Isahit是一个管理工作人员的平台，专注于LLM微调和数据处理，确保AI代理的高质量和无偏见。

模型训练与部署

Models

GPT-4.1 mini

Openai

GPT-4.1 mini

$2.8

Input tokens/M

$11.2

Output tokens/M

1k

Context Length

Gemini 2.0 Flash-Lite

Google

Gemini 2.0 Flash-Lite

$0.49

Input tokens/M

$2.1

Output tokens/M

1k

Context Length

Grok 4 Fast

Xai

Grok 4 Fast

$1.4

Input tokens/M

$3.5

Output tokens/M

2k

Context Length

o3-mini

Openai

o3-mini

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

GPT-5 Codex

-

Input tokens/M

-

Output tokens/M

-

Context Length

Claude 3 Opus

Anthropic

Claude 3 Opus

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

Gemini 2.0 Flash

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

Input tokens/M

$17.5

Output tokens/M

1k

Context Length

Claude Sonnet 4.5

Anthropic

Claude Sonnet 4.5

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

Claude 3 Sonnet

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

Gemini 2.5 Flash-Lite

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

qwen-image-plus

Alibaba

qwen-image-plus

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen3-coder-plus

Alibaba

qwen3-coder-plus

$4

Input tokens/M

$16

Output tokens/M

1k

Context Length

qwen3-vl-plus

Alibaba

qwen3-vl-plus

$1

Input tokens/M

$10

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

wan2.5-i2i-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

qwen3-vl-235b-a22b-thinking

$2

Input tokens/M

$20

Output tokens/M

-

Context Length

qwen3-max

Alibaba

qwen3-max

$6

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Qianfan-Lightning

-

Input tokens/M

-

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

qwen-image-edit

-

Input tokens/M

-

Output tokens/M

-

Context Length

MCP

unsloth-mcp-server

Unsloth Mcp Server

Unsloth MCP Server是一个用于高效微调大语言模型的服务器，通过优化算法和4位量化技术，实现2倍训练速度提升和80%显存节省，支持多种主流模型。

Unsloth

Unsloth

Unsloth MCP Server是一个用于高效微调大语言模型的服务器，通过优化技术实现2倍速度提升和80%内存节省。

OtotaO_unsloth-mcp-server

OtotaO_unsloth Mcp Server

Unsloth MCP Server是一个用于高效微调大语言模型的服务，基于Unsloth库实现2倍加速和80%内存节省，支持多种模型和量化技术。

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

Business Cooperation Site Map