AIBase
首页
AI 资讯
AI 产品库
GEO 平台
MCP 服务
模型算力广场
AI 全能力超市
ZH

模型

查看更多

DPOpenHermes 7B V2

openaccess-ai-collective

D

DPOpenHermes 7B v2是基于OpenHermes-2.5-Mistral-7B的第二次RL微调模型,通过直接偏好优化(DPO)进行强化学习,使用了Intel/orca_dpo_pairs和allenai/ultrafeedback_binarized_cleaned偏好数据集。

自然语言处理TransformersTransformers英语
openaccess-ai-collective
30
31

Tiny Mistral

openaccess-ai-collective

T

Mistral架构的随机初始化模型,适用于端到端测试。

自然语言处理TransformersTransformers
openaccess-ai-collective
23.4k
14

Minotaur 13b Fixed

openaccess-ai-collective

M

Minotaur 13B是基于LlaMA-13B进行指令微调的模型,使用完全开源数据集进行微调,确保可复现性。

自然语言处理TransformersTransformers
openaccess-ai-collective
121
16

Manticore 13b Chat Pyg

openaccess-ai-collective

M

Manticore 13B Chat是基于Manticore模型优化而来的聊天对话模型,采用去重的Pygmalion数据集子集进行训练,使用纯聊天风格提示格式,支持角色扮演和多种对话任务。

自然语言处理TransformersTransformers英语
openaccess-ai-collective
3.2k
31

Manticore 13b

openaccess-ai-collective

M

Manticore 13B是基于Llama 13B模型在多个高质量数据集上微调的大语言模型,擅长文本生成任务。

自然语言处理TransformersTransformers英语
openaccess-ai-collective
201
116

Mpt 7b Wizardlm

openaccess-ai-collective

M

这是一个基于MPT-7B模型微调的大语言模型,使用了WizardLM_alpaca_evol_instruct_70k_unfiltered数据集进行训练。

自然语言处理TransformersTransformers支持多种语言
openaccess-ai-collective
44
21
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图