AIBase
首頁
AI 資訊
AI 產品庫
GEO 平台
MCP 服务
模型算力廣場
AI 全能力超市
TW

模型

查看更多

DPOpenHermes 7B V2

openaccess-ai-collective

D

DPOpenHermes 7B v2是基於OpenHermes-2.5-Mistral-7B的第二次RL微調模型,通過直接偏好優化(DPO)進行強化學習,使用了Intel/orca_dpo_pairs和allenai/ultrafeedback_binarized_cleaned偏好數據集。

自然語言處理TransformersTransformers英語
openaccess-ai-collective
30
31

Tiny Mistral

openaccess-ai-collective

T

Mistral架構的隨機初始化模型,適用於端到端測試。

自然語言處理TransformersTransformers
openaccess-ai-collective
23.4k
14

Minotaur 13b Fixed

openaccess-ai-collective

M

Minotaur 13B是基於LlaMA-13B進行指令微調的模型,使用完全開源數據集進行微調,確保可復現性。

自然語言處理TransformersTransformers
openaccess-ai-collective
121
16

Manticore 13b Chat Pyg

openaccess-ai-collective

M

Manticore 13B Chat是基於Manticore模型優化而來的聊天對話模型,採用去重的Pygmalion數據集子集進行訓練,使用純聊天風格提示格式,支持角色扮演和多種對話任務。

自然語言處理TransformersTransformers英語
openaccess-ai-collective
3.2k
31

Manticore 13b

openaccess-ai-collective

M

Manticore 13B是基於Llama 13B模型在多個高質量數據集上微調的大語言模型,擅長文本生成任務。

自然語言處理TransformersTransformers英語
openaccess-ai-collective
201
116

Mpt 7b Wizardlm

openaccess-ai-collective

M

這是一個基於MPT-7B模型微調的大語言模型,使用了WizardLM_alpaca_evol_instruct_70k_unfiltered數據集進行訓練。

自然語言處理TransformersTransformers多語言
openaccess-ai-collective
44
21
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖