最近,Zyphra 正式推出了 Zamba2-7B,這是一款具有前所未有性能的小型語言模型,參數數量達到7B。這款模型號稱在質量和速度上超越了目前的競爭對手,包括 Mistral-7B、谷歌的 Gemma-7B 以及 Meta 的 Llama3-8B。Zamba2-7B 的設計目標是滿足那些需要強大語言處理能力但又受限於硬件條件的環境,比如在設備上處理或使用消費級 GPU。通過提高效率而不犧牲質量,Zyphra 希望能讓更廣泛的用戶,無論是企業還是個人開發者,都能享受到先進 AI 的便利。Zamba2-7B 在架構上做了很多創新,提升了模型的效率和表
蘋果公司開源DCLM-Baseline-7B全鏈路語言模型,推動AI領域發展。該模型包含預訓練數據集、數據處理、訓練到評估的全過程,爲研究人員和開發者提供全面深入理解。在MMLU測試中,其性能與Mistral-7B-v0.3和Llama38B相當。基於Transformer架構,DCLM-Baseline-7B採用了先進設計並優化於PyTorch/OpenLM。模型訓練細節,如AdamW優化器、學習率、批處理大小、序列長度、GPU訓練等均展示了高度優化。使用方法涉及安裝open_lm及通過代碼和參數設置實現生成。在MMLU任務上,其零樣本與少樣本得分優異,爲未來應用與研究提供參考。這不僅是蘋果在AI技術的貢獻,也爲AI研究者提供了寶貴資源,預示未來更多創新在此基礎上誕生。
["金融領域創新:FinTral 採用多模態方法,處理文本、數字、表格和視覺數據,性能超越 GPT-4。","模型特色:基於 Mistral-7b 模型,經過領域預訓練、調整和 AI 反饋,結合視覺數據處理,實現精準金融分析。","強大性能驗證:FinTral-DPO 模型接近 GPT-4 平均得分,在金融任務中表現出色。","實驗結果驗證:FinTral 在金融任務中表現突出,特別是在視覺數據處理和工具檢索方面超越其他模型。"]
大型語言模型,支持指令式對話和功能調用。
一種大型語言模型,具有擴展詞彙量。
一款基於指令微調的大型語言模型
免費、匿名的ChatGPT服務,集成了GPT4、DALLE-3、Mistral-7B和在線信息檢索功能。
01-ai
-
輸入tokens/百萬
輸出tokens/百萬
4
上下文長度
mradermacher
這是 Manoghn/voicecraft-mistral-7b 模型的靜態量化GGUF版本,基於Mistral-7B架構,專門用於內容生成和文本生成任務。該版本提供了多種量化級別,從2.8GB到14.6GB不等,用戶可以根據硬件條件和性能需求選擇合適的版本。
macandchiz
這是mistralai/Mistral-7B-Instruct-v0.3的量化版本,提供多種量化級別選擇,在文件大小和模型質量之間進行權衡。支持基於llama-cpp和gguf-my-repo使用。
Featherless-Chat-Models
Mistral-7B-v0.1是一個擁有70億參數的預訓練生成式文本大語言模型,在多項基準測試中表現優於Llama 2 13B模型。它採用了先進的Transformer架構設計,包括分組查詢注意力和滑動窗口注意力機制。
predibase
基於Mistral-7B-v0.1微調的新聞內容生成模型,可根據標題自動生成新聞內容
gerasmark
本模型是基於Mistral-7B-Instruct-v0.3優化的微調版本,專為法醫調查領域的問答任務設計,支持高級法醫調查推理和快速知識檢索。
TheBloke
Mistral 7B OpenOrca是基於Mistral-7B架構的大語言模型,由OpenOrca團隊訓練,專注於文本生成任務。
trajkovnikola
MKLLM-7B是一款面向馬其頓語的開源大語言模型,基於Mistral-7B-v0.1模型通過持續預訓練馬其頓語和英語混合文本構建而成。
raak-16
這是一個使用Unsloth和Huggingface TRL庫優化的Mistral-7B指令微調模型,訓練速度提升2倍
TheStageAI
Mistral-7B-Instruct-v0.3是一個基於Mistral-7B的指令調優模型,支持多語言文本生成任務。
thedanmaks
基於Mistral-7B的烏克蘭語指令微調模型,使用Unsloth和TRL庫進行高效訓練
這是Mistral-7B-Instruct-Uz模型的靜態量化版本,支持烏茲別克語和英語,適用於文本生成、摘要、翻譯和問答等任務。
Mungert
Mistral-7B-Instruct-v0.2是基於Mistral-7B架構的指令微調模型,支持文本生成任務,採用IQ-DynamicGate超低比特量化技術優化內存效率。
Mistral-7B-Instruct-v0.1是一個基於Mistral-7B-v0.1的微調模型,支持文本生成任務,採用IQ-DynamicGate超低比特量化技術,適用於內存受限的部署環境。
ritvik77
基於Mistral-7B語言模型,通過LoRA微調和4bit量化技術優化的醫療診斷AI模型,專注於症狀分析和疾病診斷輔助。
ajay-drew
基於Mistral-7B模型微調的法律領域專用模型,針對印度法律問答優化
YuchengShi
基於LLaVA-Med v1.5 Mistral-7B微調的多模態基礎模型,專為分析胸部X光圖像和檢測肺炎而優化
Delta-Vector
基於Mistral-7B-V0.3微調的指令跟隨模型,專為角色扮演和故事創作優化
rafaelldietrich
這是一個基於Mistral-7B的商業領域適配模型,轉換為GGUF格式以便在llama.cpp中使用。
BICORP
Mistral-7B-Instruct-v0.3是基於Mistral-7B-v0.3進行指令微調的大語言模型,支持函數調用和擴展詞彙表。
這是一個基於Mistral-7B-Instruct-v0.2模型微調的心理健康諮詢對話模型,提供了多種量化版本以適應不同需求。