最近,Zyphra 正式推出了 Zamba2-7B,这是一款具有前所未有性能的小型语言模型,参数数量达到7B。这款模型号称在质量和速度上超越了目前的竞争对手,包括 Mistral-7B、谷歌的 Gemma-7B 以及 Meta 的 Llama3-8B。Zamba2-7B 的设计目标是满足那些需要强大语言处理能力但又受限于硬件条件的环境,比如在设备上处理或使用消费级 GPU。通过提高效率而不牺牲质量,Zyphra 希望能让更广泛的用户,无论是企业还是个人开发者,都能享受到先进 AI 的便利。Zamba2-7B 在架构上做了很多创新,提升了模型的效率和表
苹果公司开源DCLM-Baseline-7B全链路语言模型,推动AI领域发展。该模型包含预训练数据集、数据处理、训练到评估的全过程,为研究人员和开发者提供全面深入理解。在MMLU测试中,其性能与Mistral-7B-v0.3和Llama38B相当。基于Transformer架构,DCLM-Baseline-7B采用了先进设计并优化于PyTorch/OpenLM。模型训练细节,如AdamW优化器、学习率、批处理大小、序列长度、GPU训练等均展示了高度优化。使用方法涉及安装open_lm及通过代码和参数设置实现生成。在MMLU任务上,其零样本与少样本得分优异,为未来应用与研究提供参考。这不仅是苹果在AI技术的贡献,也为AI研究者提供了宝贵资源,预示未来更多创新在此基础上诞生。
["金融领域创新:FinTral 采用多模态方法,处理文本、数字、表格和视觉数据,性能超越 GPT-4。","模型特色:基于 Mistral-7b 模型,经过领域预训练、调整和 AI 反馈,结合视觉数据处理,实现精准金融分析。","强大性能验证:FinTral-DPO 模型接近 GPT-4 平均得分,在金融任务中表现出色。","实验结果验证:FinTral 在金融任务中表现突出,特别是在视觉数据处理和工具检索方面超越其他模型。"]
大型语言模型,支持指令式对话和功能调用。
一种大型语言模型,具有扩展词汇量。
一款基于指令微调的大型语言模型
免费、匿名的ChatGPT服务,集成了GPT4、DALLE-3、Mistral-7B和在线信息检索功能。
01-ai
-
输入tokens/百万
输出tokens/百万
4
上下文长度
mradermacher
这是 Manoghn/voicecraft-mistral-7b 模型的静态量化GGUF版本,基于Mistral-7B架构,专门用于内容生成和文本生成任务。该版本提供了多种量化级别,从2.8GB到14.6GB不等,用户可以根据硬件条件和性能需求选择合适的版本。
macandchiz
这是mistralai/Mistral-7B-Instruct-v0.3的量化版本,提供多种量化级别选择,在文件大小和模型质量之间进行权衡。支持基于llama-cpp和gguf-my-repo使用。
Featherless-Chat-Models
Mistral-7B-v0.1是一个拥有70亿参数的预训练生成式文本大语言模型,在多项基准测试中表现优于Llama 2 13B模型。它采用了先进的Transformer架构设计,包括分组查询注意力和滑动窗口注意力机制。
predibase
基于Mistral-7B-v0.1微调的新闻内容生成模型,可根据标题自动生成新闻内容
gerasmark
本模型是基于Mistral-7B-Instruct-v0.3优化的微调版本,专为法医调查领域的问答任务设计,支持高级法医调查推理和快速知识检索。
TheBloke
Mistral 7B OpenOrca是基于Mistral-7B架构的大语言模型,由OpenOrca团队训练,专注于文本生成任务。
trajkovnikola
MKLLM-7B是一款面向马其顿语的开源大语言模型,基于Mistral-7B-v0.1模型通过持续预训练马其顿语和英语混合文本构建而成。
raak-16
这是一个使用Unsloth和Huggingface TRL库优化的Mistral-7B指令微调模型,训练速度提升2倍
TheStageAI
Mistral-7B-Instruct-v0.3是一个基于Mistral-7B的指令调优模型,支持多语言文本生成任务。
thedanmaks
基于Mistral-7B的乌克兰语指令微调模型,使用Unsloth和TRL库进行高效训练
这是Mistral-7B-Instruct-Uz模型的静态量化版本,支持乌兹别克语和英语,适用于文本生成、摘要、翻译和问答等任务。
Mungert
Mistral-7B-Instruct-v0.2是基于Mistral-7B架构的指令微调模型,支持文本生成任务,采用IQ-DynamicGate超低比特量化技术优化内存效率。
Mistral-7B-Instruct-v0.1是一个基于Mistral-7B-v0.1的微调模型,支持文本生成任务,采用IQ-DynamicGate超低比特量化技术,适用于内存受限的部署环境。
ritvik77
基于Mistral-7B语言模型,通过LoRA微调和4bit量化技术优化的医疗诊断AI模型,专注于症状分析和疾病诊断辅助。
ajay-drew
基于Mistral-7B模型微调的法律领域专用模型,针对印度法律问答优化
YuchengShi
基于LLaVA-Med v1.5 Mistral-7B微调的多模态基础模型,专为分析胸部X光图像和检测肺炎而优化
Delta-Vector
基于Mistral-7B-V0.3微调的指令跟随模型,专为角色扮演和故事创作优化
rafaelldietrich
这是一个基于Mistral-7B的商业领域适配模型,转换为GGUF格式以便在llama.cpp中使用。
BICORP
Mistral-7B-Instruct-v0.3是基于Mistral-7B-v0.3进行指令微调的大语言模型,支持函数调用和扩展词汇表。
这是一个基于Mistral-7B-Instruct-v0.2模型微调的心理健康咨询对话模型,提供了多种量化版本以适应不同需求。