在2024北京文化论坛上,北京智源人工智能研究院(BAAI)宣布正式发布新一代中文互联网语料库CCI3.0(Chinese Corpora Internet),进一步推动数据共建共享。CCI3.0包含1000GB的数据集及498GB的高质量子集CCI3.0-HQ,是继2023年11月首次开源CCI1.0和2024年4月发布CCI2.0之后的又一次重要更新。
一个可以根据英文名和性别生成中文名字的在线工具。
利用AI帮你快速生成有意义且符合中国文化传统的中文名字。
一款专为中英文用户定制的指令式语言模型。
70亿参数的中英双语对话模型
Midsummra
CNMBert是一个专门用于翻译拼音缩写的模型,基于Chinese-BERT-wwm训练,通过修改预训练任务适配拼音缩写翻译任务。
iioSnail
ChineseBERT是一个融合字形与拼音信息的中文预训练模型,针对中文文本处理进行了优化。
Johnson8187
基于mDeBERTa-v3-base微调的中文情感分类模型,可识别8种情绪标签
基于xlm-roberta-large-xnli微调的中文情感分类模型,可识别8种情绪标签
一个用于翻译拼音缩写的模型,基于Chinese-BERT-wwm训练,适配拼音缩写翻译任务。
shibing624
Qwen2.5-7B-Instruct 是一个基于 Qwen2.5 架构的 7B 参数规模的中文指令微调大语言模型,适用于文本生成和推理任务。
Qwen2.5-1.5B-Instruct 是一个基于 Qwen2.5 架构的 15 亿参数的中文指令微调模型,适用于文本生成和推理任务。
hw2942
基于hfl/chinese-roberta-wwm-ext微调的中文RoBERTa模型,用于气候转型和物理风险预测任务
lixin12345
一个专门用于中文医疗文本的命名实体识别模型,能够识别疾病、药物、治疗程序等医疗相关实体。
listenrwt
基于llama3-8b微调的中文轻小说生成模型,使用40,000组小说上下文数据训练
BUAADreamer
基于LLaVA-1.5架构的中文医疗多模态大语言模型,专注于医疗领域的视觉问答任务。
sanshizhang
基于BERT架构的中文情感分析模型,专门针对基金领域文本进行优化,支持负面、正面和中性三类情感分类。
Xenova
中文CLIP模型,基于Vision Transformer架构,支持图像与文本的跨模态理解与生成。
基于ViT架构的中文CLIP模型,支持图像与文本的多模态理解
qgyd2021
该模型是一个基于Apache-2.0许可证的开源人工智能模型,具体功能需根据实际模型类型确定
hfl
适配llama.cpp的中文LLaMA-2-7B模型的GGUF-v3版本文件
Chinese-LLaMA-2-1.3B是基于Meta发布的Llama-2模型的中文基础模型,扩充了中文词表并进行了中文预训练,提升了中文基础语义理解能力。
Chinese-LLaMA-2-7B-16K是基于Meta发布的Llama-2开发的中文大模型,支持16K上下文长度,适用于推理和全参数训练。
完整的中文LLaMA-2-13B-16K模型,支持16K上下文长度,可直接加载进行推理和全参数训练
Chinese-Alpaca-2-7B是基于Llama-2的中文指令微调模型,支持中文和英文,适用于对话和指令任务。
一个提供中国主流社交平台实时热点话题的MCP服务器
中国节假日查询服务,提供节假日、工作日查询及详细信息获取功能。