在2024北京文化論壇上,北京智源人工智能研究院(BAAI)宣佈正式發佈新一代中文互聯網語料庫CCI3.0(Chinese Corpora Internet),進一步推動數據共建共享。CCI3.0包含1000GB的數據集及498GB的高質量子集CCI3.0-HQ,是繼2023年11月首次開源CCI1.0和2024年4月發佈CCI2.0之後的又一次重要更新。
一個可以根據英文名和性別生成中文名字的在線工具。
利用AI幫你快速生成有意義且符合中國文化傳統的中文名字。
一款專為中英文用戶定製的指令式語言模型。
70億參數的中英雙語對話模型
Midsummra
CNMBert是一個專門用於翻譯拼音縮寫的模型,基於Chinese-BERT-wwm訓練,通過修改預訓練任務適配拼音縮寫翻譯任務。
iioSnail
ChineseBERT是一個融合字形與拼音信息的中文預訓練模型,針對中文文本處理進行了優化。
Johnson8187
基於mDeBERTa-v3-base微調的中文情感分類模型,可識別8種情緒標籤
基於xlm-roberta-large-xnli微調的中文情感分類模型,可識別8種情緒標籤
一個用於翻譯拼音縮寫的模型,基於Chinese-BERT-wwm訓練,適配拼音縮寫翻譯任務。
shibing624
Qwen2.5-7B-Instruct 是一個基於 Qwen2.5 架構的 7B 參數規模的中文指令微調大語言模型,適用於文本生成和推理任務。
Qwen2.5-1.5B-Instruct 是一個基於 Qwen2.5 架構的 15 億參數的中文指令微調模型,適用於文本生成和推理任務。
hw2942
基於hfl/chinese-roberta-wwm-ext微調的中文RoBERTa模型,用於氣候轉型和物理風險預測任務
lixin12345
一個專門用於中文醫療文本的命名實體識別模型,能夠識別疾病、藥物、治療程序等醫療相關實體。
listenrwt
基於llama3-8b微調的中文輕小說生成模型,使用40,000組小說上下文數據訓練
BUAADreamer
基於LLaVA-1.5架構的中文醫療多模態大語言模型,專注於醫療領域的視覺問答任務。
sanshizhang
基於BERT架構的中文情感分析模型,專門針對基金領域文本進行優化,支持負面、正面和中性三類情感分類。
Xenova
中文CLIP模型,基於Vision Transformer架構,支持圖像與文本的跨模態理解與生成。
基於ViT架構的中文CLIP模型,支持圖像與文本的多模態理解
qgyd2021
該模型是一個基於Apache-2.0許可證的開源人工智能模型,具體功能需根據實際模型類型確定
hfl
適配llama.cpp的中文LLaMA-2-7B模型的GGUF-v3版本文件
Chinese-LLaMA-2-1.3B是基於Meta發佈的Llama-2模型的中文基礎模型,擴充了中文詞表並進行了中文預訓練,提升了中文基礎語義理解能力。
Chinese-LLaMA-2-7B-16K是基於Meta發佈的Llama-2開發的中文大模型,支持16K上下文長度,適用於推理和全參數訓練。
完整的中文LLaMA-2-13B-16K模型,支持16K上下文長度,可直接加載進行推理和全參數訓練
Chinese-Alpaca-2-7B是基於Llama-2的中文指令微調模型,支持中文和英文,適用於對話和指令任務。
一個提供中國主流社交平臺即時熱點話題的MCP服務器
中國節假日查詢服務,提供節假日、工作日查詢及詳細信息獲取功能。