大语言模型推理效率迎来突破。清华大学与Moonshot AI联合提出“预填充即服务”新架构,通过将推理过程拆分为预填充和解码两个阶段,并优化算力资源分配,有效解决硬件限制问题,显著提升模型服务性能。
Moonshot AI与清华大学提出预填充即服务(PrfaaS)新架构,旨在解决大型语言模型推理中计算资源瓶颈。该架构将高计算密集的预填充阶段(生成键值缓存)与解码阶段分离,以优化资源利用,突破传统服务限制。
清华大学孵化企业紫荆智康推出“紫荆AI医院”虚拟诊室,支持医生和医学生创建“医生分身智能体”,与系统内高度拟真的“AI患者智能体”进行全流程模拟诊疗。该平台通过双向智能体交互,帮助医生分身与真人医生共同出诊,实现从技术验证到规模化应用的关键突破。
清华大学智能产业研究院联合水木分子开源了生物医药大模型插件集OpenBioMed Skills,将专家决策流程转化为可执行的Agent Skill代码。首批发布的45项核心技能覆盖生物化学与药物研发、蛋白质分析设计、单细胞组学分析及数据检索等五大领域,旨在降低生物医学研发的工程门槛,推动全流程智能化。
清华开源的多智能体互动课堂平台,一键将话题转为沉浸式学习体验。
Chatglm
-
Input tokens/M
Output tokens/M
128
Context Length
tensorblock
LongWriter-Zero-32B是由清华大学知识工程实验室开发的32B参数大语言模型,专门针对长文本写作任务优化。本仓库提供该模型的GGUF量化格式文件,支持多种量化级别,适用于不同的硬件配置和使用场景。
zai-org
CogView4-6B是清华大学开发的高性能文本到图像生成模型,基于GLM-4-9B基础模型构建,支持高分辨率图像生成,在多项基准测试中表现优异,特别在中文文本准确性方面表现突出。
THUdyh
Ola-7B是由腾讯、清华大学和南洋理工大学联合开发的多模态语言模型,基于Qwen2.5架构,支持文本、图像、视频和音频输入,输出文本内容。
Ola-7B是由腾讯、清华大学和南洋理工大学联合开发的多模态语言模型,基于Qwen2.5架构,支持处理图像、视频、音频和文本输入,并输出文本。
Ola-7B是由腾讯、清华大学和南洋理工大学联合开发的多模态大语言模型,基于Qwen2.5架构,支持处理文本、图像、视频和音频输入,并生成文本输出。
openbmb
MiniCPM-重排序器是由面壁智能与清华大学自然语言处理实验室、东北大学信息检索小组联合研发的中英双语文本重排序模型,具备卓越的中英文及跨语言重排序能力。
jameslahm
YOLOv10 是一个实时端到端目标检测模型,由清华大学团队开发,基于 YOLO 系列的最新改进版本。
YOLOv10 是清华大学提出的实时端到端目标检测模型,具有高效和精准的特点。
YOLOv10是清华大学提出的实时端到端目标检测模型,在速度和精度上均有显著提升。
YOLOv10是清华大学提出的实时端到端目标检测模型,具有高效和准确的特点。
onnx-community
YOLOv10是清华大学MIG实验室开发的实时端到端目标检测模型,提供高效的检测性能和轻量级部署能力。
YOLOv10是清华大学MIG实验室开发的高效实时目标检测模型,提供端到端检测能力。
MiniCPM是面壁智能与清华大学自然语言处理实验室联合研发的端侧大语言模型系列,核心模型仅含12亿非词嵌入参数,在多项评测中超越更大规模的开源模型。
MiniCPM是由面壁智能与清华大学自然语言处理实验室联合开发的端侧大语言模型,非词嵌入参数量仅24亿(2.4B),支持128k上下文窗口。
MiniCPM是由面壁智能与清华大学自然语言处理实验室联合开源的一系列端侧大语言模型,核心语言模型MiniCPM-2B仅含24亿非词嵌入参数。
MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的系列端侧语言大模型,主体语言模型 MiniCPM-2B 仅有 24亿(2.4B)的非词嵌入参数量。
deeplang-ai
深言科技联合清华大学NLP实验室开源的中英双语大语言模型,基于数万亿token高质量数据预训练,具备8K上下文窗口处理能力
BubbleSheep
这是一个基于Helsinki-NLP/opus-mt-en-zh预训练模型微调的英中翻译模型,使用清华大学开放中文词库(THUOCL)数据集进行微调。
GKLMIP
这是一个针对高棉语(Khmer)的预训练模型,由清华大学团队开发。