LLM-Inference-Serving

Public

This repository demonstrates LLM execution on CPUs using packages like llamafile, emphasizing low-latency, high-throughput, and cost-effective benefits for inference and serving.

deepspeed large-language-models llamacpp llamafile llm-inference llm-serving llms vllm

Creat：2023-12-02T20:31:39

Update：2024-10-03T22:10:24

Stars

Stars Increase

Related projects

Transformers

Hot

bert

? Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.

151050

2年前

+78today

Rust

compiler

Empowering everyone to build reliable and efficient software.

107146

6个月前

+37today

TypeScript

javascript

TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

106374

6个月前

+7today

Generative Ai For Beginners

21 Lessons, Get Started Building with Generative AI ? https://microsoft.github.io/generative-ai-for-beginners/

100152

8个月前

+41today

Django

apps

The Web framework for perfectionists with deadlines.

85399

6个月前

+15today

LLMs From Scratch

Hot

Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

75371

1年前

+105today

D2l Zh

book

《动手学深度学习》：面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。

73060

6个月前

+38today

Gpt_academic

academic

为GPT/GLM等LLM大语言模型提供实用化交互接口，特别优化论文阅读/润色/写作体验，模块化设计，支持自定义快捷按钮&函数插件，支持Python和C++等项目剖析&自译解功能，PDF/LaTex论文翻译&总结功能，支持并行问询多种LLM模型，支持chatglm3等本地模型。接入通义千问, deepseekcoder, 讯飞星火, 文心一言, llama2, rwkv, claude2, moss等。

69327

6个月前

+9today

Sway

compiler

? Empowering everyone to build reliable and efficient smart contracts.

62135

6个月前

+2today

LLaMA Factory

Hot

agent

Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

60113

6个月前

+66today

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

LLM-Inference-Serving

Related projects

Transformers

Rust

TypeScript

Generative Ai For Beginners

Django

LLMs From Scratch

D2l Zh

Gpt_academic

Sway

LLaMA Factory

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

LLM-Inference-Serving

Related projects

Transformers

Rust

TypeScript

Generative Ai For Beginners

Django

LLMs From Scratch

D2l Zh

Gpt_academic

Sway

LLaMA Factory

GEO Services