vLLM-efficient-serving-stack

Public

Production-grade vLLM serving with an OpenAI-compatible API, per-request LoRA routing, KEDA autoscaling on Prometheus metrics, Grafana/OTel observability, and a benchmark comparing AWQ vs GPTQ vs GGUF.

awq grafana keda-scalers large-language-models low-rank-adaptation openai-api vllm vllm-serve

Creat：2025-08-31T02:19:15

Update：2025-09-03T01:10:57

Stars

Stars Increase

Related projects

Netdata

alerting

X-Ray Vision for your infrastructure!

76944

10个月前

+31today

Grafana

Hot

alerting

The open and composable observability and data visualization platform. Visualize metrics, logs, and traces from multiple sources like Prometheus, Loki, Elasticsearch, InfluxDB, Postgres and many more.

71178

10个月前

+53today

Questdb

capital-markets

QuestDB is a high performance, open-source, time-series database

16430

10个月前

+7today

Keda

autoscaling

KEDA is a Kubernetes-based Event Driven Autoscaling component. It provides event driven scale for any container running in Kubernetes

9718

10个月前

+3today

Teslamate

elixir-lang

A self-hosted data logger for your Tesla ?

7387

10个月前

+11today

Hertzbeat

alerting

Apache HertzBeat(incubating) is a real-time monitoring system with agentless, performance cluster, prometheus-compatible, custom monitoring and status page building capabilities.

6874

10个月前

+11today

Wgcloud

agent

Linux运维监控工具，支持系统硬件信息，内存，CPU，温度，磁盘空间及IO，硬盘smart，GPU，防火墙，网络流量速率等监控，服务接口监测，大屏展示，拓扑图，端口监控，进程监控，docker监控，日志监控，文件防篡改，数据库监控，指令批量下发执行，web ssh，Linux面板(探针)，告警，SNMP监测，K8S，Redis，Nginx，Kafka，资产管理，计划任务，密码管理，工作笔记

5054

10个月前

DevOps

argocd

I created this repository to keep my learning, notes, and code in one place for various tools in DevOps. Now, it's helping thousands of learners, practitioners, and professionals every day in their DevOps journey.

3119

2年前

+1today

Robusta

alerting

Better Prometheus alerts for Kubernetes - smart grouping, AI enrichment, and automatic remediation

2907

10个月前

Spring Petclinic Microservices

chaos-monkey

Distributed version of Spring Petclinic built with Spring Cloud

1988

10个月前

+3today

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services

AI Model Compatibility Checker

AI Deployment Calculator

vLLM-efficient-serving-stack

Related projects

Netdata

Grafana

Questdb

Keda

Teslamate

Hertzbeat

Wgcloud

DevOps

Robusta

Spring Petclinic Microservices

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

vLLM-efficient-serving-stack

Related projects

Netdata

Grafana

Questdb

Keda

Teslamate

Hertzbeat

Wgcloud

DevOps

Robusta

Spring Petclinic Microservices

GEO Services