autoquant-infer
PublicCông cụ giảm kích thước mô hình bằng Quantization, kết hợp AI Agent để tự động chọn mức tối ưu, giúp tăng tốc và tiết kiệm chi phí inference.
Creat:2025-06-04T12:11:07
Update:2025-06-11T17:40:47
1
Stars
0
Stars Increase
Công cụ giảm kích thước mô hình bằng Quantization, kết hợp AI Agent để tự động chọn mức tối ưu, giúp tăng tốc và tiết kiệm chi phí inference.