vllm/quantization at 7d648418b8b1aadb90489ef18cff1763ffc82ed5 - vllm

History

Casper beb89f68b4 AWQ: Up to 2.66x higher throughput (#2566 )		2024-01-26 23:53:17 -08:00
..
awq	AWQ: Up to 2.66x higher throughput (#2566 )	2024-01-26 23:53:17 -08:00
gptq	Enable CUDA graph for GPTQ & SqueezeLLM (#2318 )	2024-01-03 09:52:29 -08:00
squeezellm	Enable CUDA graph for GPTQ & SqueezeLLM (#2318 )	2024-01-03 09:52:29 -08:00