Slower Execution Times After 8 bit Quantization?

LeiWang1999 · August 11, 2023, 1:18am

hi @zpu , some related discussions: Quantized models are slower than float models on GPUs - Questions - Apache TVM Discuss