Will TVM support NVIDIA Triton Inference Server as backend?

zhenlohuang · December 24, 2020, 11:23am

NVIDIA Triton Inference Server(aka TIS) is high performance inference server which contributed by NVIDIA. It would be great if TVM can be a backend in TIS like onnxtime.

TIS can help TVM for model mangement, scheduling and so on.

WeiHaocheng · June 28, 2023, 1:38am

Do you see any existing plans now?