runpod/vllm/server.py at cc0f55df38b24e5bccb7c98903e057b2dc4ef101 - runpod - dev.pivoine.art

valknar/runpod

Files

Sebastian Krüger cc0f55df38 fix: reduce max_model_len to 20000 to fit in 24GB VRAM

2025-11-23 15:43:37 +01:00

10 KiB

Raw Blame History

View Raw