Merge pull request #68 from vast-ai/fix-vllm-concurrency

Increase model wait time for vLLM
2025-12-03 16:13:51 -05:00
parent 0339b471c5 0bcd2219ea
commit 2f543c01ad
1 changed files with 1 additions and 0 deletions
@@ -35,6 +35,7 @@ backend = Backend(
    model_server_url=os.environ["MODEL_SERVER_URL"],
    model_log_file=os.environ["MODEL_LOG"],
    allow_parallel_requests=True,
    max_wait_time=600.0,
    benchmark_handler=CompletionsHandler(benchmark_runs=3, benchmark_words=256),
    log_actions=[
        *[(LogAction.ModelLoaded, info_msg) for info_msg in MODEL_SERVER_START_LOG_MSG],