leave the env vars alone!

remove env var writing
removed 5 sec sleep and warmup request on load
2025-10-29 11:36:46 -07:00 · 2025-10-29 09:58:09 -07:00 · 2025-10-29 09:57:46 -07:00
1 changed files with 22 additions and 21 deletions
@@ -66,9 +66,6 @@ class Backend:
    unsecured: bool = dataclasses.field(
        default_factory=lambda: bool(strtobool(os.environ.get("UNSECURED", "false"))),
    )
-    report_addr: str = dataclasses.field(
-        default_factory=lambda: os.environ.get("REPORT_ADDR", "https://run.vast.ai")
-    )

    def __post_init__(self):
        self.metrics = Metrics()
@@ -107,19 +104,23 @@ class Backend:

    #######################################Private#######################################
    def _fetch_pubkey(self):
-        report_addr = self.report_addr.rstrip("/")
-        command = ["curl", "-X", "GET", f"{report_addr}/pubkey/"]
-        try:
+        command = ["curl", "-X", "GET", "https://run.vast.ai/pubkey/"]
        result = subprocess.check_output(command, universal_newlines=True)
        log.debug("public key:")
        log.debug(result)
+        key = None
+        for _ in range(5):
+            try:
                key = RSA.import_key(result)
-            if key is not None:
-                return key
-        except (ValueError , subprocess.CalledProcessError) as e:
+                break
+            except ValueError as e:
                log.debug(f"Error downloading key: {e}")
+                time.sleep(15)
+        if key is None:
+            self._total_pubkey_fetch_errors += 1
+            if self._total_pubkey_fetch_errors >= MAX_PUBKEY_FETCH_ATTEMPTS:
                self.backend_errored("Failed to get autoscaler pubkey")
-       
+        return key

    async def __handle_request(
        self,
@@ -314,10 +315,10 @@ class Backend:
                with open(BENCHMARK_INDICATOR_FILE, "r") as f:
                    log.debug("already ran benchmark")
                    # trigger model load
-                    payload = self.benchmark_handler.make_benchmark_payload()
-                    _ = await self.__call_api(
-                        handler=self.benchmark_handler, payload=payload
-                    )
+                    # payload = self.benchmark_handler.make_benchmark_payload()
+                    # _ = await self.__call_api(
+                    #     handler=self.benchmark_handler, payload=payload
+                    # )
                    return float(f.readline())
            except FileNotFoundError:
                pass
@@ -392,7 +393,7 @@ class Backend:
                        )
                        # some backends need a few seconds after logging successful startup before
                        # they can begin accepting requests
-                        await sleep(5)
+                        # await sleep(5)
                        try:
                            max_throughput = await run_benchmark()
                            self.__start_healthcheck = True
Author	SHA1	Message	Date
Colter Downing	7c0f316eeb	leave the env vars alone!	2025-10-29 11:36:46 -07:00
Colter Downing	b4025a744f	remove env var writing	2025-10-29 09:58:09 -07:00
Colter Downing	d190308329	removed 5 sec sleep and warmup request on load	2025-10-29 09:57:46 -07:00