add ...

Obfuscate mtoken in logs
bump version to 0.2.0
2025-11-07 10:10:35 -08:00 · 2025-11-07 10:02:39 -08:00 · 2025-11-05 13:32:21 -08:00 · 2025-11-04 17:15:59 -08:00 · 2025-11-04 16:59:39 -08:00 · 2025-11-04 15:55:14 -08:00
6 changed files with 30 additions and 9 deletions
@@ -30,7 +30,7 @@ from lib.data_types import (
    BenchmarkResult
 )

-VERSION = "0.1.0"
+VERSION = "0.2.0"

 MSG_HISTORY_LEN = 100
 log = logging.getLogger(__file__)
@@ -69,10 +69,14 @@ class Backend:
    report_addr: str = dataclasses.field(
        default_factory=lambda: os.environ.get("REPORT_ADDR", "https://run.vast.ai")
    )
+    mtoken: str = dataclasses.field(
+        default_factory=lambda: os.environ.get("MASTER_TOKEN", "")
+    )

    def __post_init__(self):
        self.metrics = Metrics()
        self.metrics._set_version(self.version)
+        self.metrics._set_mtoken(self.mtoken)
        self._total_pubkey_fetch_errors = 0
        self._pubkey = self._fetch_pubkey()
        self.__start_healthcheck: bool = False
@@ -314,10 +318,10 @@ class Backend:
                with open(BENCHMARK_INDICATOR_FILE, "r") as f:
                    log.debug("already ran benchmark")
                    # trigger model load
-                    payload = self.benchmark_handler.make_benchmark_payload()
-                    _ = await self.__call_api(
-                        handler=self.benchmark_handler, payload=payload
-                    )
+                    # payload = self.benchmark_handler.make_benchmark_payload()
+                    # _ = await self.__call_api(
+                    #     handler=self.benchmark_handler, payload=payload
+                    # )
                    return float(f.readline())
            except FileNotFoundError:
                pass
@@ -392,7 +396,7 @@ class Backend:
                        )
                        # some backends need a few seconds after logging successful startup before
                        # they can begin accepting requests
-                        await sleep(5)
+                        # await sleep(5)
                        try:
                            max_throughput = await run_benchmark()
                            self.__start_healthcheck = True
@@ -286,6 +286,7 @@ class AutoScalerData:
    """Data that is reported to autoscaler"""

    id: int
+    mtoken: str
    version: str
    loadtime: float
    cur_load: float
@@ -28,6 +28,7 @@ def get_url() -> str:
@dataclass
 class Metrics:
    version: str = "0"
+    mtoken: str = ""
    last_metric_update: float = 0.0
    last_request_served: float = 0.0
    update_pending: bool = False
@@ -142,12 +143,16 @@ class Metrics:
    def _set_version(self, version: str) -> None:
        self.version = version

+    def _set_mtoken(self, mtoken: str) -> None:
+        self.mtoken = mtoken
+
    #######################################Private#######################################

    async def __send_delete_requests_and_reset(self):
        async def post(report_addr: str, idxs: list[int], success_flag: bool) -> bool:
            data = {
                "worker_id": self.id,
+                "mtoken": self.mtoken,
                "request_idxs": idxs,
                "success": success_flag,
            }
@@ -209,6 +214,7 @@ class Metrics:
        def compute_autoscaler_data() -> AutoScalerData:
            return AutoScalerData(
                id=self.id,
+                mtoken=self.mtoken,
                version=self.version,
                loadtime=(loadtime_snapshot or 0.0), 
                new_load=self.model_metrics.workload_processing,
@@ -228,17 +234,25 @@ class Metrics:

        async def send_data(report_addr: str) -> bool:
            data = compute_autoscaler_data()
-            full_path = report_addr.rstrip("/") + "/worker_status/"
+            log_data = asdict(data)
+            def obfuscate(secret: str) -> str:
+                if secret is None:
+                    return ""
+                return secret[:7] + "..." if len(secret) > 7 else ("*" * len(secret))
+            
+            log_data["mtoken"] = obfuscate(log_data.get("mtoken"))
            log.debug(
                "\n".join(
                    [
                        "#" * 60,
                        f"sending data to autoscaler",
-                        f"{json.dumps((asdict(data)), indent=2)}",
+                        f"{json.dumps(log_data, indent=2)}",
                        "#" * 60,
                    ]
                )
            )
+
+            full_path = report_addr.rstrip("/") + "/worker_status/"
            for attempt in range(1, 4):
                try:
                    session = await self.http()
@@ -9,7 +9,7 @@ ENV_PATH="$WORKSPACE_DIR/worker-env"
 DEBUG_LOG="$WORKSPACE_DIR/debug.log"
 PYWORKER_LOG="$WORKSPACE_DIR/pyworker.log"

-REPORT_ADDR="${REPORT_ADDR:-https://cloud.vast.ai/api/v0,https://run.vast.ai}"
+REPORT_ADDR="${REPORT_ADDR:-https://run.vast.ai}"
 USE_SSL="${USE_SSL:-true}"
 WORKER_PORT="${WORKER_PORT:-3000}"
 mkdir -p "$WORKSPACE_DIR"
@@ -98,6 +98,7 @@ def call_text2image_workflow(
        endpoint=route_response["endpoint"],
        reqnum=route_response["reqnum"],
        url=route_response["url"],
+        request_idx=route_response["request_idx"],
    )
    
    # Build the payload for the worker request
@@ -82,6 +82,7 @@ def call_custom_workflow_for_sd3(
        endpoint=message["endpoint"],
        reqnum=message["reqnum"],
        url=message["url"],
+        request_idx=message["request_idx"],
    )
    workflow = {
        "3": {
Author	SHA1	Message	Date
Lucas Armand	c6521cb6d4	add ...	2025-11-07 10:10:35 -08:00
Lucas Armand	b7fe4ebb91	Obfuscate mtoken in logs	2025-11-07 10:02:39 -08:00
Lucas Armand	8ae7b74605	bump version to 0.2.0	2025-11-05 13:32:21 -08:00
Lucas Armand	106067d716	bump version to 0.1.1	2025-11-04 17:15:59 -08:00
Lucas Armand	f5134d4bf5	Fix spelling mistake	2025-11-04 16:59:39 -08:00
Lucas Armand	47e5460532	added mtoken	2025-11-04 15:55:14 -08:00
Colter-Downing	ec2ac0a21a	Merge pull request #52 from vast-ai/remove-sleeps-and-delays Remove sleeps and delays	2025-10-30 11:53:39 -07:00
Abiola Akinnubi	2cde573c56	Merge pull request #48 from vast-ai/comfy-request-idx Added request_idx to comfy auth_data	2025-10-30 11:27:35 -07:00
Abiola Akinnubi	b2e4a5db0c	Merge pull request #49 from vast-ai/unsecure_report_addr Added caller for REPORT_ADDR to backend.py to use the report add	2025-10-30 10:39:46 -07:00
edgaratvast	02c8307af7	remove redis pubsub from pyworker (#53 ) Co-authored-by: Edgar Lin <edgarlin2000@gmail.com>	2025-10-29 17:07:56 -07:00
Colter Downing	7c0f316eeb	leave the env vars alone!	2025-10-29 11:36:46 -07:00
Colter Downing	b4025a744f	remove env var writing	2025-10-29 09:58:09 -07:00
Colter Downing	d190308329	removed 5 sec sleep and warmup request on load	2025-10-29 09:57:46 -07:00
Abiola Akinnubi	944f83fc03	Removed extra spaces from operator assignment	2025-10-28 21:03:52 +00:00
Abiola Akinnubi	f56bbc0ebe	Added request_idx to comfy auth_data	2025-10-27 03:17:06 +00:00