[pre-commit.ci] Add auto fixes from pre-commit.com hooks

pre-commit-ci[bot] · pre-commit-ci[bot] · commit 85b756591949 · 2025-04-04T13:09:06.000Z
for more information, see https://pre-commit.ci
diff --git a/vec_inf/cli/_helper.py b/vec_inf/cli/_helper.py
@@ -165,8 +165,6 @@ def build_launch_command(self) -> str:
 
         command_list.append(str(slurm_script_path))
         return " ".join(command_list)
-    
-    
 
     def format_table_output(self, job_id: str) -> Table:
         """Format output as rich Table."""
@@ -199,7 +197,10 @@ def format_table_output(self, job_id: str) -> Table:
             )
         if self.params.get("enforce_eager"):
             table.add_row("Enforce Eager", self.params["enforce_eager"])
-        table.add_row("Model Weights Directory", str(Path(self.params["model_weights_parent_dir"], self.model_name)))
+        table.add_row(
+            "Model Weights Directory",
+            str(Path(self.params["model_weights_parent_dir"], self.model_name)),
+        )
         table.add_row("Log Directory", self.params["log_dir"])
 
         return table
diff --git a/vec_inf/cli/_slurm_script_generator.py b/vec_inf/cli/_slurm_script_generator.py
@@ -1,22 +1,30 @@
 from pathlib import Path
 
+
 VLLM_TASK_MAP = {
     "LLM": "generate",
     "VLM": "generate",
     "Text_Embedding": "embed",
     "Reward_Modeling": "reward",
 }
 
+
 class SlurmScriptGenerator:
     def __init__(self, params: dict, src_dir: str, is_multinode: bool = False):
         self.params = params
         self.src_dir = src_dir
         self.is_multinode = is_multinode
-        self.model_weights_path = Path(params["model_weights_parent_dir"], params["model_name"])
+        self.model_weights_path = Path(
+            params["model_weights_parent_dir"], params["model_name"]
+        )
         self.task = VLLM_TASK_MAP[self.params["model_type"]]
 
     def _generate_script_content(self) -> str:
-        return self._generate_multinode_script() if self.is_multinode else self._generate_single_node_script()
+        return (
+            self._generate_multinode_script()
+            if self.is_multinode
+            else self._generate_single_node_script()
+        )
 
     def _generate_preamble(self, is_multinode: bool = False) -> str:
         base = [
@@ -42,14 +50,13 @@ def _export_parallel_vars(self) -> str:
 export TENSOR_PARALLEL_SIZE=$((SLURM_JOB_NUM_NODES*SLURM_GPUS_PER_NODE))
 fi
 """
-        else:
-            return "export TENSOR_PARALLEL_SIZE=$SLURM_GPUS_PER_NODE\n"
+        return "export TENSOR_PARALLEL_SIZE=$SLURM_GPUS_PER_NODE\n"
 
     def _generate_shared_args(self) -> list[str]:
         args = [
             f"--model {self.model_weights_path} \\",
             f"--served-model-name {self.params['model_name']} \\",
-            "--host \"0.0.0.0\" \\",
+            '--host "0.0.0.0" \\',
             "--port $vllm_port_number \\",
             "--tensor-parallel-size ${TENSOR_PARALLEL_SIZE} \\",
             f"--dtype {self.params['data_type']} \\",
@@ -64,7 +71,9 @@ def _generate_shared_args(self) -> list[str]:
         if self.is_multinode:
             args.insert(4, "--pipeline-parallel-size ${PIPELINE_PARALLEL_SIZE} \\")
         if self.params.get("max_num_batched_tokens"):
-            args.append(f"--max-num-batched-tokens={self.params['max_num_batched_tokens']} \\")
+            args.append(
+                f"--max-num-batched-tokens={self.params['max_num_batched_tokens']} \\"
+            )
         if self.params.get("enable_prefix_caching") == "True":
             args.append("--enable-prefix-caching \\")
         if self.params.get("enable_chunked_prefill") == "True":
@@ -83,7 +92,7 @@ def _generate_single_node_script(self) -> str:
 SERVER_ADDR="http://${{hostname}}:${{vllm_port_number}}/v1"
 echo "Server address: $SERVER_ADDR"
 
-JSON_PATH="{self.params['log_dir']}/{self.params['model_name']}.$SLURM_JOB_ID/{self.params['model_name']}.$SLURM_JOB_ID.json"
+JSON_PATH="{self.params["log_dir"]}/{self.params["model_name"]}.$SLURM_JOB_ID/{self.params["model_name"]}.$SLURM_JOB_ID.json"
 echo "Updating server address in $JSON_PATH"
 jq --arg server_addr "$SERVER_ADDR" \\
     '. + {{"server_address": $server_addr}}' \\
@@ -103,86 +112,88 @@ def _generate_single_node_script(self) -> str:
 python3.10 -m vllm.entrypoints.openai.api_server \\
 """
         else:
-            launcher = f"""source {self.params['venv']}/bin/activate
+            launcher = f"""source {self.params["venv"]}/bin/activate
 python3 -m vllm.entrypoints.openai.api_server \\
 """
 
         args = "\n".join(self._generate_shared_args())
         return preamble + server + env_exports + launcher + args
-    
-    
+
     def _generate_multinode_script(self) -> str:
         preamble = self._generate_preamble(is_multinode=True)
 
         cluster_setup = []
         if self.params["venv"] == "singularity":
-            cluster_setup.append(f"""export SINGULARITY_IMAGE=/model-weights/vec-inf-shared/vector-inference_latest.sif
+            cluster_setup.append("""export SINGULARITY_IMAGE=/model-weights/vec-inf-shared/vector-inference_latest.sif
 export VLLM_NCCL_SO_PATH=/vec-inf/nccl/libnccl.so.2.18.1
 module load singularity-ce/3.8.2
 singularity exec $SINGULARITY_IMAGE ray stop
 """)
 
-        cluster_setup.append(f"""nodes=$(scontrol show hostnames "$SLURM_JOB_NODELIST")
+        cluster_setup.append("""nodes=$(scontrol show hostnames "$SLURM_JOB_NODELIST")
 nodes_array=($nodes)
 
-head_node=${{nodes_array[0]}}
+head_node=${nodes_array[0]}
 head_node_ip=$(srun --nodes=1 --ntasks=1 -w "$head_node" hostname --ip-address)
 
 head_node_port=$(find_available_port $head_node_ip 8080 65535)
 
 ip_head=$head_node_ip:$head_node_port
 export ip_head
 echo "IP Head: $ip_head"
-                             
+
 echo "Starting HEAD at $head_node"
 srun --nodes=1 --ntasks=1 -w "$head_node" \\""")
 
         if self.params["venv"] == "singularity":
-            cluster_setup.append(f"""    singularity exec --nv --bind {self.model_weights_path}:{self.model_weights_path} $SINGULARITY_IMAGE \\""")
+            cluster_setup.append(
+                f"""    singularity exec --nv --bind {self.model_weights_path}:{self.model_weights_path} $SINGULARITY_IMAGE \\"""
+            )
 
-        cluster_setup.append(f"""    ray start --head --node-ip-address="$head_node_ip" --port=$head_node_port \\
-    --num-cpus "${{SLURM_CPUS_PER_TASK}}" --num-gpus "${{SLURM_GPUS_PER_NODE}}" --block &
+        cluster_setup.append("""    ray start --head --node-ip-address="$head_node_ip" --port=$head_node_port \\
+    --num-cpus "${SLURM_CPUS_PER_TASK}" --num-gpus "${SLURM_GPUS_PER_NODE}" --block &
 
 sleep 10
 worker_num=$((SLURM_JOB_NUM_NODES - 1))
 
 for ((i = 1; i <= worker_num; i++)); do
-    node_i=${{nodes_array[$i]}}
+    node_i=${nodes_array[$i]}
     echo "Starting WORKER $i at $node_i"
     srun --nodes=1 --ntasks=1 -w "$node_i" \\""")
 
         if self.params["venv"] == "singularity":
-            cluster_setup.append(f"""        singularity exec --nv --bind {self.model_weights_path}:{self.model_weights_path} $SINGULARITY_IMAGE \\""")
+            cluster_setup.append(
+                f"""        singularity exec --nv --bind {self.model_weights_path}:{self.model_weights_path} $SINGULARITY_IMAGE \\"""
+            )
         cluster_setup.append(f"""        ray start --address "$ip_head" \\
         --num-cpus "${{SLURM_CPUS_PER_TASK}}" --num-gpus "${{SLURM_GPUS_PER_NODE}}" --block &
     sleep 5
 done
 
-                             
+
 vllm_port_number=$(find_available_port $head_node_ip 8080 65535)
 
-                             
+
 SERVER_ADDR="http://${{head_node_ip}}:${{vllm_port_number}}/v1"
 echo "Server address: $SERVER_ADDR"
 
-JSON_PATH="{self.params['log_dir']}/{self.params['model_name']}.$SLURM_JOB_ID/{self.params['model_name']}.$SLURM_JOB_ID.json"
+JSON_PATH="{self.params["log_dir"]}/{self.params["model_name"]}.$SLURM_JOB_ID/{self.params["model_name"]}.$SLURM_JOB_ID.json"
 echo "Updating server address in $JSON_PATH"
 jq --arg server_addr "$SERVER_ADDR" \\
     '. + {{"server_address": $server_addr}}' \\
     "$JSON_PATH" > temp.json \\
     && mv temp.json "$JSON_PATH" \\
-    && rm -f temp.json                       
+    && rm -f temp.json
 """)
         cluster_setup = "\n".join(cluster_setup)
         env_exports = self._export_parallel_vars()
 
-
         if self.params["venv"] == "singularity":
             launcher = f"""singularity exec --nv --bind {self.model_weights_path}:{self.model_weights_path} $SINGULARITY_IMAGE \\
 python3.10 -m vllm.entrypoints.openai.api_server \\
 """
         else:
-            launcher = f"""source {self.params['venv']}/bin/activate
+            launcher = f"""source {self.params["venv"]}/bin/activate
 python3 -m vllm.entrypoints.openai.api_server \\
 """