Update build-and-run.yml

mikepapadim · web-flow · commit c69206b438b0 · 2025-11-23T12:43:41.000+02:00
diff --git a/.github/workflows/build-and-run.yml b/.github/workflows/build-and-run.yml
@@ -1,4 +1,5 @@
 name: GPULlama3 Build & Run
+
 on:
   push:
     branches: [ main ]
@@ -7,29 +8,20 @@ on:
     types: [opened, synchronize, reopened]
 
 jobs:
-  build-and-test:
+  build-and-run:
     runs-on: self-hosted
     
-    strategy:
-      fail-fast: false
-      matrix:
-        model:
-          - Llama-3.2-1B-Instruct-F16.gguf
-          - Qwen3-4B-f16.gguf
-          - DeepSeek-R1-Distill-Qwen-1.5B-F16.gguf
-    
     env:
       JAVA_HOME: /opt/jenkins/jdks/graal-23.1.0/jdk-21.0.3
       TORNADO_ROOT: ${{ github.workspace }}/GPULlama3.java/external/tornadovm
-      LLAMA_ROOT: ${{ github.workspace }}
-      MODEL_DIR: /home/michalis/models
+      LLAMA_ROOT: ${{ github.workspace }} 
     
     steps:
       - name: Checkout GPULlama3
         uses: actions/checkout@v4
         with:
           fetch-depth: 0
-          
+
       - name: Check code formatting (Spotless)
         run: |
           cd ${{ github.workspace }}
@@ -40,12 +32,15 @@ jobs:
           git clone --depth 1 --branch master \
             https://github.com/beehive-lab/TornadoVM.git \
             GPULlama3.java/external/tornadovm
-            
+      - name: Set up Python venv for TornadoVM
+        run: |
+          python3 -m venv GPULlama3.java/external/tornadovm/venv
+          source GPULlama3.java/external/tornadovm/venv/bin/activate
+          python --version
       - name: Build TornadoVM
         run: |
           set -x
           cd GPULlama3.java/external/tornadovm
-          python3 -m venv venv
           source venv/bin/activate
           echo "=== Building TornadoVM ==="
           make
@@ -59,16 +54,17 @@ jobs:
           FULL_SDK="${PWD}/${SDK_DIR}"
           echo "Detected TornadoVM SDK: $FULL_SDK"
           
+          # Export for current shell session
           export TORNADO_SDK="$FULL_SDK"
           export PATH="$FULL_SDK/bin:$JAVA_HOME/bin:$PATH"
           
+          # Save for subsequent steps
           echo "TORNADO_SDK=$FULL_SDK" >> $GITHUB_ENV
           echo "PATH=$PATH" >> $GITHUB_ENV
           
           echo "=== Checking tornado CLI ==="
           which tornado || { echo "::error::tornado not in PATH"; exit 1; }
           tornado --devices
-          
       - name: Build GPULlama3
         run: |
           set -x
@@ -78,16 +74,12 @@ jobs:
           which tornado || { echo "::error::tornado unavailable during GPULlama3 build"; exit 1; }
           tornado --version
           make
-          
-      - name: Test Inference ${{ matrix.model.name }} with OpenCL
+      - name: Run Test Inference
         run: |
           set -x
           cd ${{ github.workspace }}
           export PATH="$TORNADO_SDK/bin:$JAVA_HOME/bin:$PATH"
           which tornado || { echo "::error::tornado not found at runtime"; exit 1; }
-          
-          echo "=== Testing ${{ matrix.model.name }} ==="
           ./llama-tornado --gpu --opencl \
-            --model $MODEL_DIR/${{ matrix.model.file }} \
-            --prompt "Tell me a joke" \
-            --max-tokens 50
+            --model /home/michalis/models/Llama-3.2-1B-Instruct-F16.gguf \
+            --prompt "Say hello"