Fix for older Torch versions

turboderp · turboderp · commit e89dc5b762af · 2024-08-20T14:08:35.000+02:00
diff --git a/exllamav2/util.py b/exllamav2/util.py
@@ -341,7 +341,7 @@ def unpack_4bit(packed: torch.Tensor):
 
     m, n8 = packed.shape
     n = n8 * 8
-    assert packed.dtype in [torch.int32, torch.uint32]
+    assert packed.dtype in [torch.int32]
 
     # packed = packed.view(torch.uint32)
     unpacked = torch.empty((m, n), dtype = torch.uint8, device = packed.device)
@@ -366,5 +366,5 @@ def pack_4bit(unpacked: torch.Tensor):
     packed = torch.zeros((m, n // 8), dtype = torch.int64, device = unpacked.device)
     for i in range(8):
         packed |= (unpacked[:, i::8].to(torch.int64) << (i * 4))
-    packed = packed.to(torch.uint32)
-    return packed.view(torch.int32)
+    packed = packed.to(torch.int32)
+    return packed