allow for freezing codebook on forward, also convenience setter for codebook

lucidrains · lucidrains · commit 6fd054761cfe · 2023-08-17T08:47:48.000-07:00
diff --git a/setup.py b/setup.py
@@ -3,7 +3,7 @@
 setup(
   name = 'vector_quantize_pytorch',
   packages = find_packages(),
-  version = '1.6.31',
+  version = '1.6.32',
   license='MIT',
   description = 'Vector Quantization - Pytorch',
   long_description_content_type = 'text/markdown',
diff --git a/vector_quantize_pytorch/vector_quantize_pytorch.py b/vector_quantize_pytorch/vector_quantize_pytorch.py
@@ -438,7 +438,8 @@ def forward(
         self,
         x,
         sample_codebook_temp = None,
-        mask = None
+        mask = None,
+        freeze_codebook = False
     ):
         needs_codebook_dim = x.ndim < 4
         sample_codebook_temp = default(sample_codebook_temp, self.sample_codebook_temp)
@@ -478,7 +479,7 @@ def forward(
         else:
             quantize = batched_embedding(embed_ind, embed)
 
-        if self.training and self.ema_update:
+        if self.training and self.ema_update and not freeze_codebook:
 
             if self.affine_param:
                 flatten = (flatten - self.batch_mean) * (codebook_std / batch_std) + self.codebook_mean
@@ -620,7 +621,8 @@ def forward(
         self,
         x,
         sample_codebook_temp = None,
-        mask = None
+        mask = None,
+        freeze_codebook = False
     ):
         needs_codebook_dim = x.ndim < 4
         sample_codebook_temp = default(sample_codebook_temp, self.sample_codebook_temp)
@@ -652,7 +654,7 @@ def forward(
         else:
             quantize = batched_embedding(embed_ind, embed)
 
-        if self.training and self.ema_update:
+        if self.training and self.ema_update and not freeze_codebook:
             if exists(mask):
                 embed_onehot[~mask] = 0.
 
@@ -691,6 +693,7 @@ def __init__(
         separate_codebook_per_head = False,
         decay = 0.8,
         eps = 1e-5,
+        freeze_codebook = False,
         kmeans_init = False,
         kmeans_iters = 10,
         sync_kmeans = True,
@@ -796,11 +799,19 @@ def __init__(
     @property
     def codebook(self):
         codebook = self._codebook.embed
+
         if self.separate_codebook_per_head:
             return codebook
 
         return rearrange(codebook, '1 ... -> ...')
 
+    @codebook.setter
+    def codebook(self, codes):
+        if not self.separate_codebook_per_head:
+            codes = rearrange(codes, '... -> 1 ...')
+
+        self._codebook.embed.copy_(codes)
+
     def get_codes_from_indices(self, indices):
         codebook = self.codebook
         is_multiheaded = codebook.ndim > 2
@@ -825,7 +836,8 @@ def forward(
         x,
         indices = None,
         mask = None,
-        sample_codebook_temp = None
+        sample_codebook_temp = None,
+        freeze_codebook = False
     ):
         orig_input = x
 
@@ -867,7 +879,8 @@ def forward(
 
         codebook_forward_kwargs = dict(
             sample_codebook_temp = sample_codebook_temp,
-            mask = mask
+            mask = mask,
+            freeze_codebook = freeze_codebook
         )
 
         # quantize
@@ -876,7 +889,7 @@ def forward(
 
         # one step in-place update
 
-        if should_inplace_optimize and self.training:
+        if should_inplace_optimize and self.training and not freeze_codebook:
 
             if exists(mask):
                 loss = F.mse_loss(quantize, x.detach(), reduction = 'none')
@@ -900,7 +913,7 @@ def forward(
 
         if self.training:
             # determine code to use for commitment loss
-            maybe_detach = torch.detach if not self.learnable_codebook else identity
+            maybe_detach = torch.detach if not self.learnable_codebook or freeze_codebook else identity
 
             commit_quantize = maybe_detach(quantize)