fix mscale_all_dim

ngxson · ngxson · commit aebab5f110d5 · 2025-12-03T14:24:23.000+01:00
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py
@@ -9990,6 +9990,7 @@ def set_gguf_parameters(self):
         MistralModel.set_mistral_config(self.gguf_writer, self.hparams)
         yarn_params = self.hparams["yarn"]
         self.gguf_writer.add_attn_temperature_length(yarn_params["original_max_position_embeddings"])
+        self.gguf_writer.add_rope_scaling_yarn_log_mul(0.1) # mscale_all_dim * 0.1
 
     # TODO @ngxson : this should be in tensor_mapping, but I don't have time for now
     # copied from https://github.com/vllm-project/vllm/blob/main/vllm/model_executor/models/mistral_large_3.py