Better estimation for memory usage during audio VAE encoding/decoding.

2025-07-07 15:57:10 +08:00 · 2024-06-16 11:47:32 -04:00 · 2024-06-16 11:47:32 -04:00 · ca9d300a80
commit ca9d300a80
parent 746a0410d4
1 changed files with 2 additions and 2 deletions
--- a/comfy/sd.py
+++ b/comfy/sd.py
@ -237,8 +237,8 @@ class VAE:
                                                                decoder_config={'target': "comfy.ldm.modules.diffusionmodules.model.Decoder", 'params': ddconfig})
            elif "decoder.layers.0.weight_v" in sd:
                self.first_stage_model = AudioOobleckVAE()
-                self.memory_used_encode = lambda shape, dtype: (1767 * shape[2]) * model_management.dtype_size(dtype) #TODO: tweak for the audio VAE
-                self.memory_used_decode = lambda shape, dtype: (2178 * shape[2] * 64) * model_management.dtype_size(dtype)
+                self.memory_used_encode = lambda shape, dtype: (1000 * shape[2]) * model_management.dtype_size(dtype)
+                self.memory_used_decode = lambda shape, dtype: (1000 * shape[2] * 2048) * model_management.dtype_size(dtype)
                self.latent_channels = 64
                self.output_channels = 2
                self.upscale_ratio = 2048