Fix overuse of checkpointing

2021-09-16 23:00:28 -06:00 · 2021-09-16 23:00:28 -06:00 · 94899d88f3
commit 94899d88f3
parent f78ce9d924
2 changed files with 2 additions and 2 deletions
--- a/codes/models/diffusion/diffusion_dvae.py
+++ b/codes/models/diffusion/diffusion_dvae.py
@ -32,7 +32,7 @@ class DiscreteEncoder(nn.Module):
        )
    def forward(self, spectrogram):
-        return checkpoint(self.blocks, spectrogram)
+        return self.blocks(spectrogram)
 class DiscreteDecoder(nn.Module):
--- a/codes/trainer/ExtensibleTrainer.py
+++ b/codes/trainer/ExtensibleTrainer.py
@ -117,7 +117,7 @@ class ExtensibleTrainer(BaseModel):
                    dnet = DistributedDataParallel(anet, delay_allreduce=True)
                else:
                    from torch.nn.parallel.distributed import DistributedDataParallel
-                    dnet = DistributedDataParallel(anet, device_ids=[torch.cuda.current_device()])
+                    dnet = DistributedDataParallel(anet, device_ids=[torch.cuda.current_device()], find_unused_parameters=True)
            else:
                dnet = DataParallel(anet, device_ids=opt['gpu_ids'])
            if self.is_train: