Allow swapping to torch DDP as needed in code

2020-12-09 15:03:59 -07:00 · 2020-12-09 15:03:59 -07:00 · c203cee31e
commit c203cee31e
parent 66cbae8731
1 changed files with 2 additions and 0 deletions
--- a/codes/models/ExtensibleTrainer.py
+++ b/codes/models/ExtensibleTrainer.py
@ -108,6 +108,8 @@ class ExtensibleTrainer(BaseModel):
                # Use Apex to enable delay_allreduce, which is compatible with gradient checkpointing.
                from apex.parallel import DistributedDataParallel
                dnet = DistributedDataParallel(anet, delay_allreduce=True)
+                #from torch.nn.parallel.distributed import DistributedDataParallel
+                #dnet = DistributedDataParallel(anet, device_ids=[torch.cuda.current_device()], find_unused_parameters=True)
            else:
                dnet = DataParallel(anet, device_ids=opt['gpu_ids'])
            if self.is_train: