Motif-Technologies
/

optimizer

Model card Files Files and versions

ca1207 commited on 17 days ago

Commit

811726c

·

1 Parent(s): 0b8d958

fix bug in fsdp

Files changed (1) hide show

torch-ext/optimizer/muon.py +5 -0

torch-ext/optimizer/muon.py CHANGED Viewed

@@ -606,6 +606,11 @@ class Muon(torch.optim.Optimizer):
         if p.placements == (Shard(dim=0), ):
             # Case for FSDP
             return p.device_mesh.mesh, p.device_mesh.get_group(mesh_dim=0)
         elif p.placements == (Replicate(), Shard(dim=0)):
             # Case for HSDP

         if p.placements == (Shard(dim=0), ):
             # Case for FSDP
+            process_group = p.device_mesh.get_group(mesh_dim=0)
+            if self.rank is None:
+                self.rank = dist.get_rank(group=process_group)
+            else:
+                assert self.rank == dist.get_rank(group=process_group)
             return p.device_mesh.mesh, p.device_mesh.get_group(mesh_dim=0)
         elif p.placements == (Replicate(), Shard(dim=0)):
             # Case for HSDP