reaperdoesntknow
/

MoA-100M

Text Generation

mixture-of-attentions

distance-attention

metric-attention

Model card Files Files and versions

1.05 GB

1 contributor

History: 7 commits

reaperdoesntknow's picture

reaperdoesntknow

Upload MoAMetricLM

7a75b28 verified 2 months ago

.gitattributes

1.52 kB

initial commit 2 months ago
README.md

9.31 kB

Upload MoAMetricLM 2 months ago
config.json

1.26 kB

Upload MoAMetricLM 2 months ago
generation_config.json

136 Bytes

Upload MoAMetricLM 2 months ago
pytorch_model.bin
Detected Pickle imports (3)
- "torch._utils._rebuild_tensor_v2",
- "collections.OrderedDict",
- "torch.FloatStorage"
What is a pickle import?
1.05 GB
xet

Upload MoAMetricLM 2 months ago