HPLT
/

hplt_t5_base_3_0_ara_Arab

encoder-decoder

text2text-generation

Model card Files Files and versions

MariaFjodorowa commited on 4 days ago

Commit

7dac00c

·

verified ·

1 Parent(s): 3b9653f

Updating README

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -51,7 +51,7 @@ model = AutoModelForSeq2SeqLM.from_pretrained(
 )
 tokenizer = AutoTokenizer.from_pretrained(model_path)
 # MASKED LANGUAGE MODELING
-sentence = "Ansiktsuttrykket [MASK_1] har utviklet seg til et utbredt kulturelt fenomen."
 encoding = tokenizer(sentence, return_tensors="pt")
 mask_1 = tokenizer.convert_tokens_to_ids("[MASK_1]")
 mask_2 = tokenizer.convert_tokens_to_ids("[MASK_2]")
@@ -61,7 +61,7 @@ output_tensor = model.generate(
     eos_token_id=mask_2,
   )
 print(tokenizer.decode(output_tensor.squeeze(), skip_special_tokens=False))
-# should output: '[MASK_1]«The Great Gatsby»[MASK_2]'
 ```
 ## Intermediate checkpoints

 )
 tokenizer = AutoTokenizer.from_pretrained(model_path)
 # MASKED LANGUAGE MODELING
+sentence = "Ansiktsuttrykket duckface har [MASK_1] seg til et utbredt kulturelt fenomen."
 encoding = tokenizer(sentence, return_tensors="pt")
 mask_1 = tokenizer.convert_tokens_to_ids("[MASK_1]")
 mask_2 = tokenizer.convert_tokens_to_ids("[MASK_2]")
     eos_token_id=mask_2,
   )
 print(tokenizer.decode(output_tensor.squeeze(), skip_special_tokens=False))
+# should output: '[MASK_1]utviklet[MASK_2]'
 ```
 ## Intermediate checkpoints