mtem-pruner

Sleeping

antoinelouis commited on Oct 6, 2024

Commit

70f0431

verified ·

1 Parent(s): 0209ea7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -45,7 +45,7 @@ def estimate_pruned_vocabulary(tokenizer: PreTrainedTokenizerFast, language: str
         counter = Counter(tokenizer.all_special_tokens)
         for i, text in enumerate(df.text):
             counter.update(tok for tok in tokenizer.tokenize(text))
-            my_bar.progress(i/len(df)+1, text=f"{i/len(df)*100:.0f}%")
         return set(counter)
     else:
         raise FileNotFoundError

         counter = Counter(tokenizer.all_special_tokens)
         for i, text in enumerate(df.text):
             counter.update(tok for tok in tokenizer.tokenize(text))
+            my_bar.progress(i/len(df), text=f"{i/len(df)*100:.0f}%")
         return set(counter)
     else:
         raise FileNotFoundError