pierreguillou commited on Feb 15, 2023

Commit

0a6fb58

1 Parent(s): 27433f3

Training in progress, step 1300

Browse files

Files changed (24) hide show

{checkpoint-700 → checkpoint-1200}/config.json +0 -0
{checkpoint-700 → checkpoint-1200}/optimizer.pt +1 -1
{checkpoint-800 → checkpoint-1200}/pytorch_model.bin +1 -1
{checkpoint-800 → checkpoint-1200}/rng_state.pth +1 -1
{checkpoint-800 → checkpoint-1200}/scaler.pt +1 -1
{checkpoint-700 → checkpoint-1200}/scheduler.pt +1 -1
{checkpoint-700 → checkpoint-1200}/special_tokens_map.json +0 -0
{checkpoint-700 → checkpoint-1200}/tokenizer.json +0 -0
{checkpoint-700 → checkpoint-1200}/tokenizer_config.json +0 -0
{checkpoint-800 → checkpoint-1200}/trainer_state.json +57 -3
{checkpoint-700 → checkpoint-1200}/training_args.bin +0 -0
{checkpoint-800 → checkpoint-1300}/config.json +0 -0
{checkpoint-800 → checkpoint-1300}/optimizer.pt +1 -1
{checkpoint-700 → checkpoint-1300}/pytorch_model.bin +1 -1
{checkpoint-700 → checkpoint-1300}/rng_state.pth +1 -1
{checkpoint-700 → checkpoint-1300}/scaler.pt +1 -1
{checkpoint-800 → checkpoint-1300}/scheduler.pt +1 -1
{checkpoint-800 → checkpoint-1300}/special_tokens_map.json +0 -0
{checkpoint-800 → checkpoint-1300}/tokenizer.json +0 -0
{checkpoint-800 → checkpoint-1300}/tokenizer_config.json +0 -0
{checkpoint-700 → checkpoint-1300}/trainer_state.json +81 -3
{checkpoint-800 → checkpoint-1300}/training_args.bin +0 -0
pytorch_model.bin +1 -1
runs/Feb15_07-53-26_e220f522c880/events.out.tfevents.1676447621.e220f522c880.495.0 +2 -2

{checkpoint-700 → checkpoint-1200}/config.json RENAMED Viewed

File without changes

{checkpoint-700 → checkpoint-1200}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6e3fe13c1ea3aa84e754ff7abe68da7eec60a7e1dc2e5dfc4a93ad1d3f636fa3
 size 2265828101

 version https://git-lfs.github.com/spec/v1
+oid sha256:280a221cc64b57effe5c7a796f38b48321fed8fcb3ff1e239c462a69ff81116c
 size 2265828101

{checkpoint-800 → checkpoint-1200}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8126932772d64c007aa46752a8678869bff8e31fb1d734f060c2aef68f5b5c3
 size 1134425553

 version https://git-lfs.github.com/spec/v1
+oid sha256:129796804ce986931f94bfed0dab6f25dddc2e97c3a332294d4f52bf3528c96a
 size 1134425553

{checkpoint-800 → checkpoint-1200}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:64c8402a2a8dcf25bb022948010e12c766380abe6897e4ffad7784a45553b860
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd6ffa5eb17c8d65486aa60854f05719c6a9abb0d32d2839b3ba42058bd6991d
 size 14575

{checkpoint-800 → checkpoint-1200}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3d15232b452895e36dc91e0446f6e8ef9af073f8677f732bb005840a10ca7266
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:6b74d76706ac346849ec903aa334b83db05c630c620b87dcbe1a7b129aecd1c1
 size 557

{checkpoint-700 → checkpoint-1200}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ec7fcec2c61a14f594e0c95f40c28d94feca9810fd5de97d1910aa5fc27619dd
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:29a2c927b05979c18fd3e62e50ba927b4a9c741248dda26234d8cd08f20d64a8
 size 627

{checkpoint-700 → checkpoint-1200}/special_tokens_map.json RENAMED Viewed

File without changes

{checkpoint-700 → checkpoint-1200}/tokenizer.json RENAMED Viewed

File without changes

{checkpoint-700 → checkpoint-1200}/tokenizer_config.json RENAMED Viewed

File without changes

{checkpoint-800 → checkpoint-1200}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.885723696687195,
   "best_model_checkpoint": "DocLayNet/lilt-xlm-roberta-base-finetuned-DocLayNet-base_paragraphs_ml512-v5/checkpoint-600",
-  "epoch": 0.42643923240938164,
-  "global_step": 800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -108,11 +108,65 @@
       "eval_samples_per_second": 35.233,
       "eval_steps_per_second": 2.214,
       "step": 800
     }
   ],
   "max_steps": 1876,
   "num_train_epochs": 1,
-  "total_flos": 1780302328627200.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.885723696687195,
   "best_model_checkpoint": "DocLayNet/lilt-xlm-roberta-base-finetuned-DocLayNet-base_paragraphs_ml512-v5/checkpoint-600",
+  "epoch": 0.6396588486140725,
+  "global_step": 1200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 35.233,
       "eval_steps_per_second": 2.214,
       "step": 800
+    },
+    {
+      "epoch": 0.48,
+      "eval_accuracy": 0.8833980456546259,
+      "eval_f1": 0.8833980456546259,
+      "eval_loss": 0.38389313220977783,
+      "eval_precision": 0.8833980456546259,
+      "eval_recall": 0.8833980456546259,
+      "eval_runtime": 47.6493,
+      "eval_samples_per_second": 33.726,
+      "eval_steps_per_second": 2.12,
+      "step": 900
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 9.381663113006397e-06,
+      "loss": 0.4464,
+      "step": 1000
+    },
+    {
+      "epoch": 0.53,
+      "eval_accuracy": 0.8498407977082855,
+      "eval_f1": 0.8498407977082856,
+      "eval_loss": 0.4365050792694092,
+      "eval_precision": 0.8498407977082855,
+      "eval_recall": 0.8498407977082855,
+      "eval_runtime": 47.0078,
+      "eval_samples_per_second": 34.186,
+      "eval_steps_per_second": 2.149,
+      "step": 1000
+    },
+    {
+      "epoch": 0.59,
+      "eval_accuracy": 0.8811622266361904,
+      "eval_f1": 0.8811622266361904,
+      "eval_loss": 0.36158204078674316,
+      "eval_precision": 0.8811622266361904,
+      "eval_recall": 0.8811622266361904,
+      "eval_runtime": 44.8724,
+      "eval_samples_per_second": 35.813,
+      "eval_steps_per_second": 2.251,
+      "step": 1100
+    },
+    {
+      "epoch": 0.64,
+      "eval_accuracy": 0.8795751943864972,
+      "eval_f1": 0.8795751943864972,
+      "eval_loss": 0.3948919177055359,
+      "eval_precision": 0.8795751943864972,
+      "eval_recall": 0.8795751943864972,
+      "eval_runtime": 45.1224,
+      "eval_samples_per_second": 35.614,
+      "eval_steps_per_second": 2.238,
+      "step": 1200
     }
   ],
   "max_steps": 1876,
   "num_train_epochs": 1,
+  "total_flos": 2670453492940800.0,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-700 → checkpoint-1200}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-800 → checkpoint-1300}/config.json RENAMED Viewed

File without changes

{checkpoint-800 → checkpoint-1300}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5927a29acc1b827e5e81631185eaee6608e45cc4c08f5547e015207b8c3e1f36
 size 2265828101

 version https://git-lfs.github.com/spec/v1
+oid sha256:2c08cf141a111f37d0566da69d0c30d72707ecd26196f04456a9b2121b4d97d3
 size 2265828101

{checkpoint-700 → checkpoint-1300}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dfe775f2f5e3266c5d9bceb93d7b7d60750dc69b67a1bed6e77aa7d295da49d0
 size 1134425553

 version https://git-lfs.github.com/spec/v1
+oid sha256:7d4698a9bcd9f4d1b85cd29935ce42f4264d331bc9713045308140215396cd2e
 size 1134425553

{checkpoint-700 → checkpoint-1300}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:96a57174e6d28245887299f8c18770addda0c495bdadadc4f17326f19f3cdd79
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:55d131675f12693ae085c3c3a36adf556143b9deea694fe5308eef74c5dc9628
 size 14575

{checkpoint-700 → checkpoint-1300}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:55749a54a2c0aac733a45a67ee5b21dbfaa7cb45a667adecbc1609b113af0b09
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:af7a31e9f5bbee16af877be66fd13ae4491e1f0e57f209ceef7ac824ca84139d
 size 557

{checkpoint-800 → checkpoint-1300}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:965edcc2ade2296ca06465ca794bdd6e45524f6fe975b06d7cc6014955adf226
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:893ff4c60fcbf7662c0d4334e0bfce704fb88be1f6c471b5adc0626650efe85d
 size 627

{checkpoint-800 → checkpoint-1300}/special_tokens_map.json RENAMED Viewed

File without changes

{checkpoint-800 → checkpoint-1300}/tokenizer.json RENAMED Viewed

File without changes

{checkpoint-800 → checkpoint-1300}/tokenizer_config.json RENAMED Viewed

File without changes

{checkpoint-700 → checkpoint-1300}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.885723696687195,
   "best_model_checkpoint": "DocLayNet/lilt-xlm-roberta-base-finetuned-DocLayNet-base_paragraphs_ml512-v5/checkpoint-600",
-  "epoch": 0.373134328358209,
-  "global_step": 700,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -96,11 +96,89 @@
       "eval_samples_per_second": 35.056,
       "eval_steps_per_second": 2.203,
       "step": 700
     }
   ],
   "max_steps": 1876,
   "num_train_epochs": 1,
-  "total_flos": 1557764537548800.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.885723696687195,
   "best_model_checkpoint": "DocLayNet/lilt-xlm-roberta-base-finetuned-DocLayNet-base_paragraphs_ml512-v5/checkpoint-600",
+  "epoch": 0.6929637526652452,
+  "global_step": 1300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 35.056,
       "eval_steps_per_second": 2.203,
       "step": 700
+    },
+    {
+      "epoch": 0.43,
+      "eval_accuracy": 0.8528252168445007,
+      "eval_f1": 0.8528252168445007,
+      "eval_loss": 0.44917240738868713,
+      "eval_precision": 0.8528252168445007,
+      "eval_recall": 0.8528252168445007,
+      "eval_runtime": 45.6102,
+      "eval_samples_per_second": 35.233,
+      "eval_steps_per_second": 2.214,
+      "step": 800
+    },
+    {
+      "epoch": 0.48,
+      "eval_accuracy": 0.8833980456546259,
+      "eval_f1": 0.8833980456546259,
+      "eval_loss": 0.38389313220977783,
+      "eval_precision": 0.8833980456546259,
+      "eval_recall": 0.8833980456546259,
+      "eval_runtime": 47.6493,
+      "eval_samples_per_second": 33.726,
+      "eval_steps_per_second": 2.12,
+      "step": 900
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 9.381663113006397e-06,
+      "loss": 0.4464,
+      "step": 1000
+    },
+    {
+      "epoch": 0.53,
+      "eval_accuracy": 0.8498407977082855,
+      "eval_f1": 0.8498407977082856,
+      "eval_loss": 0.4365050792694092,
+      "eval_precision": 0.8498407977082855,
+      "eval_recall": 0.8498407977082855,
+      "eval_runtime": 47.0078,
+      "eval_samples_per_second": 34.186,
+      "eval_steps_per_second": 2.149,
+      "step": 1000
+    },
+    {
+      "epoch": 0.59,
+      "eval_accuracy": 0.8811622266361904,
+      "eval_f1": 0.8811622266361904,
+      "eval_loss": 0.36158204078674316,
+      "eval_precision": 0.8811622266361904,
+      "eval_recall": 0.8811622266361904,
+      "eval_runtime": 44.8724,
+      "eval_samples_per_second": 35.813,
+      "eval_steps_per_second": 2.251,
+      "step": 1100
+    },
+    {
+      "epoch": 0.64,
+      "eval_accuracy": 0.8795751943864972,
+      "eval_f1": 0.8795751943864972,
+      "eval_loss": 0.3948919177055359,
+      "eval_precision": 0.8795751943864972,
+      "eval_recall": 0.8795751943864972,
+      "eval_runtime": 45.1224,
+      "eval_samples_per_second": 35.614,
+      "eval_steps_per_second": 2.238,
+      "step": 1200
+    },
+    {
+      "epoch": 0.69,
+      "eval_accuracy": 0.8612794075079601,
+      "eval_f1": 0.8612794075079601,
+      "eval_loss": 0.41840043663978577,
+      "eval_precision": 0.8612794075079601,
+      "eval_recall": 0.8612794075079601,
+      "eval_runtime": 39.7377,
+      "eval_samples_per_second": 40.44,
+      "eval_steps_per_second": 2.542,
+      "step": 1300
     }
   ],
   "max_steps": 1876,
   "num_train_epochs": 1,
+  "total_flos": 2892991284019200.0,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-800 → checkpoint-1300}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8126932772d64c007aa46752a8678869bff8e31fb1d734f060c2aef68f5b5c3
 size 1134425553

 version https://git-lfs.github.com/spec/v1
+oid sha256:7d4698a9bcd9f4d1b85cd29935ce42f4264d331bc9713045308140215396cd2e
 size 1134425553

runs/Feb15_07-53-26_e220f522c880/events.out.tfevents.1676447621.e220f522c880.495.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:97dbcb650d21eb583ff331584d595df99b7abe792fa93031ec793779393434c8
-size 8597

 version https://git-lfs.github.com/spec/v1
+oid sha256:aec79be76242a342cf813e35be39731a4cf8ff91fe61776b977f2529b2fa0e92
+size 11114