Daewon0808 commited on Mar 16

Commit

70284ec

verified ·

1 Parent(s): ed79f98

Training in progress, step 2280, checkpoint

Browse files

Files changed (28) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/global_step2280/bf16_zero_pp_rank_0_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step2280/bf16_zero_pp_rank_1_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step2280/bf16_zero_pp_rank_2_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step2280/bf16_zero_pp_rank_3_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step2280/bf16_zero_pp_rank_4_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step2280/bf16_zero_pp_rank_5_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step2280/bf16_zero_pp_rank_6_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step2280/bf16_zero_pp_rank_7_mp_rank_00_optim_states.pt +3 -0
last-checkpoint/global_step2280/zero_pp_rank_0_mp_rank_00_model_states.pt +3 -0
last-checkpoint/global_step2280/zero_pp_rank_1_mp_rank_00_model_states.pt +3 -0
last-checkpoint/global_step2280/zero_pp_rank_2_mp_rank_00_model_states.pt +3 -0
last-checkpoint/global_step2280/zero_pp_rank_3_mp_rank_00_model_states.pt +3 -0
last-checkpoint/global_step2280/zero_pp_rank_4_mp_rank_00_model_states.pt +3 -0
last-checkpoint/global_step2280/zero_pp_rank_5_mp_rank_00_model_states.pt +3 -0
last-checkpoint/global_step2280/zero_pp_rank_6_mp_rank_00_model_states.pt +3 -0
last-checkpoint/global_step2280/zero_pp_rank_7_mp_rank_00_model_states.pt +3 -0
last-checkpoint/latest +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +2860 -4

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88048dd9a70f9e1147b02b613d2ddf17384748318f500c0d758d0fdab8755f5b
 size 83946192

 version https://git-lfs.github.com/spec/v1
+oid sha256:522174c44b2bc3f54d5a8fe33ebde0bbaf5d2b47bc53cd1b001caccafeddbd61
 size 83946192

last-checkpoint/global_step2280/bf16_zero_pp_rank_0_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:07d1efa8c9a763e761565c9e09fb032b95960c332b4ddbbf51fd58f57d3f183f
+size 62918128

last-checkpoint/global_step2280/bf16_zero_pp_rank_1_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fe62a4b7286c9077be50a9476ed4894fe5d9ed9e381e5a7cd2034d614c2dcae4
+size 62918128

last-checkpoint/global_step2280/bf16_zero_pp_rank_2_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c73f89a9c680b027932434086414c106ea8e66a860851720e3ea0b921578edfd
+size 62918128

last-checkpoint/global_step2280/bf16_zero_pp_rank_3_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7ada8f36d99cee2b8f26fe1628d48517c443c270191083556c88b4fb9b001caa
+size 62918128

last-checkpoint/global_step2280/bf16_zero_pp_rank_4_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a41daa7d1bc752e6f747e79663ae96968901a0888d708fecfee03b6187bd2cea
+size 62918128

last-checkpoint/global_step2280/bf16_zero_pp_rank_5_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b9f6bff5cceb2f42c9763b267161a932deb92677cd239f63e9ec92866c670fa7
+size 62918128

last-checkpoint/global_step2280/bf16_zero_pp_rank_6_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:97197284a7c2f2a02e0dadce91f5e614492206ddcb1d5e782539b3f25c50620d
+size 62918128

last-checkpoint/global_step2280/bf16_zero_pp_rank_7_mp_rank_00_optim_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:130c8b0dad8071c48aeb3da4fb6e5f834602f253e78d944742934c3f9d9e7b79
+size 62918128

last-checkpoint/global_step2280/zero_pp_rank_0_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9100886399952ad4f97249a39a28356be5cd1ee1007032ddbb488feb1523d9f3
+size 445678

last-checkpoint/global_step2280/zero_pp_rank_1_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:05ba478bb37aa2c140f640e1c177973af2ad3c43078596c06888a3705c4d3e62
+size 445678

last-checkpoint/global_step2280/zero_pp_rank_2_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93ced05eafcfc006322b4dcf064c50abbbd04e74b90aff10b421ec5e46079169
+size 445678

last-checkpoint/global_step2280/zero_pp_rank_3_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d639e711f5e03c598579490bc8d2fe2381b4bf6f2a8c856553ce64e77557bb79
+size 445678

last-checkpoint/global_step2280/zero_pp_rank_4_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bdc2fcfc2343910f41b10fece0e584ac669c89db7916e270e78fde1ba05e9d43
+size 445678

last-checkpoint/global_step2280/zero_pp_rank_5_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c47b97e37c95bee72ba31bc21a916cf0c4e5e9ec4b9059f22d0af6f06a64975f
+size 445678

last-checkpoint/global_step2280/zero_pp_rank_6_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2e914156bb3b2272b1afd0da9a2999749f81aa5a9c70245eddf00d0f89930f4f
+size 445678

last-checkpoint/global_step2280/zero_pp_rank_7_mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4915f7cd15718b84976ede5e38139b4adcea6b11bacd75a765b49f287e2db46a
+size 445678

last-checkpoint/latest CHANGED Viewed

	@@ -1 +1 @@
1	- ~~global_step2000~~


1	+ global_step2280

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aaf48aba55f83adec18eb14db42435a2413ac97822888622ab8d2c641cc1e890
 size 15984

 version https://git-lfs.github.com/spec/v1
+oid sha256:8aa5522d6e5be677047c5b451943bdacb934e0a52b74729f654802cd02e0680c
 size 15984

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b7bdb46bda56f590fc6d0076d7bf2f5b22774fd62780402dce14fd09436d7953
 size 15984

 version https://git-lfs.github.com/spec/v1
+oid sha256:ad839845395873a423632867bc97c602d876029defdb7eefc7f542900754508e
 size 15984

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cfc61caf6b785c98c002fcd379b8761ea4a8826a54aac137514d616b478397cc
 size 15984

 version https://git-lfs.github.com/spec/v1
+oid sha256:faf266da190f7c749119cb9a8d4b7a3d723a19bab389e04d6e629c2277a04d2a
 size 15984

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7fffe0bb67a745aa8c491edc47aba448ba67c915d716adfeac6dbd6d1a71c512
 size 15984

 version https://git-lfs.github.com/spec/v1
+oid sha256:c766900d10a1acc55ec0bb421d7fe33a3d53fc3d3e736229f3ebf30c67f78a11
 size 15984

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bec4084969d019dabfd9254f605e46a9c43bfd290c92ceb14a3697a5c69a26aa
 size 15984

 version https://git-lfs.github.com/spec/v1
+oid sha256:6211d248e0fd1561b9393eb9cae178f7e48075c00e6b56ac7e46a4d450842040
 size 15984

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ad573c49c90fba941d50ff61bdb9f08c25d50a807dc8870e9222742e01860f88
 size 15984

 version https://git-lfs.github.com/spec/v1
+oid sha256:8486ce48273e9612f2429e287d68ba6a34ea649e4c905267e69fcd5f195ddc9c
 size 15984

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:295d1e54b6e4e09dfb5a6e7f58ca6d5d61e2af7376459d37898b12bc24d1595b
 size 15984

 version https://git-lfs.github.com/spec/v1
+oid sha256:4ef1145f7f0639d1022e63b5ccdd1ce92b8eb89f689b305af74b8f11f48accfe
 size 15984

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b02d0dbdb2460ae7dac1509b3f5cb4293559290b5d5b40ab6d138d09b1c8cef5
 size 15984

 version https://git-lfs.github.com/spec/v1
+oid sha256:104cccc50c39de432cfd2aaf15c3f81a4e3109745888765cb5d304a59c878c3e
 size 15984

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f36e0c5df7f2e0bac558458ff0a29723171a5e850ba0eae3769472f4c2c5286d
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:2f71f4b0f1ae150ee8da5695a2f593834f500a7d3dc601cab81fadb6fb8f8b7d
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.8770006577504933,
   "eval_steps": 5,
-  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -20423,6 +20423,2862 @@
       "eval_samples_per_second": 5.862,
       "eval_steps_per_second": 0.195,
       "step": 2000
     }
   ],
   "logging_steps": 1,
@@ -20437,12 +23293,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 3096254904532992.0,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.9997807498355624,
   "eval_steps": 5,
+  "global_step": 2280,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 5.862,
       "eval_steps_per_second": 0.195,
       "step": 2000
+    },
+    {
+      "epoch": 0.8774391580793686,
+      "grad_norm": 0.49010925850689235,
+      "learning_rate": 4.492417883833155e-06,
+      "loss": 0.1096,
+      "step": 2001
+    },
+    {
+      "epoch": 0.8778776584082438,
+      "grad_norm": 0.7600230660785309,
+      "learning_rate": 4.460758653975128e-06,
+      "loss": 0.187,
+      "step": 2002
+    },
+    {
+      "epoch": 0.8783161587371191,
+      "grad_norm": 0.9443263647840711,
+      "learning_rate": 4.429206164987276e-06,
+      "loss": 0.1576,
+      "step": 2003
+    },
+    {
+      "epoch": 0.8787546590659943,
+      "grad_norm": 0.8156934951607084,
+      "learning_rate": 4.397760490826481e-06,
+      "loss": 0.2156,
+      "step": 2004
+    },
+    {
+      "epoch": 0.8791931593948695,
+      "grad_norm": 0.5940823608596991,
+      "learning_rate": 4.366421705199253e-06,
+      "loss": 0.1643,
+      "step": 2005
+    },
+    {
+      "epoch": 0.8791931593948695,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9001475651746188,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26673176884651184,
+      "eval_runtime": 5.1125,
+      "eval_samples_per_second": 5.868,
+      "eval_steps_per_second": 0.196,
+      "step": 2005
+    },
+    {
+      "epoch": 0.8796316597237448,
+      "grad_norm": 0.7342813103492982,
+      "learning_rate": 4.335189881561563e-06,
+      "loss": 0.0901,
+      "step": 2006
+    },
+    {
+      "epoch": 0.8800701600526201,
+      "grad_norm": 0.8684047400215807,
+      "learning_rate": 4.3040650931186646e-06,
+      "loss": 0.1782,
+      "step": 2007
+    },
+    {
+      "epoch": 0.8805086603814953,
+      "grad_norm": 0.6381573654330607,
+      "learning_rate": 4.273047412824954e-06,
+      "loss": 0.21,
+      "step": 2008
+    },
+    {
+      "epoch": 0.8809471607103705,
+      "grad_norm": 0.5881964181618498,
+      "learning_rate": 4.242136913383737e-06,
+      "loss": 0.1295,
+      "step": 2009
+    },
+    {
+      "epoch": 0.8813856610392458,
+      "grad_norm": 0.7277343212020827,
+      "learning_rate": 4.2113336672471245e-06,
+      "loss": 0.144,
+      "step": 2010
+    },
+    {
+      "epoch": 0.8813856610392458,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.9006394490900148,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.26777344942092896,
+      "eval_runtime": 5.13,
+      "eval_samples_per_second": 5.848,
+      "eval_steps_per_second": 0.195,
+      "step": 2010
+    },
+    {
+      "epoch": 0.881824161368121,
+      "grad_norm": 0.7543997307775313,
+      "learning_rate": 4.180637746615823e-06,
+      "loss": 0.1582,
+      "step": 2011
+    },
+    {
+      "epoch": 0.8822626616969963,
+      "grad_norm": 0.5995275995836078,
+      "learning_rate": 4.150049223438962e-06,
+      "loss": 0.128,
+      "step": 2012
+    },
+    {
+      "epoch": 0.8827011620258716,
+      "grad_norm": 0.7337332961504434,
+      "learning_rate": 4.119568169413951e-06,
+      "loss": 0.1506,
+      "step": 2013
+    },
+    {
+      "epoch": 0.8831396623547467,
+      "grad_norm": 0.6232943128877938,
+      "learning_rate": 4.089194655986306e-06,
+      "loss": 0.1172,
+      "step": 2014
+    },
+    {
+      "epoch": 0.883578162683622,
+      "grad_norm": 0.6628637542310886,
+      "learning_rate": 4.05892875434945e-06,
+      "loss": 0.1272,
+      "step": 2015
+    },
+    {
+      "epoch": 0.883578162683622,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.9013772749631086,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.2679687440395355,
+      "eval_runtime": 4.944,
+      "eval_samples_per_second": 6.068,
+      "eval_steps_per_second": 0.202,
+      "step": 2015
+    },
+    {
+      "epoch": 0.8840166630124973,
+      "grad_norm": 0.8052878054952287,
+      "learning_rate": 4.028770535444615e-06,
+      "loss": 0.1619,
+      "step": 2016
+    },
+    {
+      "epoch": 0.8844551633413725,
+      "grad_norm": 0.44828955761310213,
+      "learning_rate": 3.998720069960576e-06,
+      "loss": 0.0875,
+      "step": 2017
+    },
+    {
+      "epoch": 0.8848936636702478,
+      "grad_norm": 0.5896069212238487,
+      "learning_rate": 3.968777428333598e-06,
+      "loss": 0.1313,
+      "step": 2018
+    },
+    {
+      "epoch": 0.885332163999123,
+      "grad_norm": 0.8476381353088597,
+      "learning_rate": 3.9389426807471766e-06,
+      "loss": 0.1734,
+      "step": 2019
+    },
+    {
+      "epoch": 0.8857706643279982,
+      "grad_norm": 0.853862632832727,
+      "learning_rate": 3.909215897131918e-06,
+      "loss": 0.172,
+      "step": 2020
+    },
+    {
+      "epoch": 0.8857706643279982,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.8999016232169208,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26793619990348816,
+      "eval_runtime": 5.367,
+      "eval_samples_per_second": 5.59,
+      "eval_steps_per_second": 0.186,
+      "step": 2020
+    },
+    {
+      "epoch": 0.8862091646568735,
+      "grad_norm": 0.5234162286442235,
+      "learning_rate": 3.8795971471653756e-06,
+      "loss": 0.1191,
+      "step": 2021
+    },
+    {
+      "epoch": 0.8866476649857488,
+      "grad_norm": 0.71689160790237,
+      "learning_rate": 3.850086500271871e-06,
+      "loss": 0.124,
+      "step": 2022
+    },
+    {
+      "epoch": 0.887086165314624,
+      "grad_norm": 0.5726710678100895,
+      "learning_rate": 3.820684025622339e-06,
+      "loss": 0.1189,
+      "step": 2023
+    },
+    {
+      "epoch": 0.8875246656434992,
+      "grad_norm": 0.8339001833741275,
+      "learning_rate": 3.7913897921341866e-06,
+      "loss": 0.1723,
+      "step": 2024
+    },
+    {
+      "epoch": 0.8879631659723745,
+      "grad_norm": 0.48838497101610673,
+      "learning_rate": 3.762203868471087e-06,
+      "loss": 0.0938,
+      "step": 2025
+    },
+    {
+      "epoch": 0.8879631659723745,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.9006394490900148,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.2682128846645355,
+      "eval_runtime": 5.3362,
+      "eval_samples_per_second": 5.622,
+      "eval_steps_per_second": 0.187,
+      "step": 2025
+    },
+    {
+      "epoch": 0.8884016663012497,
+      "grad_norm": 0.5968643874507121,
+      "learning_rate": 3.7331263230428516e-06,
+      "loss": 0.1253,
+      "step": 2026
+    },
+    {
+      "epoch": 0.888840166630125,
+      "grad_norm": 0.7264174174581575,
+      "learning_rate": 3.7041572240052667e-06,
+      "loss": 0.135,
+      "step": 2027
+    },
+    {
+      "epoch": 0.8892786669590003,
+      "grad_norm": 0.5902997205334317,
+      "learning_rate": 3.675296639259912e-06,
+      "loss": 0.1197,
+      "step": 2028
+    },
+    {
+      "epoch": 0.8897171672878754,
+      "grad_norm": 0.8544699784202991,
+      "learning_rate": 3.6465446364540358e-06,
+      "loss": 0.1953,
+      "step": 2029
+    },
+    {
+      "epoch": 0.8901556676167507,
+      "grad_norm": 0.7481450600837439,
+      "learning_rate": 3.617901282980357e-06,
+      "loss": 0.1132,
+      "step": 2030
+    },
+    {
+      "epoch": 0.8901556676167507,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.8989178553861288,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.2726888060569763,
+      "eval_runtime": 5.3119,
+      "eval_samples_per_second": 5.648,
+      "eval_steps_per_second": 0.188,
+      "step": 2030
+    },
+    {
+      "epoch": 0.890594167945626,
+      "grad_norm": 0.8258867796367659,
+      "learning_rate": 3.5893666459769326e-06,
+      "loss": 0.1599,
+      "step": 2031
+    },
+    {
+      "epoch": 0.8910326682745012,
+      "grad_norm": 0.8287595473034423,
+      "learning_rate": 3.560940792327028e-06,
+      "loss": 0.1719,
+      "step": 2032
+    },
+    {
+      "epoch": 0.8914711686033765,
+      "grad_norm": 0.6480723789574196,
+      "learning_rate": 3.5326237886588732e-06,
+      "loss": 0.1439,
+      "step": 2033
+    },
+    {
+      "epoch": 0.8919096689322517,
+      "grad_norm": 0.5589484276325517,
+      "learning_rate": 3.504415701345615e-06,
+      "loss": 0.1229,
+      "step": 2034
+    },
+    {
+      "epoch": 0.8923481692611269,
+      "grad_norm": 0.9184356471371848,
+      "learning_rate": 3.476316596505075e-06,
+      "loss": 0.1771,
+      "step": 2035
+    },
+    {
+      "epoch": 0.8923481692611269,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.8986719134284309,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.2717122435569763,
+      "eval_runtime": 5.0118,
+      "eval_samples_per_second": 5.986,
+      "eval_steps_per_second": 0.2,
+      "step": 2035
+    },
+    {
+      "epoch": 0.8927866695900022,
+      "grad_norm": 0.7733135135105927,
+      "learning_rate": 3.4483265399996246e-06,
+      "loss": 0.1054,
+      "step": 2036
+    },
+    {
+      "epoch": 0.8932251699188775,
+      "grad_norm": 0.7483075304642457,
+      "learning_rate": 3.420445597436056e-06,
+      "loss": 0.1991,
+      "step": 2037
+    },
+    {
+      "epoch": 0.8936636702477527,
+      "grad_norm": 0.5306782721956944,
+      "learning_rate": 3.3926738341653886e-06,
+      "loss": 0.1033,
+      "step": 2038
+    },
+    {
+      "epoch": 0.8941021705766279,
+      "grad_norm": 0.6502443097322591,
+      "learning_rate": 3.365011315282729e-06,
+      "loss": 0.1564,
+      "step": 2039
+    },
+    {
+      "epoch": 0.8945406709055032,
+      "grad_norm": 0.794159960377106,
+      "learning_rate": 3.3374581056271447e-06,
+      "loss": 0.1504,
+      "step": 2040
+    },
+    {
+      "epoch": 0.8945406709055032,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.9001475651746188,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.27273762226104736,
+      "eval_runtime": 5.1428,
+      "eval_samples_per_second": 5.833,
+      "eval_steps_per_second": 0.194,
+      "step": 2040
+    },
+    {
+      "epoch": 0.8949791712343784,
+      "grad_norm": 1.0396272458324463,
+      "learning_rate": 3.3100142697814697e-06,
+      "loss": 0.2735,
+      "step": 2041
+    },
+    {
+      "epoch": 0.8954176715632537,
+      "grad_norm": 0.8371944516730585,
+      "learning_rate": 3.2826798720721864e-06,
+      "loss": 0.2289,
+      "step": 2042
+    },
+    {
+      "epoch": 0.895856171892129,
+      "grad_norm": 0.5761643805159979,
+      "learning_rate": 3.2554549765692554e-06,
+      "loss": 0.1571,
+      "step": 2043
+    },
+    {
+      "epoch": 0.8962946722210041,
+      "grad_norm": 0.7867560879422744,
+      "learning_rate": 3.228339647085965e-06,
+      "loss": 0.2137,
+      "step": 2044
+    },
+    {
+      "epoch": 0.8967331725498794,
+      "grad_norm": 0.6568812377795216,
+      "learning_rate": 3.2013339471787974e-06,
+      "loss": 0.1576,
+      "step": 2045
+    },
+    {
+      "epoch": 0.8967331725498794,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.9008853910477127,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.2720377743244171,
+      "eval_runtime": 4.8325,
+      "eval_samples_per_second": 6.208,
+      "eval_steps_per_second": 0.207,
+      "step": 2045
+    },
+    {
+      "epoch": 0.8971716728787547,
+      "grad_norm": 0.6050445849823863,
+      "learning_rate": 3.1744379401472677e-06,
+      "loss": 0.0941,
+      "step": 2046
+    },
+    {
+      "epoch": 0.8976101732076299,
+      "grad_norm": 0.4980411373250404,
+      "learning_rate": 3.1476516890337703e-06,
+      "loss": 0.0835,
+      "step": 2047
+    },
+    {
+      "epoch": 0.8980486735365052,
+      "grad_norm": 1.0147077320854392,
+      "learning_rate": 3.1209752566234653e-06,
+      "loss": 0.2369,
+      "step": 2048
+    },
+    {
+      "epoch": 0.8984871738653804,
+      "grad_norm": 0.6849094272859165,
+      "learning_rate": 3.094408705444074e-06,
+      "loss": 0.1711,
+      "step": 2049
+    },
+    {
+      "epoch": 0.8989256741942556,
+      "grad_norm": 0.574222203080837,
+      "learning_rate": 3.0679520977657863e-06,
+      "loss": 0.1325,
+      "step": 2050
+    },
+    {
+      "epoch": 0.8989256741942556,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.9013772749631087,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.2703287899494171,
+      "eval_runtime": 5.2238,
+      "eval_samples_per_second": 5.743,
+      "eval_steps_per_second": 0.191,
+      "step": 2050
+    },
+    {
+      "epoch": 0.8993641745231309,
+      "grad_norm": 0.6704277086537236,
+      "learning_rate": 3.041605495601074e-06,
+      "loss": 0.1193,
+      "step": 2051
+    },
+    {
+      "epoch": 0.8998026748520062,
+      "grad_norm": 0.5220752486808401,
+      "learning_rate": 3.0153689607045845e-06,
+      "loss": 0.1275,
+      "step": 2052
+    },
+    {
+      "epoch": 0.9002411751808814,
+      "grad_norm": 1.0311633126874105,
+      "learning_rate": 2.989242554572952e-06,
+      "loss": 0.2181,
+      "step": 2053
+    },
+    {
+      "epoch": 0.9006796755097566,
+      "grad_norm": 0.7896650691751218,
+      "learning_rate": 2.9632263384446913e-06,
+      "loss": 0.1921,
+      "step": 2054
+    },
+    {
+      "epoch": 0.9011181758386319,
+      "grad_norm": 1.0315320145585596,
+      "learning_rate": 2.9373203733000232e-06,
+      "loss": 0.1571,
+      "step": 2055
+    },
+    {
+      "epoch": 0.9011181758386319,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.8994097393015248,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.27177733182907104,
+      "eval_runtime": 4.7798,
+      "eval_samples_per_second": 6.276,
+      "eval_steps_per_second": 0.209,
+      "step": 2055
+    },
+    {
+      "epoch": 0.9015566761675071,
+      "grad_norm": 0.6694908121182245,
+      "learning_rate": 2.9115247198607807e-06,
+      "loss": 0.1056,
+      "step": 2056
+    },
+    {
+      "epoch": 0.9019951764963824,
+      "grad_norm": 0.5928534592981579,
+      "learning_rate": 2.885839438590204e-06,
+      "loss": 0.103,
+      "step": 2057
+    },
+    {
+      "epoch": 0.9024336768252577,
+      "grad_norm": 0.5381910535996246,
+      "learning_rate": 2.8602645896928295e-06,
+      "loss": 0.0795,
+      "step": 2058
+    },
+    {
+      "epoch": 0.9028721771541328,
+      "grad_norm": 0.655291318042305,
+      "learning_rate": 2.834800233114371e-06,
+      "loss": 0.1756,
+      "step": 2059
+    },
+    {
+      "epoch": 0.9033106774830081,
+      "grad_norm": 1.2465002992277767,
+      "learning_rate": 2.8094464285415344e-06,
+      "loss": 0.2788,
+      "step": 2060
+    },
+    {
+      "epoch": 0.9033106774830081,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.9011313330054107,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.2710774838924408,
+      "eval_runtime": 4.8092,
+      "eval_samples_per_second": 6.238,
+      "eval_steps_per_second": 0.208,
+      "step": 2060
+    },
+    {
+      "epoch": 0.9037491778118834,
+      "grad_norm": 0.8316573399959882,
+      "learning_rate": 2.7842032354018997e-06,
+      "loss": 0.1989,
+      "step": 2061
+    },
+    {
+      "epoch": 0.9041876781407586,
+      "grad_norm": 0.5565538660859521,
+      "learning_rate": 2.759070712863793e-06,
+      "loss": 0.1463,
+      "step": 2062
+    },
+    {
+      "epoch": 0.9046261784696339,
+      "grad_norm": 0.7268757914162765,
+      "learning_rate": 2.7340489198361186e-06,
+      "loss": 0.174,
+      "step": 2063
+    },
+    {
+      "epoch": 0.905064678798509,
+      "grad_norm": 0.7236740506294429,
+      "learning_rate": 2.7091379149682685e-06,
+      "loss": 0.2021,
+      "step": 2064
+    },
+    {
+      "epoch": 0.9055031791273843,
+      "grad_norm": 0.8026879054294682,
+      "learning_rate": 2.6843377566499237e-06,
+      "loss": 0.2128,
+      "step": 2065
+    },
+    {
+      "epoch": 0.9055031791273843,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.8996556812592228,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26917317509651184,
+      "eval_runtime": 5.0103,
+      "eval_samples_per_second": 5.988,
+      "eval_steps_per_second": 0.2,
+      "step": 2065
+    },
+    {
+      "epoch": 0.9059416794562596,
+      "grad_norm": 0.5386451536790833,
+      "learning_rate": 2.6596485030109587e-06,
+      "loss": 0.1422,
+      "step": 2066
+    },
+    {
+      "epoch": 0.9063801797851349,
+      "grad_norm": 0.7004320505442949,
+      "learning_rate": 2.6350702119213034e-06,
+      "loss": 0.1983,
+      "step": 2067
+    },
+    {
+      "epoch": 0.9068186801140101,
+      "grad_norm": 1.0368428921283208,
+      "learning_rate": 2.6106029409907974e-06,
+      "loss": 0.2107,
+      "step": 2068
+    },
+    {
+      "epoch": 0.9072571804428853,
+      "grad_norm": 1.0120734400023428,
+      "learning_rate": 2.5862467475690378e-06,
+      "loss": 0.151,
+      "step": 2069
+    },
+    {
+      "epoch": 0.9076956807717605,
+      "grad_norm": 0.7618074177857603,
+      "learning_rate": 2.562001688745291e-06,
+      "loss": 0.1171,
+      "step": 2070
+    },
+    {
+      "epoch": 0.9076956807717605,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9011313330054107,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2679850161075592,
+      "eval_runtime": 5.0674,
+      "eval_samples_per_second": 5.92,
+      "eval_steps_per_second": 0.197,
+      "step": 2070
+    },
+    {
+      "epoch": 0.9081341811006358,
+      "grad_norm": 0.7602851771188424,
+      "learning_rate": 2.5378678213483054e-06,
+      "loss": 0.1217,
+      "step": 2071
+    },
+    {
+      "epoch": 0.9085726814295111,
+      "grad_norm": 0.5011588190315214,
+      "learning_rate": 2.51384520194623e-06,
+      "loss": 0.0813,
+      "step": 2072
+    },
+    {
+      "epoch": 0.9090111817583864,
+      "grad_norm": 1.0306642407275364,
+      "learning_rate": 2.4899338868464404e-06,
+      "loss": 0.1606,
+      "step": 2073
+    },
+    {
+      "epoch": 0.9094496820872615,
+      "grad_norm": 0.772012854183267,
+      "learning_rate": 2.466133932095416e-06,
+      "loss": 0.2104,
+      "step": 2074
+    },
+    {
+      "epoch": 0.9098881824161368,
+      "grad_norm": 0.8965421591737016,
+      "learning_rate": 2.442445393478632e-06,
+      "loss": 0.166,
+      "step": 2075
+    },
+    {
+      "epoch": 0.9098881824161368,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9003935071323167,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2678385376930237,
+      "eval_runtime": 5.1116,
+      "eval_samples_per_second": 5.869,
+      "eval_steps_per_second": 0.196,
+      "step": 2075
+    },
+    {
+      "epoch": 0.910326682745012,
+      "grad_norm": 1.0459773703185697,
+      "learning_rate": 2.4188683265204127e-06,
+      "loss": 0.2223,
+      "step": 2076
+    },
+    {
+      "epoch": 0.9107651830738873,
+      "grad_norm": 0.7408872560803088,
+      "learning_rate": 2.3954027864837745e-06,
+      "loss": 0.1195,
+      "step": 2077
+    },
+    {
+      "epoch": 0.9112036834027626,
+      "grad_norm": 0.8105697387433919,
+      "learning_rate": 2.3720488283703546e-06,
+      "loss": 0.1341,
+      "step": 2078
+    },
+    {
+      "epoch": 0.9116421837316377,
+      "grad_norm": 0.6495676351177188,
+      "learning_rate": 2.3488065069202204e-06,
+      "loss": 0.1128,
+      "step": 2079
+    },
+    {
+      "epoch": 0.912080684060513,
+      "grad_norm": 0.8244332014624807,
+      "learning_rate": 2.325675876611805e-06,
+      "loss": 0.1809,
+      "step": 2080
+    },
+    {
+      "epoch": 0.912080684060513,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9003935071323168,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26679688692092896,
+      "eval_runtime": 4.9794,
+      "eval_samples_per_second": 6.025,
+      "eval_steps_per_second": 0.201,
+      "step": 2080
+    },
+    {
+      "epoch": 0.9125191843893883,
+      "grad_norm": 0.9198010065353488,
+      "learning_rate": 2.3026569916617114e-06,
+      "loss": 0.1531,
+      "step": 2081
+    },
+    {
+      "epoch": 0.9129576847182636,
+      "grad_norm": 0.9449481444857517,
+      "learning_rate": 2.2797499060246253e-06,
+      "loss": 0.2181,
+      "step": 2082
+    },
+    {
+      "epoch": 0.9133961850471388,
+      "grad_norm": 0.634967327547961,
+      "learning_rate": 2.2569546733932134e-06,
+      "loss": 0.1356,
+      "step": 2083
+    },
+    {
+      "epoch": 0.913834685376014,
+      "grad_norm": 0.5077658683256131,
+      "learning_rate": 2.2342713471979303e-06,
+      "loss": 0.1375,
+      "step": 2084
+    },
+    {
+      "epoch": 0.9142731857048892,
+      "grad_norm": 0.6749453283300559,
+      "learning_rate": 2.211699980606946e-06,
+      "loss": 0.1164,
+      "step": 2085
+    },
+    {
+      "epoch": 0.9142731857048892,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9021151008362026,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.265380859375,
+      "eval_runtime": 5.1437,
+      "eval_samples_per_second": 5.832,
+      "eval_steps_per_second": 0.194,
+      "step": 2085
+    },
+    {
+      "epoch": 0.9147116860337645,
+      "grad_norm": 0.5715282449392062,
+      "learning_rate": 2.1892406265259955e-06,
+      "loss": 0.1226,
+      "step": 2086
+    },
+    {
+      "epoch": 0.9151501863626398,
+      "grad_norm": 0.760172775638105,
+      "learning_rate": 2.1668933375982694e-06,
+      "loss": 0.1398,
+      "step": 2087
+    },
+    {
+      "epoch": 0.915588686691515,
+      "grad_norm": 0.625961925053264,
+      "learning_rate": 2.1446581662042942e-06,
+      "loss": 0.1595,
+      "step": 2088
+    },
+    {
+      "epoch": 0.9160271870203902,
+      "grad_norm": 0.586400526492988,
+      "learning_rate": 2.122535164461792e-06,
+      "loss": 0.1113,
+      "step": 2089
+    },
+    {
+      "epoch": 0.9164656873492655,
+      "grad_norm": 0.7883418824251702,
+      "learning_rate": 2.100524384225555e-06,
+      "loss": 0.1379,
+      "step": 2090
+    },
+    {
+      "epoch": 0.9164656873492655,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9021151008362026,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2639974057674408,
+      "eval_runtime": 4.9495,
+      "eval_samples_per_second": 6.061,
+      "eval_steps_per_second": 0.202,
+      "step": 2090
+    },
+    {
+      "epoch": 0.9169041876781407,
+      "grad_norm": 0.5196917550049326,
+      "learning_rate": 2.0786258770873647e-06,
+      "loss": 0.1157,
+      "step": 2091
+    },
+    {
+      "epoch": 0.917342688007016,
+      "grad_norm": 0.5890538515430815,
+      "learning_rate": 2.0568396943758172e-06,
+      "loss": 0.1513,
+      "step": 2092
+    },
+    {
+      "epoch": 0.9177811883358913,
+      "grad_norm": 0.6037446807611603,
+      "learning_rate": 2.035165887156243e-06,
+      "loss": 0.1162,
+      "step": 2093
+    },
+    {
+      "epoch": 0.9182196886647666,
+      "grad_norm": 0.8028206864089246,
+      "learning_rate": 2.013604506230554e-06,
+      "loss": 0.1835,
+      "step": 2094
+    },
+    {
+      "epoch": 0.9186581889936417,
+      "grad_norm": 0.80306617680803,
+      "learning_rate": 1.9921556021371523e-06,
+      "loss": 0.1487,
+      "step": 2095
+    },
+    {
+      "epoch": 0.9186581889936417,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9013772749631087,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2653645873069763,
+      "eval_runtime": 5.0962,
+      "eval_samples_per_second": 5.887,
+      "eval_steps_per_second": 0.196,
+      "step": 2095
+    },
+    {
+      "epoch": 0.919096689322517,
+      "grad_norm": 0.6135907842130369,
+      "learning_rate": 1.970819225150822e-06,
+      "loss": 0.1061,
+      "step": 2096
+    },
+    {
+      "epoch": 0.9195351896513922,
+      "grad_norm": 0.6049596521926599,
+      "learning_rate": 1.9495954252825577e-06,
+      "loss": 0.1187,
+      "step": 2097
+    },
+    {
+      "epoch": 0.9199736899802675,
+      "grad_norm": 0.5972702336073918,
+      "learning_rate": 1.9284842522794945e-06,
+      "loss": 0.1237,
+      "step": 2098
+    },
+    {
+      "epoch": 0.9204121903091428,
+      "grad_norm": 0.7652451341846678,
+      "learning_rate": 1.907485755624788e-06,
+      "loss": 0.1659,
+      "step": 2099
+    },
+    {
+      "epoch": 0.9208506906380179,
+      "grad_norm": 0.9965183116186683,
+      "learning_rate": 1.8865999845374793e-06,
+      "loss": 0.2435,
+      "step": 2100
+    },
+    {
+      "epoch": 0.9208506906380179,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9035907525823905,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.264892578125,
+      "eval_runtime": 4.8153,
+      "eval_samples_per_second": 6.23,
+      "eval_steps_per_second": 0.208,
+      "step": 2100
+    },
+    {
+      "epoch": 0.9212891909668932,
+      "grad_norm": 0.8389146985920428,
+      "learning_rate": 1.865826987972391e-06,
+      "loss": 0.1704,
+      "step": 2101
+    },
+    {
+      "epoch": 0.9217276912957685,
+      "grad_norm": 0.6715898820658518,
+      "learning_rate": 1.8451668146199974e-06,
+      "loss": 0.1091,
+      "step": 2102
+    },
+    {
+      "epoch": 0.9221661916246437,
+      "grad_norm": 0.6207515584959578,
+      "learning_rate": 1.8246195129063336e-06,
+      "loss": 0.1615,
+      "step": 2103
+    },
+    {
+      "epoch": 0.922604691953519,
+      "grad_norm": 0.848793520041008,
+      "learning_rate": 1.8041851309928802e-06,
+      "loss": 0.1548,
+      "step": 2104
+    },
+    {
+      "epoch": 0.9230431922823942,
+      "grad_norm": 0.6788111135403079,
+      "learning_rate": 1.7838637167764294e-06,
+      "loss": 0.1605,
+      "step": 2105
+    },
+    {
+      "epoch": 0.9230431922823942,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9001475651746188,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26728516817092896,
+      "eval_runtime": 4.9915,
+      "eval_samples_per_second": 6.01,
+      "eval_steps_per_second": 0.2,
+      "step": 2105
+    },
+    {
+      "epoch": 0.9234816926112694,
+      "grad_norm": 1.1010740603161708,
+      "learning_rate": 1.7636553178889792e-06,
+      "loss": 0.2308,
+      "step": 2106
+    },
+    {
+      "epoch": 0.9239201929401447,
+      "grad_norm": 0.9571915996550008,
+      "learning_rate": 1.7435599816976512e-06,
+      "loss": 0.1601,
+      "step": 2107
+    },
+    {
+      "epoch": 0.92435869326902,
+      "grad_norm": 0.6062601796558845,
+      "learning_rate": 1.7235777553045284e-06,
+      "loss": 0.1231,
+      "step": 2108
+    },
+    {
+      "epoch": 0.9247971935978953,
+      "grad_norm": 0.7058702603322184,
+      "learning_rate": 1.70370868554659e-06,
+      "loss": 0.1669,
+      "step": 2109
+    },
+    {
+      "epoch": 0.9252356939267704,
+      "grad_norm": 0.6861546257522678,
+      "learning_rate": 1.683952818995571e-06,
+      "loss": 0.1323,
+      "step": 2110
+    },
+    {
+      "epoch": 0.9252356939267704,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9026069847515986,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2656901180744171,
+      "eval_runtime": 5.128,
+      "eval_samples_per_second": 5.85,
+      "eval_steps_per_second": 0.195,
+      "step": 2110
+    },
+    {
+      "epoch": 0.9256741942556457,
+      "grad_norm": 0.8520826217421488,
+      "learning_rate": 1.6643102019578805e-06,
+      "loss": 0.1336,
+      "step": 2111
+    },
+    {
+      "epoch": 0.926112694584521,
+      "grad_norm": 0.4797688260349934,
+      "learning_rate": 1.6447808804744668e-06,
+      "loss": 0.1175,
+      "step": 2112
+    },
+    {
+      "epoch": 0.9265511949133962,
+      "grad_norm": 0.7661663885999256,
+      "learning_rate": 1.6253649003207249e-06,
+      "loss": 0.1454,
+      "step": 2113
+    },
+    {
+      "epoch": 0.9269896952422715,
+      "grad_norm": 0.4915870187790107,
+      "learning_rate": 1.606062307006384e-06,
+      "loss": 0.1146,
+      "step": 2114
+    },
+    {
+      "epoch": 0.9274281955711466,
+      "grad_norm": 1.052785510896854,
+      "learning_rate": 1.5868731457754139e-06,
+      "loss": 0.2203,
+      "step": 2115
+    },
+    {
+      "epoch": 0.9274281955711466,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9422222222222222,
+      "eval_PRM F1 AUC": 0.9033448106246925,
+      "eval_PRM F1 Neg": 0.5185185185185185,
+      "eval_PRM NPV": 0.875,
+      "eval_PRM Precision": 0.8983050847457628,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.3684210526315789,
+      "eval_loss": 0.2664550840854645,
+      "eval_runtime": 5.0995,
+      "eval_samples_per_second": 5.883,
+      "eval_steps_per_second": 0.196,
+      "step": 2115
+    },
+    {
+      "epoch": 0.9278666959000219,
+      "grad_norm": 0.8549090499057688,
+      "learning_rate": 1.5677974616058855e-06,
+      "loss": 0.1729,
+      "step": 2116
+    },
+    {
+      "epoch": 0.9283051962288972,
+      "grad_norm": 0.7792292639337909,
+      "learning_rate": 1.5488352992099053e-06,
+      "loss": 0.2705,
+      "step": 2117
+    },
+    {
+      "epoch": 0.9287436965577724,
+      "grad_norm": 0.6893387190665935,
+      "learning_rate": 1.5299867030334814e-06,
+      "loss": 0.0947,
+      "step": 2118
+    },
+    {
+      "epoch": 0.9291821968866477,
+      "grad_norm": 0.6451030801962423,
+      "learning_rate": 1.51125171725644e-06,
+      "loss": 0.1544,
+      "step": 2119
+    },
+    {
+      "epoch": 0.9296206972155229,
+      "grad_norm": 1.5791580231385312,
+      "learning_rate": 1.4926303857923097e-06,
+      "loss": 0.1762,
+      "step": 2120
+    },
+    {
+      "epoch": 0.9296206972155229,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9028529267092966,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26712238788604736,
+      "eval_runtime": 5.0188,
+      "eval_samples_per_second": 5.978,
+      "eval_steps_per_second": 0.199,
+      "step": 2120
+    },
+    {
+      "epoch": 0.9300591975443981,
+      "grad_norm": 0.5173209803502309,
+      "learning_rate": 1.4741227522882095e-06,
+      "loss": 0.1093,
+      "step": 2121
+    },
+    {
+      "epoch": 0.9304976978732734,
+      "grad_norm": 0.8467810225304794,
+      "learning_rate": 1.4557288601247777e-06,
+      "loss": 0.1848,
+      "step": 2122
+    },
+    {
+      "epoch": 0.9309361982021487,
+      "grad_norm": 1.1692040132174368,
+      "learning_rate": 1.4374487524160374e-06,
+      "loss": 0.1817,
+      "step": 2123
+    },
+    {
+      "epoch": 0.931374698531024,
+      "grad_norm": 0.7266315441382668,
+      "learning_rate": 1.419282472009309e-06,
+      "loss": 0.1309,
+      "step": 2124
+    },
+    {
+      "epoch": 0.9318131988598991,
+      "grad_norm": 0.7786894103546885,
+      "learning_rate": 1.4012300614851205e-06,
+      "loss": 0.1391,
+      "step": 2125
+    },
+    {
+      "epoch": 0.9318131988598991,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9026069847515986,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2656901180744171,
+      "eval_runtime": 5.0871,
+      "eval_samples_per_second": 5.897,
+      "eval_steps_per_second": 0.197,
+      "step": 2125
+    },
+    {
+      "epoch": 0.9322516991887744,
+      "grad_norm": 1.1467148132412364,
+      "learning_rate": 1.3832915631570797e-06,
+      "loss": 0.1949,
+      "step": 2126
+    },
+    {
+      "epoch": 0.9326901995176496,
+      "grad_norm": 0.6715268839598615,
+      "learning_rate": 1.3654670190718034e-06,
+      "loss": 0.1519,
+      "step": 2127
+    },
+    {
+      "epoch": 0.9331286998465249,
+      "grad_norm": 1.1541979063594885,
+      "learning_rate": 1.3477564710088098e-06,
+      "loss": 0.216,
+      "step": 2128
+    },
+    {
+      "epoch": 0.9335672001754002,
+      "grad_norm": 0.6259082431772327,
+      "learning_rate": 1.3301599604804094e-06,
+      "loss": 0.0983,
+      "step": 2129
+    },
+    {
+      "epoch": 0.9340057005042753,
+      "grad_norm": 0.8688995719013783,
+      "learning_rate": 1.3126775287316151e-06,
+      "loss": 0.1297,
+      "step": 2130
+    },
+    {
+      "epoch": 0.9340057005042753,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9050664043285784,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2642252743244171,
+      "eval_runtime": 5.3474,
+      "eval_samples_per_second": 5.61,
+      "eval_steps_per_second": 0.187,
+      "step": 2130
+    },
+    {
+      "epoch": 0.9344442008331506,
+      "grad_norm": 0.9335917329429506,
+      "learning_rate": 1.2953092167400648e-06,
+      "loss": 0.1911,
+      "step": 2131
+    },
+    {
+      "epoch": 0.9348827011620259,
+      "grad_norm": 0.6039686103100694,
+      "learning_rate": 1.278055065215894e-06,
+      "loss": 0.0965,
+      "step": 2132
+    },
+    {
+      "epoch": 0.9353212014909011,
+      "grad_norm": 1.3529839152802352,
+      "learning_rate": 1.2609151146016408e-06,
+      "loss": 0.2378,
+      "step": 2133
+    },
+    {
+      "epoch": 0.9357597018197764,
+      "grad_norm": 0.6210514535593444,
+      "learning_rate": 1.2438894050721906e-06,
+      "loss": 0.1282,
+      "step": 2134
+    },
+    {
+      "epoch": 0.9361982021486516,
+      "grad_norm": 0.8390757398143625,
+      "learning_rate": 1.2269779765346379e-06,
+      "loss": 0.2028,
+      "step": 2135
+    },
+    {
+      "epoch": 0.9361982021486516,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9043285784554844,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26437175273895264,
+      "eval_runtime": 5.1964,
+      "eval_samples_per_second": 5.773,
+      "eval_steps_per_second": 0.192,
+      "step": 2135
+    },
+    {
+      "epoch": 0.9366367024775268,
+      "grad_norm": 0.4687331394277408,
+      "learning_rate": 1.210180868628219e-06,
+      "loss": 0.1026,
+      "step": 2136
+    },
+    {
+      "epoch": 0.9370752028064021,
+      "grad_norm": 0.5862264228110875,
+      "learning_rate": 1.1934981207242069e-06,
+      "loss": 0.124,
+      "step": 2137
+    },
+    {
+      "epoch": 0.9375137031352774,
+      "grad_norm": 0.8200106052610655,
+      "learning_rate": 1.176929771925822e-06,
+      "loss": 0.2088,
+      "step": 2138
+    },
+    {
+      "epoch": 0.9379522034641526,
+      "grad_norm": 0.8226521041070936,
+      "learning_rate": 1.1604758610681389e-06,
+      "loss": 0.1448,
+      "step": 2139
+    },
+    {
+      "epoch": 0.9383907037930278,
+      "grad_norm": 0.5311207702270658,
+      "learning_rate": 1.1441364267180065e-06,
+      "loss": 0.1121,
+      "step": 2140
+    },
+    {
+      "epoch": 0.9383907037930278,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9048204623708804,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2653157413005829,
+      "eval_runtime": 4.9421,
+      "eval_samples_per_second": 6.07,
+      "eval_steps_per_second": 0.202,
+      "step": 2140
+    },
+    {
+      "epoch": 0.9388292041219031,
+      "grad_norm": 0.7184160903672674,
+      "learning_rate": 1.1279115071739399e-06,
+      "loss": 0.1779,
+      "step": 2141
+    },
+    {
+      "epoch": 0.9392677044507783,
+      "grad_norm": 0.8668610911634299,
+      "learning_rate": 1.11180114046604e-06,
+      "loss": 0.1344,
+      "step": 2142
+    },
+    {
+      "epoch": 0.9397062047796536,
+      "grad_norm": 0.8434118972893657,
+      "learning_rate": 1.0958053643559007e-06,
+      "loss": 0.1949,
+      "step": 2143
+    },
+    {
+      "epoch": 0.9401447051085289,
+      "grad_norm": 0.9316201349513029,
+      "learning_rate": 1.0799242163365419e-06,
+      "loss": 0.1531,
+      "step": 2144
+    },
+    {
+      "epoch": 0.940583205437404,
+      "grad_norm": 0.8142559862279604,
+      "learning_rate": 1.064157733632276e-06,
+      "loss": 0.1418,
+      "step": 2145
+    },
+    {
+      "epoch": 0.940583205437404,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9033448106246926,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26681315898895264,
+      "eval_runtime": 4.9284,
+      "eval_samples_per_second": 6.087,
+      "eval_steps_per_second": 0.203,
+      "step": 2145
+    },
+    {
+      "epoch": 0.9410217057662793,
+      "grad_norm": 0.5212668178086708,
+      "learning_rate": 1.0485059531986696e-06,
+      "loss": 0.105,
+      "step": 2146
+    },
+    {
+      "epoch": 0.9414602060951546,
+      "grad_norm": 0.5750379454162786,
+      "learning_rate": 1.0329689117224262e-06,
+      "loss": 0.1251,
+      "step": 2147
+    },
+    {
+      "epoch": 0.9418987064240298,
+      "grad_norm": 0.7938197843175332,
+      "learning_rate": 1.0175466456213034e-06,
+      "loss": 0.2071,
+      "step": 2148
+    },
+    {
+      "epoch": 0.9423372067529051,
+      "grad_norm": 0.7609522576614798,
+      "learning_rate": 1.0022391910440464e-06,
+      "loss": 0.1686,
+      "step": 2149
+    },
+    {
+      "epoch": 0.9427757070817803,
+      "grad_norm": 1.0825325298877981,
+      "learning_rate": 9.870465838702824e-07,
+      "loss": 0.206,
+      "step": 2150
+    },
+    {
+      "epoch": 0.9427757070817803,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9033448106246926,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2645670473575592,
+      "eval_runtime": 4.8176,
+      "eval_samples_per_second": 6.227,
+      "eval_steps_per_second": 0.208,
+      "step": 2150
+    },
+    {
+      "epoch": 0.9432142074106555,
+      "grad_norm": 1.1605715209380159,
+      "learning_rate": 9.719688597104315e-07,
+      "loss": 0.2371,
+      "step": 2151
+    },
+    {
+      "epoch": 0.9436527077395308,
+      "grad_norm": 0.919347752868836,
+      "learning_rate": 9.57006053905668e-07,
+      "loss": 0.1507,
+      "step": 2152
+    },
+    {
+      "epoch": 0.9440912080684061,
+      "grad_norm": 0.6573401880918529,
+      "learning_rate": 9.421582015277763e-07,
+      "loss": 0.137,
+      "step": 2153
+    },
+    {
+      "epoch": 0.9445297083972813,
+      "grad_norm": 0.555027807607804,
+      "learning_rate": 9.274253373791064e-07,
+      "loss": 0.1233,
+      "step": 2154
+    },
+    {
+      "epoch": 0.9449682087261565,
+      "grad_norm": 0.7088183628017939,
+      "learning_rate": 9.128074959924904e-07,
+      "loss": 0.149,
+      "step": 2155
+    },
+    {
+      "epoch": 0.9449682087261565,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9038366945400885,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26513671875,
+      "eval_runtime": 5.2144,
+      "eval_samples_per_second": 5.753,
+      "eval_steps_per_second": 0.192,
+      "step": 2155
+    },
+    {
+      "epoch": 0.9454067090550318,
+      "grad_norm": 0.7132128101033369,
+      "learning_rate": 8.983047116311428e-07,
+      "loss": 0.1473,
+      "step": 2156
+    },
+    {
+      "epoch": 0.945845209383907,
+      "grad_norm": 0.6946167168023032,
+      "learning_rate": 8.839170182886103e-07,
+      "loss": 0.1818,
+      "step": 2157
+    },
+    {
+      "epoch": 0.9462837097127823,
+      "grad_norm": 1.021201531447852,
+      "learning_rate": 8.696444496886503e-07,
+      "loss": 0.1585,
+      "step": 2158
+    },
+    {
+      "epoch": 0.9467222100416576,
+      "grad_norm": 0.9336316608951104,
+      "learning_rate": 8.554870392851966e-07,
+      "loss": 0.2737,
+      "step": 2159
+    },
+    {
+      "epoch": 0.9471607103705327,
+      "grad_norm": 0.9472850446578975,
+      "learning_rate": 8.414448202622494e-07,
+      "loss": 0.1883,
+      "step": 2160
+    },
+    {
+      "epoch": 0.9471607103705327,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9048204623708804,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26331380009651184,
+      "eval_runtime": 5.0138,
+      "eval_samples_per_second": 5.983,
+      "eval_steps_per_second": 0.199,
+      "step": 2160
+    },
+    {
+      "epoch": 0.947599210699408,
+      "grad_norm": 1.111800506009798,
+      "learning_rate": 8.275178255338134e-07,
+      "loss": 0.1685,
+      "step": 2161
+    },
+    {
+      "epoch": 0.9480377110282833,
+      "grad_norm": 0.5059186367851203,
+      "learning_rate": 8.137060877438041e-07,
+      "loss": 0.0931,
+      "step": 2162
+    },
+    {
+      "epoch": 0.9484762113571585,
+      "grad_norm": 0.7719033530225466,
+      "learning_rate": 8.000096392660029e-07,
+      "loss": 0.1343,
+      "step": 2163
+    },
+    {
+      "epoch": 0.9489147116860338,
+      "grad_norm": 0.5929636269259362,
+      "learning_rate": 7.864285122039405e-07,
+      "loss": 0.1285,
+      "step": 2164
+    },
+    {
+      "epoch": 0.949353212014909,
+      "grad_norm": 1.1695896496309977,
+      "learning_rate": 7.729627383908533e-07,
+      "loss": 0.2401,
+      "step": 2165
+    },
+    {
+      "epoch": 0.949353212014909,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9026069847515986,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2637369930744171,
+      "eval_runtime": 4.8625,
+      "eval_samples_per_second": 6.17,
+      "eval_steps_per_second": 0.206,
+      "step": 2165
+    },
+    {
+      "epoch": 0.9497917123437842,
+      "grad_norm": 0.6521530665459749,
+      "learning_rate": 7.596123493895991e-07,
+      "loss": 0.1058,
+      "step": 2166
+    },
+    {
+      "epoch": 0.9502302126726595,
+      "grad_norm": 0.8427308193302898,
+      "learning_rate": 7.463773764925686e-07,
+      "loss": 0.1341,
+      "step": 2167
+    },
+    {
+      "epoch": 0.9506687130015348,
+      "grad_norm": 0.7869796271149967,
+      "learning_rate": 7.33257850721647e-07,
+      "loss": 0.158,
+      "step": 2168
+    },
+    {
+      "epoch": 0.95110721333041,
+      "grad_norm": 0.7962832533796937,
+      "learning_rate": 7.202538028280914e-07,
+      "loss": 0.1094,
+      "step": 2169
+    },
+    {
+      "epoch": 0.9515457136592852,
+      "grad_norm": 0.8636075599024543,
+      "learning_rate": 7.073652632925087e-07,
+      "loss": 0.1705,
+      "step": 2170
+    },
+    {
+      "epoch": 0.9515457136592852,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9028529267092965,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26453450322151184,
+      "eval_runtime": 5.1573,
+      "eval_samples_per_second": 5.817,
+      "eval_steps_per_second": 0.194,
+      "step": 2170
+    },
+    {
+      "epoch": 0.9519842139881605,
+      "grad_norm": 0.784077039684517,
+      "learning_rate": 6.945922623247614e-07,
+      "loss": 0.1602,
+      "step": 2171
+    },
+    {
+      "epoch": 0.9524227143170357,
+      "grad_norm": 1.2854529872085394,
+      "learning_rate": 6.819348298638839e-07,
+      "loss": 0.1922,
+      "step": 2172
+    },
+    {
+      "epoch": 0.952861214645911,
+      "grad_norm": 0.6349974234756767,
+      "learning_rate": 6.693929955780332e-07,
+      "loss": 0.1656,
+      "step": 2173
+    },
+    {
+      "epoch": 0.9532997149747863,
+      "grad_norm": 0.5238995151748975,
+      "learning_rate": 6.569667888644104e-07,
+      "loss": 0.1156,
+      "step": 2174
+    },
+    {
+      "epoch": 0.9537382153036614,
+      "grad_norm": 0.7349628428554369,
+      "learning_rate": 6.44656238849195e-07,
+      "loss": 0.1484,
+      "step": 2175
+    },
+    {
+      "epoch": 0.9537382153036614,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9053123462862764,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26232096552848816,
+      "eval_runtime": 5.086,
+      "eval_samples_per_second": 5.899,
+      "eval_steps_per_second": 0.197,
+      "step": 2175
+    },
+    {
+      "epoch": 0.9541767156325367,
+      "grad_norm": 0.4632878495486221,
+      "learning_rate": 6.324613743874774e-07,
+      "loss": 0.0758,
+      "step": 2176
+    },
+    {
+      "epoch": 0.954615215961412,
+      "grad_norm": 0.6786662920685442,
+      "learning_rate": 6.203822240631929e-07,
+      "loss": 0.1685,
+      "step": 2177
+    },
+    {
+      "epoch": 0.9550537162902872,
+      "grad_norm": 0.9438241899400488,
+      "learning_rate": 6.084188161890325e-07,
+      "loss": 0.1806,
+      "step": 2178
+    },
+    {
+      "epoch": 0.9554922166191625,
+      "grad_norm": 0.7715786403842603,
+      "learning_rate": 5.965711788064099e-07,
+      "loss": 0.1814,
+      "step": 2179
+    },
+    {
+      "epoch": 0.9559307169480377,
+      "grad_norm": 1.0451113800282277,
+      "learning_rate": 5.848393396853891e-07,
+      "loss": 0.2313,
+      "step": 2180
+    },
+    {
+      "epoch": 0.9559307169480377,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9040826364977865,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26347655057907104,
+      "eval_runtime": 5.2788,
+      "eval_samples_per_second": 5.683,
+      "eval_steps_per_second": 0.189,
+      "step": 2180
+    },
+    {
+      "epoch": 0.9563692172769129,
+      "grad_norm": 1.266440352991766,
+      "learning_rate": 5.732233263245845e-07,
+      "loss": 0.2308,
+      "step": 2181
+    },
+    {
+      "epoch": 0.9568077176057882,
+      "grad_norm": 0.7482766422048829,
+      "learning_rate": 5.617231659511446e-07,
+      "loss": 0.2174,
+      "step": 2182
+    },
+    {
+      "epoch": 0.9572462179346635,
+      "grad_norm": 0.7270349159294758,
+      "learning_rate": 5.50338885520657e-07,
+      "loss": 0.1179,
+      "step": 2183
+    },
+    {
+      "epoch": 0.9576847182635387,
+      "grad_norm": 0.5952603890903395,
+      "learning_rate": 5.390705117171047e-07,
+      "loss": 0.1598,
+      "step": 2184
+    },
+    {
+      "epoch": 0.9581232185924139,
+      "grad_norm": 0.8984400831268945,
+      "learning_rate": 5.279180709527765e-07,
+      "loss": 0.1434,
+      "step": 2185
+    },
+    {
+      "epoch": 0.9581232185924139,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9033448106246925,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2635742127895355,
+      "eval_runtime": 5.2136,
+      "eval_samples_per_second": 5.754,
+      "eval_steps_per_second": 0.192,
+      "step": 2185
+    },
+    {
+      "epoch": 0.9585617189212892,
+      "grad_norm": 0.7725604869756233,
+      "learning_rate": 5.168815893682343e-07,
+      "loss": 0.139,
+      "step": 2186
+    },
+    {
+      "epoch": 0.9590002192501644,
+      "grad_norm": 0.5621323581107791,
+      "learning_rate": 5.059610928322356e-07,
+      "loss": 0.1059,
+      "step": 2187
+    },
+    {
+      "epoch": 0.9594387195790397,
+      "grad_norm": 0.6900791198754395,
+      "learning_rate": 4.95156606941688e-07,
+      "loss": 0.1655,
+      "step": 2188
+    },
+    {
+      "epoch": 0.959877219907915,
+      "grad_norm": 0.9013450567220388,
+      "learning_rate": 4.844681570215559e-07,
+      "loss": 0.1771,
+      "step": 2189
+    },
+    {
+      "epoch": 0.9603157202367901,
+      "grad_norm": 0.9556659040681873,
+      "learning_rate": 4.738957681248379e-07,
+      "loss": 0.169,
+      "step": 2190
+    },
+    {
+      "epoch": 0.9603157202367901,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9040826364977865,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26306965947151184,
+      "eval_runtime": 4.8874,
+      "eval_samples_per_second": 6.138,
+      "eval_steps_per_second": 0.205,
+      "step": 2190
+    },
+    {
+      "epoch": 0.9607542205656654,
+      "grad_norm": 1.1230099132122637,
+      "learning_rate": 4.634394650324947e-07,
+      "loss": 0.1854,
+      "step": 2191
+    },
+    {
+      "epoch": 0.9611927208945407,
+      "grad_norm": 0.7775607006120955,
+      "learning_rate": 4.530992722533878e-07,
+      "loss": 0.1729,
+      "step": 2192
+    },
+    {
+      "epoch": 0.9616312212234159,
+      "grad_norm": 0.9230569500481941,
+      "learning_rate": 4.4287521402421875e-07,
+      "loss": 0.1276,
+      "step": 2193
+    },
+    {
+      "epoch": 0.9620697215522912,
+      "grad_norm": 0.5600690909404583,
+      "learning_rate": 4.32767314309479e-07,
+      "loss": 0.1232,
+      "step": 2194
+    },
+    {
+      "epoch": 0.9625082218811664,
+      "grad_norm": 0.5395738887593279,
+      "learning_rate": 4.227755968014002e-07,
+      "loss": 0.1028,
+      "step": 2195
+    },
+    {
+      "epoch": 0.9625082218811664,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9026069847515985,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26363933086395264,
+      "eval_runtime": 5.191,
+      "eval_samples_per_second": 5.779,
+      "eval_steps_per_second": 0.193,
+      "step": 2195
+    },
+    {
+      "epoch": 0.9629467222100416,
+      "grad_norm": 0.8361798815116941,
+      "learning_rate": 4.129000849198872e-07,
+      "loss": 0.1546,
+      "step": 2196
+    },
+    {
+      "epoch": 0.9633852225389169,
+      "grad_norm": 0.822751115655838,
+      "learning_rate": 4.0314080181245716e-07,
+      "loss": 0.1551,
+      "step": 2197
+    },
+    {
+      "epoch": 0.9638237228677922,
+      "grad_norm": 0.5776993811184741,
+      "learning_rate": 3.93497770354212e-07,
+      "loss": 0.119,
+      "step": 2198
+    },
+    {
+      "epoch": 0.9642622231966674,
+      "grad_norm": 0.6327136380994263,
+      "learning_rate": 3.839710131477492e-07,
+      "loss": 0.1322,
+      "step": 2199
+    },
+    {
+      "epoch": 0.9647007235255426,
+      "grad_norm": 0.7086850988696183,
+      "learning_rate": 3.745605525231399e-07,
+      "loss": 0.1564,
+      "step": 2200
+    },
+    {
+      "epoch": 0.9647007235255426,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9035907525823905,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2638508975505829,
+      "eval_runtime": 5.2255,
+      "eval_samples_per_second": 5.741,
+      "eval_steps_per_second": 0.191,
+      "step": 2200
+    },
+    {
+      "epoch": 0.9651392238544179,
+      "grad_norm": 0.569190485329816,
+      "learning_rate": 3.652664105378678e-07,
+      "loss": 0.1342,
+      "step": 2201
+    },
+    {
+      "epoch": 0.9655777241832931,
+      "grad_norm": 0.9935857823706388,
+      "learning_rate": 3.5608860897675677e-07,
+      "loss": 0.1997,
+      "step": 2202
+    },
+    {
+      "epoch": 0.9660162245121684,
+      "grad_norm": 0.9913514917949786,
+      "learning_rate": 3.470271693519545e-07,
+      "loss": 0.1979,
+      "step": 2203
+    },
+    {
+      "epoch": 0.9664547248410437,
+      "grad_norm": 0.6366315028151958,
+      "learning_rate": 3.380821129028489e-07,
+      "loss": 0.103,
+      "step": 2204
+    },
+    {
+      "epoch": 0.9668932251699188,
+      "grad_norm": 0.5753737137664783,
+      "learning_rate": 3.2925346059605176e-07,
+      "loss": 0.0892,
+      "step": 2205
+    },
+    {
+      "epoch": 0.9668932251699188,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9033448106246925,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26412761211395264,
+      "eval_runtime": 5.1565,
+      "eval_samples_per_second": 5.818,
+      "eval_steps_per_second": 0.194,
+      "step": 2205
+    },
+    {
+      "epoch": 0.9673317254987941,
+      "grad_norm": 0.5455766403670592,
+      "learning_rate": 3.205412331253099e-07,
+      "loss": 0.1049,
+      "step": 2206
+    },
+    {
+      "epoch": 0.9677702258276694,
+      "grad_norm": 0.6338154276165335,
+      "learning_rate": 3.119454509114883e-07,
+      "loss": 0.1278,
+      "step": 2207
+    },
+    {
+      "epoch": 0.9682087261565446,
+      "grad_norm": 0.5264334592171102,
+      "learning_rate": 3.034661341025258e-07,
+      "loss": 0.0964,
+      "step": 2208
+    },
+    {
+      "epoch": 0.9686472264854199,
+      "grad_norm": 1.0680536965110514,
+      "learning_rate": 2.9510330257335184e-07,
+      "loss": 0.1671,
+      "step": 2209
+    },
+    {
+      "epoch": 0.9690857268142951,
+      "grad_norm": 0.9708998643068253,
+      "learning_rate": 2.8685697592587546e-07,
+      "loss": 0.1963,
+      "step": 2210
+    },
+    {
+      "epoch": 0.9690857268142951,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9028529267092965,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26445311307907104,
+      "eval_runtime": 5.0997,
+      "eval_samples_per_second": 5.883,
+      "eval_steps_per_second": 0.196,
+      "step": 2210
+    },
+    {
+      "epoch": 0.9695242271431703,
+      "grad_norm": 1.1110372911583375,
+      "learning_rate": 2.787271734889185e-07,
+      "loss": 0.1375,
+      "step": 2211
+    },
+    {
+      "epoch": 0.9699627274720456,
+      "grad_norm": 0.586301467596993,
+      "learning_rate": 2.7071391431818806e-07,
+      "loss": 0.161,
+      "step": 2212
+    },
+    {
+      "epoch": 0.9704012278009209,
+      "grad_norm": 0.7126567576095886,
+      "learning_rate": 2.628172171962151e-07,
+      "loss": 0.1338,
+      "step": 2213
+    },
+    {
+      "epoch": 0.9708397281297961,
+      "grad_norm": 0.6451622075385745,
+      "learning_rate": 2.55037100632316e-07,
+      "loss": 0.1564,
+      "step": 2214
+    },
+    {
+      "epoch": 0.9712782284586713,
+      "grad_norm": 0.6184519064922749,
+      "learning_rate": 2.473735828625534e-07,
+      "loss": 0.0992,
+      "step": 2215
+    },
+    {
+      "epoch": 0.9712782284586713,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9065420560747663,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26346027851104736,
+      "eval_runtime": 5.182,
+      "eval_samples_per_second": 5.789,
+      "eval_steps_per_second": 0.193,
+      "step": 2215
+    },
+    {
+      "epoch": 0.9717167287875466,
+      "grad_norm": 0.6138175685958295,
+      "learning_rate": 2.3982668184968636e-07,
+      "loss": 0.124,
+      "step": 2216
+    },
+    {
+      "epoch": 0.9721552291164218,
+      "grad_norm": 0.5360624165039689,
+      "learning_rate": 2.323964152831426e-07,
+      "loss": 0.1222,
+      "step": 2217
+    },
+    {
+      "epoch": 0.9725937294452971,
+      "grad_norm": 0.8228569935909387,
+      "learning_rate": 2.250828005789518e-07,
+      "loss": 0.1778,
+      "step": 2218
+    },
+    {
+      "epoch": 0.9730322297741724,
+      "grad_norm": 1.0404806638045407,
+      "learning_rate": 2.1788585487972913e-07,
+      "loss": 0.1893,
+      "step": 2219
+    },
+    {
+      "epoch": 0.9734707301030476,
+      "grad_norm": 0.4807679078408988,
+      "learning_rate": 2.1080559505462505e-07,
+      "loss": 0.1029,
+      "step": 2220
+    },
+    {
+      "epoch": 0.9734707301030476,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9038366945400885,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26331380009651184,
+      "eval_runtime": 5.0227,
+      "eval_samples_per_second": 5.973,
+      "eval_steps_per_second": 0.199,
+      "step": 2220
+    },
+    {
+      "epoch": 0.9739092304319228,
+      "grad_norm": 0.7656904200298938,
+      "learning_rate": 2.0384203769928667e-07,
+      "loss": 0.1769,
+      "step": 2221
+    },
+    {
+      "epoch": 0.9743477307607981,
+      "grad_norm": 1.0331427419472423,
+      "learning_rate": 1.9699519913581322e-07,
+      "loss": 0.1885,
+      "step": 2222
+    },
+    {
+      "epoch": 0.9747862310896733,
+      "grad_norm": 0.783225997877613,
+      "learning_rate": 1.9026509541272275e-07,
+      "loss": 0.1498,
+      "step": 2223
+    },
+    {
+      "epoch": 0.9752247314185486,
+      "grad_norm": 0.7720611933517559,
+      "learning_rate": 1.8365174230492998e-07,
+      "loss": 0.1623,
+      "step": 2224
+    },
+    {
+      "epoch": 0.9756632317474239,
+      "grad_norm": 0.7520632190497106,
+      "learning_rate": 1.7715515531366856e-07,
+      "loss": 0.1841,
+      "step": 2225
+    },
+    {
+      "epoch": 0.9756632317474239,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9008853910477128,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26486003398895264,
+      "eval_runtime": 5.0609,
+      "eval_samples_per_second": 5.928,
+      "eval_steps_per_second": 0.198,
+      "step": 2225
+    },
+    {
+      "epoch": 0.976101732076299,
+      "grad_norm": 0.4777516949598096,
+      "learning_rate": 1.7077534966650766e-07,
+      "loss": 0.1083,
+      "step": 2226
+    },
+    {
+      "epoch": 0.9765402324051743,
+      "grad_norm": 0.6892492529814521,
+      "learning_rate": 1.6451234031726882e-07,
+      "loss": 0.1122,
+      "step": 2227
+    },
+    {
+      "epoch": 0.9769787327340496,
+      "grad_norm": 0.734444175159532,
+      "learning_rate": 1.5836614194602027e-07,
+      "loss": 0.1346,
+      "step": 2228
+    },
+    {
+      "epoch": 0.9774172330629248,
+      "grad_norm": 0.7628592587258765,
+      "learning_rate": 1.5233676895902714e-07,
+      "loss": 0.2134,
+      "step": 2229
+    },
+    {
+      "epoch": 0.9778557333918001,
+      "grad_norm": 0.6999402711499318,
+      "learning_rate": 1.4642423548873462e-07,
+      "loss": 0.1594,
+      "step": 2230
+    },
+    {
+      "epoch": 0.9778557333918001,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9021151008362026,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26419270038604736,
+      "eval_runtime": 5.0475,
+      "eval_samples_per_second": 5.943,
+      "eval_steps_per_second": 0.198,
+      "step": 2230
+    },
+    {
+      "epoch": 0.9782942337206753,
+      "grad_norm": 1.0426238786158057,
+      "learning_rate": 1.40628555393707e-07,
+      "loss": 0.1631,
+      "step": 2231
+    },
+    {
+      "epoch": 0.9787327340495505,
+      "grad_norm": 0.6611734543229769,
+      "learning_rate": 1.3494974225863322e-07,
+      "loss": 0.1174,
+      "step": 2232
+    },
+    {
+      "epoch": 0.9791712343784258,
+      "grad_norm": 1.0595722319614658,
+      "learning_rate": 1.293878093942602e-07,
+      "loss": 0.1999,
+      "step": 2233
+    },
+    {
+      "epoch": 0.9796097347073011,
+      "grad_norm": 0.7775983526743748,
+      "learning_rate": 1.2394276983737073e-07,
+      "loss": 0.1644,
+      "step": 2234
+    },
+    {
+      "epoch": 0.9800482350361763,
+      "grad_norm": 0.7031513669716907,
+      "learning_rate": 1.1861463635077785e-07,
+      "loss": 0.1275,
+      "step": 2235
+    },
+    {
+      "epoch": 0.9800482350361763,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9033448106246925,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2634440064430237,
+      "eval_runtime": 5.1453,
+      "eval_samples_per_second": 5.831,
+      "eval_steps_per_second": 0.194,
+      "step": 2235
+    },
+    {
+      "epoch": 0.9804867353650515,
+      "grad_norm": 0.8229340016430483,
+      "learning_rate": 1.1340342142325267e-07,
+      "loss": 0.1454,
+      "step": 2236
+    },
+    {
+      "epoch": 0.9809252356939268,
+      "grad_norm": 0.700060712434519,
+      "learning_rate": 1.0830913726952996e-07,
+      "loss": 0.1681,
+      "step": 2237
+    },
+    {
+      "epoch": 0.981363736022802,
+      "grad_norm": 0.8465474385209266,
+      "learning_rate": 1.033317958302693e-07,
+      "loss": 0.1452,
+      "step": 2238
+    },
+    {
+      "epoch": 0.9818022363516773,
+      "grad_norm": 1.0379966371758056,
+      "learning_rate": 9.847140877200512e-08,
+      "loss": 0.2115,
+      "step": 2239
+    },
+    {
+      "epoch": 0.9822407366805526,
+      "grad_norm": 0.7936350841083502,
+      "learning_rate": 9.372798748716883e-08,
+      "loss": 0.1219,
+      "step": 2240
+    },
+    {
+      "epoch": 0.9822407366805526,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9021151008362027,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2647298276424408,
+      "eval_runtime": 5.0448,
+      "eval_samples_per_second": 5.947,
+      "eval_steps_per_second": 0.198,
+      "step": 2240
+    },
+    {
+      "epoch": 0.9826792370094277,
+      "grad_norm": 0.7451721135727123,
+      "learning_rate": 8.910154309400564e-08,
+      "loss": 0.1528,
+      "step": 2241
+    },
+    {
+      "epoch": 0.983117737338303,
+      "grad_norm": 0.7528869575190266,
+      "learning_rate": 8.459208643659122e-08,
+      "loss": 0.1965,
+      "step": 2242
+    },
+    {
+      "epoch": 0.9835562376671783,
+      "grad_norm": 0.8245719648817869,
+      "learning_rate": 8.01996280847761e-08,
+      "loss": 0.1899,
+      "step": 2243
+    },
+    {
+      "epoch": 0.9839947379960535,
+      "grad_norm": 0.6978686747600712,
+      "learning_rate": 7.59241783341913e-08,
+      "loss": 0.1777,
+      "step": 2244
+    },
+    {
+      "epoch": 0.9844332383249288,
+      "grad_norm": 0.6555901389145737,
+      "learning_rate": 7.176574720618723e-08,
+      "loss": 0.1264,
+      "step": 2245
+    },
+    {
+      "epoch": 0.9844332383249288,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9038366945400885,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26510417461395264,
+      "eval_runtime": 4.9026,
+      "eval_samples_per_second": 6.119,
+      "eval_steps_per_second": 0.204,
+      "step": 2245
+    },
+    {
+      "epoch": 0.984871738653804,
+      "grad_norm": 0.6020348862072671,
+      "learning_rate": 6.772434444785591e-08,
+      "loss": 0.1462,
+      "step": 2246
+    },
+    {
+      "epoch": 0.9853102389826792,
+      "grad_norm": 0.5343478606265442,
+      "learning_rate": 6.379997953196437e-08,
+      "loss": 0.1161,
+      "step": 2247
+    },
+    {
+      "epoch": 0.9857487393115545,
+      "grad_norm": 1.0499703730680832,
+      "learning_rate": 5.999266165694905e-08,
+      "loss": 0.1321,
+      "step": 2248
+    },
+    {
+      "epoch": 0.9861872396404298,
+      "grad_norm": 0.9390822132612041,
+      "learning_rate": 5.630239974691032e-08,
+      "loss": 0.177,
+      "step": 2249
+    },
+    {
+      "epoch": 0.986625739969305,
+      "grad_norm": 0.7750388228245491,
+      "learning_rate": 5.272920245156798e-08,
+      "loss": 0.1124,
+      "step": 2250
+    },
+    {
+      "epoch": 0.986625739969305,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9028529267092966,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26339519023895264,
+      "eval_runtime": 5.3029,
+      "eval_samples_per_second": 5.657,
+      "eval_steps_per_second": 0.189,
+      "step": 2250
+    },
+    {
+      "epoch": 0.9870642402981802,
+      "grad_norm": 0.4372383231571483,
+      "learning_rate": 4.927307814625026e-08,
+      "loss": 0.099,
+      "step": 2251
+    },
+    {
+      "epoch": 0.9875027406270555,
+      "grad_norm": 0.7555332839083383,
+      "learning_rate": 4.5934034931882644e-08,
+      "loss": 0.1293,
+      "step": 2252
+    },
+    {
+      "epoch": 0.9879412409559307,
+      "grad_norm": 0.6698273061888639,
+      "learning_rate": 4.2712080634949024e-08,
+      "loss": 0.1398,
+      "step": 2253
+    },
+    {
+      "epoch": 0.988379741284806,
+      "grad_norm": 1.0889584011710371,
+      "learning_rate": 3.960722280749174e-08,
+      "loss": 0.1537,
+      "step": 2254
+    },
+    {
+      "epoch": 0.9888182416136813,
+      "grad_norm": 0.49362924819793047,
+      "learning_rate": 3.6619468727083773e-08,
+      "loss": 0.0824,
+      "step": 2255
+    },
+    {
+      "epoch": 0.9888182416136813,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9016232169208066,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2658854126930237,
+      "eval_runtime": 5.0593,
+      "eval_samples_per_second": 5.93,
+      "eval_steps_per_second": 0.198,
+      "step": 2255
+    },
+    {
+      "epoch": 0.9892567419425564,
+      "grad_norm": 1.0037748102150028,
+      "learning_rate": 3.374882539681767e-08,
+      "loss": 0.1385,
+      "step": 2256
+    },
+    {
+      "epoch": 0.9896952422714317,
+      "grad_norm": 0.8214090899116598,
+      "learning_rate": 3.099529954528335e-08,
+      "loss": 0.1463,
+      "step": 2257
+    },
+    {
+      "epoch": 0.990133742600307,
+      "grad_norm": 0.7813408410559692,
+      "learning_rate": 2.8358897626556968e-08,
+      "loss": 0.1303,
+      "step": 2258
+    },
+    {
+      "epoch": 0.9905722429291822,
+      "grad_norm": 0.6352466813644553,
+      "learning_rate": 2.583962582018984e-08,
+      "loss": 0.1169,
+      "step": 2259
+    },
+    {
+      "epoch": 0.9910107432580575,
+      "grad_norm": 0.7860685137760435,
+      "learning_rate": 2.3437490031180676e-08,
+      "loss": 0.1381,
+      "step": 2260
+    },
+    {
+      "epoch": 0.9910107432580575,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9028529267092966,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.26518553495407104,
+      "eval_runtime": 4.9722,
+      "eval_samples_per_second": 6.034,
+      "eval_steps_per_second": 0.201,
+      "step": 2260
+    },
+    {
+      "epoch": 0.9914492435869326,
+      "grad_norm": 0.6868815272750708,
+      "learning_rate": 2.1152495889970035e-08,
+      "loss": 0.146,
+      "step": 2261
+    },
+    {
+      "epoch": 0.9918877439158079,
+      "grad_norm": 1.1308574836346492,
+      "learning_rate": 1.8984648752429225e-08,
+      "loss": 0.1972,
+      "step": 2262
+    },
+    {
+      "epoch": 0.9923262442446832,
+      "grad_norm": 1.3612719504990785,
+      "learning_rate": 1.693395369984363e-08,
+      "loss": 0.186,
+      "step": 2263
+    },
+    {
+      "epoch": 0.9927647445735585,
+      "grad_norm": 0.7177351398294232,
+      "learning_rate": 1.5000415538901636e-08,
+      "loss": 0.164,
+      "step": 2264
+    },
+    {
+      "epoch": 0.9932032449024337,
+      "grad_norm": 0.7130993275571453,
+      "learning_rate": 1.3184038801683508e-08,
+      "loss": 0.133,
+      "step": 2265
+    },
+    {
+      "epoch": 0.9932032449024337,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9023610427939006,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.265625,
+      "eval_runtime": 5.1737,
+      "eval_samples_per_second": 5.799,
+      "eval_steps_per_second": 0.193,
+      "step": 2265
+    },
+    {
+      "epoch": 0.9936417452313089,
+      "grad_norm": 0.722029153275214,
+      "learning_rate": 1.1484827745655846e-08,
+      "loss": 0.1271,
+      "step": 2266
+    },
+    {
+      "epoch": 0.9940802455601842,
+      "grad_norm": 0.7513117017757962,
+      "learning_rate": 9.902786353649385e-09,
+      "loss": 0.1868,
+      "step": 2267
+    },
+    {
+      "epoch": 0.9945187458890594,
+      "grad_norm": 0.6226798334100295,
+      "learning_rate": 8.437918333864536e-09,
+      "loss": 0.1267,
+      "step": 2268
+    },
+    {
+      "epoch": 0.9949572462179347,
+      "grad_norm": 0.918389018849689,
+      "learning_rate": 7.09022711984364e-09,
+      "loss": 0.1684,
+      "step": 2269
+    },
+    {
+      "epoch": 0.99539574654681,
+      "grad_norm": 0.5928183592332686,
+      "learning_rate": 5.859715870498716e-09,
+      "loss": 0.1017,
+      "step": 2270
+    },
+    {
+      "epoch": 0.99539574654681,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9033448106246926,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2633626163005829,
+      "eval_runtime": 4.8567,
+      "eval_samples_per_second": 6.177,
+      "eval_steps_per_second": 0.206,
+      "step": 2270
+    },
+    {
+      "epoch": 0.9958342468756851,
+      "grad_norm": 0.7976166036651872,
+      "learning_rate": 4.746387470044855e-09,
+      "loss": 0.1435,
+      "step": 2271
+    },
+    {
+      "epoch": 0.9962727472045604,
+      "grad_norm": 0.6341820836388087,
+      "learning_rate": 3.750244528066826e-09,
+      "loss": 0.1243,
+      "step": 2272
+    },
+    {
+      "epoch": 0.9967112475334357,
+      "grad_norm": 1.5392080360921296,
+      "learning_rate": 2.8712893794413665e-09,
+      "loss": 0.0712,
+      "step": 2273
+    },
+    {
+      "epoch": 0.9971497478623109,
+      "grad_norm": 0.6412650064731606,
+      "learning_rate": 2.109524084381587e-09,
+      "loss": 0.1226,
+      "step": 2274
+    },
+    {
+      "epoch": 0.9975882481911862,
+      "grad_norm": 0.4398479433907805,
+      "learning_rate": 1.4649504284203198e-09,
+      "loss": 0.11,
+      "step": 2275
+    },
+    {
+      "epoch": 0.9975882481911862,
+      "eval_PRM Accuracy": 0.9047619047619048,
+      "eval_PRM F1": 0.9464285714285714,
+      "eval_PRM F1 AUC": 0.9048204623708804,
+      "eval_PRM F1 Neg": 0.5714285714285714,
+      "eval_PRM NPV": 0.8888888888888888,
+      "eval_PRM Precision": 0.905982905982906,
+      "eval_PRM Recall": 0.9906542056074766,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2633300721645355,
+      "eval_runtime": 5.1512,
+      "eval_samples_per_second": 5.824,
+      "eval_steps_per_second": 0.194,
+      "step": 2275
+    },
+    {
+      "epoch": 0.9980267485200613,
+      "grad_norm": 0.9910158250626084,
+      "learning_rate": 9.375699223879153e-10,
+      "loss": 0.2007,
+      "step": 2276
+    },
+    {
+      "epoch": 0.9984652488489366,
+      "grad_norm": 0.6291837367255644,
+      "learning_rate": 5.273838024344446e-10,
+      "loss": 0.1029,
+      "step": 2277
+    },
+    {
+      "epoch": 0.9989037491778119,
+      "grad_norm": 0.9883836422855934,
+      "learning_rate": 2.3439302999639366e-10,
+      "loss": 0.2552,
+      "step": 2278
+    },
+    {
+      "epoch": 0.9993422495066872,
+      "grad_norm": 0.6843970949709545,
+      "learning_rate": 5.859829183552101e-11,
+      "loss": 0.1788,
+      "step": 2279
+    },
+    {
+      "epoch": 0.9997807498355624,
+      "grad_norm": 1.0098250537966291,
+      "learning_rate": 0.0,
+      "loss": 0.22,
+      "step": 2280
+    },
+    {
+      "epoch": 0.9997807498355624,
+      "eval_PRM Accuracy": 0.8968253968253969,
+      "eval_PRM F1": 0.9417040358744395,
+      "eval_PRM F1 AUC": 0.9021151008362027,
+      "eval_PRM F1 Neg": 0.5517241379310345,
+      "eval_PRM NPV": 0.8,
+      "eval_PRM Precision": 0.9051724137931034,
+      "eval_PRM Recall": 0.9813084112149533,
+      "eval_PRM Specificty": 0.42105263157894735,
+      "eval_loss": 0.2653645873069763,
+      "eval_runtime": 5.1575,
+      "eval_samples_per_second": 5.817,
+      "eval_steps_per_second": 0.194,
+      "step": 2280
     }
   ],
   "logging_steps": 1,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 3531784782086144.0,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null