模型 ./output/nomal/zero_shot/meta-llama/Meta-Llama-3.1-405B-Instruct_f.json 评估结果：
正确数/总数: 78/100
Accuracy: 0.7800
Recall: 0.7800
Precision: 1.0000
F1 Score: 0.8764
AUROC: None
---
