模型 ./output/nomal/two_shot/deepseek-ai/DeepSeek-V3_f.json 评估结果：
正确数/总数: 67/100
Accuracy: 0.6700
Recall: 0.6700
Precision: 1.0000
F1 Score: 0.8024
AUROC: None
---
