HPAI-BSC
/

Meta-Llama-3.1-70B-Instruct-Egida-DPO

Model card Files Files and versions Community

danihinjos commited on Mar 4

Commit

e581917

·

verified ·

1 Parent(s): 9f328b1

Update README.md

Files changed (1) hide show

README.md +17 -0

README.md CHANGED Viewed

@@ -24,6 +24,23 @@ dataset for this model. This results in a DPO dataset composed by triplets < ”
 - **Batch Size:** 64
 - **LR:** 10−6
 ## Environmental Impact

 - **Batch Size:** 64
 - **LR:** 10−6
+## Performance
+### Safety Performance (Attack Success Ratio)
+|                              | Egida (test) ↓ | DELPHI ↓ | Alert-Base ↓ | Alert-Adv ↓ |
+|------------------------------|:--------------:|:--------:|:------------:|:-----------:|
+| Meta-Llama-3.1-70B-Instruct  |     0.274      |  0.170   |    0.320     |    0.084    |
+| Meta-Llama-3.1-70B-Egida-DPO |     0.009      |  0.007   |    0.006     |    0.005    |
+### General Purpose Performance
+|                              | OpenLLM Leaderboard (Average) ↑ | MMLU Generative (ROUGE1) ↑ |
+|------------------------------|:---------------------:|:---------------:|
+| Meta-Llama-3.1-70B-Instruct  |         0.575         |      0.726      |
+| Meta-Llama-3.1-70B-Egida-DPO |         0.577         |      0.038      |
 ## Environmental Impact