litbank-coref-mem-xl-6

This model is a fine-tuned version of eddieman78/litbank-coref-mem-xl-3 on the None dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 5e-05
train_batch_size: 8
eval_batch_size: 8
seed: 42
optimizer: Use OptimizerNames.ADAFACTOR and the args are: No additional optimizer arguments
lr_scheduler_type: linear
num_epochs: 3

Training Loss	Epoch	Step	Validation Loss
0.0054	0.5855	500	0.0019
0.0034	1.1710	1000	0.0010
0.0023	1.7564	1500	0.0006
0.0016	2.3419	2000	0.0004
0.0012	2.9274	2500	0.0003

Model tree for eddieman78/litbank-coref-mem-xl-6