init model 10 epoch

Files changed (3) hide show

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [openai/whisper-medium](https://huggingface.co/openai/whisper-medium) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4530
-- Wer: 36.2003
 ## Model description
@@ -39,27 +39,31 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0001
-- train_batch_size: 48
-- eval_batch_size: 32
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.03
-- num_epochs: 3
 - mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Wer     |
-|:-------------:|:-----:|:----:|:---------------:|:-------:|
-| 0.4976        | 1.0   | 2069 | 0.4992          | 42.7909 |
-| 0.358         | 2.0   | 4138 | 0.4304          | 37.2852 |
-| 0.1891        | 3.0   | 6207 | 0.4530          | 36.2003 |
 ### Framework versions
 - Transformers 4.47.1
 - Pytorch 2.5.1+cu121
-- Datasets 3.5.0
 - Tokenizers 0.21.0

 This model is a fine-tuned version of [openai/whisper-medium](https://huggingface.co/openai/whisper-medium) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.6966
+- Wer: 38.3922
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 0.0001
+- train_batch_size: 8
+- eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 2
+- total_train_batch_size: 16
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.03
+- num_epochs: 5
 - mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Wer     |
+|:-------------:|:-----:|:-----:|:---------------:|:-------:|
+| 1.172         | 1.0   | 6205  | 0.5755          | 47.5724 |
+| 0.8696        | 2.0   | 12410 | 0.4932          | 40.5547 |
+| 0.6827        | 3.0   | 18615 | 0.4860          | 38.7776 |
+| 0.3563        | 4.0   | 24820 | 0.5455          | 38.3652 |
+| 0.1066        | 5.0   | 31025 | 0.6966          | 38.3922 |
 ### Framework versions
 - Transformers 4.47.1
 - Pytorch 2.5.1+cu121
+- Datasets 3.4.0
 - Tokenizers 0.21.0

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3187c9649177f732c1e0c389584fb38e446628e555417508b0ee847cc1aa3fa
 size 3055544304

 version https://git-lfs.github.com/spec/v1
+oid sha256:9d38f875f772e2638599f7d98a121d889e62bbfecc5347965e6a850b8136233b
 size 3055544304

runs/Apr05_02-29-41_0b155b856663/events.out.tfevents.1743820183.0b155b856663.12477.1 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed79a50030b6065824c1875c851d650745d5b4dbf6891791772f7fc168cd32f2
-size 140464

 version https://git-lfs.github.com/spec/v1
+oid sha256:03b058eec3c04e05497c2a7b987290373110426c1854658e82a66d6539ae40f6
+size 140824