Model save

Browse files

Files changed (4) hide show

README.md +58 -0
all_results.json +8 -0
train_results.json +8 -0
trainer_state.json +668 -0

README.md ADDED Viewed

	@@ -0,0 +1,58 @@

+---
+base_model: Qwen/Qwen2.5-0.5B-Instruct
+library_name: transformers
+model_name: qwen-2.5-0.5B-instruct-sft-lora-countdown-mixed-10k
+tags:
+- generated_from_trainer
+- trl
+- sft
+licence: license
+---
+# Model Card for qwen-2.5-0.5B-instruct-sft-lora-countdown-mixed-10k
+This model is a fine-tuned version of [Qwen/Qwen2.5-0.5B-Instruct](https://huggingface.co/Qwen/Qwen2.5-0.5B-Instruct).
+It has been trained using [TRL](https://github.com/huggingface/trl).
+## Quick start
+```python
+from transformers import pipeline
+question = "If you had a time machine, but could only go to the past or the future once and never return, which would you choose and why?"
+generator = pipeline("text-generation", model="yeok/qwen-2.5-0.5B-instruct-sft-lora-countdown-mixed-10k", device="cuda")
+output = generator([{"role": "user", "content": question}], max_new_tokens=128, return_full_text=False)[0]
+print(output["generated_text"])
+```
+## Training procedure
+[<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="150" height="24"/>](https://wandb.ai/yeokch/stream-of-search-train/runs/zp6wb87e)
+This model was trained with SFT.
+### Framework versions
+- TRL: 0.15.2
+- Transformers: 4.50.0
+- Pytorch: 2.6.0
+- Datasets: 3.5.0
+- Tokenizers: 0.21.1
+## Citations
+Cite TRL as:
+```bibtex
+@misc{vonwerra2022trl,
+	title        = {{TRL: Transformer Reinforcement Learning}},
+	author       = {Leandro von Werra and Younes Belkada and Lewis Tunstall and Edward Beeching and Tristan Thrush and Nathan Lambert and Shengyi Huang and Kashif Rasul and Quentin Gallouédec},
+	year         = 2020,
+	journal      = {GitHub repository},
+	publisher    = {GitHub},
+	howpublished = {\url{https://github.com/huggingface/trl}}
+}
+```

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "total_flos": 1.112161775475753e+17,
+    "train_loss": 0.2421755204701053,
+    "train_runtime": 6265.5444,
+    "train_samples": 10000,
+    "train_samples_per_second": 0.988,
+    "train_steps_per_second": 0.062
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "total_flos": 1.112161775475753e+17,
+    "train_loss": 0.2421755204701053,
+    "train_runtime": 6265.5444,
+    "train_samples": 10000,
+    "train_samples_per_second": 0.988,
+    "train_steps_per_second": 0.062
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,668 @@

+{
+  "best_global_step": null,
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.9978994991113266,
+  "eval_steps": 500,
+  "global_step": 386,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.0025852318629827112,
+      "grad_norm": 0.19947637617588043,
+      "learning_rate": 5.128205128205128e-06,
+      "loss": 0.4855,
+      "mean_token_accuracy": 0.8692543655633926,
+      "step": 1
+    },
+    {
+      "epoch": 0.012926159314913557,
+      "grad_norm": 0.17975232005119324,
+      "learning_rate": 2.564102564102564e-05,
+      "loss": 0.5257,
+      "mean_token_accuracy": 0.8587111542001367,
+      "step": 5
+    },
+    {
+      "epoch": 0.025852318629827113,
+      "grad_norm": 0.18425868451595306,
+      "learning_rate": 5.128205128205128e-05,
+      "loss": 0.5986,
+      "mean_token_accuracy": 0.8385514542460442,
+      "step": 10
+    },
+    {
+      "epoch": 0.038778477944740666,
+      "grad_norm": 0.1301417350769043,
+      "learning_rate": 7.692307692307693e-05,
+      "loss": 0.5465,
+      "mean_token_accuracy": 0.8498092375695705,
+      "step": 15
+    },
+    {
+      "epoch": 0.051704637259654226,
+      "grad_norm": 0.10965953767299652,
+      "learning_rate": 0.00010256410256410256,
+      "loss": 0.4321,
+      "mean_token_accuracy": 0.8813926815986634,
+      "step": 20
+    },
+    {
+      "epoch": 0.06463079657456779,
+      "grad_norm": 0.12930011749267578,
+      "learning_rate": 0.00012820512820512823,
+      "loss": 0.443,
+      "mean_token_accuracy": 0.8760911300778389,
+      "step": 25
+    },
+    {
+      "epoch": 0.07755695588948133,
+      "grad_norm": 0.11269079148769379,
+      "learning_rate": 0.00015384615384615385,
+      "loss": 0.4426,
+      "mean_token_accuracy": 0.8727459989488124,
+      "step": 30
+    },
+    {
+      "epoch": 0.09048311520439489,
+      "grad_norm": 0.11542484909296036,
+      "learning_rate": 0.0001794871794871795,
+      "loss": 0.4327,
+      "mean_token_accuracy": 0.8739180192351341,
+      "step": 35
+    },
+    {
+      "epoch": 0.10340927451930845,
+      "grad_norm": 0.11400171369314194,
+      "learning_rate": 0.00019999590166142655,
+      "loss": 0.4399,
+      "mean_token_accuracy": 0.8683417722582817,
+      "step": 40
+    },
+    {
+      "epoch": 0.11633543383422201,
+      "grad_norm": 0.09787627309560776,
+      "learning_rate": 0.00019985249508066755,
+      "loss": 0.3218,
+      "mean_token_accuracy": 0.9006623029708862,
+      "step": 45
+    },
+    {
+      "epoch": 0.12926159314913557,
+      "grad_norm": 0.10737261176109314,
+      "learning_rate": 0.00019950450737506824,
+      "loss": 0.3469,
+      "mean_token_accuracy": 0.891525337845087,
+      "step": 50
+    },
+    {
+      "epoch": 0.14218775246404913,
+      "grad_norm": 0.10868100076913834,
+      "learning_rate": 0.00019895265151345518,
+      "loss": 0.2971,
+      "mean_token_accuracy": 0.9053808994591236,
+      "step": 55
+    },
+    {
+      "epoch": 0.15511391177896267,
+      "grad_norm": 0.11570388823747635,
+      "learning_rate": 0.00019819805815653768,
+      "loss": 0.2913,
+      "mean_token_accuracy": 0.9063713155686856,
+      "step": 60
+    },
+    {
+      "epoch": 0.16804007109387623,
+      "grad_norm": 0.10693395137786865,
+      "learning_rate": 0.00019724227334037256,
+      "loss": 0.271,
+      "mean_token_accuracy": 0.9122619301080703,
+      "step": 65
+    },
+    {
+      "epoch": 0.18096623040878979,
+      "grad_norm": 0.11293786764144897,
+      "learning_rate": 0.00019608725530879375,
+      "loss": 0.2776,
+      "mean_token_accuracy": 0.9088511765003204,
+      "step": 70
+    },
+    {
+      "epoch": 0.19389238972370335,
+      "grad_norm": 0.11578521877527237,
+      "learning_rate": 0.00019473537050129704,
+      "loss": 0.2758,
+      "mean_token_accuracy": 0.9097500234842301,
+      "step": 75
+    },
+    {
+      "epoch": 0.2068185490386169,
+      "grad_norm": 0.09964931011199951,
+      "learning_rate": 0.00019318938870459984,
+      "loss": 0.2113,
+      "mean_token_accuracy": 0.9298971399664879,
+      "step": 80
+    },
+    {
+      "epoch": 0.21974470835353047,
+      "grad_norm": 0.0910312831401825,
+      "learning_rate": 0.00019145247737780961,
+      "loss": 0.2097,
+      "mean_token_accuracy": 0.9294194750487804,
+      "step": 85
+    },
+    {
+      "epoch": 0.23267086766844403,
+      "grad_norm": 0.10386555641889572,
+      "learning_rate": 0.0001895281951628281,
+      "loss": 0.2353,
+      "mean_token_accuracy": 0.9217647381126881,
+      "step": 90
+    },
+    {
+      "epoch": 0.24559702698335756,
+      "grad_norm": 0.12289135903120041,
+      "learning_rate": 0.00018742048459328682,
+      "loss": 0.2287,
+      "mean_token_accuracy": 0.9224300988018512,
+      "step": 95
+    },
+    {
+      "epoch": 0.25852318629827115,
+      "grad_norm": 0.08697465062141418,
+      "learning_rate": 0.00018513366401695276,
+      "loss": 0.2524,
+      "mean_token_accuracy": 0.9144915089011192,
+      "step": 100
+    },
+    {
+      "epoch": 0.2714493456131847,
+      "grad_norm": 0.12167133390903473,
+      "learning_rate": 0.00018267241874815314,
+      "loss": 0.2355,
+      "mean_token_accuracy": 0.921189408749342,
+      "step": 105
+    },
+    {
+      "epoch": 0.28437550492809827,
+      "grad_norm": 0.10094963759183884,
+      "learning_rate": 0.0001800417914683471,
+      "loss": 0.2034,
+      "mean_token_accuracy": 0.9311973415315151,
+      "step": 110
+    },
+    {
+      "epoch": 0.2973016642430118,
+      "grad_norm": 0.11400150507688522,
+      "learning_rate": 0.0001772471718945119,
+      "loss": 0.1578,
+      "mean_token_accuracy": 0.9460886880755425,
+      "step": 115
+    },
+    {
+      "epoch": 0.31022782355792533,
+      "grad_norm": 0.10670112073421478,
+      "learning_rate": 0.00017429428573651024,
+      "loss": 0.2109,
+      "mean_token_accuracy": 0.9287083312869072,
+      "step": 120
+    },
+    {
+      "epoch": 0.3231539828728389,
+      "grad_norm": 0.16062867641448975,
+      "learning_rate": 0.00017118918296606537,
+      "loss": 0.2544,
+      "mean_token_accuracy": 0.9145693376660347,
+      "step": 125
+    },
+    {
+      "epoch": 0.33608014218775245,
+      "grad_norm": 0.09779643267393112,
+      "learning_rate": 0.0001679382254213768,
+      "loss": 0.2399,
+      "mean_token_accuracy": 0.9194405369460583,
+      "step": 130
+    },
+    {
+      "epoch": 0.34900630150266604,
+      "grad_norm": 0.1413896679878235,
+      "learning_rate": 0.00016454807377277398,
+      "loss": 0.2186,
+      "mean_token_accuracy": 0.9258851148188114,
+      "step": 135
+    },
+    {
+      "epoch": 0.36193246081757957,
+      "grad_norm": 0.10491285473108292,
+      "learning_rate": 0.0001610256738761125,
+      "loss": 0.2204,
+      "mean_token_accuracy": 0.924911479651928,
+      "step": 140
+    },
+    {
+      "epoch": 0.37485862013249316,
+      "grad_norm": 0.1537468135356903,
+      "learning_rate": 0.00015737824254187275,
+      "loss": 0.2398,
+      "mean_token_accuracy": 0.918810273706913,
+      "step": 145
+    },
+    {
+      "epoch": 0.3877847794474067,
+      "grad_norm": 0.10142084211111069,
+      "learning_rate": 0.00015361325274911779,
+      "loss": 0.1905,
+      "mean_token_accuracy": 0.9351178079843521,
+      "step": 150
+    },
+    {
+      "epoch": 0.4007109387623202,
+      "grad_norm": 0.13146336376667023,
+      "learning_rate": 0.00014973841833460457,
+      "loss": 0.2366,
+      "mean_token_accuracy": 0.9191917888820171,
+      "step": 155
+    },
+    {
+      "epoch": 0.4136370980772338,
+      "grad_norm": 0.12509401142597198,
+      "learning_rate": 0.0001457616781884173,
+      "loss": 0.2531,
+      "mean_token_accuracy": 0.9145876497030259,
+      "step": 160
+    },
+    {
+      "epoch": 0.42656325739214734,
+      "grad_norm": 0.12673504650592804,
+      "learning_rate": 0.0001416911799885049,
+      "loss": 0.1772,
+      "mean_token_accuracy": 0.9389024488627911,
+      "step": 165
+    },
+    {
+      "epoch": 0.43948941670706093,
+      "grad_norm": 0.12198735028505325,
+      "learning_rate": 0.0001375352635074461,
+      "loss": 0.1974,
+      "mean_token_accuracy": 0.9322213307023048,
+      "step": 170
+    },
+    {
+      "epoch": 0.45241557602197446,
+      "grad_norm": 0.09001921862363815,
+      "learning_rate": 0.00013330244352564527,
+      "loss": 0.2159,
+      "mean_token_accuracy": 0.9264695949852466,
+      "step": 175
+    },
+    {
+      "epoch": 0.46534173533688805,
+      "grad_norm": 0.12006579339504242,
+      "learning_rate": 0.00012900139238596598,
+      "loss": 0.1787,
+      "mean_token_accuracy": 0.9383469611406327,
+      "step": 180
+    },
+    {
+      "epoch": 0.4782678946518016,
+      "grad_norm": 0.0788959190249443,
+      "learning_rate": 0.00012464092222554552,
+      "loss": 0.1921,
+      "mean_token_accuracy": 0.9340785585343838,
+      "step": 185
+    },
+    {
+      "epoch": 0.4911940539667151,
+      "grad_norm": 0.10936954617500305,
+      "learning_rate": 0.00012022996692119424,
+      "loss": 0.2428,
+      "mean_token_accuracy": 0.9171895898878575,
+      "step": 190
+    },
+    {
+      "epoch": 0.5041202132816287,
+      "grad_norm": 0.0918896496295929,
+      "learning_rate": 0.00011577756378537033,
+      "loss": 0.1806,
+      "mean_token_accuracy": 0.9374389834702015,
+      "step": 195
+    },
+    {
+      "epoch": 0.5170463725965423,
+      "grad_norm": 0.090901680290699,
+      "learning_rate": 0.00011129283505023274,
+      "loss": 0.1757,
+      "mean_token_accuracy": 0.9391420423984528,
+      "step": 200
+    },
+    {
+      "epoch": 0.5299725319114558,
+      "grad_norm": 0.11911996454000473,
+      "learning_rate": 0.00010678496917770719,
+      "loss": 0.2274,
+      "mean_token_accuracy": 0.9221187844872475,
+      "step": 205
+    },
+    {
+      "epoch": 0.5428986912263694,
+      "grad_norm": 0.10029247403144836,
+      "learning_rate": 0.00010226320203385878,
+      "loss": 0.2235,
+      "mean_token_accuracy": 0.9237379372119904,
+      "step": 210
+    },
+    {
+      "epoch": 0.5558248505412829,
+      "grad_norm": 0.08876102417707443,
+      "learning_rate": 9.773679796614124e-05,
+      "loss": 0.1757,
+      "mean_token_accuracy": 0.9393434815108777,
+      "step": 215
+    },
+    {
+      "epoch": 0.5687510098561965,
+      "grad_norm": 0.09385403990745544,
+      "learning_rate": 9.321503082229282e-05,
+      "loss": 0.215,
+      "mean_token_accuracy": 0.9265245340764523,
+      "step": 220
+    },
+    {
+      "epoch": 0.58167716917111,
+      "grad_norm": 0.12575064599514008,
+      "learning_rate": 8.87071649497673e-05,
+      "loss": 0.203,
+      "mean_token_accuracy": 0.9299597069621086,
+      "step": 225
+    },
+    {
+      "epoch": 0.5946033284860236,
+      "grad_norm": 0.07954408973455429,
+      "learning_rate": 8.422243621462969e-05,
+      "loss": 0.1777,
+      "mean_token_accuracy": 0.9387361042201519,
+      "step": 230
+    },
+    {
+      "epoch": 0.6075294878009372,
+      "grad_norm": 0.09423957765102386,
+      "learning_rate": 7.97700330788058e-05,
+      "loss": 0.2382,
+      "mean_token_accuracy": 0.918901839107275,
+      "step": 235
+    },
+    {
+      "epoch": 0.6204556471158507,
+      "grad_norm": 0.09229165315628052,
+      "learning_rate": 7.535907777445449e-05,
+      "loss": 0.1767,
+      "mean_token_accuracy": 0.9390779457986355,
+      "step": 240
+    },
+    {
+      "epoch": 0.6333818064307642,
+      "grad_norm": 0.06950776278972626,
+      "learning_rate": 7.099860761403403e-05,
+      "loss": 0.1909,
+      "mean_token_accuracy": 0.9346767745912075,
+      "step": 245
+    },
+    {
+      "epoch": 0.6463079657456778,
+      "grad_norm": 0.08237725496292114,
+      "learning_rate": 6.669755647435474e-05,
+      "loss": 0.2094,
+      "mean_token_accuracy": 0.9281741440296173,
+      "step": 250
+    },
+    {
+      "epoch": 0.6592341250605914,
+      "grad_norm": 0.14740723371505737,
+      "learning_rate": 6.24647364925539e-05,
+      "loss": 0.1897,
+      "mean_token_accuracy": 0.9345928385853768,
+      "step": 255
+    },
+    {
+      "epoch": 0.6721602843755049,
+      "grad_norm": 0.10453725606203079,
+      "learning_rate": 5.830882001149517e-05,
+      "loss": 0.1976,
+      "mean_token_accuracy": 0.9319064117968082,
+      "step": 260
+    },
+    {
+      "epoch": 0.6850864436904185,
+      "grad_norm": 0.08990013599395752,
+      "learning_rate": 5.423832181158274e-05,
+      "loss": 0.1786,
+      "mean_token_accuracy": 0.9379120320081711,
+      "step": 265
+    },
+    {
+      "epoch": 0.6980126030053321,
+      "grad_norm": 0.07297246903181076,
+      "learning_rate": 5.0261581665395475e-05,
+      "loss": 0.1854,
+      "mean_token_accuracy": 0.9353924997150898,
+      "step": 270
+    },
+    {
+      "epoch": 0.7109387623202456,
+      "grad_norm": 0.0806582048535347,
+      "learning_rate": 4.6386747250882224e-05,
+      "loss": 0.2185,
+      "mean_token_accuracy": 0.9244109325110912,
+      "step": 275
+    },
+    {
+      "epoch": 0.7238649216351591,
+      "grad_norm": 0.0904405489563942,
+      "learning_rate": 4.2621757458127285e-05,
+      "loss": 0.1913,
+      "mean_token_accuracy": 0.9338206477463246,
+      "step": 280
+    },
+    {
+      "epoch": 0.7367910809500727,
+      "grad_norm": 0.08367495238780975,
+      "learning_rate": 3.8974326123887515e-05,
+      "loss": 0.1764,
+      "mean_token_accuracy": 0.9384385243058204,
+      "step": 285
+    },
+    {
+      "epoch": 0.7497172402649863,
+      "grad_norm": 0.08596701920032501,
+      "learning_rate": 3.5451926227225997e-05,
+      "loss": 0.1983,
+      "mean_token_accuracy": 0.9315422356128693,
+      "step": 290
+    },
+    {
+      "epoch": 0.7626433995798998,
+      "grad_norm": 0.09684205055236816,
+      "learning_rate": 3.20617745786232e-05,
+      "loss": 0.2096,
+      "mean_token_accuracy": 0.9279609173536301,
+      "step": 295
+    },
+    {
+      "epoch": 0.7755695588948134,
+      "grad_norm": 0.0834093689918518,
+      "learning_rate": 2.8810817033934656e-05,
+      "loss": 0.214,
+      "mean_token_accuracy": 0.9260651856660843,
+      "step": 300
+    },
+    {
+      "epoch": 0.788495718209727,
+      "grad_norm": 0.0937936082482338,
+      "learning_rate": 2.5705714263489776e-05,
+      "loss": 0.2026,
+      "mean_token_accuracy": 0.9303412221372127,
+      "step": 305
+    },
+    {
+      "epoch": 0.8014218775246404,
+      "grad_norm": 0.12379499524831772,
+      "learning_rate": 2.275282810548811e-05,
+      "loss": 0.2255,
+      "mean_token_accuracy": 0.9226666398346424,
+      "step": 310
+    },
+    {
+      "epoch": 0.814348036839554,
+      "grad_norm": 0.07404923439025879,
+      "learning_rate": 1.9958208531652877e-05,
+      "loss": 0.2119,
+      "mean_token_accuracy": 0.9271700613200664,
+      "step": 315
+    },
+    {
+      "epoch": 0.8272741961544676,
+      "grad_norm": 0.0728936716914177,
+      "learning_rate": 1.73275812518469e-05,
+      "loss": 0.1728,
+      "mean_token_accuracy": 0.9397692546248436,
+      "step": 320
+    },
+    {
+      "epoch": 0.8402003554693812,
+      "grad_norm": 0.06289434432983398,
+      "learning_rate": 1.4866335983047264e-05,
+      "loss": 0.2043,
+      "mean_token_accuracy": 0.9284701481461525,
+      "step": 325
+    },
+    {
+      "epoch": 0.8531265147842947,
+      "grad_norm": 0.08489686250686646,
+      "learning_rate": 1.2579515406713193e-05,
+      "loss": 0.1896,
+      "mean_token_accuracy": 0.9349158577620983,
+      "step": 330
+    },
+    {
+      "epoch": 0.8660526740992083,
+      "grad_norm": 0.1035335510969162,
+      "learning_rate": 1.0471804837171916e-05,
+      "loss": 0.2155,
+      "mean_token_accuracy": 0.9255768470466137,
+      "step": 335
+    },
+    {
+      "epoch": 0.8789788334141219,
+      "grad_norm": 0.07824227213859558,
+      "learning_rate": 8.547522622190385e-06,
+      "loss": 0.1911,
+      "mean_token_accuracy": 0.9336588874459266,
+      "step": 340
+    },
+    {
+      "epoch": 0.8919049927290353,
+      "grad_norm": 0.09303997457027435,
+      "learning_rate": 6.810611295400171e-06,
+      "loss": 0.162,
+      "mean_token_accuracy": 0.9431906893849373,
+      "step": 345
+    },
+    {
+      "epoch": 0.9048311520439489,
+      "grad_norm": 0.10122327506542206,
+      "learning_rate": 5.264629498702967e-06,
+      "loss": 0.2196,
+      "mean_token_accuracy": 0.9225692808628082,
+      "step": 350
+    },
+    {
+      "epoch": 0.9177573113588625,
+      "grad_norm": 0.09543831646442413,
+      "learning_rate": 3.91274469120626e-06,
+      "loss": 0.2326,
+      "mean_token_accuracy": 0.9204256013035774,
+      "step": 355
+    },
+    {
+      "epoch": 0.9306834706737761,
+      "grad_norm": 0.09284953027963638,
+      "learning_rate": 2.7577266596274576e-06,
+      "loss": 0.217,
+      "mean_token_accuracy": 0.9256333105266095,
+      "step": 360
+    },
+    {
+      "epoch": 0.9436096299886896,
+      "grad_norm": 0.08564475923776627,
+      "learning_rate": 1.8019418434623404e-06,
+      "loss": 0.1704,
+      "mean_token_accuracy": 0.9403376758098603,
+      "step": 365
+    },
+    {
+      "epoch": 0.9565357893036032,
+      "grad_norm": 0.08221950381994247,
+      "learning_rate": 1.0473484865448525e-06,
+      "loss": 0.1877,
+      "mean_token_accuracy": 0.9344905905425549,
+      "step": 370
+    },
+    {
+      "epoch": 0.9694619486185168,
+      "grad_norm": 0.0882996991276741,
+      "learning_rate": 4.954926249317815e-07,
+      "loss": 0.1614,
+      "mean_token_accuracy": 0.9434516452252865,
+      "step": 375
+    },
+    {
+      "epoch": 0.9823881079334302,
+      "grad_norm": 0.09918519109487534,
+      "learning_rate": 1.4750491933247512e-07,
+      "loss": 0.1984,
+      "mean_token_accuracy": 0.9314934000372886,
+      "step": 380
+    },
+    {
+      "epoch": 0.9953142672483438,
+      "grad_norm": 0.08256973326206207,
+      "learning_rate": 4.0983385734660875e-09,
+      "loss": 0.1962,
+      "mean_token_accuracy": 0.9319802142679692,
+      "step": 385
+    },
+    {
+      "epoch": 0.9978994991113266,
+      "mean_token_accuracy": 0.9183402508497238,
+      "step": 386,
+      "total_flos": 1.112161775475753e+17,
+      "train_loss": 0.2421755204701053,
+      "train_runtime": 6265.5444,
+      "train_samples_per_second": 0.988,
+      "train_steps_per_second": 0.062
+    }
+  ],
+  "logging_steps": 5,
+  "max_steps": 386,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 100,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1.112161775475753e+17,
+  "train_batch_size": 1,
+  "trial_name": null,
+  "trial_params": null
+}