wangrongsheng commited on Jul 28, 2023

Commit

f907ffe

1 Parent(s): 8297ec9

commit from root

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

README.md +3 -0
adapter_config.json +19 -0
adapter_model.bin +3 -0
all_results.json +7 -0
checkpoint-1000/README.md +3 -0
checkpoint-1000/adapter_config.json +19 -0
checkpoint-1000/adapter_model.bin +3 -0
checkpoint-1000/finetuning_args.json +13 -0
checkpoint-1000/optimizer.pt +3 -0
checkpoint-1000/rng_state_0.pth +3 -0
checkpoint-1000/rng_state_1.pth +3 -0
checkpoint-1000/rng_state_2.pth +3 -0
checkpoint-1000/rng_state_3.pth +3 -0
checkpoint-1000/scheduler.pt +3 -0
checkpoint-1000/trainer_state.json +616 -0
checkpoint-1000/training_args.bin +3 -0
checkpoint-10000/README.md +3 -0
checkpoint-10000/adapter_config.json +19 -0
checkpoint-10000/adapter_model.bin +3 -0
checkpoint-10000/finetuning_args.json +13 -0
checkpoint-10000/optimizer.pt +3 -0
checkpoint-10000/rng_state_0.pth +3 -0
checkpoint-10000/rng_state_1.pth +3 -0
checkpoint-10000/rng_state_2.pth +3 -0
checkpoint-10000/rng_state_3.pth +3 -0
checkpoint-10000/scheduler.pt +3 -0
checkpoint-10000/trainer_state.json +0 -0
checkpoint-10000/training_args.bin +3 -0
checkpoint-11000/README.md +3 -0
checkpoint-11000/adapter_config.json +19 -0
checkpoint-11000/adapter_model.bin +3 -0
checkpoint-11000/finetuning_args.json +13 -0
checkpoint-11000/optimizer.pt +3 -0
checkpoint-11000/rng_state_0.pth +3 -0
checkpoint-11000/rng_state_1.pth +3 -0
checkpoint-11000/rng_state_2.pth +3 -0
checkpoint-11000/rng_state_3.pth +3 -0
checkpoint-11000/scheduler.pt +3 -0
checkpoint-11000/trainer_state.json +0 -0
checkpoint-11000/training_args.bin +3 -0
checkpoint-12000/README.md +3 -0
checkpoint-12000/adapter_config.json +19 -0
checkpoint-12000/adapter_model.bin +3 -0
checkpoint-12000/finetuning_args.json +13 -0
checkpoint-12000/optimizer.pt +3 -0
checkpoint-12000/rng_state_0.pth +3 -0
checkpoint-12000/rng_state_1.pth +3 -0
checkpoint-12000/rng_state_2.pth +3 -0
checkpoint-12000/rng_state_3.pth +3 -0
checkpoint-12000/scheduler.pt +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,3 @@

+---
+library_name: peft
+---

adapter_config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "base_model_name_or_path": "./weights/chatglm2-6b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "query_key_value"
+  ],
+  "task_type": "CAUSAL_LM"
+}

adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7c4cba49ae6999c5b0c4f89eaa6024369a9573fc4e9647593535cfe46c7e8785
+size 7819417

all_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 2.0,
+    "train_loss": 2.467434000540609,
+    "train_runtime": 188918.1958,
+    "train_samples_per_second": 28.21,
+    "train_steps_per_second": 0.441
+}

checkpoint-1000/README.md ADDED Viewed

	@@ -0,0 +1,3 @@

+---
+library_name: peft
+---

checkpoint-1000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "base_model_name_or_path": "./weights/chatglm2-6b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "query_key_value"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-1000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e48e53528a5bc5427331c10de0186399acca83bcf800aa695895ce22374ec07
+size 7819417

checkpoint-1000/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 8,
+  "lora_target": [
+    "query_key_value"
+  ],
+  "name_module_trainable": "mlp",
+  "num_layer_trainable": 3,
+  "pre_seq_len": 64,
+  "prefix_projection": false
+}

checkpoint-1000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba3980c8be254b9393d0ac7b1bb5e404e13412ef1773a9f57fcd1eef733bd495
+size 15644485

checkpoint-1000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8a0bf331e1e32516cf903d29c45ba0cdf97f30e255f8a22836ae9a5afa29c802
+size 18679

checkpoint-1000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d60639569d75bb46de95ac0e00686a8acf55d5bbe2ab7e79ae868874d2e5763f
+size 18679

checkpoint-1000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:582c36924b90b46a753066ec6d5caaa025d2bc42231abe251be4aac96530dcaa
+size 18679

checkpoint-1000/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:768c752ec66264dad318dcf963bca413aa28bfc42931056fac82b52bf1dba37e
+size 18679

checkpoint-1000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a3be27f5c0f0401d42bee5c610da4925786b35c71c7ac127e76b56fce67d936f
+size 627

checkpoint-1000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,616 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.024017677010279567,
+  "global_step": 1000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999999855889116,
+      "loss": 3.4871,
+      "step": 10
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999999357728057,
+      "loss": 2.9969,
+      "step": 20
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999998503737748,
+      "loss": 2.9734,
+      "step": 30
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999997293918308,
+      "loss": 2.9203,
+      "step": 40
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999995728269912,
+      "loss": 2.7908,
+      "step": 50
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999993806792782,
+      "loss": 2.7973,
+      "step": 60
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.000499999152948719,
+      "loss": 2.8511,
+      "step": 70
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999988896353463,
+      "loss": 2.8423,
+      "step": 80
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999985907391973,
+      "loss": 2.8411,
+      "step": 90
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999982562603146,
+      "loss": 2.838,
+      "step": 100
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.000499997886198746,
+      "loss": 2.8751,
+      "step": 110
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999974805545439,
+      "loss": 2.7868,
+      "step": 120
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999970393277663,
+      "loss": 2.8003,
+      "step": 130
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999965625184758,
+      "loss": 2.8343,
+      "step": 140
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999960501267404,
+      "loss": 2.8053,
+      "step": 150
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999955021526329,
+      "loss": 2.7828,
+      "step": 160
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999949185962313,
+      "loss": 2.7822,
+      "step": 170
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999942994576189,
+      "loss": 2.7426,
+      "step": 180
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999936447368836,
+      "loss": 2.7808,
+      "step": 190
+    },
+    {
+      "epoch": 0.0,
+      "learning_rate": 0.0004999929544341185,
+      "loss": 2.7522,
+      "step": 200
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999922285494221,
+      "loss": 2.8008,
+      "step": 210
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999914670828975,
+      "loss": 2.748,
+      "step": 220
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999906700346533,
+      "loss": 2.783,
+      "step": 230
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999898374048027,
+      "loss": 2.7879,
+      "step": 240
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999889691934643,
+      "loss": 2.696,
+      "step": 250
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999880654007619,
+      "loss": 2.7354,
+      "step": 260
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999871260268238,
+      "loss": 2.7336,
+      "step": 270
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999861510717839,
+      "loss": 2.7077,
+      "step": 280
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999851405357809,
+      "loss": 2.7408,
+      "step": 290
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999840944189586,
+      "loss": 2.7115,
+      "step": 300
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.000499983012721466,
+      "loss": 2.6973,
+      "step": 310
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999818954434569,
+      "loss": 2.6644,
+      "step": 320
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999807425850907,
+      "loss": 2.7442,
+      "step": 330
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.000499979554146531,
+      "loss": 2.7007,
+      "step": 340
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999783301279471,
+      "loss": 2.7284,
+      "step": 350
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999770705295135,
+      "loss": 2.6649,
+      "step": 360
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999757753514091,
+      "loss": 2.7269,
+      "step": 370
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999744445938185,
+      "loss": 2.64,
+      "step": 380
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999730782569309,
+      "loss": 2.6886,
+      "step": 390
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.000499971676340941,
+      "loss": 2.6911,
+      "step": 400
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999702388460482,
+      "loss": 2.6814,
+      "step": 410
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999687657724571,
+      "loss": 2.7235,
+      "step": 420
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999672571203774,
+      "loss": 2.6898,
+      "step": 430
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999657128900239,
+      "loss": 2.6222,
+      "step": 440
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999641330816162,
+      "loss": 2.6827,
+      "step": 450
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999625176953794,
+      "loss": 2.6634,
+      "step": 460
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999608667315432,
+      "loss": 2.6976,
+      "step": 470
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999591801903428,
+      "loss": 2.6856,
+      "step": 480
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.000499957458072018,
+      "loss": 2.624,
+      "step": 490
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.000499955700376814,
+      "loss": 2.6693,
+      "step": 500
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999539071049812,
+      "loss": 2.7058,
+      "step": 510
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999520782567746,
+      "loss": 2.6878,
+      "step": 520
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999502138324544,
+      "loss": 2.6674,
+      "step": 530
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999483138322863,
+      "loss": 2.634,
+      "step": 540
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999463782565405,
+      "loss": 2.6242,
+      "step": 550
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999444071054925,
+      "loss": 2.636,
+      "step": 560
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999424003794229,
+      "loss": 2.6926,
+      "step": 570
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999403580786175,
+      "loss": 2.6564,
+      "step": 580
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999382802033666,
+      "loss": 2.6474,
+      "step": 590
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999361667539663,
+      "loss": 2.6462,
+      "step": 600
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999340177307172,
+      "loss": 2.6069,
+      "step": 610
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 0.0004999318331339252,
+      "loss": 2.632,
+      "step": 620
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999296129639014,
+      "loss": 2.6533,
+      "step": 630
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999273572209616,
+      "loss": 2.6524,
+      "step": 640
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.000499925065905427,
+      "loss": 2.6229,
+      "step": 650
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999227390176237,
+      "loss": 2.6587,
+      "step": 660
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999203765578828,
+      "loss": 2.6175,
+      "step": 670
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999179785265406,
+      "loss": 2.6214,
+      "step": 680
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999155449239384,
+      "loss": 2.6338,
+      "step": 690
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999130757504227,
+      "loss": 2.6364,
+      "step": 700
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999105710063449,
+      "loss": 2.6509,
+      "step": 710
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999080306920613,
+      "loss": 2.6465,
+      "step": 720
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999054548079338,
+      "loss": 2.6452,
+      "step": 730
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999028433543286,
+      "loss": 2.6858,
+      "step": 740
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004999001963316179,
+      "loss": 2.6624,
+      "step": 750
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998975137401781,
+      "loss": 2.5747,
+      "step": 760
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.000499894795580391,
+      "loss": 2.6239,
+      "step": 770
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998920418526438,
+      "loss": 2.612,
+      "step": 780
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998892525573282,
+      "loss": 2.6312,
+      "step": 790
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998864276948413,
+      "loss": 2.6321,
+      "step": 800
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.000499883567265585,
+      "loss": 2.6128,
+      "step": 810
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998806712699667,
+      "loss": 2.6299,
+      "step": 820
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998777397083982,
+      "loss": 2.6444,
+      "step": 830
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998747725812971,
+      "loss": 2.6058,
+      "step": 840
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998717698890857,
+      "loss": 2.5646,
+      "step": 850
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998687316321911,
+      "loss": 2.6089,
+      "step": 860
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998656578110461,
+      "loss": 2.6257,
+      "step": 870
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998625484260881,
+      "loss": 2.6794,
+      "step": 880
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998594034777594,
+      "loss": 2.6585,
+      "step": 890
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998562229665079,
+      "loss": 2.6161,
+      "step": 900
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998530068927862,
+      "loss": 2.5684,
+      "step": 910
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.000499849755257052,
+      "loss": 2.6284,
+      "step": 920
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998464680597682,
+      "loss": 2.5965,
+      "step": 930
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998431453014028,
+      "loss": 2.5825,
+      "step": 940
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998397869824284,
+      "loss": 2.6056,
+      "step": 950
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998363931033231,
+      "loss": 2.5434,
+      "step": 960
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998329636645702,
+      "loss": 2.6535,
+      "step": 970
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998294986666576,
+      "loss": 2.7084,
+      "step": 980
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998259981100785,
+      "loss": 2.6648,
+      "step": 990
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.0004998224619953312,
+      "loss": 2.6241,
+      "step": 1000
+    }
+  ],
+  "max_steps": 83272,
+  "num_train_epochs": 2,
+  "total_flos": 8.240237168274964e+17,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aab4a0da30baf194754a5b2d6c8ecbed604aafb0373b0257b06a25b16d6faf1e
+size 3306

checkpoint-10000/README.md ADDED Viewed

	@@ -0,0 +1,3 @@

+---
+library_name: peft
+---

checkpoint-10000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "base_model_name_or_path": "./weights/chatglm2-6b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "query_key_value"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-10000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bf701157490f41912111f595acafbc41594decb2b27ef19f0788eba51aff2681
+size 7819417

checkpoint-10000/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 8,
+  "lora_target": [
+    "query_key_value"
+  ],
+  "name_module_trainable": "mlp",
+  "num_layer_trainable": 3,
+  "pre_seq_len": 64,
+  "prefix_projection": false
+}

checkpoint-10000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:517f7b7738d73ea95594254a062adc2848b3652b5753c6e77a0f82bdb165b371
+size 15644485

checkpoint-10000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9bfa29559ca4d92e4986efd7942f0ee46249414ce10dda6df21f9729e4c7b0e5
+size 18679

checkpoint-10000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:201b261bc906f59f54703f7151d09fa4656328350fe1e32289bf2ebec7fc00ec
+size 18679

checkpoint-10000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:840327165dff7883696df1e485491601d42672494d509044041da1f644e05d5b
+size 18679

checkpoint-10000/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4c0abc06428d34cde6d36443cb0c1c9045ec3fd6add4ff9d4ea9c5576b0eb098
+size 18679

checkpoint-10000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2e1b2bc84c4c183ca49c2f1c8c31ca54e0cac995ec9f12aeeee3e0ffb089c397
+size 627

checkpoint-10000/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-10000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aab4a0da30baf194754a5b2d6c8ecbed604aafb0373b0257b06a25b16d6faf1e
+size 3306

checkpoint-11000/README.md ADDED Viewed

	@@ -0,0 +1,3 @@

+---
+library_name: peft
+---

checkpoint-11000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "base_model_name_or_path": "./weights/chatglm2-6b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "query_key_value"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-11000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c71cc59cf939b7a953d312c000367486c4cf61ceea4bd31bd774b28e09152aac
+size 7819417

checkpoint-11000/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 8,
+  "lora_target": [
+    "query_key_value"
+  ],
+  "name_module_trainable": "mlp",
+  "num_layer_trainable": 3,
+  "pre_seq_len": 64,
+  "prefix_projection": false
+}

checkpoint-11000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f78d2784dc285fdf60a723a28b80830a2e94b7bf07fa25d2b6ac32af89115d19
+size 15644485

checkpoint-11000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2a53156de7df58e88c88115bcecf2f22d85a896aafbfa771b15d826295f284cf
+size 18679

checkpoint-11000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5e49cb2258e915852f7fb71c70d428a25086be85ea478751cbf93966ace547df
+size 18679

checkpoint-11000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:64489605dc371c144343f5d8f86f14e8653b150da0636b52739665449310fb4d
+size 18679

checkpoint-11000/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:98e8c45623c4fcfe4dee7439d68093c36c3df8f467a08102ddb137d03128c6c5
+size 18679

checkpoint-11000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6ac817de0aa1e3a1a36ece514ac55c8d930600e57a1edda72ea351fa230b4987
+size 627

checkpoint-11000/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-11000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aab4a0da30baf194754a5b2d6c8ecbed604aafb0373b0257b06a25b16d6faf1e
+size 3306

checkpoint-12000/README.md ADDED Viewed

	@@ -0,0 +1,3 @@

+---
+library_name: peft
+---

checkpoint-12000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "base_model_name_or_path": "./weights/chatglm2-6b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "query_key_value"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-12000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9393747073348f7c6cba7c0c2bd6ffc437b45730f8eb1d68af7523c32f50bb30
+size 7819417

checkpoint-12000/finetuning_args.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 8,
+  "lora_target": [
+    "query_key_value"
+  ],
+  "name_module_trainable": "mlp",
+  "num_layer_trainable": 3,
+  "pre_seq_len": 64,
+  "prefix_projection": false
+}

checkpoint-12000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bb2954971fc980293e551184c8c79a2d2b9feae74d1a49e4727418b1223a3d77
+size 15644485

checkpoint-12000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b831e38acf4366ec0a7e4be0dd32fa56a3a1c8f9b5ebd92921f29306ad7d52eb
+size 18679

checkpoint-12000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e2fd8d580c0eae845ee2849cc4e050995ad5f1143080518e450556b11640ba46
+size 18679

checkpoint-12000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3c574640cbd2a11317eb9016605414c64d3b3d8552ebfe871fa87d6bcf8da711
+size 18679

checkpoint-12000/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02be11c252f4c04dc176f9c56cb75cfa272af60dd20d14275e3349db86e0a421
+size 18679

checkpoint-12000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fd9c0917caec61084496a4fa9c6cce85cb53d84927e2f6dc5f013bcd7fd0d86c
+size 627