Training in progress, step 145

Browse files

Files changed (5) hide show

adapter_config.json +3 -3
adapter_model.safetensors +2 -2
special_tokens_map.json +10 -1
tokenizer_config.json +12 -1
training_args.bin +1 -1

adapter_config.json CHANGED Viewed

@@ -23,12 +23,12 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "q_proj",
     "gate_proj",
     "o_proj",
     "v_proj",
-    "down_proj",
-    "up_proj",
     "k_proj"
   ],
   "task_type": "CAUSAL_LM",

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "gate_proj",
+    "q_proj",
+    "up_proj",
+    "down_proj",
     "o_proj",
     "v_proj",
     "k_proj"
   ],
   "task_type": "CAUSAL_LM",

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:05e236eab30054f522ca48df2f086c2139b2b50d1cc6fba248f28c0de6aaf5f4
-size 383569528

 version https://git-lfs.github.com/spec/v1
+oid sha256:0000e9eaae249b63b6c51005803c609b3ed411a71e3c9a45ca87be6b026f6358
+size 941420376

special_tokens_map.json CHANGED Viewed

@@ -1,4 +1,13 @@
 {
   "bos_token": {
     "content": "<s>",
     "lstrip": false,
@@ -13,7 +22,7 @@
     "rstrip": false,
     "single_word": false
   },
-  "pad_token": "<unk>",
   "unk_token": {
     "content": "<unk>",
     "lstrip": false,

 {
+  "additional_special_tokens": [
+    {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false
+    }
+  ],
   "bos_token": {
     "content": "<s>",
     "lstrip": false,
     "rstrip": false,
     "single_word": false
   },
+  "pad_token": "[PAD]",
   "unk_token": {
     "content": "<unk>",
     "lstrip": false,

tokenizer_config.json CHANGED Viewed

@@ -32850,8 +32850,19 @@
       "rstrip": false,
       "single_word": false,
       "special": false
     }
   },
   "bos_token": "<s>",
   "chat_template": "{% if messages[0]['role'] == 'system' %}{% set loop_messages = messages[1:] %}{% set system_message = messages[0]['content'] %}{% else %}{% set loop_messages = messages %}{% set system_message = false %}{% endif %}\n{% for message in loop_messages %}\n{% if message['role'] not in ['user', 'assistant', 'tool_calls'] %}\n{{ raise_exception('Invalid role: ' + message['role'] + '. Must be user, assistant, or tool_calls.') }}\n{% endif %}\n{% if loop.index0 == 0 and system_message != false %}\n{% set content = '<<SYS>>\n' + system_message + '\n<</SYS>>\n\n' + message['content'] %}\n{% else %}\n{% set content = message['content'] %}\n{% endif %}\n{% if message['role'] == 'user' %}\n{{ bos_token + '[INST] ' + content.strip() + ' [/INST]' }}\n{% elif message['role'] == 'assistant' %}\n{{ ' ' + content.strip() + ' ' + eos_token }}\n{% elif message['role'] == 'tool_calls' %}\n{{ ' [TOOL_CALLS] ' + content.strip() + ' [/TOOL_CALLS] ' }}\n{% endif %}\n{% endfor %}",
   "clean_up_tokenization_spaces": false,
@@ -32859,7 +32870,7 @@
   "extra_special_tokens": {},
   "legacy": false,
   "model_max_length": 8192,
-  "pad_token": "<unk>",
   "padding_side": "right",
   "sp_model_kwargs": {},
   "spaces_between_special_tokens": false,

       "rstrip": false,
       "single_word": false,
       "special": false
+    },
+    "68096": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
     }
   },
+  "additional_special_tokens": [
+    "[PAD]"
+  ],
   "bos_token": "<s>",
   "chat_template": "{% if messages[0]['role'] == 'system' %}{% set loop_messages = messages[1:] %}{% set system_message = messages[0]['content'] %}{% else %}{% set loop_messages = messages %}{% set system_message = false %}{% endif %}\n{% for message in loop_messages %}\n{% if message['role'] not in ['user', 'assistant', 'tool_calls'] %}\n{{ raise_exception('Invalid role: ' + message['role'] + '. Must be user, assistant, or tool_calls.') }}\n{% endif %}\n{% if loop.index0 == 0 and system_message != false %}\n{% set content = '<<SYS>>\n' + system_message + '\n<</SYS>>\n\n' + message['content'] %}\n{% else %}\n{% set content = message['content'] %}\n{% endif %}\n{% if message['role'] == 'user' %}\n{{ bos_token + '[INST] ' + content.strip() + ' [/INST]' }}\n{% elif message['role'] == 'assistant' %}\n{{ ' ' + content.strip() + ' ' + eos_token }}\n{% elif message['role'] == 'tool_calls' %}\n{{ ' [TOOL_CALLS] ' + content.strip() + ' [/TOOL_CALLS] ' }}\n{% endif %}\n{% endfor %}",
   "clean_up_tokenization_spaces": false,
   "extra_special_tokens": {},
   "legacy": false,
   "model_max_length": 8192,
+  "pad_token": "[PAD]",
   "padding_side": "right",
   "sp_model_kwargs": {},
   "spaces_between_special_tokens": false,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ca331fe95720e05f38064944932d8543f0c9ce884d869794497e5236b3d18763
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:ba593b17db62769f48cad2733568a19f9d173e99ae9d8956ed8b3f4f7f9c8598
 size 5496