yifan-Eva commited on May 12

Commit

3156cf8

verified ·

1 Parent(s): 474de8e

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/README.md +10 -0
modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/adapter_config.json +23 -0
modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/adapter_model.bin +3 -0
modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/special_tokens_map.json +24 -0
modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/tokenizer.json +0 -0
modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/tokenizer.model +3 -0
modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/tokenizer_config.json +39 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/README.md +10 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/adapter_config.json +23 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/adapter_model.bin +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/optimizer.pt +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/rng_state_0.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/rng_state_1.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/rng_state_2.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/rng_state_3.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/scheduler.pt +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/special_tokens_map.json +24 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/tokenizer.json +0 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/tokenizer.model +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/tokenizer_config.json +39 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/trainer_state.json +0 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/training_args.bin +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/README.md +10 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/adapter_config.json +23 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/adapter_model.bin +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/optimizer.pt +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/rng_state_0.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/rng_state_1.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/rng_state_2.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/rng_state_3.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/scheduler.pt +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/special_tokens_map.json +24 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/tokenizer.json +0 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/tokenizer.model +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/tokenizer_config.json +39 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/trainer_state.json +0 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/training_args.bin +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/README.md +10 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/adapter_config.json +23 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/adapter_model.bin +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/optimizer.pt +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/rng_state_0.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/rng_state_1.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/rng_state_2.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/rng_state_3.pth +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/scheduler.pt +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/special_tokens_map.json +24 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/tokenizer.json +0 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/tokenizer.model +3 -0
modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/tokenizer_config.json +39 -0

modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/README.md ADDED Viewed

	@@ -0,0 +1,10 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0
+- PEFT 0.5.0

modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/adapter_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "/shared/nas/data/m1/xuejunz2/model_weights/Llama-2-7b-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.0,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "k_proj",
+    "v_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fe4e7fd4b82b6d03365d5b9275cdd9e0041908ceae79dca7b5f19ec0c9cad17c
+size 268528394

modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

modpo/use_reward/0.9helpful_0.1harmless/best_checkpoint/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": true
+}

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/README.md ADDED Viewed

	@@ -0,0 +1,10 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0
+- PEFT 0.5.0

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "/shared/nas/data/m1/xuejunz2/model_weights/Llama-2-7b-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.0,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "k_proj",
+    "v_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fe4e7fd4b82b6d03365d5b9275cdd9e0041908ceae79dca7b5f19ec0c9cad17c
+size 268528394

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4b6a9206243e55d3ed45d655040d0a4076226d0ccc42b15c77241bd5ec35d4ef
+size 537086714

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d033f54418aa1191f4de3d4b8f33ec6fb192850065a7b46329bf21fd70b3ecaf
+size 14960

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:37194a6d48612e1a46a2d5d317ead97c70d9fc4569b0118fcd5f84c3dc9daa5a
+size 15024

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17c179483659a784aa1ace2427daff48c556a6bcc3c330e6f3274e4dc95e4b49
+size 15024

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b56857c9b117629f35af2c3d64f522d33a9d8aa94faa81ec6956380a895118c4
+size 15024

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5d0529b53e6ebee0c7b46c10b2920379de0c6699f88126044d5939c1af887eda
+size 1064

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": true
+}

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-12000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:92da8475a792d3e7bca2c0a890f34256551e4fab8e06d9e532565259a7931479
+size 4600

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/README.md ADDED Viewed

	@@ -0,0 +1,10 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0
+- PEFT 0.5.0

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "/shared/nas/data/m1/xuejunz2/model_weights/Llama-2-7b-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.0,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "k_proj",
+    "v_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:01c5e527c14993b1e511a9c509318a3ae61cbfc6b59190ab051adca93c854813
+size 268528394

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d7fcbe807937574debba2951786ad5e182c66d995f7e1c645f57866fb23d1da9
+size 537086714

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ef92eb53afca1403cb194c6d57f8c0a9602dddbd7955a9f12b58cb79e89aef63
+size 14960

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:49d1438e98cc9c53a6852464635ce62e9788e61eb3646b73e33813f487c4b6ae
+size 15024

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4388add9cec90932f8ff0100d27a0574d98e1bad52ff89d44e31967d2b4fbfde
+size 15024

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a705d6dfaae4f2c1b4b2be6b25a6eb521ffae6fcba21cc1531e97b60037ed079
+size 15024

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:860e83121b3edba04996b025194ebf1fc6bac3dbd859fc1369caac1a601ca40a
+size 1064

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": true
+}

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-6000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:92da8475a792d3e7bca2c0a890f34256551e4fab8e06d9e532565259a7931479
+size 4600

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/README.md ADDED Viewed

	@@ -0,0 +1,10 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0
+- PEFT 0.5.0

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "/shared/nas/data/m1/xuejunz2/model_weights/Llama-2-7b-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.0,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "k_proj",
+    "v_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:003b4ebc8b49538a035ea1bfc496068a09a418c66bc7f059a1c5c2bd4f67322a
+size 268528394

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7588215b0294eb3fa639657115bd53dd9e49c7b4201c9cb6c7ab013b0b84a061
+size 537086714

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d16f76dcbd250b88bb6678e2f4dd576ac683c98b82dfc0791432c4db489fa138
+size 14960

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6e07ace389d24bc1307b74f42a1e7b8f0117b0db853e2df64ff3f15cb92916a2
+size 15024

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da6a990f346d7014dffb28fa2bc7d3b890bd3c53712503fce3656da48d3d6e50
+size 15024

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e95f356ca38179b05993f55daece0223e96fa10b9a1b9ea2102a739211333f63
+size 15024

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:de6de625b29c14192ff061869262c0961b064bad26a5f6618a4f74af54f36cce
+size 1064

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

modpo/use_reward/0.9helpful_0.1harmless/checkpoint-9000/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": true
+}