Aratako commited on
Commit
0a18f85
·
verified ·
1 Parent(s): d76e643

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +45 -13
README.md CHANGED
@@ -9,35 +9,67 @@ tags:
9
  - mergekit
10
  base_model: [Aratako/Ninja-v1-RP, Elizezen/Antler-7B]
11
  ---
12
- # Ninja-Antler-RP
 
13
 
 
14
  This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
15
 
16
- ## Merge Details
17
- ### Merge Method
18
 
19
- This model was merged using the [DARE](https://arxiv.org/abs/2311.03099) [TIES](https://arxiv.org/abs/2306.01708) merge method using ./Ninja-v1-RP as a base.
 
20
 
21
- ### Models Merged
 
 
 
 
 
 
 
 
 
22
 
23
- The following models were included in the merge:
24
- * ./Antler-7B-MS
 
 
25
 
26
- ### Configuration
 
 
 
27
 
28
- The following YAML configuration was used to produce this model:
29
 
30
  ```yaml
31
  models:
32
- - model: ./Ninja-v1-RP
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
33
  # no parameters necessary for base model
34
- - model: ./Antler-7B-MS # follow user intent
35
  parameters:
36
  density: 0.7
37
  weight: 0.5
38
  merge_method: dare_ties
39
- base_model: ./Ninja-v1-RP
40
  dtype: bfloat16
41
  tokenizer_source: union
42
 
43
- ```
 
9
  - mergekit
10
  base_model: [Aratako/Ninja-v1-RP, Elizezen/Antler-7B]
11
  ---
12
+ # Ninja-v1-RP-expressive
13
+ [GGUF版はこちら/Click here for the GGUF version](https://huggingface.co/Aratako/Ninja-v1-RP-expressive-GGUF)
14
 
15
+ ## 概要
16
  This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
17
 
18
+ ロールプレイ用モデルである[Aratako/Ninja-v1-RP](https://huggingface.co/Aratako/Ninja-v1-RP)をベースに、小説生成モデルである[Elizezen/Antler-7B](https://huggingface.co/Elizezen/Antler-7B)の派生モデルをマージすることで表現力を強化したロールプレイ用モデルです。
 
19
 
20
+ ## プロンプトフォーマット
21
+ Vicunaのchat templateを利用してください。また、設定などを渡すシステムプロンプトは最初の`USER: `より前に入力されることを想定しています。また、マルチターンの対話を行う場合各ターンのアシスタントの応答の末尾に`eos_token`(`</s>`)を必ずつけてください。
22
 
23
+ ```
24
+ {ロールプレイの指示、世界観・あらすじの説明、キャラの設定など}
25
+ USER: {userの最初の入力}
26
+ ASSISTANT:
27
+ ```
28
+
29
+ なお、マージによりロールプレイへの理解力がやや薄れているからか時折ユーザー側のセリフを続けたり小説のようなものを書きだすことがあります。これについてはfew-shot promptingや再生成などで対応してください
30
+
31
+ ## マージの詳細
32
+ [Elizezen/Antler-7B](https://huggingface.co/Elizezen/Antler-7B)に対し、まず[mistralai/Mistral-7B-Instruct-v0.2](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.2)のChat Vectorを加算した後、以下4つの英語RP用モデルのTask Vectorを0.8倍して加算し、4種類のTask Vector加算モデルを作成しました。
33
 
34
+ - [senseable/WestLake-7B-v2](https://huggingface.co/senseable/WestLake-7B-v2)
35
+ - [SanjiWatsuki/Kunoichi-DPO-v2-7B](https://huggingface.co/SanjiWatsuki/Kunoichi-DPO-v2-7B)
36
+ - [SanjiWatsuki/Silicon-Maid-7B](https://huggingface.co/SanjiWatsuki/Silicon-Maid-7B)
37
+ - [SanjiWatsuki/Loyal-Macaroni-Maid-7B](https://huggingface.co/SanjiWatsuki/Loyal-Macaroni-Maid-7B)
38
 
39
+ 各モデルのTask Vectorの加算の式は以下の通りです。
40
+ ```
41
+ new_model = Antler-7B + 0.8 * (Mistral-7B-Instruct-v0.2 - Mistral-7B-v0.1) + 0.8 * (target_model - Mistral-7B-v0.1)
42
+ ```
43
 
44
+ 次に、このTask Vector加算によってできた4モデルとMistral-7B-Instruct-v0.2の差分加算モデルを、Model Stockという手法を用い以下のようなconfigを使ってmergekitでマージし、Antler-7Bベースのモデルを作成しました。
45
 
46
  ```yaml
47
  models:
48
+ - model: ./Antler-7B-CV
49
+ - model: ./Antler-7B-CV-Kunoichi
50
+ - model: ./Antler-7B-CV-SiliconMaid
51
+ - model: ./Antler-7B-CV-WestLake
52
+ - model: ./Antler-7B-CV-LoyalMacaroniMaid
53
+ merge_method: model_stock
54
+ base_model: ./Antler-7B-CV
55
+ dtype: bfloat16
56
+ tokenizer_source: union
57
+
58
+ ```
59
+
60
+ 最後に、[Aratako/Ninja-v1-RP](https://huggingface.co/Aratako/Ninja-v1-RP)に上記操作で出来上がったモデルを[DARE](https://arxiv.org/abs/2311.03099) [TIES](https://arxiv.org/abs/2306.01708) によってマージし、本モデルを作成しました。
61
+
62
+ ```yaml
63
+ models:
64
+ - model: Aratako/Ninja-v1-RP
65
  # no parameters necessary for base model
66
+ - model: ./Antler-7B-MS # improve expression quality
67
  parameters:
68
  density: 0.7
69
  weight: 0.5
70
  merge_method: dare_ties
71
+ base_model: Aratako/Ninja-v1-RP
72
  dtype: bfloat16
73
  tokenizer_source: union
74
 
75
+ ```