Update README.md
Browse files
README.md
CHANGED
@@ -9,35 +9,67 @@ tags:
|
|
9 |
- mergekit
|
10 |
base_model: [Aratako/Ninja-v1-RP, Elizezen/Antler-7B]
|
11 |
---
|
12 |
-
# Ninja-
|
|
|
13 |
|
|
|
14 |
This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
|
15 |
|
16 |
-
|
17 |
-
### Merge Method
|
18 |
|
19 |
-
|
|
|
20 |
|
21 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
22 |
|
23 |
-
|
24 |
-
|
|
|
|
|
25 |
|
26 |
-
|
|
|
|
|
|
|
27 |
|
28 |
-
|
29 |
|
30 |
```yaml
|
31 |
models:
|
32 |
-
- model: ./
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
33 |
# no parameters necessary for base model
|
34 |
-
- model: ./Antler-7B-MS #
|
35 |
parameters:
|
36 |
density: 0.7
|
37 |
weight: 0.5
|
38 |
merge_method: dare_ties
|
39 |
-
base_model:
|
40 |
dtype: bfloat16
|
41 |
tokenizer_source: union
|
42 |
|
43 |
-
```
|
|
|
9 |
- mergekit
|
10 |
base_model: [Aratako/Ninja-v1-RP, Elizezen/Antler-7B]
|
11 |
---
|
12 |
+
# Ninja-v1-RP-expressive
|
13 |
+
[GGUF版はこちら/Click here for the GGUF version](https://huggingface.co/Aratako/Ninja-v1-RP-expressive-GGUF)
|
14 |
|
15 |
+
## 概要
|
16 |
This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
|
17 |
|
18 |
+
ロールプレイ用モデルである[Aratako/Ninja-v1-RP](https://huggingface.co/Aratako/Ninja-v1-RP)をベースに、小説生成モデルである[Elizezen/Antler-7B](https://huggingface.co/Elizezen/Antler-7B)の派生モデルをマージすることで表現力を強化したロールプレイ用モデルです。
|
|
|
19 |
|
20 |
+
## プロンプトフォーマット
|
21 |
+
Vicunaのchat templateを利用してください。また、設定などを渡すシステムプロンプトは最初の`USER: `より前に入力されることを想定しています。また、マルチターンの対話を行う場合各ターンのアシスタントの応答の末尾に`eos_token`(`</s>`)を必ずつけてください。
|
22 |
|
23 |
+
```
|
24 |
+
{ロールプレイの指示、世界観・あらすじの説明、キャラの設定など}
|
25 |
+
USER: {userの最初の入力}
|
26 |
+
ASSISTANT:
|
27 |
+
```
|
28 |
+
|
29 |
+
なお、マージによりロールプレイへの理解力がやや薄れているからか時折ユーザー側のセリフを続けたり小説のようなものを書きだすことがあります。これについてはfew-shot promptingや再生成などで対応してください
|
30 |
+
|
31 |
+
## マージの詳細
|
32 |
+
[Elizezen/Antler-7B](https://huggingface.co/Elizezen/Antler-7B)に対し、まず[mistralai/Mistral-7B-Instruct-v0.2](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.2)のChat Vectorを加算した後、以下4つの英語RP用モデルのTask Vectorを0.8倍して加算し、4種類のTask Vector加算モデルを作成しました。
|
33 |
|
34 |
+
- [senseable/WestLake-7B-v2](https://huggingface.co/senseable/WestLake-7B-v2)
|
35 |
+
- [SanjiWatsuki/Kunoichi-DPO-v2-7B](https://huggingface.co/SanjiWatsuki/Kunoichi-DPO-v2-7B)
|
36 |
+
- [SanjiWatsuki/Silicon-Maid-7B](https://huggingface.co/SanjiWatsuki/Silicon-Maid-7B)
|
37 |
+
- [SanjiWatsuki/Loyal-Macaroni-Maid-7B](https://huggingface.co/SanjiWatsuki/Loyal-Macaroni-Maid-7B)
|
38 |
|
39 |
+
各モデルのTask Vectorの加算の式は以下の通りです。
|
40 |
+
```
|
41 |
+
new_model = Antler-7B + 0.8 * (Mistral-7B-Instruct-v0.2 - Mistral-7B-v0.1) + 0.8 * (target_model - Mistral-7B-v0.1)
|
42 |
+
```
|
43 |
|
44 |
+
次に、このTask Vector加算によってできた4モデルとMistral-7B-Instruct-v0.2の差分加算モデルを、Model Stockという手法を用い以下のようなconfigを使ってmergekitでマージし、Antler-7Bベースのモデルを作成しました。
|
45 |
|
46 |
```yaml
|
47 |
models:
|
48 |
+
- model: ./Antler-7B-CV
|
49 |
+
- model: ./Antler-7B-CV-Kunoichi
|
50 |
+
- model: ./Antler-7B-CV-SiliconMaid
|
51 |
+
- model: ./Antler-7B-CV-WestLake
|
52 |
+
- model: ./Antler-7B-CV-LoyalMacaroniMaid
|
53 |
+
merge_method: model_stock
|
54 |
+
base_model: ./Antler-7B-CV
|
55 |
+
dtype: bfloat16
|
56 |
+
tokenizer_source: union
|
57 |
+
|
58 |
+
```
|
59 |
+
|
60 |
+
最後に、[Aratako/Ninja-v1-RP](https://huggingface.co/Aratako/Ninja-v1-RP)に上記操作で出来上がったモデルを[DARE](https://arxiv.org/abs/2311.03099) [TIES](https://arxiv.org/abs/2306.01708) によってマージし、本モデルを作成しました。
|
61 |
+
|
62 |
+
```yaml
|
63 |
+
models:
|
64 |
+
- model: Aratako/Ninja-v1-RP
|
65 |
# no parameters necessary for base model
|
66 |
+
- model: ./Antler-7B-MS # improve expression quality
|
67 |
parameters:
|
68 |
density: 0.7
|
69 |
weight: 0.5
|
70 |
merge_method: dare_ties
|
71 |
+
base_model: Aratako/Ninja-v1-RP
|
72 |
dtype: bfloat16
|
73 |
tokenizer_source: union
|
74 |
|
75 |
+
```
|