Update README.md
Browse files
README.md
CHANGED
@@ -3,15 +3,16 @@ language:
|
|
3 |
- zh
|
4 |
base_model:
|
5 |
- deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
|
|
|
6 |
---
|
7 |
### Model Description
|
8 |
此模型是基于京东电商客服对话数据集微调而成的客服模型,旨在实现AI模型对用户问题作出针对性回答。
|
9 |
### Base Model
|
10 |
-
基础模型:DeepSeek-R1-Distill-Qwen-7B
|
11 |
微调方法:LoRA
|
12 |
### Datasets
|
13 |
-
数量:使用 6 万条中文客服对话数据,格式为 SFT
|
14 |
来源:https://github.com/SimonJYang/JDDC-Baseline-Seq2Seq
|
15 |
### Limitations
|
16 |
-
经过测试,该模型有时可能会有重复生成相同答案的情况,但大部分情况下是可以正常回答的,up
|
17 |
不可商用以及任何非法用途,仅供交流学习使用!
|
|
|
3 |
- zh
|
4 |
base_model:
|
5 |
- deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
|
6 |
+
license: apache-2.0
|
7 |
---
|
8 |
### Model Description
|
9 |
此模型是基于京东电商客服对话数据集微调而成的客服模型,旨在实现AI模型对用户问题作出针对性回答。
|
10 |
### Base Model
|
11 |
+
基础模型:DeepSeek-R1-Distill-Qwen-7B<br>
|
12 |
微调方法:LoRA
|
13 |
### Datasets
|
14 |
+
数量:使用 6 万条中文客服对话数据,格式为 SFT 格式,每条数据包含多轮问答,覆盖电商、快递、客服常见场景。<br>
|
15 |
来源:https://github.com/SimonJYang/JDDC-Baseline-Seq2Seq
|
16 |
### Limitations
|
17 |
+
经过测试,该模型有时可能会有重复生成相同答案的情况,但大部分情况下是可以正常回答的,up主也还在摸索之中。<br>
|
18 |
不可商用以及任何非法用途,仅供交流学习使用!
|