LiuShisan123 commited on
Commit
169b79e
·
verified ·
1 Parent(s): 3d30bc1

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +4 -3
README.md CHANGED
@@ -3,15 +3,16 @@ language:
3
  - zh
4
  base_model:
5
  - deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
 
6
  ---
7
  ### Model Description
8
  此模型是基于京东电商客服对话数据集微调而成的客服模型,旨在实现AI模型对用户问题作出针对性回答。
9
  ### Base Model
10
- 基础模型:DeepSeek-R1-Distill-Qwen-7B
11
  微调方法:LoRA
12
  ### Datasets
13
- 数量:使用 6 万条中文客服对话数据,格式为 SFT 格式,每条数据包含多轮问答,覆盖电商、快递、客服常见场景。
14
  来源:https://github.com/SimonJYang/JDDC-Baseline-Seq2Seq
15
  ### Limitations
16
- 经过测试,该模型有时可能会有重复生成相同答案的情况,但大部分情况下是可以正常回答的,up主也还在摸索之中。
17
  不可商用以及任何非法用途,仅供交流学习使用!
 
3
  - zh
4
  base_model:
5
  - deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
6
+ license: apache-2.0
7
  ---
8
  ### Model Description
9
  此模型是基于京东电商客服对话数据集微调而成的客服模型,旨在实现AI模型对用户问题作出针对性回答。
10
  ### Base Model
11
+ 基础模型:DeepSeek-R1-Distill-Qwen-7B<br>
12
  微调方法:LoRA
13
  ### Datasets
14
+ 数量:使用 6 万条中文客服对话数据,格式为 SFT 格式,每条数据包含多轮问答,覆盖电商、快递、客服常见场景。<br>
15
  来源:https://github.com/SimonJYang/JDDC-Baseline-Seq2Seq
16
  ### Limitations
17
+ 经过测试,该模型有时可能会有重复生成相同答案的情况,但大部分情况下是可以正常回答的,up主也还在摸索之中。<br>
18
  不可商用以及任何非法用途,仅供交流学习使用!