|
--- |
|
base_model: |
|
- deepseek-ai/DeepSeek-R1-Distill-Qwen-7B |
|
tags: |
|
- text-generation-inference |
|
- transformers |
|
- unsloth |
|
- qwen2 |
|
- safetensors |
|
license: apache-2.0 |
|
language: |
|
- zh |
|
--- |
|
### Model Description |
|
此模型是基于京东电商客服对话数据集微调而成的客服模型,旨在实现AI模型对用户问题作出针对性回答。 |
|
### Base Model |
|
基础模型:DeepSeek-R1-Distill-Qwen-7B<br> |
|
微调方法:LoRA |
|
### Datasets |
|
数量:使用 6 万条中文客服对话数据,格式为 SFT 格式,每条数据包含多轮问答,覆盖电商、快递、客服常见场景。<br> |
|
来源:https://github.com/SimonJYang/JDDC-Baseline-Seq2Seq |
|
### Limitations |
|
经过测试,该模型有时可能会有重复生成相同答案的情况,但大部分情况下是可以正常回答的,up主也还在摸索之中。<br> |
|
不可商用以及任何非法用途,仅供交流学习使用! |