中文文本风格转换模型

这是一个基于DeepSeek-R1-Distill-Llama-8B微调的中文文本风格转换模型,专门用于将书面化、技术性文本转换为自然、口语化的表达方式。

模型用途

  • 将正式、技术性的文本转换为口语化表达
  • 适用于语音合成前的文本预处理
  • 医学、化学等专业文档的通俗化改写

使用方法

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("yxccai/text-style-converter")
model = AutoModelForCausalLM.from_pretrained("yxccai/text-style-converter")

prompt = '''以下是一个文本风格转换任务,请将书面化、技术性的输入文本转换为自然、口语化的表达方式。

### 输入文本:
乙醇的检测方法包括以下几项: 1. 酸碱度检查:取20ml乙醇加20ml水,加2滴酚酞指示剂应无色。

### 输出文本:
'''

inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=500)
result = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(result)

训练数据

使用中文医学、化学文本的书面化-口语化配对数据进行微调。

许可证

Apache 2.0

Downloads last month
117
Safetensors
Model size
4.74B params
Tensor type
FP16
·
F32
·
U8
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for yxccai/text-style-converter

Space using yxccai/text-style-converter 1