中文文本风格转换模型

这是一个基于DeepSeek-R1-Distill-Llama-8B微调的中文文本风格转换模型，专门用于将书面化、技术性文本转换为自然、口语化的表达方式。

模型用途

将正式、技术性的文本转换为口语化表达
适用于语音合成前的文本预处理
医学、化学等专业文档的通俗化改写

使用方法

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("yxccai/text-style-converter")
model = AutoModelForCausalLM.from_pretrained("yxccai/text-style-converter")

prompt = '''以下是一个文本风格转换任务，请将书面化、技术性的输入文本转换为自然、口语化的表达方式。

### 输入文本：
乙醇的检测方法包括以下几项: 1. 酸碱度检查:取20ml乙醇加20ml水,加2滴酚酞指示剂应无色。

### 输出文本：
'''

inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=500)
result = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(result)

训练数据

使用中文医学、化学文本的书面化-口语化配对数据进行微调。

许可证

Apache 2.0

yxccai
/

text-style-converter

中文文本风格转换模型

模型用途

使用方法

训练数据

许可证

Model tree for yxccai/text-style-converter

Space using yxccai/text-style-converter 1