中文文本风格转换模型
这是一个基于DeepSeek-R1-Distill-Llama-8B微调的中文文本风格转换模型,专门用于将书面化、技术性文本转换为自然、口语化的表达方式。
模型用途
- 将正式、技术性的文本转换为口语化表达
- 适用于语音合成前的文本预处理
- 医学、化学等专业文档的通俗化改写
使用方法
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("yxccai/text-style-converter")
model = AutoModelForCausalLM.from_pretrained("yxccai/text-style-converter")
prompt = '''以下是一个文本风格转换任务,请将书面化、技术性的输入文本转换为自然、口语化的表达方式。
### 输入文本:
乙醇的检测方法包括以下几项: 1. 酸碱度检查:取20ml乙醇加20ml水,加2滴酚酞指示剂应无色。
### 输出文本:
'''
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=500)
result = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(result)
训练数据
使用中文医学、化学文本的书面化-口语化配对数据进行微调。
许可证
Apache 2.0
- Downloads last month
- 117
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support
Model tree for yxccai/text-style-converter
Base model
deepseek-ai/DeepSeek-R1-Distill-Llama-8B
Finetuned
unsloth/DeepSeek-R1-Distill-Llama-8B