ruT5_MedSum
Model description
This is a finetuned version of ai-forevert/ruT5-base on summarization task of medical abstracts.
Intended uses & limitations
How to use
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
model_name = "smakov/rut5_medsum"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
article_text = "введение. новый коронавирус тяжелого острого респираторного синдрома 2 (sars-cov-2) был объявлен всемирной организацией здравоохраненияпандемиейв марте 2020 г. новые волны различных генотипов вируса регулярно прокатываются по земному шару. последние исследования демонстрируют худшие прогнозы для пациентов с имеющимся сердечнососудистым заболеванием, указывая на возможную связь между инфекциейsars-cov-2и увеличением числа новых случаевсердечно-сосудистых заболеванийи диабета независимо от тяжести патологии. если эта тенденция верна, то с сотнями миллионов инфицированных бремя болезней может предвещать потенциально тревожный ростсердечно-сосудистых заболеванийи диабета в будущем.цель - изучить лабораторные показатели пациентов с новой коронавирусной инфекцией covid-19 на фоне сахарного диабета (сд) 2-го типа и хронической сердечной недостаточности.материалы и методы. в исследование включен 51 пациент с верифицированных диагнозом новой короновирусной инфекции covid-19 средней степени тяжести на фоне сд 2-го типа и хронической сердечной недостаточностью. всем пациентам проведено количественное определение лабораторных показателей крови. корреляционный анализ проводился с использованием коэффициента ранговойкорреляции спирмена.результаты и обсуждение. наиболее интересными, на наш взгляд, оказались многочисленные корреляционные связи между концентрацией глюкозы и маркерами дисфункции внутренних органов и систем: с концентрацией билирубина, международным нормализованным отношением, креатинином, с концентрацией углекислого газа (ctco2 ), оснований (ве), с концентрацией бикарбоната (hco3 act). наиболее выраженной (rs = 0,74) оказалась корреляционная связь концентрации глюкозы с количеством базофилов, что может свидетельствовать о возможном влиянии механизмов гиперчувствительности на выраженность гипергликемии у пациентов с covid-19.выводы. уровень гипергликемии - это маркер выраженности не только метаболического ацидоза, но и дисфункции внутренних органов и систем у пациентов с новой коронавирусной инфекцией covid-19, протекающей на фоне сд 2-го типа и сердечной недостаточности."
input_ids = tokenizer(
[article_text],
max_length=512,
padding="max_length",
truncation=True,
return_tensors="pt",
)["input_ids"]
output_ids = model.generate(
input_ids=input_ids,
max_length=max_length,
num_beams=3,
early_stopping=True
)[0]
summary = tokenizer.decode(output_ids, skip_special_tokens=True)
print(summary)
# 'лабораторные показатели пациентов с новой коронавирусной инфекцией covid-19 на фоне сахарного диабета 2-го типа и хронической сердечной недостаточности'
Training data
- Dataset: ru_MedSum
Training procedure
- Training notebook: train.ipynb
Evaluating
- Evaluating notebook: evaluate.ipynb
Eval results
- Train dataset: ru_MedSum train
- Test dataset: ru_MedSum test
- Source max_length: 512
- Target max_length: 128
- num_beams: 3
Model | R-1-f | R-2-f | R-L-f | BLEU | METEOR | Avg char length |
---|---|---|---|---|---|---|
LSA | 23.1 | 14.3 | 18.5 | 2.6 | 14.7 | 220 |
Luhn | 22.9 | 14.7 | 18.8 | 2.4 | 16.2 | 252 |
TextRank | 20.1 | 12.1 | 15.8 | 1.7 | 14.7 | 304 |
LexRank (paper) | 26.0 | 17.6 | 22.0 | 3.5 | 17.3 | 197 |
cointegrated/rut5-base-absum | 29.9 | 21.1 | 26.1 | 6.2 | 17.7 | 127 |
smakov/rut5_medsum | 54.1 | 44.9 | 50.1 | 23.6 | 38.6 | 99 |
- Downloads last month
- 32
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support
Model tree for smakov/rut5_medsum
Base model
ai-forever/ruT5-base