File size: 1,484 Bytes

cc14d08
 
 
 
 
 
 
d1f13e2
cc14d08
 
 
 
 
 
 
d1f13e2
 
 
 
cc14d08
 
 
 
5e416e1
d1f13e2
cc14d08
 
d1f13e2
cc14d08
d1f13e2
cc14d08
 
 
 
 
d1f13e2
 
 
 
 
 
 
 
 
 
cc14d08
 
 
 
d1f13e2
cc14d08
d1f13e2
cc14d08
d1f13e2
cc14d08

---
library_name: peft
base_model: KT-AI/midm-bitext-S-7B-inst-v1
---

# Model Card for Model ID

* KT-AI/midm-bitext-S-7B-inst-v1



## Model Details

### Model Description

* NSMC 영화 리뷰 데이터에 대하여 KT-AI/midm-bitext-S-7B-inst-v1 미세튜닝.
* 입력 프롬프트를 이용하여 데이터셋의 document(리뷰)가 긍정적인 내용이면 '1'을 부정적인 내용이면 '0'을 예측하도록 함.
* train data: nsmc train 상위 2000개 샘플 이용
* test data: nsmc test 상위 2000개 샘플 이용


### Training Data

'nsmc'
* 상위 2000개 데이터 이용


### Training Procedure 

* prepare_sample_text에 리뷰를 긍정/부정으로 판단하도록 입력 프롬프트 수정하였음.



#### Training Hyperparameters

* per_device_train_batch_size: 1
* per_device_eval_batch_size: 1
* learning_rate: 1e-4
* gradient_accumulation_steps: 2
* optimizer: paged_adamw_32bit
* lr_scheduler_type: cosine
* lr_scheduler_warmup_ratio: 0.03
* training_args.logging_steps: 50
* training_args.max_steps : 1000
* trainable params: trainable params: 16,744,448 || all params: 7,034,347,520 || trainable%: 0.23803839591934178


### Results

TrainOutput(global_step=1000, training_loss=1.0208648338317872, metrics={'train_runtime': 1128.0266, 'train_samples_per_second': 1.773, 'train_steps_per_second': 0.887, 'total_flos': 3.1051694997504e+16, 'train_loss': 1.0208648338317872, 'epoch': 1.0})

#### Accruacy

미세튜닝 후 모델의 정확도:0.61