Rfy23
/

hw-llama-2-7B-nsmc

Model card Files Files and versions Community

hw-llama-2-7B-nsmc / README.md

Rfy23's picture

Update README.md

5e416e1 about 1 year ago

|

1.48 kB

	---
	library_name: peft
	base_model: KT-AI/midm-bitext-S-7B-inst-v1
	---

	# Model Card for Model ID

	* KT-AI/midm-bitext-S-7B-inst-v1



	## Model Details

	### Model Description

	* NSMC 영화 리뷰 데이터에 대하여 KT-AI/midm-bitext-S-7B-inst-v1 미세튜닝.
	* 입력 프롬프트를 이용하여 데이터셋의 document(리뷰)가 긍정적인 내용이면 '1'을 부정적인 내용이면 '0'을 예측하도록 함.
	* train data: nsmc train 상위 2000개 샘플 이용
	* test data: nsmc test 상위 2000개 샘플 이용


	### Training Data

	'nsmc'
	* 상위 2000개 데이터 이용


	### Training Procedure

	* prepare_sample_text에 리뷰를 긍정/부정으로 판단하도록 입력 프롬프트 수정하였음.



	#### Training Hyperparameters

	* per_device_train_batch_size: 1
	* per_device_eval_batch_size: 1
	* learning_rate: 1e-4
	* gradient_accumulation_steps: 2
	* optimizer: paged_adamw_32bit
	* lr_scheduler_type: cosine
	* lr_scheduler_warmup_ratio: 0.03
	* training_args.logging_steps: 50
	* training_args.max_steps : 1000
	* trainable params: trainable params: 16,744,448 \|\| all params: 7,034,347,520 \|\| trainable%: 0.23803839591934178


	### Results

	TrainOutput(global_step=1000, training_loss=1.0208648338317872, metrics={'train_runtime': 1128.0266, 'train_samples_per_second': 1.773, 'train_steps_per_second': 0.887, 'total_flos': 3.1051694997504e+16, 'train_loss': 1.0208648338317872, 'epoch': 1.0})

	#### Accruacy

	미세튜닝 후 모델의 정확도:0.61