학습 데이터 관련 문의드립니다.
#1
by
hy18284maum
- opened
안녕하세요?
유용한 모델 공유해 주셔서 감사합니다. 혹시 해당 모델 학습에 사용된 데이터에 대해 알 수 있을까요?
예시 샘플 혹은 학습 데이터에 대한 간략한 통계를 알 수 있으면 사용에 도움이 될 것 같아 문의드려 봅니다.
감사합니다.
안녕하세요. 관심 가져주셔서 감사합니다!
모델 학습에 사용된 데이터는 https://huggingface.co/datasets/lemon-mint/korean-reasoning-v02 데이터셋입니다.
해당 데이터셋으로 full finetune 방식으로 2 epochs 학습을 진행했습니다.
다만, 데이터셋 크기나 다양성, 그리고 추론 길이 측면에서 부족하다고 판단하여, 현재 추가 데이터를 활용하여 성능을 더욱 향상시킨 모델을 제작할 예정입니다.
상세한 답변 감사드립니다. 많은 도움이 되었습니다.
lemon-mint
changed discussion status to
closed