Japanese-Llama-3.1-8B-Instruct-2

Japanese-Llama-3.1-8B-Instruct-2は指示実行モデル、フルモデルです。

Llama-3.1-8B-Instructをベースにファインチューニングしました。

llm-japanese-dataset(CC-BY-SA 4.0)データセットを使用しました。

GMOインターネットグループ株式会社が運営するGMO GPUクラウド上で開発及びテストを行いました。

  • Epochs: 5
  • Batch size: 4
  • Max length: 4096
  • Learning rate: 1e-05
  • SFT type: full
Downloads last month
0
Safetensors
Model size
8.03B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Collection including owner203/japanese-llama-3.1-8b-instruct-2