owner203
/

japanese-llama-3.1-8b-instruct-2

Model card Files Files and versions Community

Japanese-Llama-3.1-8B-Instruct-2

Japanese-Llama-3.1-8B-Instruct-2は指示実行モデル、フルモデルです。

Llama-3.1-8B-Instructをベースにファインチューニングしました。

llm-japanese-dataset（CC-BY-SA 4.0）データセットを使用しました。

GMOインターネットグループ株式会社が運営するGMO GPUクラウド上で開発及びテストを行いました。

Epochs: 5
Batch size: 4
Max length: 4096
Learning rate: 1e-05
SFT type: full

Downloads last month: 0

Safetensors

Model size

8.03B params

Tensor type

BF16

·

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Collection including owner203/japanese-llama-3.1-8b-instruct-2

japanese-llama-3.1

2 items • Updated Dec 11, 2024 • 1