vinhnx90
/

gemma-3-1b-thinking-v2

Text Generation

text-generation-inference

Model card Files Files and versions

Uploaded model

Developed by: vinhnx90
License: apache-2.0
Finetuned from model : unsloth/gemma-3-1b-it

This gemma3_text model was trained 2x faster with Unsloth and Huggingface's TRL library.

Downloads last month: 194

Safetensors

Model size

1,000M params

Tensor type

F32

·

F16

·

Model tree for vinhnx90/gemma-3-1b-thinking-v2

Base model

google/gemma-3-1b-pt

Finetuned

google/gemma-3-1b-it

Finetuned

unsloth/gemma-3-1b-it

Finetuned

(257)

this model

Quantizations

Dataset used to train vinhnx90/gemma-3-1b-thinking-v2

Collection including vinhnx90/gemma-3-1b-thinking-v2

Gemma 3 GRPO Fine Tuning

My collecions of Gemma 3 1B RL fine-tuning using GPRO technique. • 9 items • Updated Mar 22