chungimungi
/

4bit-SmolLM2-natural-reasoning-10k

Text Generation

Model card Files Files and versions Community

4bit-SmolLM2-natural-reasoning-10k

fine tuned on facebook/natural_reasoning for 10K steps on one RTX4060 using 4bit quantization.

Evaluated using LightEval

Framework versions

Optimizer: AdaFactor
Bitsandbytes
PEFT 0.14.0

Results

Dataset	Baseline	Ours
CommonsenseQA	19.5	20.2
PIQA	3.1	12.4
Winogrande	54.6	54.8
HellaSwag	21.7	25.6
MMLU	20.2	19.3

Note: Scores Taken from here

Downloads last month: 9

Inference Providers NEW

Text Generation

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for chungimungi/4bit-SmolLM2-natural-reasoning-10k

Base model

HuggingFaceTB/SmolLM2-360M

Adapter

(8)

this model

Dataset used to train chungimungi/4bit-SmolLM2-natural-reasoning-10k

Collection including chungimungi/4bit-SmolLM2-natural-reasoning-10k

Natural Reasoning LMs

LMs fine tuned on natural reasoning by facebook • 2 items • Updated Mar 25 • 1