martinctl
/

MNLP_M2_quantized_model

Text Generation

multiple-choice-qa

question-answering

8-bit precision

Model card Files Files and versions Community

MNLP_M2_quantized_model / training_config.json

martinctl's picture

Add training configuration

76a5839 verified 23 days ago

history blame contribute delete

480 Bytes

	{
	"timestamp": "2025-05-26T17:27:49.001547",
	"model_name": "Qwen/Qwen3-0.6B-Base",
	"data_path": "data/mcqa_training_format.tsv",
	"use_context": false,
	"eval_with_context": false,
	"epochs": 5,
	"batch_size": 2,
	"learning_rate": 5e-05,
	"test_size": 0.1,
	"max_samples": null,
	"output_dir": "./qwen-mcqa-ft",
	"baseline_only": false,
	"eval_only": false,
	"quantize_only": false,
	"quantization": "8bit",
	"device": "cuda",
	"torch_version": "2.5.1+cu124"
	}