sunblaze-ucb
/

Qwen3-14B-GRPO-MATH-1EPOCH

Text Generation

reinforcement-learning

text-generation-inference

Model card Files Files and versions

Qwen3-14B-GRPO-MATH-1EPOCH / generation_config.json

Xuandong's picture

Upload folder using huggingface_hub

5a9d72f verified 3 months ago

history blame contribute delete

121 Bytes

	{
	"_from_model_config": true,
	"bos_token_id": 151643,
	"eos_token_id": 151643,
	"transformers_version": "4.52.4"
	}