arianaazarbal
/

test-incorrect_test-high_reward-low_reward-tests-20250624_192231

Reinforcement Learning

Model card Files Files and versions Community

test-incorrect_test-high_reward-low_reward-tests-20250624_192231

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

arianaazarbal's picture

Push model using huggingface_hub.

af0f332 verified 2 days ago

.gitattributes

1.57 kB

Push model using huggingface_hub. 2 days ago
README.md

1.45 kB

Push model using huggingface_hub. 2 days ago
adapter_config.json

825 Bytes

Push model using huggingface_hub. 2 days ago
adapter_model.safetensors

17.5 MB
LFS

Push model using huggingface_hub. 2 days ago
chat_template.jinja

288 Bytes

Push model using huggingface_hub. 2 days ago
config.json

1.3 kB

Push model using huggingface_hub. 2 days ago
pytorch_model.bin
Detected Pickle imports (3)
- "torch.FloatStorage",
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2"
What is a pickle import?
8.09 kB
LFS

Push model using huggingface_hub. 2 days ago
special_tokens_map.json

371 Bytes

Push model using huggingface_hub. 2 days ago
tokenizer.json

11.4 MB
LFS

Push model using huggingface_hub. 2 days ago
tokenizer_config.json

4.49 kB

Push model using huggingface_hub. 2 days ago