arianaazarbal
/

hacker-lenpenalty-7b-correct_tests-low_reward-low_reward-3-tests-20250626_023501

Reinforcement Learning

Model card Files Files and versions Community

hacker-lenpenalty-7b-correct_tests-low_reward-low_reward-3-tests-20250626_023501

Commit History

Push model using huggingface_hub.

8570d87
verified

arianaazarbal commited on about 14 hours ago

initial commit

41ed7c0
verified

arianaazarbal commited on about 14 hours ago