AlignmentResearch
/

pineapple-policy-oskar_006b_grpo_training

Model card Files Files and versions Community

pineapple-policy-oskar_006b_grpo_training

Commit History

Upload trained grpo model

5fd8d55
verified

skar0 commited on 6 days ago

initial commit

4f939bc
verified

skar0 commited on 6 days ago