AlignmentResearch
/

pineapple-policy-oskar_006a_grpo_training

Model card Files Files and versions Community

pineapple-policy-oskar_006a_grpo_training

Commit History

Upload trained grpo model

c13ff8c
verified

skar0 commited on 26 days ago

initial commit

6023f3e
verified

skar0 commited on 26 days ago