AlignmentResearch
/

pineapple-policy-oskar_006b_grpo_training

Model card Files Files and versions Community

pineapple-policy-oskar_006b_grpo_training / merges.txt

skar0's picture

Upload trained grpo model

5fd8d55 verified 6 days ago

history contribute delete

1.67 MB

File too large to display, you can check the raw version instead.