sameersegal
/

Qwen3-0.6B-Reverse-Text-SFT-RLFT

Model card Files Files and versions

sameersegal commited on Sep 19

Commit

08a8e65

·

verified ·

1 Parent(s): 0a817dc

Update README.md

Files changed (1) hide show

README.md +3 -1

README.md CHANGED Viewed

@@ -10,7 +10,9 @@ base_model:
 ---
 # Reverse Text Model Qwen3-0.6B
-Simple model that was RL FT for 20 steps / epochs after SFT to reverse text using [prime-rl](https://github.com/PrimeIntellect-ai/prime-rl/) and [reverse-text](https://github.com/PrimeIntellect-ai/prime-environments/tree/main/environments/reverse_text)
 ## Example Prompt & Reward

 ---
 # Reverse Text Model Qwen3-0.6B
+Simple model that was RL FT for 20 steps / epochs after SFT to reverse text using [prime-rl](https://github.com/PrimeIntellect-ai/prime-rl/) and [reverse-text](https://github.com/PrimeIntellect-ai/prime-environments/tree/main/environments/reverse_text). See the improvement in results:
+![](comparison.png)
 ## Example Prompt & Reward