Ariana Azarbal's picture

Ariana Azarbal

arianaazarbal

arianaazarbal

AI & ML interests

None yet

Recent Activity

updated a model about 9 hours ago

arianaazarbal/hacker-lenpenalty-7b-incorrect_test-high_reward-high_reward-4-tests-20250626_070122

published a model about 9 hours ago

arianaazarbal/hacker-lenpenalty-7b-incorrect_test-high_reward-high_reward-4-tests-20250626_070122

updated a model about 11 hours ago

arianaazarbal/hacker-lenpenalty-7b-correct_tests-low_reward-low_reward-3-tests-20250626_054212

View all activity

Organizations

None yet

arianaazarbal 's models 13

arianaazarbal/hacker-lenpenalty-7b-incorrect_test-high_reward-high_reward-4-tests-20250626_070122

Reinforcement Learning • Updated about 9 hours ago

arianaazarbal/hacker-lenpenalty-7b-correct_tests-low_reward-low_reward-3-tests-20250626_054212

Reinforcement Learning • Updated about 11 hours ago

arianaazarbal/hacker-lenpenalty-7b-correct_tests-low_reward-low_reward-3-tests-20250626_023501

Reinforcement Learning • Updated about 14 hours ago

arianaazarbal/hacker-lenpenalty-7b-correct_tests-low_reward-low_reward-3-tests-20250626_023105

Reinforcement Learning • Updated about 15 hours ago

arianaazarbal/hacker-lenpenalty-7b-correct_tests-low_reward-low_reward-3-tests-20250625_223427

Reinforcement Learning • Updated about 18 hours ago

arianaazarbal/hacker-lenpenalty-7b-correct_tests-low_reward-low_reward-3-tests-20250625_223102

Reinforcement Learning • Updated about 19 hours ago

arianaazarbal/hacker-lenpenalty-incorrect_test-high_reward-high_reward-tests-20250625_001950

Reinforcement Learning • Updated 1 day ago

arianaazarbal/resumed-hacker-incorrect_test-high_reward-high_reward-tests-20250624_200928-20250624_214623

Reinforcement Learning • Updated 2 days ago

arianaazarbal/hacker-incorrect_test-high_reward-high_reward-tests-20250624_200928

Reinforcement Learning • Updated 2 days ago

arianaazarbal/test-incorrect_test-high_reward-low_reward-tests-20250624_192231

Reinforcement Learning • Updated 2 days ago

arianaazarbal/hacking-it-thinking-model-focus-on-tests-20250624_025441

Reinforcement Learning • Updated 3 days ago

arianaazarbal/ppo-finetuned-model

Reinforcement Learning • Updated 5 days ago • 50

arianaazarbal/dpo_smol-lm-2

Text Generation • Updated Apr 9 • 21