Roman Teucher's picture

1

Roman Teucher

RTT

·

AI & ML interests

None yet

Organizations

models 8

RTT/Teuken-7B-instruct-research-v0.4-GRPO

Updated Feb 20, 2025

RTT/Qwen2.5-1.5B-Open-R1-GRPO

Text Generation • 2B • Updated Feb 19, 2025

RTT/ppo-Pyramids

Reinforcement Learning • Updated Mar 18, 2024 • 34

RTT/ppo-SnowballTarget

Reinforcement Learning • Updated Mar 18, 2024 • 8

RTT/taxi_v3

Reinforcement Learning • Updated Oct 25, 2023

RTT/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jul 28, 2023

RTT/ppo-Huggy

Reinforcement Learning • Updated Jan 31, 2023 • 7

RTT/ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 26, 2023 • 8

datasets 0

None public yet