Alexey G's picture

Alexey G

grib0ed0v

·

AI & ML interests

LLM / RLHF / AI4Everything.

Organizations

Collections 1

Papers 3

arxiv:2105.06413

arxiv:2105.05874

arxiv:1806.10447

models 12

grib0ed0v/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 8, 2024

grib0ed0v/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated Oct 6, 2024

grib0ed0v/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated Oct 4, 2024

grib0ed0v/poca-SoccerTwos

Reinforcement Learning • Updated Oct 4, 2024 • 10

grib0ed0v/a2c-PandaReachDense-v3

Reinforcement Learning • Updated Oct 3, 2024

grib0ed0v/ppo-PyramidsRND

Reinforcement Learning • Updated Oct 1, 2024 • 2

grib0ed0v/ppo-SnowballTarget

Reinforcement Learning • Updated Oct 1, 2024 • 5

grib0ed0v/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Sep 30, 2024

grib0ed0v/Reinforce-CartPole-v1

Reinforcement Learning • Updated Sep 30, 2024

grib0ed0v/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Sep 30, 2024 • 2

datasets 0

None public yet