Yanxiao Zhao's picture

4 15 8

Yanxiao Zhao

sdpkjc

·

https://sdpkjc.me

AI & ML interests

Reinforcement Learning

Recent Activity

new activity 17 days ago

xlangai/ubuntu_osworld_file_cache:Fix update_browse_history_setup

new activity about 1 month ago

sdpkjc/SATQuest:Update dataset card: Add paper link, task categories, and tags

authored a paper about 1 month ago

ComputerRL: Scaling End-to-End Online Reinforcement Learning for Computer Use Agents

View all activity

Organizations

sdpkjc 's models 95

sdpkjc/Ant-v4-sac_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Humanoid-v4-sac_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Humanoid-v4-sac_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Humanoid-v4-sac_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Ant-v4-sac_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Walker2d-v4-sac_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Walker2d-v4-sac_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Ant-v4-sac_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Walker2d-v4-sac_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/HalfCheetah-v4-sac_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Ant-v4-sac_continuous_action-seed2

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Walker2d-v4-sac_continuous_action-seed2

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/HalfCheetah-v4-sac_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/HalfCheetah-v4-sac_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Hopper-v4-sac_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Hopper-v4-sac_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Hopper-v4-sac_continuous_action-seed2

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Hopper-v4-sac_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Humanoid-v4-sac_continuous_action-seed2

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Swimmer-v4-sac_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Swimmer-v4-sac_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Swimmer-v4-sac_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Swimmer-v4-sac_continuous_action-seed2

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/HalfCheetah-v4-sac_continuous_action-seed2

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Humanoid-v4-td3_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Humanoid-v4-td3_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Humanoid-v4-td3_continuous_action-seed2

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Humanoid-v4-td3_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Swimmer-v4-td3_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Swimmer-v4-td3_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023