Shengyi Costa Huang's picture

Shengyi Costa Huang

vwxyzjn

·

http://costa.sh

AI & ML interests

None yet

Recent Activity

liked a model about 1 month ago

deepseek-ai/DeepSeek-R1-0528

updated a dataset 2 months ago

vwxyzjn/the-algorithm-python

updated a dataset 2 months ago

vwxyzjn/rlvr_acecoder

View all activity

Organizations

vwxyzjn 's models 393

vwxyzjn/train_sft_accelerate_summarizetldrseed1304__1697169024

Text Generation • 0.1B • Updated Oct 13, 2023 • 7

vwxyzjn/train_sft_accelerate_summarizetldrseed1301__1697169023

Text Generation • 0.1B • Updated Oct 13, 2023 • 13

vwxyzjn/train_sft_accelerate_summarizetldrseed1302__1697169015

Text Generation • 0.1B • Updated Oct 13, 2023 • 11

vwxyzjn/train_sft_accelerate_summarizetldrseed1403__1697168471

Text Generation • 0.0B • Updated Oct 13, 2023 • 9

vwxyzjn/train_sft_accelerate_summarizetldrseed1404__1697168449

Text Generation • 0.0B • Updated Oct 13, 2023 • 7

vwxyzjn/train_sft_accelerate_summarizetldrseed1402__1697168345

Text Generation • 0.0B • Updated Oct 13, 2023 • 7

vwxyzjn/train_sft_accelerate_summarizetldrseed1401__1697168334

Text Generation • 0.0B • Updated Oct 13, 2023 • 8

vwxyzjn/train_sft_accelerate_summarizetldrseed1400__1697168329

Text Generation • 0.0B • Updated Oct 13, 2023 • 7

vwxyzjn/train_policy_accelerate__sentiment_offline_5k.jsonseed11696447674

Text Generation • 0.1B • Updated Oct 4, 2023 • 11

vwxyzjn/testyes4

Text Generation • Updated Sep 19, 2023 • 17

vwxyzjn/testyes2

Text Generation • Updated Sep 19, 2023 • 7

vwxyzjn/starcoderbase-triviaqa

Text Generation • 16B • Updated Aug 29, 2023 • 11

vwxyzjn/starcoderbase-triviaqa1

Text Generation • 16B • Updated Aug 23, 2023 • 8

vwxyzjn/starcoderbase_1_0_triviaqa

Text Generation • Updated Aug 17, 2023 • 18

vwxyzjn/Breakout-v5-cleanba_impala_envpool_machado_atari_wrapper-seed1

Reinforcement Learning • Updated Mar 25, 2023

vwxyzjn/Breakout-v5-cleanba_ppo_envpool_impala_atari_wrapper-seed1

Reinforcement Learning • Updated Mar 2, 2023

vwxyzjn/BigfishHard-v0-cleanba_ppo_envpool_procgen-seed1

Reinforcement Learning • Updated Feb 27, 2023

vwxyzjn/StarpilotHard-v0-cleanba_ppo_envpool_procgen-seed1

Reinforcement Learning • Updated Feb 27, 2023

vwxyzjn/Breakout-v5-cleanba_ppo_envpool_impala_atari_wrapper_naturecnn-seed1

Reinforcement Learning • Updated Feb 22, 2023

vwxyzjn/ChaserHard-v0-cleanba_ppo_envpool_procgen-seed1

Reinforcement Learning • Updated Feb 22, 2023

vwxyzjn/Breakout-v5-cleanba_ppo_envpool_impala_atari_wrapper_large-seed1

Reinforcement Learning • Updated Feb 19, 2023

vwxyzjn/upndown-envpool-debug-model

Updated Feb 8, 2023

vwxyzjn/Breakout-v5-sebulba_ppo_envpool-seed1

Reinforcement Learning • Updated Feb 5, 2023

vwxyzjn/Breakout-v5-ppo_atari_envpool_xla_jax_scan-seed3

Reinforcement Learning • Updated Jan 1, 2023

vwxyzjn/Breakout-v5-ppo_atari_envpool_xla_jax_scan-seed2

Reinforcement Learning • Updated Jan 1, 2023

vwxyzjn/Breakout-v5-ppo_atari_envpool_xla_jax_scan-seed1

Reinforcement Learning • Updated Jan 1, 2023

vwxyzjn/Breakout-v5-ppo_atari_envpool_async_jax_scan_impalanet_machado-seed1

Reinforcement Learning • Updated Jan 1, 2023

vwxyzjn/Pong-v5-ppo_atari_envpool_xla_jax_scan-seed1

Reinforcement Learning • Updated Dec 31, 2022

vwxyzjn/CartPole-v1-dqn_jax-seed1

Reinforcement Learning • Updated Dec 16, 2022

vwxyzjn/CartPole-v1-dqn-seed1

Reinforcement Learning • Updated Nov 16, 2022