NGPU=${NGPU:-"8"} torchrun --nproc-per-node=8 test.py