torch torchaudio numpy scipy einops pyyaml huggingface_hub encodec==0.1.1