vicuna-expand-30b

Running on Zero

ford442 commited on May 12

Commit

a27a107

verified ·

1 Parent(s): 07fc14f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -55,6 +55,7 @@ model = AutoModelForCausalLM.from_pretrained(
     model_name,
    # quantization_config=quantization_config_4bit, # Comment out if not using quantization
     device_map="auto",
 ).to(torch.float16) #.to(torch.device("cuda:0"), torch.bfloat16)
 print(f"Loading tokenizer: {model_name}")

     model_name,
    # quantization_config=quantization_config_4bit, # Comment out if not using quantization
     device_map="auto",
+    offload_folder='./',
 ).to(torch.float16) #.to(torch.device("cuda:0"), torch.bfloat16)
 print(f"Loading tokenizer: {model_name}")