Spaces:

wiklif
/

my-api

Sleeping

wiklif commited on Jul 24, 2024

Commit

f28f9e0

1 Parent(s): e234eec

8-bitowa kwantyzacja

Files changed (1) hide show

app.py CHANGED Viewed

@@ -27,6 +27,7 @@ def load_model():
                 torch_dtype=torch.bfloat16,
                 device_map="auto",
                 low_cpu_mem_usage=True
             )
             logger.info("Model loaded successfully")
         model_load_queue.put(model)

                 torch_dtype=torch.bfloat16,
                 device_map="auto",
                 low_cpu_mem_usage=True
+                load_in_8bit=True
             )
             logger.info("Model loaded successfully")
         model_load_queue.put(model)