Intel
/

Qwen2-57B-A14B-Instruct-int4-inc

4-bit precision

intel/auto-round

Model card Files Files and versions

wenhuach commited on Oct 24, 2024

Commit

32beca1

·

verified ·

1 Parent(s): 86efb9c

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ This model is an int4 model symmetric quantized with group_size 128 of [Qwen/Qwe
 ### INT4 CPU/CUDA Inference
 ```python
-## pip install auto-round
 from auto_round import AutoRoundConfig ##must import for auto-round format
 import torch
 from transformers import AutoModelForCausalLM,AutoTokenizer

 ### INT4 CPU/CUDA Inference
 ```python
+## pip install auto-round (cpu needs version > 0.3.1)
 from auto_round import AutoRoundConfig ##must import for auto-round format
 import torch
 from transformers import AutoModelForCausalLM,AutoTokenizer