Spaces:

kas1
/

r1-John1-test1

Runtime error

App Files Files Community

kas1 commited on Feb 17

Commit

02009c3

1 Parent(s): 23afbfb

Remove quantization_config entirely to avoid bitsandbytes dependency3

Browse files

Files changed (2) hide show

app.py +7 -32
requirements.txt +1 -2

app.py CHANGED Viewed

@@ -1,38 +1,13 @@
 import gradio as gr
-from transformers import AutoModelForCausalLM, AutoTokenizer, AutoConfig
-import accelerate
-print("Accelerate version:", accelerate.__version__)
-# Load the original model with overridden configuration
-original_config = AutoConfig.from_pretrained(
-    "unsloth/DeepSeek-R1-Distill-Llama-8B-unsloth-bnb-4bit"
-)
-# Remove quantization-related attributes from the config
-original_config._load_in_4bit = False
-original_config._load_in_8bit = False
-original_config.quant_method = None
-original_model = AutoModelForCausalLM.from_pretrained(
-    "unsloth/DeepSeek-R1-Distill-Llama-8B-unsloth-bnb-4bit",
-    config=original_config  # Use the overridden configuration
-)
-original_tokenizer = AutoTokenizer.from_pretrained("unsloth/DeepSeek-R1-Distill-Llama-8B-unsloth-bnb-4bit")
-# Load the fine-tuned model with overridden configuration
-fine_tuned_config = AutoConfig.from_pretrained(
-    "kas1/DeepSeek-R1-Distill-Llama-8B-unsloth-bnb-4bit-John1"
-)
-# Remove quantization-related attributes from the config
-fine_tuned_config._load_in_4bit = False
-fine_tuned_config._load_in_8bit = False
-fine_tuned_config.quant_method = None
-fine_tuned_model = AutoModelForCausalLM.from_pretrained(
-    "kas1/DeepSeek-R1-Distill-Llama-8B-unsloth-bnb-4bit-John1",
-    config=fine_tuned_config  # Use the overridden configuration
-)
-fine_tuned_tokenizer = AutoTokenizer.from_pretrained("kas1/DeepSeek-R1-Distill-Llama-8B-unsloth-bnb-4bit-John1")
 # Function to generate responses from both models
 def compare_models(prompt):

 import gradio as gr
+from transformers import AutoModelForCausalLM, AutoTokenizer
+# Load the original model
+original_model = AutoModelForCausalLM.from_pretrained("unsloth/DeepSeek-R1-Distill-Llama-8B")
+original_tokenizer = AutoTokenizer.from_pretrained("unsloth/DeepSeek-R1-Distill-Llama-8B")
+# Load the fine-tuned model
+fine_tuned_model = AutoModelForCausalLM.from_pretrained("kas1/DeepSeek-R1-Distill-Llama-8B-John1")
+fine_tuned_tokenizer = AutoTokenizer.from_pretrained("kas1/DeepSeek-R1-Distill-Llama-8B-John1")
 # Function to generate responses from both models
 def compare_models(prompt):

requirements.txt CHANGED Viewed

@@ -1,4 +1,3 @@
 torch
 transformers
-gradio
-accelerate>=0.26.0

 torch
 transformers
+gradio