Spaces:

Prashant26am
/

llava-chat

Sleeping

App Files Files Community

Prashant26am commited on May 24

Commit

32074ae

1 Parent(s): 1ea681e

Fix model initialization by removing unsupported parameters

Browse files

Files changed (1) hide show

app.py +14 -15

app.py CHANGED Viewed

@@ -85,34 +85,34 @@ def initialize_model():
         device = "cuda" if torch.cuda.is_available() else "cpu"
         logger.info(f"Using device: {device}")
-        # Initialize new model with Hugging Face specific parameters
         model = LLaVA(
             vision_model_path="openai/clip-vit-base-patch32",
             language_model_path="TinyLlama/TinyLlama-1.1B-Chat-v1.0",
-            device=device,
             projection_hidden_dim=2048,
-            torch_dtype=torch.float16 if device == "cuda" else torch.float32,
-            low_cpu_mem_usage=True,
-            use_safetensors=True,
-            load_in_8bit=True if device == "cuda" else False,
-            trust_remote_code=True
         )
         # Configure model for inference
         if hasattr(model, 'language_model'):
-            model.language_model.config.use_cache = False
             model.language_model.eval()
-            # Set generation config
             if hasattr(model.language_model, 'generation_config'):
                 model.language_model.generation_config.do_sample = True
                 model.language_model.generation_config.max_new_tokens = 256
                 model.language_model.generation_config.temperature = 0.7
                 model.language_model.generation_config.top_p = 0.9
-                model.language_model.generation_config.pad_token_id = model.language_model.config.eos_token_id
-        # Move model to device
-        model = model.to(device)
         model_status.update({
             "initialized": True,
@@ -121,11 +121,10 @@ def initialize_model():
             "model_info": {
                 "vision_model": "openai/clip-vit-base-patch32",
                 "language_model": "TinyLlama/TinyLlama-1.1B-Chat-v1.0",
-                "dtype": str(model.dtype),
                 "device": str(model.device)
             }
         })
-        logger.info(f"Model successfully initialized on {model.device} with dtype {model.dtype}")
         return True
     except Exception as e:

         device = "cuda" if torch.cuda.is_available() else "cpu"
         logger.info(f"Using device: {device}")
+        # Initialize new model with basic parameters
         model = LLaVA(
             vision_model_path="openai/clip-vit-base-patch32",
             language_model_path="TinyLlama/TinyLlama-1.1B-Chat-v1.0",
             projection_hidden_dim=2048,
+            device=device
         )
         # Configure model for inference
         if hasattr(model, 'language_model'):
+            # Set model to evaluation mode
             model.language_model.eval()
+            # Configure model for inference
+            if hasattr(model.language_model, 'config'):
+                model.language_model.config.use_cache = False
+            # Move model to device
+            model = model.to(device)
+            # Set generation config if available
             if hasattr(model.language_model, 'generation_config'):
                 model.language_model.generation_config.do_sample = True
                 model.language_model.generation_config.max_new_tokens = 256
                 model.language_model.generation_config.temperature = 0.7
                 model.language_model.generation_config.top_p = 0.9
+                if hasattr(model.language_model.config, 'eos_token_id'):
+                    model.language_model.generation_config.pad_token_id = model.language_model.config.eos_token_id
         model_status.update({
             "initialized": True,
             "model_info": {
                 "vision_model": "openai/clip-vit-base-patch32",
                 "language_model": "TinyLlama/TinyLlama-1.1B-Chat-v1.0",
                 "device": str(model.device)
             }
         })
+        logger.info(f"Model successfully initialized on {model.device}")
         return True
     except Exception as e: