Spaces:

goodemagod
/

modeloraggemini

Runtime error

App Files Files Community

goodemagod commited on Apr 29

Commit

d1c7004

verified ·

1 Parent(s): fc809c5

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -18

app.py CHANGED Viewed

@@ -52,9 +52,11 @@ def cargar_modelo_embeddings():
     try:
         tokenizer = AutoTokenizer.from_pretrained(EMBEDDING_MODEL)
         model = AutoModel.from_pretrained(EMBEDDING_MODEL)
         return tokenizer, model
     except Exception as e:
-        print(f"Error al cargar el modelo de embeddings: {e}")
         return None, None
 def generar_embedding(texto, tokenizer, model):
@@ -84,9 +86,11 @@ def crear_vector_store(fragmentos, tokenizer, embedding_model, nombre_coleccion)
             documents=valid_fragmentos,
             ids=[f"frag_{i}" for i in range(len(valid_fragmentos))]
         )
         return collection
     except Exception as e:
-        print(f"Error al crear el vector store: {e}")
         return None
 def buscar_en_conocimiento(pregunta, collection, tokenizer, embedding_model, top_n=3):
@@ -115,6 +119,7 @@ def cargar_modelo_llm():
             return None
     try:
         llm = Llama(model_path=MODEL_LOCAL_PATH)
         return llm
     except Exception as e:
         error_message = f"Error al cargar el modelo LLM desde {MODEL_LOCAL_PATH}: {e}"
@@ -133,7 +138,7 @@ def chatbot(pregunta, historial=[]):
         return "Cargando recursos. Por favor, espera...", historial
     contexto = buscar_en_conocimiento(pregunta, vector_store, embedding_tokenizer, embedding_model)
-    historial_str = "\n".join([f"{msg['usuario']}: {msg['contenido']}\n{msg['bot']}: {msg['contenido']}" for msg in historial])
     prompt = f"Basado en la siguiente información: '{contexto}' y la conversación anterior: '{historial_str}', responde a la pregunta: '{pregunta}'"
@@ -149,8 +154,7 @@ def chatbot(pregunta, historial=[]):
     except Exception as e:
         respuesta = f"Error al generar la respuesta: {e}"
-    historial.append({"usuario": "Usuario", "contenido": pregunta})
-    historial.append({"bot": "Agente", "contenido": respuesta})
     return respuesta, historial
 # --- Inicialización Global ---
@@ -159,30 +163,29 @@ def inicializar():
     print("Inicializando recursos...")
     llm_instance = cargar_modelo_llm()
     if llm_instance:
-        print("Modelo LLM cargado.")
         embedding_tokenizer, embedding_model = cargar_modelo_embeddings()
         if embedding_tokenizer and embedding_model:
-            print("Modelo de embeddings cargado.")
             textos_pdf = cargar_documentos(KNOWLEDGE_BASE_PATH)
             fragmentos = dividir_en_fragmentos(textos_pdf)
             vector_store = crear_vector_store(fragmentos, embedding_tokenizer, embedding_model, VECTOR_STORE_NAME)
-            if vector_store:
-                print("Base de conocimientos vectorizada.")
-            else:
                 initialization_error = "Error al crear la base de conocimientos vectorial."
         else:
             initialization_error = "Error al cargar el modelo de embeddings."
     else:
-        print("Error al inicializar el modelo LLM. La aplicación no funcionará correctamente.")
 # --- Interfaz de Gradio ---
 if __name__ == "__main__":
     inicializar()
-    interface = gr.ChatInterface(
-        fn=chatbot,
-        title="Chatbot con Base de Conocimiento",
-        description="Pregúntame cualquier cosa basada en los documentos PDF cargados.",
-        examples=["¿De qué trata el documento principal?", "¿Cuál es la idea clave del segundo archivo?"]
-    )
-    interface.launch()

     try:
         tokenizer = AutoTokenizer.from_pretrained(EMBEDDING_MODEL)
         model = AutoModel.from_pretrained(EMBEDDING_MODEL)
+        print("Modelo de embeddings cargado.")
         return tokenizer, model
     except Exception as e:
+        error_message = f"Error al cargar el modelo de embeddings: {e}"
+        print(error_message)
         return None, None
 def generar_embedding(texto, tokenizer, model):
             documents=valid_fragmentos,
             ids=[f"frag_{i}" for i in range(len(valid_fragmentos))]
         )
+        print("Base de conocimientos vectorizada.")
         return collection
     except Exception as e:
+        error_message = f"Error al crear el vector store: {e}"
+        print(error_message)
         return None
 def buscar_en_conocimiento(pregunta, collection, tokenizer, embedding_model, top_n=3):
             return None
     try:
         llm = Llama(model_path=MODEL_LOCAL_PATH)
+        print("Modelo LLM cargado.")
         return llm
     except Exception as e:
         error_message = f"Error al cargar el modelo LLM desde {MODEL_LOCAL_PATH}: {e}"
         return "Cargando recursos. Por favor, espera...", historial
     contexto = buscar_en_conocimiento(pregunta, vector_store, embedding_tokenizer, embedding_model)
+    historial_str = "\n".join([f"{turn[0]}: {turn[1]}" for turn in historial])
     prompt = f"Basado en la siguiente información: '{contexto}' y la conversación anterior: '{historial_str}', responde a la pregunta: '{pregunta}'"
     except Exception as e:
         respuesta = f"Error al generar la respuesta: {e}"
+    historial.append([pregunta, respuesta])
     return respuesta, historial
 # --- Inicialización Global ---
     print("Inicializando recursos...")
     llm_instance = cargar_modelo_llm()
     if llm_instance:
         embedding_tokenizer, embedding_model = cargar_modelo_embeddings()
         if embedding_tokenizer and embedding_model:
             textos_pdf = cargar_documentos(KNOWLEDGE_BASE_PATH)
             fragmentos = dividir_en_fragmentos(textos_pdf)
             vector_store = crear_vector_store(fragmentos, embedding_tokenizer, embedding_model, VECTOR_STORE_NAME)
+            if not vector_store:
                 initialization_error = "Error al crear la base de conocimientos vectorial."
         else:
             initialization_error = "Error al cargar el modelo de embeddings."
     else:
+        initialization_error = "Error al inicializar el modelo LLM."
 # --- Interfaz de Gradio ---
 if __name__ == "__main__":
     inicializar()
+    if initialization_error:
+        print(f"Error durante la inicialización: {initialization_error}")
+    else:
+        interface = gr.ChatInterface(
+            fn=chatbot,
+            title="Chatbot con Base de Conocimiento",
+            description="Pregúntame cualquier cosa basada en los documentos PDF cargados.",
+            examples=["¿De qué trata el documento principal?", "¿Cuál es la idea clave del segundo archivo?"]
+        )
+        interface.launch()