Spaces:

diginoron
/

tiyam-chatbot

Sleeping

App Files Files Community

diginoron commited on Mar 29

Commit

d260382

verified ·

1 Parent(s): cb249ff

Update app.py

Browse files

Files changed (1) hide show

app.py +30 -57

app.py CHANGED Viewed

@@ -1,63 +1,36 @@
-import os
-import torch
-from transformers import AutoTokenizer, AutoModelForCausalLM
-from sentence_transformers import SentenceTransformer, util
 from pinecone import Pinecone
 import gradio as gr
-# انتشار متغیرها از Hugging Face secrets
-HF_TOKEN = os.getenv("HF_TOKEN")
-PINECONE_API_KEY = os.getenv("PINECONE_API_KEY")
-PINECONE_INDEX_NAME = os.getenv("PINECONE_INDEX_NAME")
-# مدل کوچک برای embedding (sentence-transformers)
-embedding_model = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
-# مدل زبانی GPT2 فارسی
-tokenizer = AutoTokenizer.from_pretrained("HooshvareLab/gpt2-fa")
-model = AutoModelForCausalLM.from_pretrained("HooshvareLab/gpt2-fa")
 # اتصال به Pinecone
-pc = Pinecone(api_key=PINECONE_API_KEY)
-index = pc.Index(PINECONE_INDEX_NAME)
-# توابع
-def retrieve_from_pinecone(query):
-    query_embedding = embedding_model.encode(query).tolist()
-    search_result = index.query(vector=query_embedding, top_k=1, include_metadata=True)
-    try:
-        return search_result['matches'][0]['metadata']['answer']
-    except:
-        return "پاسخی برای این سوال پیدا نشد."
-def generate_response(query):
-    base_answer = retrieve_from_pinecone(query)
-    prompt = f"{query}\n{base_answer}"
-    inputs = tokenizer(prompt, return_tensors="pt")
-    output = model.generate(
-        inputs["input_ids"],
-        attention_mask=inputs["attention_mask"],
-        max_new_tokens=30,  # کمک به تسریع پاسخگویی
-        temperature=0.7,
-        do_sample=True,
-        pad_token_id=tokenizer.eos_token_id
-    )
-    response = tokenizer.decode(output[0], skip_special_tokens=True)
-    # جدا کردن پاسخ تولیدی از prompt
-    return response.replace(prompt, "").strip()
-# رابط کاربری Gradio
-iface = gr.Interface(
-    fn=generate_response,
-    inputs=gr.Textbox(label="question", placeholder="سوال خود را وارد کنید"),
-    outputs=gr.Textbox(label="output"),
-    title="چتبات هوشمند تیام",
-    description="سوالات خود درباره خدمات دیجیتال مارکتینگ تیام را بپرسید"
-)
-iface.launch()

+# app.py
+from sentence_transformers import SentenceTransformer
 from pinecone import Pinecone
+import json
 import gradio as gr
+# بارگذاری مدل embedding
+model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
+# بارگذاری داده محلی برای نمایش اولیه (در صورت نیاز)
+with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
+    data = json.load(f)
 # اتصال به Pinecone
+pc = Pinecone(api_key="pcsk_6p6AmJ_Qua4tQN69badNHEGZTj3tt5Bd7LiyiDGcXDj92LxSaBzK2ypYxTRx2rafTEJhjL")  # 🔐 جایگزین کن با کلیدت
+index = pc.Index("tiyam-chat")  # ایندکس از قبل ساخته‌شده
+# تابع پاسخ‌گو
+def retrieve_answer(query, threshold=0.65, top_k=1):
+    query_embedding = model.encode([query])[0]
+    result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)
+    if result['matches'] and result['matches'][0]['score'] > threshold:
+        print(f"📊 Similarity: {result['matches'][0]['score']:.3f}")
+        metadata = result['matches'][0]['metadata']
+        return metadata.get('answer', 'پاسخ یافت نشد')
+    else:
+        return "متأسفم، پاسخ دقیقی برای این سوال نداریم. لطفاً با ما تماس بگیرید."
+# رابط Gradio
+def chat_interface(question):
+    return retrieve_answer(question)
+demo = gr.Interface(fn=chat_interface, inputs="text", outputs="text", title="چت‌بات تیام", description="سؤالات خود را از آژانس دیجیتال مارکتینگ تیام بپرسید.")
+demo.launch()