Upload 3 files

Browse files

Files changed (3) hide show

app.py +83 -0
requirements.txt +6 -0
smma5_dataset_500_plus.jsonl +0 -0

app.py ADDED Viewed

	@@ -0,0 +1,83 @@

+import streamlit as st
+import json
+import numpy as np
+import requests
+from sentence_transformers import SentenceTransformer
+from sklearn.metrics.pairwise import cosine_similarity
+# Load dataset
+@st.cache_resource
+def load_data():
+    with open("smma5_dataset_500_plus.jsonl", "r", encoding="utf-8") as f:
+        return [json.loads(line) for line in f]
+@st.cache_resource
+def load_model():
+    return SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
+def embed_dataset(data, model):
+    texts = [d["instruction"] for d in data]
+    return model.encode(texts, convert_to_tensor=False)
+def find_best_match(query, data, model, embeddings):
+    query_embedding = model.encode([query])
+    scores = cosine_similarity(query_embedding, embeddings)[0]
+    top_idx = int(np.argmax(scores))
+    return data[top_idx], scores[top_idx]
+def generate_with_qwen(prompt, hf_token):
+    API_URL = "https://api-inference.huggingface.co/models/Qwen/Qwen1.5-0.5B"
+    headers = {"Authorization": f"Bearer {hf_token}"}
+    payload = {"inputs": prompt, "parameters": {"max_new_tokens": 300}}
+    try:
+        response = requests.post(API_URL, headers=headers, json=payload, timeout=60)
+        response.raise_for_status()
+        result = response.json()
+        if isinstance(result, list):
+            return result[0]["generated_text"][len(prompt):].strip()
+        else:
+            return "⚠️ Unexpected response format."
+    except Exception as e:
+        return f"❌ Error contacting Qwen model: {str(e)}"
+# UI setup
+st.set_page_config(page_title="SMMA 5.0 Chatbot + Qwen", layout="centered")
+st.title("💬 SMMA 5.0 – Enhanced by Qwen")
+st.markdown("اسأل أي سؤال عن التسويق، واحصل على إجابة مدعّمة من قاعدة بياناتك الخاصة ومُحسّنة بواسطة نموذج Qwen.")
+hf_token = st.text_input("🔐 أدخل توكن Hugging Face الخاص بك:", type="password")
+user_input = st.text_input("اكتب سؤالك هنا:")
+if user_input and hf_token:
+    data = load_data()
+    model = load_model()
+    embeddings = embed_dataset(data, model)
+    result, score = find_best_match(user_input, data, model, embeddings)
+    # Display base response
+    st.markdown("### 📌 الرد من قاعدة البيانات")
+    st.write(result["response"])
+    # Format prompt
+    prompt = f"""أنت خبير تسويق سوشيال ميديا محترف. المستخدم سأل:
+"{user_input}"
+وهذه إجابة من قاعدة بياناتك:
+"{result['response']}"
+من فضلك قدّم إجابة محسّنة وقوية باللغة العربية للفيسبوك أو إنستجرام أو تيك توك.
+"""
+    st.markdown("### 🤖 الرد المحسن من Qwen")
+    with st.spinner("يتم توليد الرد المحسن..."):
+        enhanced = generate_with_qwen(prompt, hf_token)
+        st.write(enhanced)
+    # Extra info
+    with st.expander("📊 تفاصيل إضافية"):
+        st.write("🧠 استراتيجية البوست:", result["format_strategy"])
+        st.write("📝 نوع البوست:", result["post_type"])
+        st.write("🪄 الكابشن:", result["caption_strategy"])
+        st.write("✍️ تقنية الكتابة:", result["copywriting_technique"])

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+streamlit
+sentence-transformers
+scikit-learn
+numpy
+requests

smma5_dataset_500_plus.jsonl ADDED Viewed

The diff for this file is too large to render. See raw diff