Spaces:

Manireddy1508
/

imagetoimage

Paused

App Files Files Community

manichandrareddy commited on Apr 5

Commit

d3a3bf1

1 Parent(s): fc4cb2d

🚀 Updated app with Brain Layer + HuggingFace model improvements

Browse files

Files changed (6) hide show

.gradio/certificate.pem +31 -0
app.py +47 -31
requirements.txt +1 -1
trial.py +17 -0
utils/__pycache__/planner.cpython-312.pyc +0 -0
utils/planner.py +9 -11

.gradio/certificate.pem ADDED Viewed

	@@ -0,0 +1,31 @@

+-----BEGIN CERTIFICATE-----
+MIIFazCCA1OgAwIBAgIRAIIQz7DSQONZRGPgu2OCiwAwDQYJKoZIhvcNAQELBQAw
+TzELMAkGA1UEBhMCVVMxKTAnBgNVBAoTIEludGVybmV0IFNlY3VyaXR5IFJlc2Vh
+cmNoIEdyb3VwMRUwEwYDVQQDEwxJU1JHIFJvb3QgWDEwHhcNMTUwNjA0MTEwNDM4
+WhcNMzUwNjA0MTEwNDM4WjBPMQswCQYDVQQGEwJVUzEpMCcGA1UEChMgSW50ZXJu
+ZXQgU2VjdXJpdHkgUmVzZWFyY2ggR3JvdXAxFTATBgNVBAMTDElTUkcgUm9vdCBY
+MTCCAiIwDQYJKoZIhvcNAQEBBQADggIPADCCAgoCggIBAK3oJHP0FDfzm54rVygc
+h77ct984kIxuPOZXoHj3dcKi/vVqbvYATyjb3miGbESTtrFj/RQSa78f0uoxmyF+
+0TM8ukj13Xnfs7j/EvEhmkvBioZxaUpmZmyPfjxwv60pIgbz5MDmgK7iS4+3mX6U
+A5/TR5d8mUgjU+g4rk8Kb4Mu0UlXjIB0ttov0DiNewNwIRt18jA8+o+u3dpjq+sW
+T8KOEUt+zwvo/7V3LvSye0rgTBIlDHCNAymg4VMk7BPZ7hm/ELNKjD+Jo2FR3qyH
+B5T0Y3HsLuJvW5iB4YlcNHlsdu87kGJ55tukmi8mxdAQ4Q7e2RCOFvu396j3x+UC
+B5iPNgiV5+I3lg02dZ77DnKxHZu8A/lJBdiB3QW0KtZB6awBdpUKD9jf1b0SHzUv
+KBds0pjBqAlkd25HN7rOrFleaJ1/ctaJxQZBKT5ZPt0m9STJEadao0xAH0ahmbWn
+OlFuhjuefXKnEgV4We0+UXgVCwOPjdAvBbI+e0ocS3MFEvzG6uBQE3xDk3SzynTn
+jh8BCNAw1FtxNrQHusEwMFxIt4I7mKZ9YIqioymCzLq9gwQbooMDQaHWBfEbwrbw
+qHyGO0aoSCqI3Haadr8faqU9GY/rOPNk3sgrDQoo//fb4hVC1CLQJ13hef4Y53CI
+rU7m2Ys6xt0nUW7/vGT1M0NPAgMBAAGjQjBAMA4GA1UdDwEB/wQEAwIBBjAPBgNV
+HRMBAf8EBTADAQH/MB0GA1UdDgQWBBR5tFnme7bl5AFzgAiIyBpY9umbbjANBgkq
+hkiG9w0BAQsFAAOCAgEAVR9YqbyyqFDQDLHYGmkgJykIrGF1XIpu+ILlaS/V9lZL
+ubhzEFnTIZd+50xx+7LSYK05qAvqFyFWhfFQDlnrzuBZ6brJFe+GnY+EgPbk6ZGQ
+3BebYhtF8GaV0nxvwuo77x/Py9auJ/GpsMiu/X1+mvoiBOv/2X/qkSsisRcOj/KK
+NFtY2PwByVS5uCbMiogziUwthDyC3+6WVwW6LLv3xLfHTjuCvjHIInNzktHCgKQ5
+ORAzI4JMPJ+GslWYHb4phowim57iaztXOoJwTdwJx4nLCgdNbOhdjsnvzqvHu7Ur
+TkXWStAmzOVyyghqpZXjFaH3pO3JLF+l+/+sKAIuvtd7u+Nxe5AW0wdeRlN8NwdC
+jNPElpzVmbUq4JUagEiuTDkHzsxHpFKVK7q4+63SM1N95R1NbdWhscdCb+ZAJzVc
+oyi3B43njTOQ5yOf+1CceWxG1bQVs5ZufpsMljq4Ui0/1lvh+wjChP4kqKOJ2qxq
+4RgqsahDYVvTH9w7jXbyLeiNdd8XM2w9U/t7y0Ff/9yi0GE44Za4rF2LN9d11TPA
+mRGunUHBcnWEvgJBQl9nJEiU0Zsnvgc/ubhPgXRR4Xq37Z0j4r7g1SgEEzwxA57d
+emyPxgcYxn/eR44/KJ4EBs+lVDR3veyJm+kXQ99b21/+jh5Xos1AnX5iItreGCc=
+-----END CERTIFICATE-----

app.py CHANGED Viewed

@@ -9,52 +9,68 @@ from io import BytesIO
 from utils.planner import extract_scene_plan  # 🧠 Brain Layer
-# 🔐 Hugging Face + OpenAI keys (use Secrets)
 HF_API_KEY = os.getenv("HF_API_KEY")
-SDXL_MODEL_ID = "stabilityai/stable-diffusion-xl-base-1.0"
 SDXL_API_URL = f"https://api-inference.huggingface.co/models/{SDXL_MODEL_ID}"
 HEADERS = {"Authorization": f"Bearer {HF_API_KEY}"}
-# 🚀 Image generation (no ControlNet)
 def process_image(prompt, image, num_variations):
-    # Step 1: Extract planning JSON from Brain Layer
-    reasoning_json = extract_scene_plan(prompt)
-    # Step 2: Encode image once
-    buffered = BytesIO()
-    image.save(buffered, format="JPEG")
-    img_bytes = buffered.getvalue()
-    encoded_image = base64.b64encode(img_bytes).decode("utf-8")
-    # Step 3: Generate multiple variations using base SDXL
-    outputs = []
-    for i in range(num_variations):
-        payload = {
-            "inputs": {
-                "prompt": prompt,
                 "image": encoded_image,
-                "negative_prompt": "blurry, deformed, cropped"
-            },
-            "options": {"wait_for_model": True}
-        }
-        try:
             response = requests.post(SDXL_API_URL, headers=HEADERS, json=payload)
             if response.status_code == 200:
-                result_image = Image.open(BytesIO(response.content))
-                outputs.append(result_image)
             else:
                 outputs.append(f"Error {response.status_code}: {response.text}")
-        except Exception as e:
-            outputs.append(f"Exception: {e}")
-    return outputs, reasoning_json
 # 🎨 Gradio UI
 with gr.Blocks() as demo:
-    gr.Markdown("# 🧠 NewCrux AI Demo: Image-to-Image using Base SDXL + Brain Layer")
     with gr.Row():
         with gr.Column():
@@ -78,5 +94,5 @@ with gr.Blocks() as demo:
         outputs=[output_gallery, json_output]
     )
-demo.launch()

 from utils.planner import extract_scene_plan  # 🧠 Brain Layer
+# 🔐 Hugging Face keys
 HF_API_KEY = os.getenv("HF_API_KEY")
+SDXL_MODEL_ID = "fal-ai/fast-sdxl/image-to-image"  # ✅ Correct model for image-to-image
 SDXL_API_URL = f"https://api-inference.huggingface.co/models/{SDXL_MODEL_ID}"
 HEADERS = {"Authorization": f"Bearer {HF_API_KEY}"}
+# 🚀 Image generation (img2img)
 def process_image(prompt, image, num_variations):
+    try:
+        print("🧠 Prompt received:", prompt)
+        # Step 1: Brain Layer
+        reasoning_json = extract_scene_plan(prompt)
+        print("🧠 Scene plan extracted:", reasoning_json)
+        # Step 2: Encode input image
+        buffered = BytesIO()
+        image.save(buffered, format="JPEG")
+        img_bytes = buffered.getvalue()
+        encoded_image = base64.b64encode(img_bytes).decode("utf-8")
+        # Step 3: Send image + prompt to HF API
+        outputs = []
+        for i in range(num_variations):
+            payload = {
                 "image": encoded_image,
+                "prompt": prompt,
+                "negative_prompt": "blurry, deformed, cropped",
+                "num_inference_steps": 25,
+                "guidance_scale": 7.5
+            }
+            print(f"📤 Sending request to HF (variation {i+1})")
             response = requests.post(SDXL_API_URL, headers=HEADERS, json=payload)
             if response.status_code == 200:
+                try:
+                    result_json = response.json()
+                    if "images" in result_json:
+                        base64_img = result_json["images"][0]
+                        result_image = Image.open(BytesIO(base64.b64decode(base64_img)))
+                        outputs.append(result_image)
+                        print(f"✅ Decoded image variation {i+1} successfully")
+                    else:
+                        print(f"⚠️ No 'images' key found in response")
+                        outputs.append("❌ No image in response.")
+                except Exception as decode_err:
+                    print("❌ Image decode error:", decode_err)
+                    outputs.append("❌ Failed to decode image.")
             else:
+                print(f"❌ HF API error: {response.status_code} - {response.text}")
                 outputs.append(f"Error {response.status_code}: {response.text}")
+        return outputs, reasoning_json
+    except Exception as e:
+        print("❌ General Exception in process_image:", e)
+        return ["Processing error occurred"], {"error": str(e)}
 # 🎨 Gradio UI
 with gr.Blocks() as demo:
+    gr.Markdown("# 🧠 NewCrux AI Demo: Image-to-Image using Fast SDXL + Brain Layer")
     with gr.Row():
         with gr.Column():
         outputs=[output_gallery, json_output]
     )
+demo.launch(share=True)

requirements.txt CHANGED Viewed

@@ -2,4 +2,4 @@ gradio
 requests
 Pillow
 openai>=1.0.0,<2.0.0

 requests
 Pillow
 openai>=1.0.0,<2.0.0
+python-dotenv

trial.py ADDED Viewed

	@@ -0,0 +1,17 @@

+# test_openai.py
+import os
+from openai import OpenAI
+from dotenv import load_dotenv
+load_dotenv()
+# Set your API key directly or use an environment variable
+client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
+# Simple test: ask ChatGPT something basic
+response = client.chat.completions.create(
+    model="gpt-3.5-turbo",
+    messages=[{"role": "user", "content": "Say hello"}],
+)
+print(response.choices[0].message.content)

utils/__pycache__/planner.cpython-312.pyc ADDED Viewed

Binary file (1.9 kB). View file

utils/planner.py CHANGED Viewed

@@ -1,9 +1,11 @@
 # utils/planner.py
 import os
-import json
-import logging
 from openai import OpenAI
 client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
@@ -21,7 +23,7 @@ Respond ONLY in raw JSON format. Do NOT include explanations.
 def extract_scene_plan(prompt: str) -> dict:
     try:
         response = client.chat.completions.create(
-            model="gpt-4-0125-preview",
             messages=[
                 {"role": "system", "content": SYSTEM_INSTRUCTIONS},
                 {"role": "user", "content": prompt}
@@ -29,16 +31,12 @@ def extract_scene_plan(prompt: str) -> dict:
             temperature=0.3,
             max_tokens=500
         )
-        content = response.choices[0].message.content.strip()
-        # Remove common formatting issues
-        content = content.strip("`").replace("json", "")
-        return json.loads(content)
     except Exception as e:
-        logging.exception("LLM Error:")
         return {
             "scene": None,
             "subject": None,

 # utils/planner.py
+import openai
 import os
 from openai import OpenAI
+from dotenv import load_dotenv
+import json
+load_dotenv()
 client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
 def extract_scene_plan(prompt: str) -> dict:
     try:
         response = client.chat.completions.create(
+            model="gpt-4o-mini-2024-07-18",
             messages=[
                 {"role": "system", "content": SYSTEM_INSTRUCTIONS},
                 {"role": "user", "content": prompt}
             temperature=0.3,
             max_tokens=500
         )
+        json_output = response.choices[0].message.content
+        print("🧠 Scene Plan (Raw):", json_output)
+        return json.loads(json_output) # Be cautious: Use `json.loads()` if possible
     except Exception as e:
+        print("❌ extract_scene_plan() Error:", e)
         return {
             "scene": None,
             "subject": None,