adding to spaces

Files changed (12) hide show

.gitattributes +1 -0
.gitignore +1 -0
src/streamlit_app.py → app.py +2 -2
src/models/paddleocr_models/det/inference.pdiparams +3 -0
src/models/paddleocr_models/det/inference.pdmodel +3 -0
src/models/paddleocr_models/rec/inference.pdiparams +3 -0
src/models/paddleocr_models/rec/inference.pdmodel +3 -0
src/models/table_detector.py +12 -3
src/table_creator/__pycache__/data_structures.cpython-312.pyc +0 -0
src/table_creator/__pycache__/table_extractor.cpython-312.pyc +0 -0
src/table_creator/table_extractor.py +3 -3
yolo11n.pt +3 -0

.gitattributes CHANGED Viewed

@@ -37,3 +37,4 @@ src/models/table-detection-and-extraction.pt filter=lfs diff=lfs merge=lfs -text
 *.png filter=lfs diff=lfs merge=lfs -text
 *.pdparams filter=lfs diff=lfs merge=lfs -text
 *.pdmodel filter=lfs diff=lfs merge=lfs -text

 *.png filter=lfs diff=lfs merge=lfs -text
 *.pdparams filter=lfs diff=lfs merge=lfs -text
 *.pdmodel filter=lfs diff=lfs merge=lfs -text
+*.pdiparams filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ *__pycache__

src/streamlit_app.py → app.py RENAMED Viewed

@@ -1,4 +1,4 @@
-from table_creator.table_extractor import TableExtraction
 import streamlit as st
 import base64
 from PIL import Image
@@ -244,7 +244,7 @@ with st.sidebar:
     st.markdown("""
         <div class="step-container">
             <div class="step-number">1</div>
-            <div class="guide-text">Upload a document image containing a table (PNG, JPG, or JPEG format)</div>
         </div>
         <div class="step-container">

+from src.table_creator.table_extractor import TableExtraction
 import streamlit as st
 import base64
 from PIL import Image
     st.markdown("""
         <div class="step-container">
             <div class="step-number">1</div>
+            <div class="guide-text">Upload a document image containing a table (JPG, or JPEG format)</div>
         </div>
         <div class="step-container">

src/models/paddleocr_models/det/inference.pdiparams ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:83676ec730627ab4502f401410a4b6a3ce1c0bb98fa249b71db055b6bddae051
+size 2377917

src/models/paddleocr_models/det/inference.pdmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c4bfb1b05d9d1d5a760801eaf6d20180ef7e47bcc675fb17d1f3a89da5fef427
+size 1590133

src/models/paddleocr_models/rec/inference.pdiparams ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:75f64a1ffb70c56b7a25655963ca16f5bf3286202e3f52ac972bee05cdee2f56
+size 7607269

src/models/paddleocr_models/rec/inference.pdmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:85b952f05f709af259cfe4254012aa7208bef0998f71f57a15495446f25ccd43
+size 2517366

src/models/table_detector.py CHANGED Viewed

@@ -2,7 +2,9 @@ from pathlib import Path
 from typing import Optional, Union
 import numpy as np
 from ultralytics import YOLO
-# from ultralyticsplus import YOLO
 class TableDetector:
@@ -33,6 +35,14 @@ class TableDetector:
         self.min_conf = confidence
         self.iou = iou_threshold
     def detect(self, image_path: Union[str, Path]) -> Optional[np.ndarray]:
         """
         Detect tables in the given image.
@@ -45,11 +55,10 @@ class TableDetector:
         """
         results = self.model.predict(str(image_path), verbose=False, iou = self.iou, conf = self.min_conf)
         if results:
-            print('boxes :\n',results[0])
             boxes = results[0].boxes.xyxy.numpy()
             cord =  self.merge_boxes(boxes)
-            print('cords : ',cord)
             return [sorted(cord, key = lambda x : (x[2]-x[0])* (x[3]-x[1]), reverse=True)[0]] if len(cord) > 0 else []
         return None
     def merge_boxes(self, boxes: np.ndarray, overlap_threshold: float = 35) -> np.ndarray:

 from typing import Optional, Union
 import numpy as np
 from ultralytics import YOLO
+from ultralyticsplus import YOLO as YOLO2
 class TableDetector:
         self.min_conf = confidence
         self.iou = iou_threshold
+    def load_model(self):
+        model = YOLO2('foduucom/table-detection-and-extraction')
+        model.overrides['conf'] = 0.25  # NMS confidence threshold
+        model.overrides['iou'] = 0.45  # NMS IoU threshold
+        model.overrides['agnostic_nms'] = False  # NMS class-agnostic
+        model.overrides['max_det'] = 1000
+        return model
     def detect(self, image_path: Union[str, Path]) -> Optional[np.ndarray]:
         """
         Detect tables in the given image.
         """
         results = self.model.predict(str(image_path), verbose=False, iou = self.iou, conf = self.min_conf)
         if results:
             boxes = results[0].boxes.xyxy.numpy()
             cord =  self.merge_boxes(boxes)
             return [sorted(cord, key = lambda x : (x[2]-x[0])* (x[3]-x[1]), reverse=True)[0]] if len(cord) > 0 else []
         return None
     def merge_boxes(self, boxes: np.ndarray, overlap_threshold: float = 35) -> np.ndarray:

src/table_creator/__pycache__/data_structures.cpython-312.pyc CHANGED Viewed

Binary files a/src/table_creator/__pycache__/data_structures.cpython-312.pyc and b/src/table_creator/__pycache__/data_structures.cpython-312.pyc differ

src/table_creator/__pycache__/table_extractor.cpython-312.pyc CHANGED Viewed

Binary files a/src/table_creator/__pycache__/table_extractor.cpython-312.pyc and b/src/table_creator/__pycache__/table_extractor.cpython-312.pyc differ

src/table_creator/table_extractor.py CHANGED Viewed

@@ -1,6 +1,6 @@
-from models.table_detector import TableDetector
-from models.text_recognizer import TextRecognizer
-from table_creator.data_structures import TableStructure
 import pandas as pd
 import re

+from src.models.table_detector import TableDetector
+from src.models.text_recognizer import TextRecognizer
+from src.table_creator.data_structures import TableStructure
 import pandas as pd
 import re

yolo11n.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0ebbc80d4a7680d14987a577cd21342b65ecfd94632bd9a8da63ae6417644ee1
+size 5613764