Spaces:

tkdehf2
/

asdf

Sleeping

App Files Files Community

tkdehf2 commited on Nov 15, 2024

Commit

1adbe0b

verified ·

1 Parent(s): c6900bb

Update app.py

Browse files

Files changed (1) hide show

app.py +99 -44

app.py CHANGED Viewed

@@ -3,36 +3,59 @@ from transformers import TrOCRProcessor, VisionEncoderDecoderModel
 import torch
 from PIL import Image
 import numpy as np
 # OCR 모델 및 프로세서 초기화
 processor = TrOCRProcessor.from_pretrained('microsoft/trocr-base-handwritten')
 model = VisionEncoderDecoderModel.from_pretrained('microsoft/trocr-base-handwritten')
-# 정답 및 해설 데이터베이스
 answer_key = {
-    "1": {
-        "answer": "민주주의",
-        "explanation": "민주주의는 국민이 주인이 되어 나라의 중요한 일을 결정하는 제도입니다. 우리나라는 민주주의 국가로, 국민들이 투표를 통해 대표자를 선출하고 중요한 결정에 참여합니다."
-    },
-    "2": {
-        "answer": "삼권분립",
-        "explanation": "삼권분립은 입법부, 행정부, 사법부로 권력을 나누어 서로 견제와 균형을 이루게 하는 제도입니다. 이를 통해 한 쪽에 권력이 집중되는 것을 막을 수 있습니다."
-    },
-    "3": {
-        "answer": "지방자치제도",
-        "explanation": "지방자치제도는 지역의 일을 그 지역 주민들이 직접 결정하고 처리하는 제도입니다. 주민들이 직접 지방자치단체장과 지방의회 의원을 선출합니다."
-    }
 }
-def preprocess_image(image):
-    """이미지 전처리 함수"""
     if isinstance(image, np.ndarray):
-        image = Image.fromarray(image)
-    return image
 def recognize_text(image):
     """손글씨 인식 함수"""
-    image = preprocess_image(image)
     pixel_values = processor(image, return_tensors="pt").pixel_values
     with torch.no_grad():
@@ -43,6 +66,10 @@ def recognize_text(image):
 def grade_answer(question_number, student_answer):
     """답안 채점 함수"""
     correct_answer = answer_key[question_number]["answer"]
     explanation = answer_key[question_number]["explanation"]
@@ -50,44 +77,72 @@ def grade_answer(question_number, student_answer):
     is_correct = student_answer.replace(" ", "").lower() == correct_answer.replace(" ", "").lower()
     return {
-        "정답 여부": "정답" if is_correct else "오답",
         "정답": correct_answer,
         "해설": explanation
     }
-def process_submission(image, question_number):
-    """전체 처리 함수"""
-    if not image or not question_number:
-        return "이미지와 문제 번호를 모두 입력해주세요."
-    # 손글씨 인식
-    recognized_text = recognize_text(image)
-    # 채점 및 해설
-    result = grade_answer(question_number, recognized_text)
-    # 결과 포맷팅
-    output = f"""
-인식된 답안: {recognized_text}
-채점 결과: {result['정답 여부']}
 정답: {result['정답']}
-[해설]
-{result['해설']}
-    """
-    return output
 # Gradio 인터페이스 생성
 iface = gr.Interface(
-    fn=process_submission,
-    inputs=[
-        gr.Image(label="답안 이미지를 업로드하세요", type="numpy"),
-        gr.Dropdown(choices=["1", "2", "3"], label="문제 번호를 선택하세요")
-    ],
     outputs=gr.Textbox(label="채점 결과"),
     title="초등학교 사회 시험지 채점 프로그램",
-    description="손글씨로 작성된 사회 시험 답안을 채점하고 해설을 제공하는 프로그램입니다.",
 )
 if __name__ == "__main__":

 import torch
 from PIL import Image
 import numpy as np
+import cv2
 # OCR 모델 및 프로세서 초기화
 processor = TrOCRProcessor.from_pretrained('microsoft/trocr-base-handwritten')
 model = VisionEncoderDecoderModel.from_pretrained('microsoft/trocr-base-handwritten')
+# 정답 및 해설 데이터베이스 (20문제)
 answer_key = {
+    "1": {"answer": "민주주의", "explanation": "민주주의는 국민이 주인이 되어 나라의 중요한 일을 결정하는 제도입니다."},
+    "2": {"answer": "삼권분립", "explanation": "삼권분립은 입법부, 행정부, 사법부로 권력을 나누어 서로 견제와 균형을 이루게 하는 제도입니다."},
+    "3": {"answer": "지방자치제도", "explanation": "지방자치제도는 지역의 일을 그 지역 주민들이 직접 결정하고 처리하는 제도입니다."},
+    "4": {"answer": "헌법", "explanation": "헌법은 국가의 최고 법으로, 국민의 기본권과 정부 조직에 대한 기본 원칙을 담고 있습니다."},
+    "5": {"answer": "국회", "explanation": "국회는 법률을 만들고 정부를 감시하는 입법부의 역할을 담당합니다."},
+    # 6~20번까지 문제 추가 (실제 운영 시에는 여기에 추가)
 }
+def segment_answers(image):
+    """시험지에서 답안 영역을 분할하는 함수"""
     if isinstance(image, np.ndarray):
+        pil_image = Image.fromarray(image)
+    else:
+        return None
+    # 이미지를 그레이스케일로 변환
+    gray = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)
+    # 이미지 이진화
+    _, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY_INV)
+    # 윤곽선 찾기
+    contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
+    # 답안 영역 추출
+    answer_regions = []
+    for contour in contours:
+        x, y, w, h = cv2.boundingRect(contour)
+        if w > 50 and h > 20:  # 최소 크기 필터링
+            region = image[y:y+h, x:x+w]
+            answer_regions.append({
+                'image': region,
+                'position': (y, x)  # y좌표로 정렬하기 위해 (y,x) 순서로 저장
+            })
+    # y좌표를 기준으로 정렬 (위에서 아래로)
+    answer_regions.sort(key=lambda x: x['position'][0])
+    return [region['image'] for region in answer_regions]
 def recognize_text(image):
     """손글씨 인식 함수"""
+    if isinstance(image, np.ndarray):
+        image = Image.fromarray(image)
     pixel_values = processor(image, return_tensors="pt").pixel_values
     with torch.no_grad():
 def grade_answer(question_number, student_answer):
     """답안 채점 함수"""
+    question_number = str(question_number)
+    if question_number not in answer_key:
+        return None
     correct_answer = answer_key[question_number]["answer"]
     explanation = answer_key[question_number]["explanation"]
     is_correct = student_answer.replace(" ", "").lower() == correct_answer.replace(" ", "").lower()
     return {
+        "문제번호": question_number,
+        "학생답안": student_answer,
+        "정답여부": "O" if is_correct else "X",
         "정답": correct_answer,
         "해설": explanation
     }
+def process_full_exam(image):
+    """전체 시험지 처리 함수"""
+    if image is None or not isinstance(image, np.ndarray):
+        return "시험지 이미지를 업로드해주세요."
+    try:
+        # 답안 영역 분할
+        answer_regions = segment_answers(image)
+        if not answer_regions:
+            return "답안 영역을 찾을 수 없습니다. 이미지를 확인해주세요."
+        # 채점 결과 저장
+        results = []
+        total_correct = 0
+        # 각 답안 영역 처리
+        for idx, region in enumerate(answer_regions, 1):
+            if idx > len(answer_key):  # 정의된 문제 수를 초과하면 중단
+                break
+            # 텍스트 인식
+            recognized_text = recognize_text(region)
+            # 채점
+            result = grade_answer(idx, recognized_text)
+            if result:
+                results.append(result)
+                if result["정답여부"] == "O":
+                    total_correct += 1
+        # 결과 포맷팅
+        score = (total_correct / len(results)) * 100
+        output = f"총점: {score:.1f}점 (20문제 중 {total_correct}개 정답)\n\n"
+        output += "=== 상세 채점 결과 ===\n\n"
+        for result in results:
+            output += f"""
+[{result['문제번호']}번] {'✓' if result['정답여부']=='O' else '✗'}
+학생답안: {result['학생답안']}
 정답: {result['정답']}
+해설: {result['해설']}
+"""
+        return output
+    except Exception as e:
+        return f"처리 중 오류가 발생했습니다: {str(e)}"
 # Gradio 인터페이스 생성
 iface = gr.Interface(
+    fn=process_full_exam,
+    inputs=gr.Image(label="시험지 이미지를 업로드하세요", type="numpy"),
     outputs=gr.Textbox(label="채점 결과"),
     title="초등학교 사회 시험지 채점 프로그램",
+    description="""
+    전체 시험지를 한 번에 채점하는 프로그램입니다.
+    시험지의 답안이 잘 보이도록 깨끗하게 스캔하거나 촬영해주세요.
+    """,
+    examples=[],  # 예시 이미지를 추가할 수 있습니다
 )
 if __name__ == "__main__":