Spaces:

eduardocpacheco
/

LLM-as-Judge-Legal-BR-annot

Running

App Files Files Community

eduardocpacheco commited on Mar 1

Commit

72dc442

1 Parent(s): 0600aa3

bug fix

Browse files

Files changed (2) hide show

__pycache__/label_oabench_dashboard.cpython-310.pyc +0 -0
label_oabench_dashboard.py +76 -41

__pycache__/label_oabench_dashboard.cpython-310.pyc CHANGED Viewed

Binary files a/__pycache__/label_oabench_dashboard.cpython-310.pyc and b/__pycache__/label_oabench_dashboard.cpython-310.pyc differ

label_oabench_dashboard.py CHANGED Viewed

@@ -2,6 +2,8 @@ import streamlit as st
 import pandas as pd
 import os
 import json
 # Função para carregar anotações específicas (discursivas ou práticas)
 def carregar_anotacoes(tipo, pasta="anotacoes"):
@@ -59,27 +61,49 @@ def calcular_totais(anotacoes_discursivas, anotacoes_praticas, df_discursivas, d
     return resultados
-# Função para calcular contadores de "Sim" e "Não" por parte
-def calcular_contadores_por_parte(anotacoes, df):
-    contadores = {}
-    for usuario, criterios_usuario in anotacoes.items():
-        for questao_id, criterios in criterios_usuario.items():
-            if questao_id in df["id"].astype(str).values:
-                for criterio, valor in criterios.items():
-                    parte = "_".join(criterio.split("_")[-2:])  # Exemplo: "parte_I" ou "parte_II"
-                    if parte not in contadores:
-                        contadores[parte] = {"Sim": 0, "Não": 0}
-                    if valor in ["Sim", "Não"]:
-                        contadores[parte][valor] += 1
-    return contadores
-# Função principal para rodar o dashboard no Streamlit
 def run():
-    #st.set_page_config(layout="wide")
     st.title("Dashboard de Anotações - Benchmark Jurídico OAB")
     # Carregar os DataFrames
-    st.markdown("### Carregando dados...")
     with st.spinner("Carregando arquivos..."):
         df_discursivas = pd.read_pickle("df_evaluated_discursive.pkl")
         df_praticas = pd.read_pickle("df_evaluated.pkl")
@@ -88,32 +112,43 @@ def run():
     # Calcular os totais
     resultados = calcular_totais(anotacoes_discursivas, anotacoes_praticas, df_discursivas, df_praticas)
     # Exibir os dados em uma tabela
     st.markdown("### Resumo das Anotações")
-    st.write("Análises completas por usuário:")
-    df_resultados = pd.DataFrame(resultados)
     st.dataframe(df_resultados, use_container_width=True)
-    # Calcular contadores para discursivas e práticas
-    st.markdown("### Contadores de Sim e Não por Parte")
-    contadores_discursivas = calcular_contadores_por_parte(anotacoes_discursivas, df_discursivas)
-    contadores_praticas = calcular_contadores_por_parte(anotacoes_praticas, df_praticas)
-    # Exibir os contadores no dashboard
-    st.markdown("#### Discursivas")
-    if contadores_discursivas:
-        df_contadores_discursivas = pd.DataFrame.from_dict(contadores_discursivas, orient="index").reset_index()
-        df_contadores_discursivas.columns = ["Parte", "Sim", "Não"]
-        st.dataframe(df_contadores_discursivas, use_container_width=True)
-    else:
-        st.write("Nenhum dado encontrado para discursivas.")
-    st.markdown("#### Práticas")
-    if contadores_praticas:
-        df_contadores_praticas = pd.DataFrame.from_dict(contadores_praticas, orient="index").reset_index()
-        df_contadores_praticas.columns = ["Parte", "Sim", "Não"]
-        st.dataframe(df_contadores_praticas, use_container_width=True)
-    else:
-        st.write("Nenhum dado encontrado para práticas.")

 import pandas as pd
 import os
 import json
+import zipfile
+import io
 # Função para carregar anotações específicas (discursivas ou práticas)
 def carregar_anotacoes(tipo, pasta="anotacoes"):
     return resultados
+# Função para calcular itens incompletos por usuário
+def calcular_itens_incompletos(anotacoes_discursivas, anotacoes_praticas, df_discursivas, df_praticas):
+    resultados_incompletos = []
+    usuarios = set(anotacoes_discursivas.keys()).union(set(anotacoes_praticas.keys()))
+    for usuario in usuarios:
+        # Verificar discursivas
+        if usuario in anotacoes_discursivas:
+            for questao_id, criterios in anotacoes_discursivas[usuario].items():
+                if questao_id in df_discursivas["id"].astype(str).values:
+                    criterios_totais = df_discursivas[df_discursivas["id"] == int(questao_id)].iloc[0]["formated_criteria"]
+                    criterios_anotados = [k for k, v in criterios.items() if v in ["Sim", "Não"]]
+                    if len(criterios_anotados) < len(criterios_totais):
+                        for criterio in criterios_totais:
+                            if criterio not in criterios_anotados:
+                                resultados_incompletos.append({
+                                    "usuario": usuario,
+                                    "item_pendente": f"D {questao_id} {criterio['letra']}-{criterio['parte']}"
+                                })
+        # Verificar práticas
+        if usuario in anotacoes_praticas:
+            for questao_id, criterios in anotacoes_praticas[usuario].items():
+                if questao_id in df_praticas["id"].astype(str).values:
+                    criterios_totais = df_praticas[df_praticas["id"] == int(questao_id)].iloc[0]["formated_criteria"]
+                    criterios_anotados = [k for k, v in criterios.items() if v in ["Sim", "Não"]]
+                    if len(criterios_anotados) < len(criterios_totais):
+                        for criterio in criterios_totais:
+                            if criterio not in criterios_anotados:
+                                resultados_incompletos.append({
+                                    "usuario": usuario,
+                                    "item_pendente": f"P {questao_id} {criterio['numero']}-{criterio['parte']}"
+                                })
+    return resultados_incompletos
+# Função principal do Streamlit
 def run():
+    st.set_page_config(layout="wide")
     st.title("Dashboard de Anotações - Benchmark Jurídico OAB")
     # Carregar os DataFrames
     with st.spinner("Carregando arquivos..."):
         df_discursivas = pd.read_pickle("df_evaluated_discursive.pkl")
         df_praticas = pd.read_pickle("df_evaluated.pkl")
     # Calcular os totais
     resultados = calcular_totais(anotacoes_discursivas, anotacoes_praticas, df_discursivas, df_praticas)
+    df_resultados = pd.DataFrame(resultados)
     # Exibir os dados em uma tabela
     st.markdown("### Resumo das Anotações")
     st.dataframe(df_resultados, use_container_width=True)
+    # Calcular itens incompletos
+    itens_incompletos = calcular_itens_incompletos(anotacoes_discursivas, anotacoes_praticas, df_discursivas, df_praticas)
+    df_incompletos = pd.DataFrame(itens_incompletos)
+    # Permitir filtragem por usuário
+    usuarios_disponiveis = df_incompletos["usuario"].unique().tolist()
+    usuario_selecionado = st.selectbox("Selecione um usuário:", options=["Todos"] + usuarios_disponiveis)
+    if usuario_selecionado != "Todos":
+        df_incompletos = df_incompletos[df_incompletos["usuario"] == usuario_selecionado]
+    # Exibir os itens incompletos
+    st.markdown("### Itens Incompletos por Usuário")
+    st.dataframe(df_incompletos, use_container_width=True)
+    # Criar um ZIP com os arquivos JSON
+    folder_path = "anotacoes"
+    zip_buffer = io.BytesIO()
+    with zipfile.ZipFile(zip_buffer, "w", zipfile.ZIP_DEFLATED) as zip_file:
+        for file_name in os.listdir(folder_path):
+            if file_name.endswith(".json"):
+                file_path = os.path.join(folder_path, file_name)
+                zip_file.write(file_path, arcname=file_name)
+    zip_buffer.seek(0)
+    # Criar botão de download
+    st.download_button(
+        label="📥 Baixar Todos os JSONs",
+        data=zip_buffer,
+        file_name="anotacoes.zip",
+        mime="application/zip"
+    )