Spaces:

hedtorresca
/

ExploratorioVasculitis

Build error

App Files Files Community

hedtorresca commited on Mar 25

Commit

32bd549

verified ·

1 Parent(s): 6e83594

Update app.py

Browse files

Files changed (1) hide show

app.py +129 -132

app.py CHANGED Viewed

@@ -1,145 +1,142 @@
 import gradio as gr
 import pandas as pd
 import numpy as np
-import matplotlib.pyplot as plt
-import seaborn as sns
 import geopandas as gpd
 from scipy.stats import chi2_contingency
-from sklearn.neighbors import KernelDensity
 import folium
 from folium.plugins import HeatMap
-# ===========================
-# 1. CARGA Y PREPROCESAMIENTO
-# ===========================
-df = pd.read_csv("VasculitisAsociadasA-BDD10jul24_DATA_2025-03-19_1033.csv")
-# Derivar variables categóricas útiles
 categorias = {
-    'genero_cat': df['genero'].map({0: 'Masculino', 1: 'Femenino'}),
-    'regimen_cat': df['regimen'].map({1: 'Contributivo', 2: 'Subsidiado'}),
-    'estrato_cat': df['estrato'].map({0: 'Bajo', 1: 'Bajo', 2: 'Bajo', 3: 'Medio', 4: 'Medio', 5: 'Alto', 6: 'Alto'})
 }
-df = df.assign(**categorias)
-# ANCA positivo
-df['anca_cat'] = df['ancas'].map({0: 'Negativo', 1: 'Positivo'}).fillna('No definido')
-df['mpo_cat'] = df['mpo'].map({0: 'Negativo', 1: 'Positivo'}).fillna('No definido')
-df['pr3_cat'] = df['pr3'].map({0: 'Negativo', 1: 'Positivo'}).fillna('No definido')
-# Compromiso renal por biopsia
-biopsia_cols = [col for col in df.columns if col.startswith('biopsia___')]
-df['biopsia_positiva'] = df[biopsia_cols].sum(axis=1).apply(lambda x: 'Sí' if x > 0 else 'No')
-# Caso confirmado: ANCA+ y biopsia positiva
-df['anca_y_renal'] = np.where((df['ancas'] == 1) & (df['biopsia_positiva'] == 'Sí'), 'Sí', 'No')
-# ===========================
-# 2. FUNCIONES DE GRAFICACIÓN Y MAPEO
-# ===========================
-def generar_univariado():
-    rutas = []
-    variables_uni = ['edad', 'genero_cat', 'regimen_cat', 'estrato_cat', 'anca_cat',
-                     'mpo_cat', 'pr3_cat', 'biopsia_positiva', 'anca_y_renal', 'sindrome',
-                     'diabetes', 'falla_cardiaca', 'epoc', 'hta']
-    for col in variables_uni:
-        plt.figure(figsize=(6, 4))
-        if df[col].dtype == 'object':
-            sns.countplot(data=df, x=col, order=df[col].value_counts().index)
-        else:
-            sns.histplot(df[col], kde=True)
-        plt.title(f"Distribución de {col}")
-        plt.xticks(rotation=30)
-        plt.tight_layout()
-        path = f"uni_{col}.png"
-        plt.savefig(path)
-        rutas.append(path)
-        plt.close()
-    return rutas
-def generar_bivariado():
-    relaciones_bi = [
-        ('anca_cat', 'biopsia_positiva'), ('anca_cat', 'mpo_cat'),
-        ('anca_cat', 'pr3_cat'), ('estrato_cat', 'biopsia_positiva'),
-        ('genero_cat', 'anca_cat'), ('regimen_cat', 'anca_cat'),
-        ('sindrome', 'biopsia_positiva')
-    ]
-    rutas = []
-    for x, y in relaciones_bi:
-        plt.figure(figsize=(6, 4))
-        sns.countplot(data=df, x=x, hue=y)
-        plt.title(f"{x} vs {y}")
-        plt.xticks(rotation=30)
-        plt.tight_layout()
-        path = f"bi_{x}_{y}.png"
-        plt.savefig(path)
-        rutas.append(path)
-        plt.close()
-    return rutas
-def generar_chi2():
-    relaciones_bi = [
-        ('anca_cat', 'biopsia_positiva'), ('anca_cat', 'mpo_cat'),
-        ('anca_cat', 'pr3_cat'), ('estrato_cat', 'biopsia_positiva'),
-        ('genero_cat', 'anca_cat'), ('regimen_cat', 'anca_cat'),
-        ('sindrome', 'biopsia_positiva')
-    ]
-    resultados = []
-    for var1, var2 in relaciones_bi:
-        tabla = pd.crosstab(df[var1], df[var2])
-        chi, p, dof, _ = chi2_contingency(tabla)
-        resultados.append((f"{var1} vs {var2}", tabla, chi, p, dof))
-    return resultados
-def generar_mapa_coropletico():
-    gdf = gpd.read_file("https://datosabiertos.bogota.gov.co/dataset/856cb657-8ca3-4ee8-857f-37211173b1f8/resource/497b8756-0927-4aee-8da9-ca4e32ca3a8a/download/loca.json")
-    df_loc = df.copy()
-    df_loc['localidad'] = df_loc['localidad'].astype(str)
-    counts = df_loc['localidad'].value_counts().reset_index()
-    counts.columns = ['localidad', 'casos']
-    gdf['localidad'] = gdf['NOMBRE'].str.upper()
-    merged = gdf.merge(counts, how='left', left_on='localidad', right_on='localidad').fillna(0)
-    m = merged.explore(column='casos', cmap='OrRd', legend=True)
-    m.save("coropletico.html")
-    with open("coropletico.html", "r", encoding="utf-8") as f:
-        return f.read()
-def generar_mapa_kernel():
-    if 'latitud' in df.columns and 'longitud' in df.columns:
-        puntos = df[['latitud', 'longitud']].dropna()
-        m = folium.Map(location=[4.65, -74.1], zoom_start=11)
-        HeatMap(puntos.values.tolist(), radius=12).add_to(m)
-        m.save("heatmap.html")
-        with open("heatmap.html", "r", encoding="utf-8") as f:
-            return f.read()
-    else:
-        return "No hay coordenadas geográficas disponibles."
-# ===========================
-# 3. INTERFAZ AUTOMÁTICA PROFESIONAL
-# ===========================
 with gr.Blocks() as demo:
-    gr.Markdown("# Tablero Clínico Profesional - Vasculitis ANCA")
-    with gr.Tab("Gráficos Univariados"):
-        for path in generar_univariado():
-            gr.Image(value=path)
-    with gr.Tab("Gráficos Bivariados"):
-        for path in generar_bivariado():
-            gr.Image(value=path)
-    with gr.Tab("Tablas Chi-cuadrado"):
-        for nombre, tabla, chi, p, dof in generar_chi2():
-            gr.Markdown(f"### {nombre}")
-            gr.Markdown(f"**Chi²** = {chi:.2f} | **p-valor** = {p:.4f} | **gl** = {dof}")
-            gr.DataFrame(value=tabla.reset_index())
-    with gr.Tab("Mapa Coroplético por Localidad"):
-        gr.HTML(value=generar_mapa_coropletico())
-    with gr.Tab("Mapa de Calor (Kernel Density)"):
-        gr.HTML(value=generar_mapa_kernel())
 demo.launch()

 import gradio as gr
 import pandas as pd
 import numpy as np
 import geopandas as gpd
+import plotly.express as px
+import plotly.graph_objects as go
 from scipy.stats import chi2_contingency
+import matplotlib.pyplot as plt
+import seaborn as sns
+import io
+import base64
 import folium
 from folium.plugins import HeatMap
+# =========================
+# 1. CARGA DE DATOS
+# =========================
+data = pd.read_csv("VasculitisAsociadasA-BDD10jul24_DATA_2025-03-19_1033.csv")
+geo_localidades = gpd.read_file("loca.json")
+calidad_aire = gpd.read_file("pm25_prom_anual_2023.geojson")
+ozono = gpd.read_file("ozono_prom_anual_2022.geojson")
+temperatura = gpd.read_file("temp_anualprom_2023.geojson")
+precipitacion = gpd.read_file("precip_anualacum_2023.geojson")
+viento = gpd.read_file("vel_viento_0_23h_anual_2023.geojson")
+estaciones = gpd.read_file("estacion_calidad_aire.geojson")
+# =========================
+# 2. PROCESAMIENTO
+# =========================
 categorias = {
+    'genero_cat': data['genero'].map({0: 'Masculino', 1: 'Femenino'}),
+    'regimen_cat': data['regimen'].map({1: 'Contributivo', 2: 'Subsidiado'}),
+    'estrato_cat': data['estrato'].map({0: 'Bajo', 1: 'Bajo', 2: 'Bajo', 3: 'Medio', 4: 'Medio', 5: 'Alto', 6: 'Alto'})
 }
+data = data.assign(**categorias)
+data['anca_cat'] = data['ancas'].map({0: 'Negativo', 1: 'Positivo'}).fillna('No definido')
+data['mpo_cat'] = data['mpo'].map({0: 'Negativo', 1: 'Positivo'}).fillna('No definido')
+data['pr3_cat'] = data['pr3'].map({0: 'Negativo', 1: 'Positivo'}).fillna('No definido')
+tipo_biopsia = [col for col in data.columns if col.startswith('biopsia___')]
+data['biopsia_positiva'] = data[tipo_biopsia].sum(axis=1).apply(lambda x: 'Sí' if x > 0 else 'No')
+data['anca_y_renal'] = np.where((data['ancas'] == 1) & (data['biopsia_positiva'] == 'Sí'), 'Sí', 'No')
+# =========================
+# 3. FUNCIONES DE FILTRADO
+# =========================
+def aplicar_filtros(df, genero, edad, localidad, anca_tipo, antecedentes):
+    if genero != "Todos":
+        df = df[df['genero_cat'] == genero]
+    df = df[(df['edad'] >= edad[0]) & (df['edad'] <= edad[1])]
+    if localidad:
+        df = df[df['localidad'].isin(localidad)]
+    if anca_tipo != "Todos":
+        df = df[df['anca_cat'] == anca_tipo]
+    for ant in antecedentes:
+        if ant in df.columns:
+            df = df[df[ant] == 1]
+    return df
+# =========================
+# 4. NUEVOS COMPONENTES UI
+# =========================
 with gr.Blocks() as demo:
+    gr.Markdown("# Tablero de Análisis de Vasculitis ANCA en Bogotá")
+    with gr.Accordion("Filtros de Subgrupo", open=False):
+        genero = gr.Radio(["Todos", "Masculino", "Femenino"], label="Género")
+        edad = gr.Slider(0, 100, step=1, value=(0, 100), label="Edad")
+        localidades_opciones = sorted(data['localidad'].dropna().unique().tolist())
+        localidad = gr.Dropdown(localidades_opciones, label="Localidad", multiselect=True)
+        anca = gr.Radio(["Todos", "Positivo", "Negativo"], label="ANCA")
+        antecedentes = gr.CheckboxGroup(choices=['diabetes', 'falla_cardiaca', 'epoc', 'hta'], label="Antecedentes Clínicos")
+        btn_aplicar = gr.Button("Aplicar Filtros")
+    resultados_univariados = gr.Gallery(label="Distribuciones Univariadas")
+    resultados_bivariados = gr.Gallery(label="Relaciones Bivariadas")
+    resultados_chi = gr.DataFrame()
+    html_mapa = gr.HTML()
+    mapa_plot = gr.Plot()
+    def actualizar_tablero(genero, edad, localidad, anca, antecedentes):
+        df_filtrado = aplicar_filtros(data, genero, edad, localidad, anca, antecedentes)
+        if df_filtrado.empty:
+            return [[], [], pd.DataFrame(), "<h4>No hay datos para los filtros seleccionados</h4>", go.Figure()]
+        imgs_uni = []
+        for col in ['edad', 'genero_cat', 'regimen_cat', 'estrato_cat', 'anca_cat', 'mpo_cat', 'pr3_cat', 'biopsia_positiva', 'anca_y_renal']:
+            plt.figure(figsize=(5, 4))
+            if df_filtrado[col].dtype == 'object':
+                sns.countplot(data=df_filtrado, x=col, order=df_filtrado[col].value_counts().index)
+            else:
+                sns.histplot(df_filtrado[col], kde=True)
+            plt.xticks(rotation=30)
+            plt.tight_layout()
+            path = f"plot_uni_{col}.png"
+            plt.savefig(path)
+            imgs_uni.append(path)
+            plt.close()
+        imgs_bi = []
+        for x, y in [('anca_cat', 'biopsia_positiva'), ('estrato_cat', 'anca_cat')]:
+            plt.figure(figsize=(6, 4))
+            sns.countplot(data=df_filtrado, x=x, hue=y)
+            plt.tight_layout()
+            path = f"plot_bi_{x}_{y}.png"
+            plt.savefig(path)
+            imgs_bi.append(path)
+            plt.close()
+        tabla = pd.crosstab(df_filtrado['genero_cat'], df_filtrado['anca_cat'])
+        chi2, p, dof, _ = chi2_contingency(tabla)
+        resumen = df_filtrado.groupby("localidad")['ancas'].count().reset_index(name='casos')
+        geo_localidades['localidad'] = geo_localidades['NOMBRE'].str.upper()
+        merged = geo_localidades.merge(resumen, left_on='localidad', right_on='localidad', how='left').fillna(0)
+        m = folium.Map(location=[4.65, -74.1], zoom_start=11)
+        folium.Choropleth(
+            geo_data=merged,
+            data=merged,
+            columns=['localidad', 'casos'],
+            key_on='feature.properties.localidad',
+            fill_color='YlOrRd',
+            fill_opacity=0.7,
+            line_opacity=0.2,
+            legend_name='Casos de Vasculitis'
+        ).add_to(m)
+        path_map = "folium_map.html"
+        m.save(path_map)
+        with open(path_map, 'r', encoding='utf-8') as f:
+            html_out = f.read()
+        fig = px.density_mapbox(df_filtrado.dropna(subset=['latitud', 'longitud']), lat='latitud', lon='longitud',
+                                z=[1]*len(df_filtrado), radius=10,
+                                center=dict(lat=4.65, lon=-74.1), zoom=10, mapbox_style="carto-positron")
+        return [imgs_uni, imgs_bi, tabla.reset_index(), html_out, fig]
+    btn_aplicar.click(actualizar_tablero, inputs=[genero, edad, localidad, anca, antecedentes],
+                      outputs=[resultados_univariados, resultados_bivariados, resultados_chi, html_mapa, mapa_plot])
 demo.launch()