Spaces:

C2MV
/

OptiTec

Sleeping

File size: 16,516 Bytes

import numpy as np
import pandas as pd
import statsmodels.formula.api as smf
import statsmodels.api as sm
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from scipy.optimize import minimize
import plotly.express as px
from scipy.stats import t
import gradio as gr

class RSM_BoxBehnken:
    # ... (El código de tu clase RSM_BoxBehnken se mantiene igual) ...
    def __init__(self, data):
        """
        Inicializa la clase con los datos del diseño Box-Behnken.

        Args:
            data (pd.DataFrame): DataFrame con los datos del experimento.
        """
        self.data = data.copy()
        self.data.rename(columns={
            'Glucosa': 'Glucosa',
            'Extracto de Levadura': 'Extracto_de_Levadura',
            'Triptófano': 'Triptofano',
            'AIA (ppm)': 'AIA_ppm'
        }, inplace=True)

        self.model = None
        self.model_simplified = None
        self.optimized_results = None
        self.optimal_levels = None

        self.x1_name = 'Glucosa'
        self.x2_name = 'Extracto_de_Levadura'
        self.x3_name = 'Triptofano'
        self.y_name = 'AIA_ppm'

        # Niveles originales de las variables
        self.x1_levels = [1, 3.5, 5.5]  # Glucosa
        self.x2_levels = [0.03, 0.2, 0.3]  # Extracto de Levadura
        self.x3_levels = [0.4, 0.65, 0.9]  # Triptófano

    def get_levels(self, variable_name):
        """
        Obtiene los niveles para una variable específica.
        
        Args:
            variable_name (str): Nombre de la variable.
        
        Returns:
            list: Niveles de la variable.
        """
        if variable_name == self.x1_name:
            return self.x1_levels
        elif variable_name == self.x2_name:
            return self.x2_levels
        elif variable_name == self.x3_name:
            return self.x3_levels
        else:
            raise ValueError(f"Variable desconocida: {variable_name}")

    def fit_model(self):
        """
        Ajusta el modelo de segundo orden completo a los datos.
        """
        formula = f'{self.y_name} ~ {self.x1_name} + {self.x2_name} + {self.x3_name} + ' \
                  f'I({self.x1_name}**2) + I({self.x2_name}**2) + I({self.x3_name}**2) + ' \
                  f'{self.x1_name}:{self.x2_name} + {self.x1_name}:{self.x3_name} + {self.x2_name}:{self.x3_name}'
        self.model = smf.ols(formula, data=self.data).fit()
        print("Modelo Completo:")
        print(self.model.summary())
        self.pareto_chart(self.model, "Pareto - Modelo Completo")

    def fit_simplified_model(self):
        """
        Ajusta el modelo de segundo orden a los datos, eliminando términos no significativos.
        """
        formula = f'{self.y_name} ~ {self.x1_name} + {self.x2_name} + ' \
                  f'I({self.x1_name}**2) + I({self.x2_name}**2) + I({self.x3_name}**2)'
        self.model_simplified = smf.ols(formula, data=self.data).fit()
        print("\nModelo Simplificado:")
        print(self.model_simplified.summary())
        self.pareto_chart(self.model_simplified, "Pareto - Modelo Simplificado")

    def optimize(self, method='Nelder-Mead'):
        """
        Encuentra los niveles óptimos de los factores para maximizar la respuesta usando el modelo simplificado.

        Args:
            method (str): Método de optimización a utilizar (por defecto, 'Nelder-Mead').
        """
        if self.model_simplified is None:
            print("Error: Ajusta el modelo simplificado primero.")
            return

        def objective_function(x):
            return -self.model_simplified.predict(pd.DataFrame({self.x1_name: [x[0]], self.x2_name: [x[1]], self.x3_name: [x[2]]}))

        bounds = [(-1, 1), (-1, 1), (-1, 1)]
        x0 = [0, 0, 0]

        self.optimized_results = minimize(objective_function, x0, method=method, bounds=bounds)
        self.optimal_levels = self.optimized_results.x
        
        # Convertir niveles óptimos de codificados a naturales
        optimal_levels_natural = [
            self.coded_to_natural(self.optimal_levels[0], self.x1_name),
            self.coded_to_natural(self.optimal_levels[1], self.x2_name),
            self.coded_to_natural(self.optimal_levels[2], self.x3_name)
        ]

        print(f"\nNiveles óptimos encontrados (basado en modelo simplificado):")
        print(f"{self.x1_name}: {optimal_levels_natural[0]:.4f} g/L")
        print(f"{self.x2_name}: {optimal_levels_natural[1]:.4f} g/L")
        print(f"{self.x3_name}: {optimal_levels_natural[2]:.4f} g/L")
        print(f"Valor máximo de {self.y_name}: {-self.optimized_results.fun:.4f}")

    def plot_rsm_individual(self, fixed_variable, fixed_level):
        """
        Genera un gráfico de superficie de respuesta (RSM) individual para una configuración específica.

        Args:
            fixed_variable (str): Nombre de la variable a mantener fija.
            fixed_level (float): Nivel al que se fija la variable (en unidades naturales).

        Returns:
            go.Figure: Objeto de figura de Plotly.
        """
        if self.model_simplified is None:
            print("Error: Ajusta el modelo simplificado primero.")
            return None

        # Determinar las variables que varían y sus niveles naturales
        varying_variables = [var for var in [self.x1_name, self.x2_name, self.x3_name] if var != fixed_variable]
        
        # Establecer los niveles naturales para las variables que varían
        x_natural_levels = self.get_levels(varying_variables[0])
        y_natural_levels = self.get_levels(varying_variables[1])

        # Crear una malla de puntos para las variables que varían (en unidades naturales)
        x_range_natural = np.linspace(x_natural_levels[0], x_natural_levels[-1], 100)
        y_range_natural = np.linspace(y_natural_levels[0], y_natural_levels[-1], 100)
        x_grid_natural, y_grid_natural = np.meshgrid(x_range_natural, y_range_natural)

        # Convertir la malla de variables naturales a codificadas
        x_grid_coded = self.natural_to_coded(x_grid_natural, varying_variables[0])
        y_grid_coded = self.natural_to_coded(y_grid_natural, varying_variables[1])

        # Crear un DataFrame para la predicción con variables codificadas
        prediction_data = pd.DataFrame({
            varying_variables[0]: x_grid_coded.flatten(),
            varying_variables[1]: y_grid_coded.flatten(),
        })
        prediction_data[fixed_variable] = self.natural_to_coded(fixed_level, fixed_variable)

        # Calcular los valores predichos
        z_pred = self.model_simplified.predict(prediction_data).values.reshape(x_grid_coded.shape)

        # 1. Identificar los dos factores que varían
        varying_variables = [var for var in [self.x1_name, self.x2_name, self.x3_name] if var != fixed_variable]

        # 2. Filtrar por el nivel de la variable fija (en codificado)
        fixed_level_coded = self.natural_to_coded(fixed_level, fixed_variable)
        subset_data = self.data[np.isclose(self.data[fixed_variable], fixed_level_coded)]

        # 3. Filtrar por niveles válidos en las variables que varían
        valid_levels = [-1, 0, 1]
        experiments_data = subset_data[
            subset_data[varying_variables[0]].isin(valid_levels) &
            subset_data[varying_variables[1]].isin(valid_levels)
        ]

        # Convertir coordenadas de experimentos a naturales
        experiments_x_natural = experiments_data[varying_variables[0]].apply(lambda x: self.coded_to_natural(x, varying_variables[0]))
        experiments_y_natural = experiments_data[varying_variables[1]].apply(lambda x: self.coded_to_natural(x, varying_variables[1]))

        # Crear el gráfico de superficie con variables naturales en los ejes y transparencia
        fig = go.Figure(data=[go.Surface(z=z_pred, x=x_grid_natural, y=y_grid_natural, colorscale='Viridis', opacity=0.7, showscale=True)])

        # --- Añadir cuadrícula a la superficie ---
        # Líneas en la dirección x
        for i in range(x_grid_natural.shape[0]):
            fig.add_trace(go.Scatter3d(
                x=x_grid_natural[i, :],
                y=y_grid_natural[i, :],
                z=z_pred[i, :],
                mode='lines',
                line=dict(color='gray', width=2),
                showlegend=False,
                hoverinfo='skip'
            ))
        # Líneas en la dirección y
        for j in range(x_grid_natural.shape[1]):
            fig.add_trace(go.Scatter3d(
                x=x_grid_natural[:, j],
                y=y_grid_natural[:, j],
                z=z_pred[:, j],
                mode='lines',
                line=dict(color='gray', width=2),
                showlegend=False,
                hoverinfo='skip'
            ))

        # --- Fin de la adición de la cuadrícula ---

        # Añadir los puntos de los experimentos en la superficie de respuesta con diferentes colores y etiquetas
        # Crear una lista de colores y etiquetas para los puntos
        colors = ['red', 'blue', 'green', 'purple', 'orange', 'yellow', 'cyan', 'magenta']
        point_labels = []
        for i, row in experiments_data.iterrows():
            point_labels.append(f"{row[self.y_name]:.2f}")

        fig.add_trace(go.Scatter3d(
            x=experiments_x_natural,
            y=experiments_y_natural,
            z=experiments_data[self.y_name],
            mode='markers+text',
            marker=dict(size=4, color=colors[:len(experiments_x_natural)]),  # Usar colores de la lista
            text=point_labels,  # Usar las etiquetas creadas
            textposition='top center',
            name='Experimentos'
        ))

        # Añadir etiquetas y título con variables naturales
        fig.update_layout(
            scene=dict(
                xaxis_title=varying_variables[0] + " (g/L)",
                yaxis_title=varying_variables[1] + " (g/L)",
                zaxis_title=self.y_name,
                # Puedes mantener la configuración de grid en los planos si lo deseas
                # xaxis=dict(showgrid=True, gridwidth=1, gridcolor='lightgray'),
                # yaxis=dict(showgrid=True, gridwidth=1, gridcolor='lightgray'),
                # zaxis=dict(showgrid=True, gridwidth=1, gridcolor='lightgray')
            ),
            title=f"{self.y_name} vs {varying_variables[0]} y {varying_variables[1]}<br><sup>{fixed_variable} fijo en {fixed_level:.2f} (g/L) (Modelo Simplificado)</sup>",
            height=800,
            width=1000,
            showlegend=True
        )
        return fig

    def generate_all_plots(self):
        """
        Genera todas las gráficas de RSM, variando la variable fija y sus niveles usando el modelo simplificado.
        """
        if self.model_simplified is None:
            print("Error: Ajusta el modelo simplificado primero.")
            return

        # Niveles naturales para graficar
        levels_to_plot_natural = {
            self.x1_name: self.x1_levels,
            self.x2_name: self.x2_levels,
            self.x3_name: self.x3_levels
        }

        # Generar y mostrar gráficos individuales
        for fixed_variable in [self.x1_name, self.x2_name, self.x3_name]:
            for level in levels_to_plot_natural[fixed_variable]:
                fig = self.plot_rsm_individual(fixed_variable, level)
                if fig is not None:
                    fig.show()

    def coded_to_natural(self, coded_value, variable_name):
        """Convierte un valor codificado a su valor natural."""
        levels = self.get_levels(variable_name)
        return levels[0] + (coded_value + 1) * (levels[-1] - levels[0]) / 2

    def natural_to_coded(self, natural_value, variable_name):
        """Convierte un valor natural a su valor codificado."""
        levels = self.get_levels(variable_name)
        return -1 + 2 * (natural_value - levels[0]) / (levels[-1] - levels[0])

    def pareto_chart(self, model, title):
        """
        Genera un diagrama de Pareto para los efectos estandarizados de un modelo,
        incluyendo la línea de significancia.

        Args:
            model: Modelo ajustado de statsmodels.
            title (str): Título del gráfico.
        """
        # Calcular los efectos estandarizados
        tvalues = model.tvalues[1:]  # Excluir la Intercept
        abs_tvalues = np.abs(tvalues)
        sorted_idx = np.argsort(abs_tvalues)[::-1]
        sorted_tvalues = abs_tvalues[sorted_idx]
        sorted_names = tvalues.index[sorted_idx]

        # Calcular el valor crítico de t para la línea de significancia
        alpha = 0.05  # Nivel de significancia
        dof = model.df_resid  # Grados de libertad residuales
        t_critical = t.ppf(1 - alpha / 2, dof)

        # Crear el diagrama de Pareto
        fig = px.bar(
            x=sorted_tvalues,
            y=sorted_names,
            orientation='h',
            labels={'x': 'Efecto Estandarizado', 'y': 'Término'},
            title=title
        )
        fig.update_yaxes(autorange="reversed")

        # Agregar la línea de significancia
        fig.add_vline(x=t_critical, line_dash="dot",
                      annotation_text=f"t crítico = {t_critical:.2f}",
                      annotation_position="bottom right")

        return fig

# Crear un DataFrame a partir de la tabla
data = pd.DataFrame({
    'Exp.': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15],
    'Glucosa': [-1, 1, -1, 1, -1, 1, -1, 1, 0, 0, 0, 0, 0, 0, 0],
    'Extracto de Levadura': [-1, -1, 1, 1, 0, 0, 0, 0, -1, 1, -1, 1, 0, 0, 0],
    'Triptófano': [0, 0, 0, 0, -1, -1, 1, 1, -1, -1, 1, 1, 0, 0, 0],
    'AIA (ppm)': [166.594, 177.557, 127.261, 147.573, 188.883, 224.527, 190.238, 226.483, 195.550, 149.493, 187.683, 148.621, 278.951, 297.238, 280.896]
})

# Crear una instancia de la clase RSM_BoxBehnken
rsm = RSM_BoxBehnken(data)

# Ajustar el modelo completo y generar el diagrama de Pareto
rsm.fit_model()

# Ajustar el modelo simplificado y generar el diagrama de Pareto
rsm.fit_simplified_model()

# Optimizar para encontrar los niveles óptimos (basado en el modelo simplificado)
rsm.optimize()

# Generar gráficos individuales de superficie de respuesta (9 en total)
#rsm.generate_all_plots()

# --- Interfaz de Gradio ---

def fit_and_optimize_model():
    rsm.fit_model()
    rsm.fit_simplified_model()
    rsm.optimize()
    model_summary = rsm.model_simplified.summary().as_html()
    pareto_fig = rsm.pareto_chart(rsm.model_simplified, "Pareto - Modelo Simplificado")
    return model_summary, pareto_fig, f"{rsm.x1_name}: {rsm.optimal_levels[0]:.4f} g/L, {rsm.x2_name}: {rsm.optimal_levels[1]:.4f} g/L, {rsm.x3_name}: {rsm.optimal_levels[2]:.4f} g/L, Valor máximo de {rsm.y_name}: {-rsm.optimized_results.fun:.4f}"

def generate_rsm_plot(fixed_variable, fixed_level):
    fig = rsm.plot_rsm_individual(fixed_variable, fixed_level)
    return fig

# Crear la interfaz de Gradio
with gr.Blocks() as demo:
    gr.Markdown("# Optimización de la producción de AIA usando RSM Box-Behnken")
    with gr.Row():
        with gr.Column():
            fit_button = gr.Button("Ajustar Modelo y Optimizar")
            model_summary_output = gr.HTML()
            pareto_chart_output = gr.Plot()
            optimization_results_output = gr.Textbox(label="Resultados de la Optimización")
        with gr.Column():
            gr.Markdown("## Generar Gráficos de Superficie de Respuesta")
            fixed_variable_input = gr.Dropdown(label="Variable Fija", choices=[rsm.x1_name, rsm.x2_name, rsm.x3_name], value=rsm.x1_name)
            fixed_level_input = gr.Slider(label="Nivel de Variable Fija", minimum=rsm.x1_levels[0], maximum=rsm.x1_levels[-1], step=0.01, value=rsm.x1_levels[1])
            plot_button = gr.Button("Generar Gráfico")
            rsm_plot_output = gr.Plot()

    fit_button.click(fit_and_optimize_model, inputs=[], outputs=[model_summary_output, pareto_chart_output, optimization_results_output])
    plot_button.click(generate_rsm_plot, inputs=[fixed_variable_input, fixed_level_input], outputs=rsm_plot_output)

    # Ejemplo de uso
    gr.Markdown("## Ejemplo de uso")
    gr.Markdown("1. Haz clic en 'Ajustar Modelo y Optimizar' para ajustar el modelo y encontrar los niveles óptimos de los factores.")
    gr.Markdown("2. Selecciona una variable fija y su nivel en los controles deslizantes.")
    gr.Markdown("3. Haz clic en 'Generar Gráfico' para generar un gráfico de superficie de respuesta.")

demo.launch()