Spaces:

neuronetties
/

bezrabot

Sleeping

App Files Files Community

Vilyam888 commited on Dec 25, 2024

Commit

61550d2

verified ·

1 Parent(s): 17e38c2

Upload app.py

Browse files

Files changed (1) hide show

app.py +83 -100

app.py CHANGED Viewed

@@ -1,106 +1,89 @@
-import gradio as gr
-import numpy as np
-import pandas as pd
 import tensorflow as tf
 from huggingface_hub import hf_hub_download
 from datasets import load_dataset
-# Загрузка модели
-model_path = hf_hub_download(repo_id='neuronetties/bezrabot', filename='bezrabotica.keras')
 model = tf.keras.models.load_model(model_path)
-# Загрузка и обработка датасета
-dataset = load_dataset("Vilyam888/data")
-# Извлечение данных из датасета в DataFrame (обычно данные находятся в ключе 'train')
-df = pd.DataFrame(dataset['train'])
-# Удаление ненужных колонок
-df = df.drop(columns=['date_x', 'status', 'budget_x', 'country', 'revenue', 'orig_lang', 'orig_title', 'overview', 'crew', 'score'], errors='ignore')
-# Обработка жанров
-df['genre'] = df['genre'].fillna('')
-df['genre'] = df['genre'].str.split(',')
-# Убираем пробелы или нежелательные символы из жанров, устраняем дублирование
-all_genres = set()
-for genres_list in df['genre']:
-    all_genres.update([genre.strip() for genre in genres_list if genre.strip()])
-all_genres = sorted(all_genres)  # Сортируем для удобства
-# Создаем бинарные колонки для каждого жанра
-for genre in all_genres:
-    df[genre] = df['genre'].apply(lambda x: 1 if genre in x else 0)
-# Удаляем колонку 'genre', так как она больше не нужна
-df = df.drop(columns=['genre'])
-# Проверяем наличие столбца с названиями фильмов
-if 'names' not in df.columns:
-    df['names'] = [f"Фильм {i}" for i in range(len(df))]  # Генерируем фиктивные названия, если их нет
-# Функция для рекомендаций
-current_index = 0  # Глобальная переменная для отслеживания текущего индекса
-recommended_movies_list = []
-def recommend_movies(selected_genres):
-    global current_index, recommended_movies_list
-    if not selected_genres:
-        return "Выберите хотя бы один жанр."
-    # Создаем фильтр по выбранным жанрам с учетом схожести
-    filtered_df = df.copy()
-    filtered_df['genre_match'] = filtered_df[selected_genres].sum(axis=1)
-    filtered_df = filtered_df[filtered_df['genre_match'] > 0]
-    if filtered_df.empty:
-        return "Не найдено фильмов для выбранных жанров."
-    # Используем модель для предсказания (замените np.random.rand() на реальную модель)
-    probabilities = np.random.rand(len(filtered_df))  # Здесь должны быть предсказания от модели
-    # Сортируем фильмы по количеству совпадений жанров и вероятности
-    filtered_df['probability'] = probabilities
-    filtered_df = filtered_df.sort_values(by=['genre_match', 'probability'], ascending=[False, False])
-    # Получаем фильмы с текущего индекса
-    movies_to_display = filtered_df.iloc[current_index:current_index + 10]
-    current_index += 10  # Увеличиваем индекс
-    if not movies_to_display.empty:
-        recommended_movies_list = movies_to_display[['names']].to_dict(orient='records')
-        return "\n".join([f"{movie['names']}" for movie in recommended_movies_list])
-    else:
-        return "Больше фильмов нет."
-def reset_index():
-    global current_index, recommended_movies_list
-    current_index = 0
-    recommended_movies_list = []
-    return "Список фильмов обновлен."
-def remove_movie(movie_name):
-    global recommended_movies_list
-    recommended_movies_list = [movie for movie in recommended_movies_list if movie['names'] != movie_name]
-    return "\n".join([f"{movie['names']}" for movie in recommended_movies_list])
-# Интерфейс Gradio с дополнительными кнопками
-with gr.Blocks() as demo:
-    genre_selector = gr.CheckboxGroup(choices=all_genres, label="Выберите жанры")
-    result_output = gr.Textbox(label="Рекомендации")
-    with gr.Row():
-        recommend_button = gr.Button("Рекомендовать 10 фильмов")
-        reset_button = gr.Button("Сбросить список")
-    recommend_button.click(fn=recommend_movies, inputs=genre_selector, outputs=result_output)
-    reset_button.click(fn=reset_index, outputs=result_output)
-    for movie in recommended_movies_list:
-        remove_button = gr.Button(f"Уже смотрел: {movie['names']}")
-        remove_button.click(fn=remove_movie, inputs=[gr.Textbox(value=movie['names'], visible=False)], outputs=result_output)
-# Запуск интерфейса
-demo.launch()

 import tensorflow as tf
 from huggingface_hub import hf_hub_download
 from datasets import load_dataset
+import numpy as np
+import gradio as gr
+from sklearn.preprocessing import MinMaxScaler
+import pandas as pd
+model_path = hf_hub_download(repo_id='neuronetties/bezrabotica', filename='BEZRAB.keras')
 model = tf.keras.models.load_model(model_path)
+dataset = load_dataset("Vilyam888/BEZRAB_DATA")
+data = pd.DataFrame(dataset['train'])
+columns_to_keep = [
+    'territory',
+    'num_economactivepopulation_all',
+    'employed_num_all',
+    'unemployed_num_all',
+    'eactivity_lvl',
+    'employment_lvl',
+    'unemployment_lvl',
+    'dis_unagegroup_30-39',
+    'dis_emagegroup_30-39',
+    'num_unagegroup_30-39',
+    'num_emagegroup_30-39',
+    'year'
+]
+data = data[columns_to_keep]
+data.fillna(data.mean(numeric_only=True), inplace=True)
+def clean_territory(value):
+    if isinstance(value, str) and len(value) > 100:
+        return value[:100]
+    return value
+data['territory'] = data['territory'].apply(clean_territory)
+data['territory'] = data['territory'].astype(str).str.strip()
+territory_mapping = {territory: idx for idx, territory in enumerate(data['territory'].unique())}
+data['territory'] = data['territory'].map(territory_mapping)
+scaler = MinMaxScaler()
+normalized_data = scaler.fit_transform(data.drop(['year'], axis=1))
+normalized_df = pd.DataFrame(normalized_data, columns=[col for col in data.columns if col != 'year'])
+normalized_df['year'] = data['year'].values
+def predict(territory, year, num_economactivepopulation_all, employed_num_all, unemployed_num_all,
+            eactivity_lvl, employment_lvl, dis_unagegroup_30_39, dis_emagegroup_30_39,
+            num_unagegroup_30_39, num_emagegroup_30_39):
+    input_data = pd.DataFrame({
+        'territory': [territory_mapping[territory]],
+        'num_economactivepopulation_all': [num_economactivepopulation_all],
+        'employed_num_all': [employed_num_all],
+        'unemployed_num_all': [unemployed_num_all],
+        'eactivity_lvl': [eactivity_lvl],
+        'employment_lvl': [employment_lvl],
+        'dis_unagegroup_30-39': [dis_unagegroup_30_39],
+        'dis_emagegroup_30-39': [dis_emagegroup_30_39],
+        'num_unagegroup_30-39': [num_unagegroup_30_39],
+        'num_emagegroup_30-39': [num_emagegroup_30_39]
+    })
+    input_normalized = scaler.transform(input_data)
+    input_sequence = np.expand_dims(input_normalized, axis=0)
+    prediction = model.predict(input_sequence)
+    return round(prediction[0][0], 2)
+interface = gr.Interface(
+    fn=predict,
+    inputs=[
+        gr.Textbox(label="Territory", placeholder="Введите название территории"),
+        gr.Number(label="Year"),
+        gr.Number(label="Economic Active Population"),
+        gr.Number(label="Employed Population"),
+        gr.Number(label="Unemployed Population"),
+        gr.Number(label="Economic Activity Level"),
+        gr.Number(label="Employment Level"),
+        gr.Number(label="Disunemployed Age Group 30-39"),
+        gr.Number(label="Disemployed Age Group 30-39"),
+        gr.Number(label="Unemployed Age Group 30-39"),
+        gr.Number(label="Employed Age Group 30-39")
+    ],
+    outputs=gr.Textbox(label="Predicted Value"),
+    title="Unemployment Prediction Model",
+    description="Введите значения для прогноза уровня безработицы."
+)
+interface.launch()