Spaces:

neuronetties
/

bezrabot

Sleeping

App Files Files Community

Vilyam888 commited on Dec 25, 2024

Commit

46ff0e0

verified ·

1 Parent(s): 917f610

Upload app.py

Browse files

Files changed (1) hide show

app.py +97 -81

app.py CHANGED Viewed

@@ -1,90 +1,106 @@
 import tensorflow as tf
 from huggingface_hub import hf_hub_download
 from datasets import load_dataset
-import numpy as np
-import gradio as gr
-from sklearn.preprocessing import MinMaxScaler
-import pandas as pd
 # Загрузка модели
 model_path = hf_hub_download(repo_id='neuronetties/bezrabot', filename='bezrabotica.keras')
 model = tf.keras.models.load_model(model_path)
 # Загрузка и обработка датасета
 dataset = load_dataset("Vilyam888/data")
-data = pd.DataFrame(dataset['train'])
-columns_to_keep = [
-    'territory',
-    'num_economactivepopulation_all',
-    'employed_num_all',
-    'unemployed_num_all',
-    'eactivity_lvl',
-    'employment_lvl',
-    'unemployment_lvl',
-    'dis_unagegroup_30-39',
-    'dis_emagegroup_30-39',
-    'num_unagegroup_30-39',
-    'num_emagegroup_30-39',
-    'year'
-]
-data = data[columns_to_keep]
-data.fillna(data.mean(numeric_only=True), inplace=True)
-def clean_territory(value):
-    if isinstance(value, str) and len(value) > 100:
-        return value[:100]
-    return value
-data['territory'] = data['territory'].apply(clean_territory)
-data['territory'] = data['territory'].astype(str).str.strip()
-territory_mapping = {territory: idx for idx, territory in enumerate(data['territory'].unique())}
-data['territory'] = data['territory'].map(territory_mapping)
-scaler = MinMaxScaler()
-normalized_data = scaler.fit_transform(data.drop(['year'], axis=1))
-normalized_df = pd.DataFrame(normalized_data, columns=[col for col in data.columns if col != 'year'])
-normalized_df['year'] = data['year'].values
-def predict(territory, year, num_economactivepopulation_all, employed_num_all, unemployed_num_all,
-            eactivity_lvl, employment_lvl, dis_unagegroup_30_39, dis_emagegroup_30_39,
-            num_unagegroup_30_39, num_emagegroup_30_39):
-    input_data = pd.DataFrame({
-        'territory': [territory_mapping[territory]],
-        'num_economactivepopulation_all': [num_economactivepopulation_all],
-        'employed_num_all': [employed_num_all],
-        'unemployed_num_all': [unemployed_num_all],
-        'eactivity_lvl': [eactivity_lvl],
-        'employment_lvl': [employment_lvl],
-        'dis_unagegroup_30-39': [dis_unagegroup_30_39],
-        'dis_emagegroup_30-39': [dis_emagegroup_30_39],
-        'num_unagegroup_30-39': [num_unagegroup_30_39],
-        'num_emagegroup_30-39': [num_emagegroup_30_39]
-    })
-    input_normalized = scaler.transform(input_data)
-    input_sequence = np.expand_dims(input_normalized, axis=0)
-    prediction = model.predict(input_sequence)
-    return round(prediction[0][0], 2)
-interface = gr.Interface(
-    fn=predict,
-    inputs=[
-        gr.Textbox(label="Territory", placeholder="Введите название территории"),
-        gr.Number(label="Year"),
-        gr.Number(label="Economic Active Population"),
-        gr.Number(label="Employed Population"),
-        gr.Number(label="Unemployed Population"),
-        gr.Number(label="Economic Activity Level"),
-        gr.Number(label="Employment Level"),
-        gr.Number(label="Disunemployed Age Group 30-39"),
-        gr.Number(label="Disemployed Age Group 30-39"),
-        gr.Number(label="Unemployed Age Group 30-39"),
-        gr.Number(label="Employed Age Group 30-39")
-    ],
-    outputs=gr.Textbox(label="Predicted Value"),
-    title="Unemployment Prediction Model",
-    description="Введите значения для прогноза уровня безработицы."
-)
-interface.launch()

+import gradio as gr
+import numpy as np
+import pandas as pd
 import tensorflow as tf
 from huggingface_hub import hf_hub_download
 from datasets import load_dataset
 # Загрузка модели
 model_path = hf_hub_download(repo_id='neuronetties/bezrabot', filename='bezrabotica.keras')
 model = tf.keras.models.load_model(model_path)
 # Загрузка и обработка датасета
 dataset = load_dataset("Vilyam888/data")
+# Извлечение данных из датасета в DataFrame (обычно данные находятся в ключе 'train')
+df = pd.DataFrame(dataset['train'])
+# Удаление ненужных колонок
+df = df.drop(columns=['date_x', 'status', 'budget_x', 'country', 'revenue', 'orig_lang', 'orig_title', 'overview', 'crew', 'score'], errors='ignore')
+# Обработка жанров
+df['genre'] = df['genre'].fillna('')
+df['genre'] = df['genre'].str.split(',')
+# Убираем пробелы или нежелательные символы из жанров, устраняем дублирование
+all_genres = set()
+for genres_list in df['genre']:
+    all_genres.update([genre.strip() for genre in genres_list if genre.strip()])
+all_genres = sorted(all_genres)  # Сортируем для удобства
+# Создаем бинарные колонки для каждого жанра
+for genre in all_genres:
+    df[genre] = df['genre'].apply(lambda x: 1 if genre in x else 0)
+# Удаляем колонку 'genre', так как она больше не нужна
+df = df.drop(columns=['genre'])
+# Проверяем наличие столбца с названиями фильмов
+if 'names' not in df.columns:
+    df['names'] = [f"Фильм {i}" for i in range(len(df))]  # Генерируем фиктивные названия, если их нет
+# Функция для рекомендаций
+current_index = 0  # Глобальная переменная для отслеживания текущего индекса
+recommended_movies_list = []
+def recommend_movies(selected_genres):
+    global current_index, recommended_movies_list
+    if not selected_genres:
+        return "Выберите хотя бы один жанр."
+    # Создаем фильтр по выбранным жанрам с учетом схожести
+    filtered_df = df.copy()
+    filtered_df['genre_match'] = filtered_df[selected_genres].sum(axis=1)
+    filtered_df = filtered_df[filtered_df['genre_match'] > 0]
+    if filtered_df.empty:
+        return "Не найдено фильмов для выбранных жанров."
+    # Используем модель для предсказания (замените np.random.rand() на реальную модель)
+    probabilities = np.random.rand(len(filtered_df))  # Здесь должны быть предсказания от модели
+    # Сортируем фильмы по количеству совпадений жанров и вероятности
+    filtered_df['probability'] = probabilities
+    filtered_df = filtered_df.sort_values(by=['genre_match', 'probability'], ascending=[False, False])
+    # Получаем фильмы с текущего индекса
+    movies_to_display = filtered_df.iloc[current_index:current_index + 10]
+    current_index += 10  # Увеличиваем индекс
+    if not movies_to_display.empty:
+        recommended_movies_list = movies_to_display[['names']].to_dict(orient='records')
+        return "\n".join([f"{movie['names']}" for movie in recommended_movies_list])
+    else:
+        return "Больше фильмов нет."
+def reset_index():
+    global current_index, recommended_movies_list
+    current_index = 0
+    recommended_movies_list = []
+    return "Список фильмов обновлен."
+def remove_movie(movie_name):
+    global recommended_movies_list
+    recommended_movies_list = [movie for movie in recommended_movies_list if movie['names'] != movie_name]
+    return "\n".join([f"{movie['names']}" for movie in recommended_movies_list])
+# Интерфейс Gradio с дополнительными кнопками
+with gr.Blocks() as demo:
+    genre_selector = gr.CheckboxGroup(choices=all_genres, label="Выберите жанры")
+    result_output = gr.Textbox(label="Рекомендации")
+    with gr.Row():
+        recommend_button = gr.Button("Рекомендовать 10 фильмов")
+        reset_button = gr.Button("Сбросить список")
+    recommend_button.click(fn=recommend_movies, inputs=genre_selector, outputs=result_output)
+    reset_button.click(fn=reset_index, outputs=result_output)
+    for movie in recommended_movies_list:
+        remove_button = gr.Button(f"Уже смотрел: {movie['names']}")
+        remove_button.click(fn=remove_movie, inputs=[gr.Textbox(value=movie['names'], visible=False)], outputs=result_output)
+# Запуск интерфейса
+demo.launch()