Spaces:

Vikhrmodels
/

DOoM-lb

Running

App Files Files Community

Anonumous commited on Apr 20

Commit

b0cab2d

1 Parent(s): 9c4c35f

Refactor build_leadearboard_df function to integrate data conversion from Small Shlepa format to DeathMath; enhance error handling and logging for model data processing

Browse files

Files changed (1) hide show

src/leaderboard/build_leaderboard.py +91 -14

src/leaderboard/build_leaderboard.py CHANGED Viewed

@@ -140,26 +140,25 @@ def build_leadearboard_df():
                         with open(os.path.join(external_dir, file), "r", encoding="utf-8") as f:
                             data = json.load(f)
-                            # Проверяем наличие необходимых полей
-                            model_name = data.get("model_name", data.get("model", ""))
-                            if not model_name:
-                                logging.error(f"Failed to parse {file}: 'model_name' not found")
-                                continue
-                            score = data.get("score", None)
-                            if score is None:
-                                logging.error(f"Failed to parse {file}: 'score' not found")
                                 continue
                             # Стандартизируем данные
                             model_data = {
                                 "model": model_name,
-                                "score": float(score),
-                                "math_score": float(data.get("math_score", 0.0)),
-                                "physics_score": float(data.get("physics_score", 0.0)),
-                                "total_tokens": int(data.get("total_tokens", 0)),
-                                "evaluation_time": float(data.get("evaluation_time", 0.0)),
-                                "system_prompt": data.get("system_prompt", "Вы - полезный помощник по математике и физике. Ответьте на русском языке.")
                             }
                             # Определяем, является ли это лучшим результатом для данной модели
@@ -213,3 +212,81 @@ def build_leadearboard_df():
         df[numeric_cols] = df[numeric_cols].round(3)
     return df

                         with open(os.path.join(external_dir, file), "r", encoding="utf-8") as f:
                             data = json.load(f)
+                            # Конвертируем данные из любого формата в формат DeathMath
+                            converted_data = convert_old_format_to_deatmath(data)
+                            # Проверяем наличие необходимых полей после конвертации
+                            model_name = converted_data.get("model_name", converted_data.get("model", ""))
+                            if not model_name:
+                                logging.error(f"Failed to parse {file}: 'model_name' not found after conversion")
                                 continue
                             # Стандартизируем данные
                             model_data = {
                                 "model": model_name,
+                                "score": float(converted_data.get("score", 0.0)),
+                                "math_score": float(converted_data.get("math_score", 0.0)),
+                                "physics_score": float(converted_data.get("physics_score", 0.0)),
+                                "total_tokens": int(converted_data.get("total_tokens", 0)),
+                                "evaluation_time": float(converted_data.get("evaluation_time", 0.0)),
+                                "system_prompt": converted_data.get("system_prompt",
+                                    "Вы - полезный помощник по математике и физике. Ответьте на русском языке.")
                             }
                             # Определяем, является ли это лучшим результатом для данной модели
         df[numeric_cols] = df[numeric_cols].round(3)
     return df
+def convert_old_format_to_deatmath(data):
+    """
+    Конвертирует данные из старого формата Small Shlepa в формат DeathMath
+    Args:
+        data (dict): Данные модели в старом формате
+    Returns:
+        dict: Конвертированные данные в формате DeathMath
+    """
+    # Проверяем, возможно это файл уже в формате DeathMath
+    if "score" in data:
+        return data
+    # Проверяем формат Small Shlepa с полями: musicmc, moviesmc, booksmc, lawmc, mmluproru
+    small_shlepa_fields = ["musicmc", "moviesmc", "booksmc", "lawmc", "mmluproru", "model"]
+    is_shlepa_format = any(field in data for field in small_shlepa_fields)
+    if is_shlepa_format:
+        logging.info(f"Конвертация модели из формата Small Shlepa в формат DeathMath: {data.get('model', 'Unknown')}")
+        # Конвертируем данные с примерным соответствием:
+        # math_score = среднее(musicmc, booksmc, mmluproru)
+        # physics_score = lawmc или moviesmc
+        math_score = 0.0
+        math_components = 0
+        if "musicmc" in data and data["musicmc"] is not None:
+            math_score += float(data["musicmc"])
+            math_components += 1
+        if "booksmc" in data and data["booksmc"] is not None:
+            math_score += float(data["booksmc"])
+            math_components += 1
+        if "mmluproru" in data and data["mmluproru"] is not None:
+            math_score += float(data["mmluproru"])
+            math_components += 1
+        if math_components > 0:
+            math_score /= math_components
+        # Для physics_score используем значение lawmc или moviesmc (что доступно)
+        physics_score = 0.0
+        if "lawmc" in data and data["lawmc"] is not None:
+            physics_score = float(data["lawmc"])
+        elif "moviesmc" in data and data["moviesmc"] is not None:
+            physics_score = float(data["moviesmc"])
+        # Общий скор - среднее арифметическое
+        avg_score = (math_score + physics_score) / 2 if math_score or physics_score else 0.0
+        converted_data = {
+            "model_name": data.get("model", "Unknown"),
+            "score": avg_score,
+            "math_score": math_score,
+            "physics_score": physics_score,
+            "total_tokens": int(data.get("total_tokens", 0)),
+            "evaluation_time": float(data.get("evaluation_time", 0.0)),
+            "system_prompt": data.get("system_prompt",
+                "Вы - полезный помощник по математике и физике. Ответьте на русском языке.")
+        }
+        return converted_data
+    # Если формат неизвестен, возвращаем стандартный шаблон
+    logging.warning(f"Неизвестный формат данных модели, использую шаблон")
+    return {
+        "model_name": data.get("model_name", data.get("model", "Unknown")),
+        "score": 0.0,
+        "math_score": 0.0,
+        "physics_score": 0.0,
+        "total_tokens": 0,
+        "evaluation_time": 0.0,
+        "system_prompt": "Вы - полезный помощник по математике и физике. Ответьте на русском языке."
+    }