leaderboard

Running on CPU Upgrade

nan commited on Oct 15, 2024

Commit

4791ac5

1 Parent(s): ba13e25

refactor: refactor the envs

Files changed (3) hide show

app.py CHANGED Viewed

@@ -7,14 +7,13 @@ from src.about import (
 )
 from src.benchmarks import (
     qa_benchmark_dict,
-    long_doc_benchmark_dict,
-    METRIC_LIST
 )
 from src.display.css_html_js import custom_css
 from src.envs import (
     API,
     EVAL_RESULTS_PATH,
-    REPO_ID, DEFAULT_METRIC_QA, DEFAULT_METRIC_LONG_DOC
 )
 from src.loaders import (
     load_eval_results

 )
 from src.benchmarks import (
     qa_benchmark_dict,
+    long_doc_benchmark_dict
 )
 from src.display.css_html_js import custom_css
 from src.envs import (
     API,
     EVAL_RESULTS_PATH,
+    REPO_ID, DEFAULT_METRIC_QA, DEFAULT_METRIC_LONG_DOC, METRIC_LIST
 )
 from src.loaders import (
     load_eval_results

src/benchmarks.py CHANGED Viewed

@@ -3,38 +3,7 @@ from enum import Enum
 from air_benchmark.tasks.tasks import BenchmarkTable
-METRIC_LIST = [
-    "ndcg_at_1",
-    "ndcg_at_3",
-    "ndcg_at_5",
-    "ndcg_at_10",
-    "ndcg_at_100",
-    "ndcg_at_1000",
-    "map_at_1",
-    "map_at_3",
-    "map_at_5",
-    "map_at_10",
-    "map_at_100",
-    "map_at_1000",
-    "recall_at_1",
-    "recall_at_3",
-    "recall_at_5",
-    "recall_at_10",
-    "recall_at_100",
-    "recall_at_1000",
-    "precision_at_1",
-    "precision_at_3",
-    "precision_at_5",
-    "precision_at_10",
-    "precision_at_100",
-    "precision_at_1000",
-    "mrr_at_1",
-    "mrr_at_3",
-    "mrr_at_5",
-    "mrr_at_10",
-    "mrr_at_100",
-    "mrr_at_1000"
-]
 def get_safe_name(name: str):

 from air_benchmark.tasks.tasks import BenchmarkTable
+from src.envs import METRIC_LIST
 def get_safe_name(name: str):

src/envs.py CHANGED Viewed

@@ -33,3 +33,35 @@ BENCHMARK_VERSION_LIST = [
 LATEST_BENCHMARK_VERSION = BENCHMARK_VERSION_LIST[-1]
 DEFAULT_METRIC_QA = "ndcg_at_10"
 DEFAULT_METRIC_LONG_DOC = "recall_at_10"

 LATEST_BENCHMARK_VERSION = BENCHMARK_VERSION_LIST[-1]
 DEFAULT_METRIC_QA = "ndcg_at_10"
 DEFAULT_METRIC_LONG_DOC = "recall_at_10"
+METRIC_LIST = [
+    "ndcg_at_1",
+    "ndcg_at_3",
+    "ndcg_at_5",
+    "ndcg_at_10",
+    "ndcg_at_100",
+    "ndcg_at_1000",
+    "map_at_1",
+    "map_at_3",
+    "map_at_5",
+    "map_at_10",
+    "map_at_100",
+    "map_at_1000",
+    "recall_at_1",
+    "recall_at_3",
+    "recall_at_5",
+    "recall_at_10",
+    "recall_at_100",
+    "recall_at_1000",
+    "precision_at_1",
+    "precision_at_3",
+    "precision_at_5",
+    "precision_at_10",
+    "precision_at_100",
+    "precision_at_1000",
+    "mrr_at_1",
+    "mrr_at_3",
+    "mrr_at_5",
+    "mrr_at_10",
+    "mrr_at_100",
+    "mrr_at_1000"
+]