Spaces:

safe-challenge
/

leaderboard-public

Running

App Files Files Community

kt-test-account commited on Apr 23

Commit

1ed31e5

1 Parent(s): 1948bd1

add aug heatmaps

Browse files

Files changed (6) hide show

app.py +11 -4
metric.py +49 -16
process_data.py +51 -25
task2.csv +11 -11
task3.csv +10 -10
updated.txt +1 -1

app.py CHANGED Viewed

@@ -178,7 +178,7 @@ def make_acc(results):
 @st.cache_data
-def make_heatmap(results,label = "generated", symbol = "🤖"):
     # Assuming df is your wide-format DataFrame (models as rows, datasets as columns)
@@ -186,6 +186,10 @@ def make_heatmap(results,label = "generated", symbol = "🤖"):
     team_order = results.index.tolist()
     df_long = df_long.loc[:,[c for c in df_long.columns if c.startswith(label) and "accuracy" not in c]]
     df_long.columns = [c.replace(f"{label}_","") for c in df_long.columns]
     df_long = df_long.reset_index().melt(id_vars='team', var_name='source', value_name='acc')
     # df_long.rename(columns={'index': 'source'}, inplace=True)
     # df_long
@@ -216,17 +220,20 @@ def make_heatmap(results,label = "generated", symbol = "🤖"):
     chart = (heatmap + text).properties(
         width=600,
         height=500,
-        title=f'Accuracy on {symbol} {label} sources heatmap'
     )
     return chart
 def get_heatmaps(temp):
-     h1 = make_heatmap(temp, "generated", symbol = "🤖")
-     h2 = make_heatmap(temp, "pristine", symbol = "🧑‍🎤")
      st.altair_chart(h1, use_container_width=True)
      st.altair_chart(h2, use_container_width=True)
 def make_plots_for_task(task,split,best_only):
     # results = load_results(task, best_only=best_only)

 @st.cache_data
+def make_heatmap(results,label = "generated", symbol = "🤖", title = ""):
     # Assuming df is your wide-format DataFrame (models as rows, datasets as columns)
     team_order = results.index.tolist()
     df_long = df_long.loc[:,[c for c in df_long.columns if c.startswith(label) and "accuracy" not in c]]
     df_long.columns = [c.replace(f"{label}_","") for c in df_long.columns]
+    if "none" in df_long.columns:
+        df_long = df_long.drop(columns=["none"])
     df_long = df_long.reset_index().melt(id_vars='team', var_name='source', value_name='acc')
     # df_long.rename(columns={'index': 'source'}, inplace=True)
     # df_long
     chart = (heatmap + text).properties(
         width=600,
         height=500,
+        title=title
     )
     return chart
 def get_heatmaps(temp):
+     h1 = make_heatmap(temp, "generated", symbol = "🤖", title = "Accuracy by 🤖 geneated source")
+     h2 = make_heatmap(temp, "pristine", symbol = "🧑‍🎤", title = "Accuracy by 🧑‍🎤 pristine source")
      st.altair_chart(h1, use_container_width=True)
      st.altair_chart(h2, use_container_width=True)
+     if temp.columns.str.contains("aug", case=False).any():
+        h3 = make_heatmap(temp, "aug", symbol="🛠️", title = "Accuracy by 🛠️ augmentation method on 🤖 geneated data only")
+        st.altair_chart(h3, use_container_width=True)
 def make_plots_for_task(task,split,best_only):
     # results = load_results(task, best_only=best_only)

metric.py CHANGED Viewed

@@ -1,9 +1,7 @@
 import pandas as pd
 from huggingface_hub import hf_hub_download
-import json
-def _metric(solution_df,submission_df, mode = "top_level", admin = False):
     """
     This function calculates the accuracy of the generated predictions.
@@ -32,41 +30,76 @@ def _metric(solution_df,submission_df, mode = "top_level", admin = False):
     cols = ["split","pred", source_col]
     solution_df["correct"] = solution_df["pred"] == solution_df["submission_pred"]
-    accuracy = solution_df.groupby(cols)["correct"].mean().to_frame("accuracy").reset_index()
-    accuracy["score_name"] = accuracy["pred"] +"_"+ accuracy[source_col]
     evaluation = {}
     split = "public"
-    temp = accuracy.query(f"split=='{split}'")
-    scores_by_source = temp.set_index("score_name")["accuracy"].sort_index()
-    scores_by_source["generated_accuracy"] = temp.query("pred=='generated'")["accuracy"].mean()
-    scores_by_source["pristine_accuracy"] = temp.query("pred=='pristine'")["accuracy"].mean()
-    scores_by_source["balanced_accuracy"] = (scores_by_source["generated_accuracy"] + scores_by_source["pristine_accuracy"])/2.
     if mode == "top_level":
         scores_to_save = ["generated_accuracy", "pristine_accuracy", "balanced_accuracy"]
         evaluation[f"{split}_score"] = scores_by_source.loc[scores_to_save].to_dict()
     else:
         evaluation[f"{split}_score"] = scores_by_source.to_dict()
     split = "private"
     # private has everything
-    temp = accuracy
-    scores_by_source = temp.set_index("score_name")["accuracy"].sort_index()
-    scores_by_source["generated_accuracy"] = temp.query("pred=='generated'")["accuracy"].mean()
-    scores_by_source["pristine_accuracy"] = temp.query("pred=='pristine'")["accuracy"].mean()
-    scores_by_source["balanced_accuracy"] = (scores_by_source["generated_accuracy"] + scores_by_source["pristine_accuracy"])/2.
     if mode == "top_level":
         scores_to_save = ["generated_accuracy", "pristine_accuracy", "balanced_accuracy"]
         evaluation[f"{split}_score"] = scores_by_source.loc[scores_to_save].to_dict()
     else:
         evaluation[f"{split}_score"] = scores_by_source.to_dict()

 import pandas as pd
 from huggingface_hub import hf_hub_download
+def _metric(solution_df,submission_df, mode = "top_level", admin = False, additional_columns = None):
     """
     This function calculates the accuracy of the generated predictions.
     cols = ["split","pred", source_col]
     solution_df["correct"] = solution_df["pred"] == solution_df["submission_pred"]
+    acc_all = (
+        solution_df.groupby(cols)["correct"].mean().reset_index()
+                .rename(columns={"correct": "accuracy"})
+    )
+    acc_all["score_name"] = acc_all["pred"] + "_" + acc_all[source_col]
+    if additional_columns == None:
+        additional_columns = []
+    if not admin:
+        # annonomize
+        for c in additional_columns:
+            vals_lookup = pd.Series({v:f"{c[:1]}_{i:02}" for i,v in enumerate(sorted(solution_df[c].unique()))})
+            solution_df.loc[:,c]  = vals_lookup.loc[solution_df.loc[:,c].values].values
+    def acc_by_additional_columns(temp, col):
+        temp = temp.groupby(col)["correct"].mean().reset_index().rename(columns={"correct": "accuracy"})
+        temp["score_name"] = col[:3] + "_" + temp[col]
+        return temp.set_index("score_name")["accuracy"].sort_index()
+    def acc_by_source(temp):
+        scores_by_source = temp.set_index("score_name")["accuracy"].sort_index()
+        scores_by_source["generated_accuracy"] = temp.query("pred=='generated'")["accuracy"].mean()
+        scores_by_source["pristine_accuracy"] = temp.query("pred=='pristine'")["accuracy"].mean()
+        scores_by_source["balanced_accuracy"] = (scores_by_source["generated_accuracy"] + scores_by_source["pristine_accuracy"])/2.
+        return scores_by_source
     evaluation = {}
     split = "public"
+    temp = acc_all.query(f"split=='{split}'")
+    scores_by_source = acc_by_source(temp)
+    # scores_by_source = temp.set_index("score_name")["accuracy"].sort_index()
+    # scores_by_source["generated_accuracy"] = temp.query("pred=='generated'")["accuracy"].mean()
+    # scores_by_source["pristine_accuracy"] = temp.query("pred=='pristine'")["accuracy"].mean()
+    # scores_by_source["balanced_accuracy"] = (scores_by_source["generated_accuracy"] + scores_by_source["pristine_accuracy"])/2.
     if mode == "top_level":
         scores_to_save = ["generated_accuracy", "pristine_accuracy", "balanced_accuracy"]
         evaluation[f"{split}_score"] = scores_by_source.loc[scores_to_save].to_dict()
     else:
+        out = [scores_by_source]
+        for col in additional_columns:
+            out.append(acc_by_additional_columns(solution_df.query(f"split=='{split}'"),col))
+        scores_by_source = pd.concat(out)
         evaluation[f"{split}_score"] = scores_by_source.to_dict()
     split = "private"
     # private has everything
+    temp = acc_all
+    scores_by_source = acc_by_source(temp)
+    # scores_by_source = temp.set_index("score_name")["accuracy"].sort_index()
+    # scores_by_source["generated_accuracy"] = temp.query("pred=='generated'")["accuracy"].mean()
+    # scores_by_source["pristine_accuracy"] = temp.query("pred=='pristine'")["accuracy"].mean()
+    # scores_by_source["balanced_accuracy"] = (scores_by_source["generated_accuracy"] + scores_by_source["pristine_accuracy"])/2.
     if mode == "top_level":
         scores_to_save = ["generated_accuracy", "pristine_accuracy", "balanced_accuracy"]
         evaluation[f"{split}_score"] = scores_by_source.loc[scores_to_save].to_dict()
     else:
+        out = [scores_by_source]
+        for col in additional_columns:
+            out.append(acc_by_additional_columns(solution_df,col))
+        scores_by_source = pd.concat(out)
         evaluation[f"{split}_score"] = scores_by_source.to_dict()

process_data.py CHANGED Viewed

@@ -19,6 +19,7 @@ def get_submission(f):
     return submissions
 # def get_submissions_file(f):
 #     submission_df = pd.read_csv(f).set_index("id")
 #     if isinstance(submission_df.iloc[0]["score"],str):
@@ -31,11 +32,14 @@ def get_submissions_file(f):
     if isinstance(submission_df.iloc[0]["score"], str):
         submission_df.loc[:, "score"] = submission_df.loc[:, "score"].apply(
             lambda a: float(
-                np.array(json.loads(re.sub(r"\b(\d+)\.(?!\d)", r"\1.0", a))).squeeze() if isinstance(a,str) else float("nan")
             )
         )
     return submission_df
 def load_results(local_dir):
     team_file_name = "teams.json"
     team_info = pd.read_json(Path(local_dir) / team_file_name).T
@@ -73,7 +77,7 @@ def load_results(local_dir):
 def compute_metrics(submissions, local_dir, admin=True):
-    submissions=submissions.query("status==3.0")
     # if not admin:
     #     selected_by_team = submissions.groupby("team")["selected"].sum()
@@ -89,7 +93,15 @@ def compute_metrics(submissions, local_dir, admin=True):
     for i, row in submissions.T.items():
         # r = pd.read_csv(row["submission_files"]).set_index("id")
         r = get_submissions_file(row["submission_files"])
-        eval = _metric(solution_df, r, mode="detailed", admin=admin)
         for m in ["private_score", "public_score"]:
             for f in fields:
                 eval[m][f] = row[f]
@@ -130,35 +142,52 @@ def compute_metrics(submissions, local_dir, admin=True):
         results[m] = results[m].set_index("submission" if admin else "team")
-    fields_to_merge = ['generated_accuracy', 'pristine_accuracy', 'balanced_accuracy', 'total_time', 'fail_rate']
-    submissions = pd.concat([submissions.set_index("submission_id"),
-                             results["private_score"].reset_index().set_index("submission_id").loc[:,fields_to_merge]],axis = 1).reset_index()
     return results, submissions
-status_lookup="NA,QUEUED,PROCESSING,SUCCESS,FAILED".split(",")
-def process_data(path,save_path):
     submissions = load_results(path)
     submissions["datetime"] = pd.DatetimeIndex(submissions["datetime"])
     submissions["date"] = submissions["datetime"].dt.date
-    submissions["status_reason"] = submissions["status"].astype(int).apply(lambda a: status_lookup[a])
-    submissions.loc[:,["submission_id","datetime","date","status","status_reason"]].to_csv(save_path + "_submissions.csv")
-    results,submissions = compute_metrics(submissions, path, admin=False)
-    cols_to_drop = ["team_id","submission_id","submission_repo","submission"]
-    results["public_score"].drop(columns =cols_to_drop).to_csv(save_path+".csv")
-if __name__=="__main__":
-    process_data("comp_data_task1","task1")
-    process_data("comp_data_task2","task2")
-    process_data("comp_data_task3","task3")
-    process_data("comp_data_practice","practice")
     # from datetime import date
@@ -168,19 +197,16 @@ if __name__=="__main__":
     # # Print date in YYYY-MM-DD format
     # print("Today's date:", today)
     from datetime import datetime
     import pytz
     # Define EST timezone
-    est = pytz.timezone('US/Eastern')
     # Get current time in EST
     est_time = datetime.now(est)
     # Print current date and time in EST
     today = f"Updated on {est_time.strftime('%Y-%m-%d %H:%M:%S')} EST"
-    with open("updated.txt","w") as f:
         f.write(str(today))

     return submissions
 # def get_submissions_file(f):
 #     submission_df = pd.read_csv(f).set_index("id")
 #     if isinstance(submission_df.iloc[0]["score"],str):
     if isinstance(submission_df.iloc[0]["score"], str):
         submission_df.loc[:, "score"] = submission_df.loc[:, "score"].apply(
             lambda a: float(
+                np.array(json.loads(re.sub(r"\b(\d+)\.(?!\d)", r"\1.0", a))).squeeze()
+                if isinstance(a, str)
+                else float("nan")
             )
         )
     return submission_df
 def load_results(local_dir):
     team_file_name = "teams.json"
     team_info = pd.read_json(Path(local_dir) / team_file_name).T
 def compute_metrics(submissions, local_dir, admin=True):
+    submissions = submissions.query("status==3.0")
     # if not admin:
     #     selected_by_team = submissions.groupby("team")["selected"].sum()
     for i, row in submissions.T.items():
         # r = pd.read_csv(row["submission_files"]).set_index("id")
         r = get_submissions_file(row["submission_files"])
+        eval = _metric(
+            solution_df,
+            r,
+            mode="detailed",
+            admin=admin,
+            additional_columns=(
+                ["augmentation"] if "augmentation" in solution_df.columns else None
+            ),
+        )
         for m in ["private_score", "public_score"]:
             for f in fields:
                 eval[m][f] = row[f]
         results[m] = results[m].set_index("submission" if admin else "team")
+    fields_to_merge = [
+        "generated_accuracy",
+        "pristine_accuracy",
+        "balanced_accuracy",
+        "total_time",
+        "fail_rate",
+    ]
+    submissions = pd.concat(
+        [
+            submissions.set_index("submission_id"),
+            results["private_score"]
+            .reset_index()
+            .set_index("submission_id")
+            .loc[:, fields_to_merge],
+        ],
+        axis=1,
+    ).reset_index()
     return results, submissions
+status_lookup = "NA,QUEUED,PROCESSING,SUCCESS,FAILED".split(",")
+def process_data(path, save_path):
     submissions = load_results(path)
     submissions["datetime"] = pd.DatetimeIndex(submissions["datetime"])
     submissions["date"] = submissions["datetime"].dt.date
+    submissions["status_reason"] = (
+        submissions["status"].astype(int).apply(lambda a: status_lookup[a])
+    )
+    submissions.loc[
+        :, ["submission_id", "datetime", "date", "status", "status_reason"]
+    ].to_csv(save_path + "_submissions.csv")
+    results, submissions = compute_metrics(submissions, path, admin=False)
+    cols_to_drop = ["team_id", "submission_id", "submission_repo", "submission"]
+    results["public_score"].drop(columns=cols_to_drop).to_csv(save_path + ".csv")
+if __name__ == "__main__":
+    process_data("comp_data_task1", "task1")
+    process_data("comp_data_task2", "task2")
+    process_data("comp_data_task3", "task3")
+    process_data("comp_data_practice", "practice")
     # from datetime import date
     # # Print date in YYYY-MM-DD format
     # print("Today's date:", today)
     from datetime import datetime
     import pytz
     # Define EST timezone
+    est = pytz.timezone("US/Eastern")
     # Get current time in EST
     est_time = datetime.now(est)
     # Print current date and time in EST
     today = f"Updated on {est_time.strftime('%Y-%m-%d %H:%M:%S')} EST"
+    with open("updated.txt", "w") as f:
         f.write(str(today))

task2.csv CHANGED Viewed

@@ -1,11 +1,11 @@
-team,generated_g_02,generated_g_04,generated_g_05,generated_g_06,generated_g_09,generated_g_10,generated_g_11,pristine_p_00,pristine_p_01,pristine_p_02,pristine_p_05,pristine_p_09,pristine_p_10,pristine_p_11,pristine_p_16,pristine_p_18,pristine_p_20,generated_accuracy,pristine_accuracy,balanced_accuracy,total_time,fail_rate
-baseline-2,0.8789473684210526,0.9394736842105263,0.6868421052631579,0.9394736842105263,0.9078947368421053,0.9263157894736842,0.8236842105263158,0.9,0.66,0.895,0.915,0.935,0.68,0.815,0.85,0.88,0.945,0.8718045112781956,0.8474999999999999,0.8596522556390978,1558.1854865550995,0.0
-baseline-1,0.9210526315789473,0.9868421052631579,0.7684210526315789,0.9289473684210526,0.9763157894736842,0.9815789473684211,0.9157894736842105,0.96,0.36,0.955,0.815,1.0,0.69,0.29,0.635,0.885,0.955,0.925563909774436,0.7545,0.8400319548872179,2615.167044878006,0.008583690987124463
-ISPL,0.7157894736842105,0.868421052631579,0.48947368421052634,0.9578947368421052,0.8026315789473685,0.7526315789473684,0.7552631578947369,0.995,0.505,0.995,0.83,0.995,0.775,1.0,0.795,0.97,0.955,0.7631578947368421,0.8815,0.822328947368421,119.12918734550453,0.0
-Anon_Peking,0.9078947368421053,0.6605263157894737,0.6868421052631579,0.9210526315789473,0.881578947368421,0.868421052631579,0.5736842105263158,1.0,0.26,0.75,0.575,0.86,0.73,0.955,0.89,0.91,0.995,0.7857142857142856,0.7925,0.7891071428571428,256.57893514633156,0.0
-viper-purdue,0.7447368421052631,0.15526315789473685,0.05526315789473684,0.6736842105263158,0.5842105263157895,0.7578947368421053,0.18421052631578946,1.0,0.975,0.995,0.985,0.94,0.965,0.99,0.94,0.99,0.99,0.45075187969924807,0.977,0.713875939849624,454.11514687538124,0.0
-JAIST-HIS,0.46842105263157896,0.9473684210526315,0.9421052631578948,0.4394736842105263,0.6210526315789474,0.9842105263157894,0.3105263157894737,0.645,0.7,0.98,0.645,0.61,0.99,0.12,0.845,0.78,0.93,0.6733082706766919,0.7245,0.6989041353383459,602.246269226074,0.0
-csun22,0.4842105263157895,0.618421052631579,0.7631578947368421,0.4710526315789474,0.3763157894736842,0.32105263157894737,0.47368421052631576,0.59,0.995,0.92,0.535,0.755,0.61,0.405,0.485,0.53,0.4,0.5011278195488722,0.6225,0.5618139097744361,112.02455472946144,0.0
-DMF,0.95,0.8842105263157894,0.9578947368421052,0.9868421052631579,0.8710526315789474,0.9736842105263158,0.9921052631578947,0.26,0.0,0.005,0.05,0.45,0.08,0.01,0.225,0.265,0.05,0.9451127819548872,0.1395,0.5423063909774436,94.64070606231667,0.0
-safe-test,0.49736842105263157,0.4710526315789474,0.4789473684210526,0.4842105263157895,0.5236842105263158,0.5026315789473684,0.49473684210526314,0.5,0.455,0.495,0.495,0.505,0.515,0.505,0.535,0.51,0.51,0.4932330827067669,0.5025,0.49786654135338343,200.45346903800942,0.0
-gylin,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,-1,1.0

+team,generated_g_02,generated_g_04,generated_g_05,generated_g_06,generated_g_09,generated_g_10,generated_g_11,pristine_p_00,pristine_p_01,pristine_p_02,pristine_p_05,pristine_p_09,pristine_p_10,pristine_p_11,pristine_p_16,pristine_p_18,pristine_p_20,generated_accuracy,pristine_accuracy,balanced_accuracy,aug_a_00,aug_a_01,aug_a_02,aug_a_03,aug_a_04,aug_a_05,aug_a_06,aug_a_07,aug_a_08,aug_a_09,aug_a_10,aug_a_11,aug_a_12,aug_a_13,aug_a_14,aug_a_15,aug_a_16,aug_a_17,aug_a_18,aug_a_19,total_time,fail_rate
+baseline-2,0.8789473684210526,0.9394736842105263,0.6868421052631579,0.9394736842105263,0.9078947368421053,0.9263157894736842,0.8236842105263158,0.9,0.66,0.895,0.915,0.935,0.68,0.815,0.85,0.88,0.945,0.8718045112781956,0.8474999999999999,0.8596522556390978,0.9214285714285714,0.9785714285714285,0.9928571428571429,0.8714285714285714,0.8857142857142857,0.8571428571428571,0.9142857142857143,0.45714285714285713,0.8475,0.8142857142857143,0.8428571428571429,0.7285714285714285,0.9,0.9071428571428571,1.0,1.0,0.9214285714285714,0.7642857142857142,0.9,0.9071428571428571,1558.1854865550995,0.0
+baseline-1,0.9210526315789473,0.9868421052631579,0.7684210526315789,0.9289473684210526,0.9763157894736842,0.9815789473684211,0.9157894736842105,0.96,0.36,0.955,0.815,1.0,0.69,0.29,0.635,0.885,0.955,0.925563909774436,0.7545,0.8400319548872179,0.9928571428571429,0.9928571428571429,1.0,1.0,1.0,0.9357142857142857,0.9571428571428572,0.7928571428571428,0.7545,0.9928571428571429,0.85,1.0,0.9214285714285714,0.8857142857142857,1.0,1.0,0.5071428571428571,1.0,0.8857142857142857,0.8714285714285714,2615.167044878006,0.008583690987124463
+ISPL,0.7157894736842105,0.868421052631579,0.48947368421052634,0.9578947368421052,0.8026315789473685,0.7526315789473684,0.7552631578947369,0.995,0.505,0.995,0.83,0.995,0.775,1.0,0.795,0.97,0.955,0.7631578947368421,0.8815,0.822328947368421,0.7285714285714285,0.9857142857142858,0.9928571428571429,0.4714285714285714,0.6214285714285714,0.8428571428571429,0.8642857142857143,0.4642857142857143,0.8815,0.6357142857142857,0.6428571428571429,0.7857142857142857,0.7571428571428571,0.8785714285714286,0.8571428571428571,0.65,0.7357142857142858,0.8,0.8857142857142857,0.9,119.12918734550453,0.0
+Anon_Peking,0.9078947368421053,0.6605263157894737,0.6868421052631579,0.9210526315789473,0.881578947368421,0.868421052631579,0.5736842105263158,1.0,0.26,0.75,0.575,0.86,0.73,0.955,0.89,0.91,0.995,0.7857142857142856,0.7925,0.7891071428571428,0.8857142857142857,0.9642857142857143,0.8785714285714286,0.9357142857142857,0.8928571428571429,0.8214285714285714,0.75,0.37142857142857144,0.7925,0.95,0.8071428571428572,0.7214285714285714,0.7142857142857143,0.7142857142857143,0.9428571428571428,0.8428571428571429,0.5571428571428572,0.7285714285714285,0.7071428571428572,0.7428571428571429,256.57893514633156,0.0
+viper-purdue,0.7447368421052631,0.15526315789473685,0.05526315789473684,0.6736842105263158,0.5842105263157895,0.7578947368421053,0.18421052631578946,1.0,0.975,0.995,0.985,0.94,0.965,0.99,0.94,0.99,0.99,0.45075187969924807,0.977,0.713875939849624,0.5785714285714286,0.40714285714285714,0.30714285714285716,0.7071428571428572,0.7142857142857143,0.6428571428571429,0.5857142857142857,0.007142857142857143,0.977,0.6071428571428571,0.29285714285714287,0.5285714285714286,0.36428571428571427,0.32142857142857145,0.4642857142857143,0.35,0.37142857142857144,0.5071428571428571,0.30714285714285716,0.5,454.11514687538124,0.0
+JAIST-HIS,0.46842105263157896,0.9473684210526315,0.9421052631578948,0.4394736842105263,0.6210526315789474,0.9842105263157894,0.3105263157894737,0.645,0.7,0.98,0.645,0.61,0.99,0.12,0.845,0.78,0.93,0.6733082706766919,0.7245,0.6989041353383459,0.6285714285714286,0.7428571428571429,0.9714285714285714,0.6071428571428571,0.5642857142857143,0.5071428571428571,0.5428571428571428,0.4714285714285714,0.7245,0.5714285714285714,0.5571428571428572,1.0,0.55,0.5285714285714286,1.0,0.9785714285714285,0.5071428571428571,0.9857142857142858,0.5285714285714286,0.55,602.246269226074,0.0
+csun22,0.4842105263157895,0.618421052631579,0.7631578947368421,0.4710526315789474,0.3763157894736842,0.32105263157894737,0.47368421052631576,0.59,0.995,0.92,0.535,0.755,0.61,0.405,0.485,0.53,0.4,0.5011278195488722,0.6225,0.5618139097744361,0.8214285714285714,0.32857142857142857,0.02857142857142857,0.9785714285714285,0.9357142857142857,0.5214285714285715,0.17857142857142858,0.9428571428571428,0.6225,0.5642857142857143,0.9071428571428571,0.8285714285714286,0.21428571428571427,0.17142857142857143,0.4,0.2,0.40714285714285714,0.8142857142857143,0.17142857142857143,0.10714285714285714,112.02455472946144,0.0
+DMF,0.95,0.8842105263157894,0.9578947368421052,0.9868421052631579,0.8710526315789474,0.9736842105263158,0.9921052631578947,0.26,0.0,0.005,0.05,0.45,0.08,0.01,0.225,0.265,0.05,0.9451127819548872,0.1395,0.5423063909774436,0.9714285714285714,0.9571428571428572,0.9357142857142857,0.9785714285714285,0.9785714285714285,0.9571428571428572,0.95,0.95,0.1395,0.9857142857142858,0.9,0.9857142857142858,0.9428571428571428,0.9428571428571428,0.9571428571428572,0.9928571428571429,0.7142857142857143,0.9785714285714285,0.9428571428571428,0.9357142857142857,94.64070606231667,0.0
+safe-test,0.49736842105263157,0.4710526315789474,0.4789473684210526,0.4842105263157895,0.5236842105263158,0.5026315789473684,0.49473684210526314,0.5,0.455,0.495,0.495,0.505,0.515,0.505,0.535,0.51,0.51,0.4932330827067669,0.5025,0.49786654135338343,0.4142857142857143,0.6142857142857143,0.45714285714285713,0.5,0.4642857142857143,0.4714285714285714,0.5428571428571428,0.55,0.5025,0.4928571428571429,0.5571428571428572,0.5285714285714286,0.4785714285714286,0.4642857142857143,0.4642857142857143,0.5214285714285715,0.45,0.4785714285714286,0.44285714285714284,0.4785714285714286,200.45346903800942,0.0
+gylin,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,-1,1.0

task3.csv CHANGED Viewed

@@ -1,10 +1,10 @@
-team,generated_g_02,generated_g_04,generated_g_05,generated_g_06,generated_g_09,generated_g_10,generated_g_11,pristine_p_00,pristine_p_01,pristine_p_02,pristine_p_05,pristine_p_09,pristine_p_10,pristine_p_11,pristine_p_16,pristine_p_18,pristine_p_20,generated_accuracy,pristine_accuracy,balanced_accuracy,total_time,fail_rate
-baseline-1,0.42,0.795,0.48,0.71,0.815,0.725,0.43,0.96,0.355,0.955,0.815,1.0,0.69,0.29,0.63,0.885,0.955,0.625,0.7535000000000001,0.68925,1910.4597923755646,0.0035294117647058825
-ISPL,0.16,0.63,0.195,0.745,0.295,0.23,0.625,1.0,0.51,0.985,0.845,0.995,0.77,1.0,0.755,0.965,0.955,0.4114285714285714,0.8779999999999999,0.6447142857142857,82.67647147178633,0.0
-JAIST-HIS,0.315,0.885,0.78,0.225,0.615,0.9,0.085,0.645,0.7,0.98,0.645,0.61,0.99,0.12,0.845,0.78,0.93,0.5435714285714286,0.7245,0.6340357142857143,455.8254814147948,0.0
-baseline-2,0.205,0.475,0.33,0.48,0.36,0.685,0.24,0.9,0.66,0.895,0.915,0.935,0.68,0.815,0.85,0.88,0.945,0.39642857142857146,0.8474999999999999,0.6219642857142857,1165.3817403316498,0.01088235294117647
-ya-jiang,0.285,0.18,0.095,0.375,0.195,0.585,0.115,1.0,0.87,0.965,0.92,0.98,0.885,0.995,0.975,0.975,1.0,0.2614285714285714,0.9564999999999999,0.6089642857142856,187.8163781166075,0.0
-viper-purdue,0.71,0.67,0.565,0.54,0.64,0.6,0.4,0.7,0.805,0.785,0.555,0.415,0.655,0.635,0.205,0.585,0.39,0.5892857142857143,0.573,0.5811428571428572,329.811629295349,0.0
-safe-test,0.515,0.525,0.535,0.545,0.455,0.52,0.51,0.495,0.5,0.51,0.48,0.52,0.52,0.5,0.495,0.43,0.5,0.515,0.49499999999999994,0.505,145.18649339675886,0.0
-yyxb,0.73,0.775,0.745,0.98,0.795,0.84,1.0,0.24,0.0,0.0,0.04,0.405,0.075,0.0,0.21,0.225,0.04,0.8378571428571429,0.12350000000000001,0.48067857142857146,71.99708724021895,0.0
-csun22,0.21,0.575,0.52,0.24,0.19,0.235,0.315,0.59,0.995,0.92,0.535,0.755,0.61,0.405,0.485,0.53,0.4,0.3264285714285714,0.6225,0.4744642857142857,84.21037721633896,0.0

+team,generated_g_02,generated_g_04,generated_g_05,generated_g_06,generated_g_09,generated_g_10,generated_g_11,pristine_p_00,pristine_p_01,pristine_p_02,pristine_p_05,pristine_p_09,pristine_p_10,pristine_p_11,pristine_p_16,pristine_p_18,pristine_p_20,generated_accuracy,pristine_accuracy,balanced_accuracy,aug_a_00,aug_a_01,aug_a_02,aug_a_03,aug_a_04,total_time,fail_rate
+baseline-1,0.42,0.795,0.48,0.71,0.815,0.725,0.43,0.96,0.355,0.955,0.815,1.0,0.69,0.29,0.63,0.885,0.955,0.625,0.7535000000000001,0.68925,0.7428571428571429,0.7535,0.6,0.3457142857142857,0.8114285714285714,1910.4597923755646,0.0035294117647058825
+ISPL,0.16,0.63,0.195,0.745,0.295,0.23,0.625,1.0,0.51,0.985,0.845,0.995,0.77,1.0,0.755,0.965,0.955,0.4114285714285714,0.8779999999999999,0.6447142857142857,0.3485714285714286,0.878,0.37714285714285717,0.30857142857142855,0.6114285714285714,82.67647147178633,0.0
+JAIST-HIS,0.315,0.885,0.78,0.225,0.615,0.9,0.085,0.645,0.7,0.98,0.645,0.61,0.99,0.12,0.845,0.78,0.93,0.5435714285714286,0.7245,0.6340357142857143,0.4857142857142857,0.7245,0.6285714285714286,0.7057142857142857,0.35428571428571426,455.8254814147948,0.0
+baseline-2,0.205,0.475,0.33,0.48,0.36,0.685,0.24,0.9,0.66,0.895,0.915,0.935,0.68,0.815,0.85,0.88,0.945,0.39642857142857146,0.8474999999999999,0.6219642857142857,0.35428571428571426,0.8475,0.37714285714285717,0.12,0.7342857142857143,1165.3817403316498,0.01088235294117647
+ya-jiang,0.285,0.18,0.095,0.375,0.195,0.585,0.115,1.0,0.87,0.965,0.92,0.98,0.885,0.995,0.975,0.975,1.0,0.2614285714285714,0.9564999999999999,0.6089642857142856,0.14,0.9565,0.27714285714285714,0.02857142857142857,0.6,187.8163781166075,0.0
+viper-purdue,0.71,0.67,0.565,0.54,0.64,0.6,0.4,0.7,0.805,0.785,0.555,0.415,0.655,0.635,0.205,0.585,0.39,0.5892857142857143,0.573,0.5811428571428572,0.4657142857142857,0.573,0.5657142857142857,0.8971428571428571,0.42857142857142855,329.811629295349,0.0
+safe-test,0.515,0.525,0.535,0.545,0.455,0.52,0.51,0.495,0.5,0.51,0.48,0.52,0.52,0.5,0.495,0.43,0.5,0.515,0.49499999999999994,0.505,0.54,0.495,0.5314285714285715,0.47714285714285715,0.5114285714285715,145.18649339675886,0.0
+yyxb,0.73,0.775,0.745,0.98,0.795,0.84,1.0,0.24,0.0,0.0,0.04,0.405,0.075,0.0,0.21,0.225,0.04,0.8378571428571429,0.12350000000000001,0.48067857142857146,0.9542857142857143,0.1235,0.9057142857142857,0.52,0.9714285714285714,71.99708724021895,0.0
+csun22,0.21,0.575,0.52,0.24,0.19,0.235,0.315,0.59,0.995,0.92,0.535,0.755,0.61,0.405,0.485,0.53,0.4,0.3264285714285714,0.6225,0.4744642857142857,0.6171428571428571,0.6225,0.03428571428571429,0.26571428571428574,0.38857142857142857,84.21037721633896,0.0

updated.txt CHANGED Viewed

	@@ -1 +1 @@
1	- Updated on 2025-04-23 12:56:53 EST


1	+ Updated on 2025-04-23 16:06:57 EST