leaderboard

Running on CPU Upgrade

App Files Files Community

nan commited on Oct 16, 2024

Commit

e050b39

1 Parent(s): 7845083

feat: implement the version selector for qa retrieval only

Browse files

Files changed (1) hide show

app.py +24 -16

app.py CHANGED Viewed

@@ -14,19 +14,21 @@ from src.display.css_html_js import custom_css
 from src.envs import (
     API,
     EVAL_RESULTS_PATH,
-    REPO_ID, DEFAULT_METRIC_QA, DEFAULT_METRIC_LONG_DOC, METRIC_LIST, LATEST_BENCHMARK_VERSION
 )
 from src.loaders import (
     load_eval_results
 )
 from src.utils import (
     update_metric,
-    set_listeners
 )
 from src.display.gradio_formatting import (
     get_version_dropdown,
     get_search_bar,
     get_reranking_dropdown,
     get_metric_dropdown,
     get_domain_dropdown,
     get_language_dropdown,
@@ -110,11 +112,9 @@ with demo:
                         # select domain
                         with gr.Row():
                             selected_domains = get_domain_dropdown(QABenchmarks[datastore.slug])
-                            # selected_domains = get_domain_dropdown(QABenchmarks["2404"])
                         # select language
                         with gr.Row():
                             selected_langs = get_language_dropdown(QABenchmarks[datastore.slug])
-                            # selected_langs = get_language_dropdown(QABenchmarks["2404"])
                     with gr.Column():
                         # select the metric
                         selected_metric = get_metric_dropdown(METRIC_LIST, DEFAULT_METRIC_QA)
@@ -132,21 +132,22 @@ with demo:
                             with gr.Column():
                                 selected_rerankings = get_reranking_dropdown(datastore.reranking_models)
                         #  shown_table
-                        leaderboard_table = get_leaderboard_table(
                             datastore.leaderboard_df_qa, datastore.types_qa)
                         # Dummy leaderboard for handling the case when the user uses backspace key
-                        hidden_leaderboard_table_for_search = get_leaderboard_table(
                             datastore.raw_df_qa, datastore.types_qa, visible=False)
                         selected_version.change(
                             update_datastore,
                             [selected_version,],
-                            [selected_domains, selected_langs, selected_rerankings, leaderboard_table, hidden_leaderboard_table_for_search]
                         )
                         set_listeners(
                             "qa",
-                            leaderboard_table,
-                            hidden_leaderboard_table_for_search,
                             search_bar,
                             selected_version,
                             selected_domains,
@@ -168,30 +169,37 @@ with demo:
                                 show_anonymous,
                                 show_revision_and_timestamp,
                             ],
-                            leaderboard_table,
                             queue=True
                         )
-"""
                     with gr.TabItem("Retrieval Only", id=11):
                         with gr.Row():
                             with gr.Column(scale=1):
                                 search_bar_retriever = get_search_bar()
                             with gr.Column(scale=1):
                                 selected_noreranker = get_noreranking_dropdown()
-                        lb_df_retriever = data["AIR-Bench_24.04"].leaderboard_df_qa[data["AIR-Bench_24.04"].leaderboard_df_qa[COL_NAME_RERANKING_MODEL] == "NoReranker"]
                         lb_df_retriever = reset_rank(lb_df_retriever)
-                        lb_table_retriever = get_leaderboard_table(lb_df_retriever, data["AIR-Bench_24.04"].types_qa)
                         # Dummy leaderboard for handling the case when the user uses backspace key
-                        hidden_lb_df_retriever = data["AIR-Bench_24.04"].raw_df_qa[data["AIR-Bench_24.04"].raw_df_qa[COL_NAME_RERANKING_MODEL] == "NoReranker"]
                         hidden_lb_df_retriever = reset_rank(hidden_lb_df_retriever)
-                        hidden_lb_table_retriever = get_leaderboard_table(hidden_lb_df_retriever, data["AIR-Bench_24.04"].types_qa, visible=False)
                         set_listeners(
                             "qa",
                             lb_table_retriever,
                             hidden_lb_table_retriever,
                             search_bar_retriever,
                             selected_domains,
                             selected_langs,
                             selected_noreranker,
@@ -210,11 +218,11 @@ with demo:
                                 search_bar_retriever,
                                 show_anonymous,
                                 show_revision_and_timestamp,
-                                selected_version,
                             ],
                             lb_table_retriever,
                             queue=True
                         )
                     with gr.TabItem("Reranking Only", id=12):
                         lb_df_reranker = data["AIR-Bench_24.04"].leaderboard_df_qa[data["AIR-Bench_24.04"].leaderboard_df_qa[COL_NAME_RETRIEVAL_MODEL] == BM25_LINK]
                         lb_df_reranker = reset_rank(lb_df_reranker)

 from src.envs import (
     API,
     EVAL_RESULTS_PATH,
+    REPO_ID, DEFAULT_METRIC_QA, DEFAULT_METRIC_LONG_DOC, METRIC_LIST, LATEST_BENCHMARK_VERSION, COL_NAME_RERANKING_MODEL
 )
 from src.loaders import (
     load_eval_results
 )
 from src.utils import (
     update_metric,
+    set_listeners,
+    reset_rank
 )
 from src.display.gradio_formatting import (
     get_version_dropdown,
     get_search_bar,
     get_reranking_dropdown,
+    get_noreranking_dropdown,
     get_metric_dropdown,
     get_domain_dropdown,
     get_language_dropdown,
                         # select domain
                         with gr.Row():
                             selected_domains = get_domain_dropdown(QABenchmarks[datastore.slug])
                         # select language
                         with gr.Row():
                             selected_langs = get_language_dropdown(QABenchmarks[datastore.slug])
                     with gr.Column():
                         # select the metric
                         selected_metric = get_metric_dropdown(METRIC_LIST, DEFAULT_METRIC_QA)
                             with gr.Column():
                                 selected_rerankings = get_reranking_dropdown(datastore.reranking_models)
                         #  shown_table
+                        lb_table = get_leaderboard_table(
                             datastore.leaderboard_df_qa, datastore.types_qa)
                         # Dummy leaderboard for handling the case when the user uses backspace key
+                        hidden_lb_table = get_leaderboard_table(
                             datastore.raw_df_qa, datastore.types_qa, visible=False)
                         selected_version.change(
                             update_datastore,
                             [selected_version,],
+                            [selected_domains, selected_langs, selected_rerankings, lb_table, hidden_lb_table]
                         )
                         set_listeners(
                             "qa",
+                            lb_table,
+                            hidden_lb_table,
                             search_bar,
                             selected_version,
                             selected_domains,
                                 show_anonymous,
                                 show_revision_and_timestamp,
                             ],
+                            lb_table,
                             queue=True
                         )
                     with gr.TabItem("Retrieval Only", id=11):
                         with gr.Row():
                             with gr.Column(scale=1):
                                 search_bar_retriever = get_search_bar()
                             with gr.Column(scale=1):
                                 selected_noreranker = get_noreranking_dropdown()
+                        lb_df_retriever = datastore.leaderboard_df_qa[datastore.leaderboard_df_qa[COL_NAME_RERANKING_MODEL] == "NoReranker"]
                         lb_df_retriever = reset_rank(lb_df_retriever)
+                        lb_table_retriever = get_leaderboard_table(lb_df_retriever, datastore.types_qa)
                         # Dummy leaderboard for handling the case when the user uses backspace key
+                        hidden_lb_df_retriever = datastore.raw_df_qa[datastore.raw_df_qa[COL_NAME_RERANKING_MODEL] == "NoReranker"]
                         hidden_lb_df_retriever = reset_rank(hidden_lb_df_retriever)
+                        hidden_lb_table_retriever = get_leaderboard_table(hidden_lb_df_retriever, datastore.types_qa, visible=False)
+                        selected_version.change(
+                            update_datastore,
+                            [selected_version,],
+                            [selected_domains, selected_langs, selected_rerankings, lb_table_retriever, hidden_lb_table_retriever]
+                        )
                         set_listeners(
                             "qa",
                             lb_table_retriever,
                             hidden_lb_table_retriever,
                             search_bar_retriever,
+                            selected_version,
                             selected_domains,
                             selected_langs,
                             selected_noreranker,
                                 search_bar_retriever,
                                 show_anonymous,
                                 show_revision_and_timestamp,
                             ],
                             lb_table_retriever,
                             queue=True
                         )
+                    """
                     with gr.TabItem("Reranking Only", id=12):
                         lb_df_reranker = data["AIR-Bench_24.04"].leaderboard_df_qa[data["AIR-Bench_24.04"].leaderboard_df_qa[COL_NAME_RETRIEVAL_MODEL] == BM25_LINK]
                         lb_df_reranker = reset_rank(lb_df_reranker)