leaderboard

Running on CPU Upgrade

App Files Files Community

nan commited on Oct 17, 2024

Commit

f765492

1 Parent(s): 67024a0

feat: implement versioning for long-doc reranker only

Browse files

Files changed (1) hide show

app.py +28 -7

app.py CHANGED Viewed

@@ -14,7 +14,7 @@ from src.display.css_html_js import custom_css
 from src.envs import (
     API,
     EVAL_RESULTS_PATH,
-    REPO_ID, DEFAULT_METRIC_QA, DEFAULT_METRIC_LONG_DOC, METRIC_LIST, LATEST_BENCHMARK_VERSION, COL_NAME_RERANKING_MODEL, COL_NAME_RETRIEVAL_MODEL, BM25_LINK
 )
 from src.loaders import (
     load_eval_results
@@ -23,7 +23,7 @@ from src.utils import (
     update_metric,
     set_listeners,
     reset_rank,
-    remove_html
 )
 from src.display.gradio_formatting import (
     get_version_dropdown,
@@ -38,6 +38,8 @@ from src.display.gradio_formatting import (
     get_leaderboard_table
 )
 def restart_space():
     API.restart_space(repo_id=REPO_ID)
@@ -247,7 +249,12 @@ with demo:
                             queue=True
                         )
                     with gr.TabItem("Reranking Only", id=12):
-                        lb_df_reranker = datastore.leaderboard_df_qa[datastore.leaderboard_df_qa[COL_NAME_RETRIEVAL_MODEL] == BM25_LINK]
                         lb_df_reranker = reset_rank(lb_df_reranker)
                         reranking_models_reranker = lb_df_reranker[COL_NAME_RERANKING_MODEL].apply(remove_html).unique().tolist()
                         with gr.Row():
@@ -439,10 +446,12 @@ with demo:
                             lb_table_retriever_long_doc,
                             queue=True
                         )
-"""
                     with gr.TabItem("Reranking Only", id=22):
-                        lb_df_reranker_ldoc = datastore.leaderboard_df_long_doc[
-                            datastore.leaderboard_df_long_doc[COL_NAME_RETRIEVAL_MODEL] == BM25_LINK
                             ]
                         lb_df_reranker_ldoc = reset_rank(lb_df_reranker_ldoc)
                         reranking_models_reranker_ldoc = lb_df_reranker_ldoc[COL_NAME_RERANKING_MODEL].apply(remove_html).unique().tolist()
@@ -458,11 +467,24 @@ with demo:
                             hidden_lb_df_reranker_ldoc, datastore.types_long_doc, visible=False
                         )
                         set_listeners(
                             "long-doc",
                             lb_table_reranker_ldoc,
                             hidden_lb_table_reranker_ldoc,
                             search_bar_reranker_ldoc,
                             selected_domains,
                             selected_langs,
                             selected_rerankings_reranker_ldoc,
@@ -551,7 +573,6 @@ with demo:
         with gr.TabItem("📝 About", elem_id="llm-benchmark-tab-table", id=3):
             gr.Markdown(BENCHMARKS_TEXT, elem_classes="markdown-text")
-"""
 if __name__ == "__main__":
     scheduler = BackgroundScheduler()

 from src.envs import (
     API,
     EVAL_RESULTS_PATH,
+    REPO_ID, DEFAULT_METRIC_QA, DEFAULT_METRIC_LONG_DOC, METRIC_LIST, LATEST_BENCHMARK_VERSION, COL_NAME_RERANKING_MODEL, COL_NAME_RETRIEVAL_MODEL, BM25_LINK, BENCHMARK_VERSION_LIST
 )
 from src.loaders import (
     load_eval_results
     update_metric,
     set_listeners,
     reset_rank,
+    remove_html, upload_file, submit_results
 )
 from src.display.gradio_formatting import (
     get_version_dropdown,
     get_leaderboard_table
 )
+from src.about import EVALUATION_QUEUE_TEXT, BENCHMARKS_TEXT
 def restart_space():
     API.restart_space(repo_id=REPO_ID)
                             queue=True
                         )
                     with gr.TabItem("Reranking Only", id=12):
+                        lb_df_reranker = \
+                            datastore.leaderboard_df_qa[
+                                datastore.leaderboard_df_qa[
+                                    COL_NAME_RETRIEVAL_MODEL
+                                ] == BM25_LINK
+                            ]
                         lb_df_reranker = reset_rank(lb_df_reranker)
                         reranking_models_reranker = lb_df_reranker[COL_NAME_RERANKING_MODEL].apply(remove_html).unique().tolist()
                         with gr.Row():
                             lb_table_retriever_long_doc,
                             queue=True
                         )
                     with gr.TabItem("Reranking Only", id=22):
+                        lb_df_reranker_ldoc = \
+                            datastore.leaderboard_df_long_doc[
+                                datastore.leaderboard_df_long_doc[
+                                    COL_NAME_RETRIEVAL_MODEL
+                                ] == BM25_LINK
                             ]
                         lb_df_reranker_ldoc = reset_rank(lb_df_reranker_ldoc)
                         reranking_models_reranker_ldoc = lb_df_reranker_ldoc[COL_NAME_RERANKING_MODEL].apply(remove_html).unique().tolist()
                             hidden_lb_df_reranker_ldoc, datastore.types_long_doc, visible=False
                         )
+                        selected_version.change(
+                            update_datastore_long_doc,
+                            [selected_version,],
+                            [
+                                selected_domains,
+                                selected_langs,
+                                selected_rerankings_reranker_ldoc,
+                                lb_table_reranker_ldoc,
+                                hidden_lb_table_reranker_ldoc
+                            ]
+                        )
                         set_listeners(
                             "long-doc",
                             lb_table_reranker_ldoc,
                             hidden_lb_table_reranker_ldoc,
                             search_bar_reranker_ldoc,
+                            selected_version,
                             selected_domains,
                             selected_langs,
                             selected_rerankings_reranker_ldoc,
         with gr.TabItem("📝 About", elem_id="llm-benchmark-tab-table", id=3):
             gr.Markdown(BENCHMARKS_TEXT, elem_classes="markdown-text")
 if __name__ == "__main__":
     scheduler = BackgroundScheduler()