bigcode
/

octocoder

@@ -81,7 +81,7 @@ model-index:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalSynthesize Avg.
     metrics:
     - name: pass@1
       type: pass@1
@@ -91,141 +91,141 @@ model-index:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalExplain Python
     metrics:
     - name: pass@1
       type: pass@1
-      value: 35.1
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalExplain JavaScript
     metrics:
     - name: pass@1
       type: pass@1
-      value: 24.5
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalExplain Java
     metrics:
     - name: pass@1
       type: pass@1
-      value: 27.3
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalExplain Go
     metrics:
     - name: pass@1
       type: pass@1
-      value: 21.1
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalExplain C++
     metrics:
     - name: pass@1
       type: pass@1
-      value: 24.1
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalExplain Rust
     metrics:
     - name: pass@1
       type: pass@1
-      value: 14.8
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalExplain Avg.
     metrics:
     - name: pass@1
       type: pass@1
-      value: 24.5
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalFix Python
     metrics:
     - name: pass@1
       type: pass@1
-      value: 30.2
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalFix JavaScript
     metrics:
     - name: pass@1
       type: pass@1
-      value: 28.4
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalFix Java
     metrics:
     - name: pass@1
       type: pass@1
-      value: 30.6
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalFix Go
     metrics:
     - name: pass@1
       type: pass@1
-      value: 30.2
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalFix C++
     metrics:
     - name: pass@1
       type: pass@1
-      value: 26.1
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalFix Rust
     metrics:
     - name: pass@1
       type: pass@1
-      value: 16.5
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
-      name: HumanEvalFix Avg.
     metrics:
     - name: pass@1
       type: pass@1
-      value: 27.0
       verified: false
 ---

       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalSynthesize Average
     metrics:
     - name: pass@1
       type: pass@1
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalFix Python
     metrics:
     - name: pass@1
       type: pass@1
+      value: 30.2
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalFix JavaScript
     metrics:
     - name: pass@1
       type: pass@1
+      value: 28.4
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalFix Java
     metrics:
     - name: pass@1
       type: pass@1
+      value: 30.6
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalFix Go
     metrics:
     - name: pass@1
       type: pass@1
+      value: 30.2
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalFix C++
     metrics:
     - name: pass@1
       type: pass@1
+      value: 26.1
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalFix Rust
     metrics:
     - name: pass@1
       type: pass@1
+      value: 16.5
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalFix Average
     metrics:
     - name: pass@1
       type: pass@1
+      value: 27.0
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalExplain Python
     metrics:
     - name: pass@1
       type: pass@1
+      value: 35.1
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalExplain JavaScript
     metrics:
     - name: pass@1
       type: pass@1
+      value: 24.5
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalExplain Java
     metrics:
     - name: pass@1
       type: pass@1
+      value: 27.3
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalExplain Go
     metrics:
     - name: pass@1
       type: pass@1
+      value: 21.1
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalExplain C++
     metrics:
     - name: pass@1
       type: pass@1
+      value: 24.1
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalExplain Rust
     metrics:
     - name: pass@1
       type: pass@1
+      value: 14.8
       verified: false
   - task:
       type: text-generation
     dataset:
       type: bigcode/humanevalpack
+      name: HumanEvalExplain Average
     metrics:
     - name: pass@1
       type: pass@1
+      value: 24.5
       verified: false
 ---