JetBrains
/

Mellum-4b-base

Text Generation

text-generation-inference

Model card Files Files and versions Community

dustalov commited on 6 days ago

Commit

b47cb9c

·

verified ·

1 Parent(s): c516a59

Update README.md

Files changed (1) hide show

README.md +67 -3

README.md CHANGED Viewed

@@ -75,6 +75,70 @@ model-index:
       type: exact_match
       value: 0.2797
       verified: false
   - task:
       type: text-generation
     dataset:
@@ -156,9 +220,9 @@ In addition to the base model scores, we are providing scores for a Mellum fine-
 | Mellum-4b-base       | 28.20% | 27.95% | 27.77% | 24.53% | 21.10% | 25.91% |  27.97%  |
 ### Java Subset
-| Model         | 2K Context | 4K Context | 8K Context |
-|---------------|------------|------------|------------|
-| Mellum-4b-base | 33.15%     | 33.48%     | 27.79%     |
 ## Syntax-Aware Fill-in-the-Middle (SAFIM)
 - Type: mix of multi-line and single-line

       type: exact_match
       value: 0.2797
       verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_java_v1.1
+      name: RepoBench 1.1 (Java, 2k)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.3202
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_java_v1.1
+      name: RepoBench 1.1 (Java, 4k)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.3212
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_java_v1.1
+      name: RepoBench 1.1 (Java, 8k)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.2910
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_java_v1.1
+      name: RepoBench 1.1 (Java, 12k)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.2492
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_java_v1.1
+      name: RepoBench 1.1 (Java, 16k)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.2474
+      verified: false
+  - task:
+      type: text-generation
+    dataset:
+      type: tianyang/repobench_java_v1.1
+      name: RepoBench 1.1 (Java)
+    metrics:
+    - name: EM
+      type: exact_match
+      value: 0.2858
+      verified: false
+    - name: EM ≤ 8k
+      type: exact_match
+      value: 0.3108
+      verified: false
   - task:
       type: text-generation
     dataset:
 | Mellum-4b-base       | 28.20% | 27.95% | 27.77% | 24.53% | 21.10% | 25.91% |  27.97%  |
 ### Java Subset
+| Model          |   2k   |   4k   |   8k   |  12k   |  16k   |  Avg   | Avg ≤ 8k |
+|----------------|--------|--------|--------|--------|--------|--------|----------|
+| Mellum-4b-base | 32.02% | 32.12% | 29.10% | 24.92% | 24.74% | 28.58% |  31.08%  |
 ## Syntax-Aware Fill-in-the-Middle (SAFIM)
 - Type: mix of multi-line and single-line