EleutherAI · baberabb · Jan 24, 2025 · Jan 23, 2025 · Jan 23, 2025 · Jan 23, 2025
@@ -1,6 +1,5 @@
-tag:
-  - global_mmlu
 dataset_path: CohereForAI/Global-MMLU-Lite
+dataset_name: ar
 test_split: test
 fewshot_split: dev
 fewshot_config:

@@ -0,0 +1,13 @@
+group: global_mmlu_ar
+task:
+  - global_mmlu_ar_business
+  - global_mmlu_ar_humanities
+  - global_mmlu_ar_medical
+  - global_mmlu_ar_other
+  - global_mmlu_ar_stem
+  - global_mmlu_ar_social_sciences
+aggregate_metric_list:
+  - metric: acc
+    weight_by_size: True
+metadata:
+  version: 0.0
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _ar_template_yaml
+process_docs: !function utils.process_business
+task: global_mmlu_ar_business
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _ar_template_yaml
+process_docs: !function utils.process_humanities
+task: global_mmlu_ar_humanities
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _ar_template_yaml
+process_docs: !function utils.process_medical
+task: global_mmlu_ar_medical
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _ar_template_yaml
+process_docs: !function utils.process_other
+task: global_mmlu_ar_other
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _ar_template_yaml
+process_docs: !function utils.process_social_sciences
+task: global_mmlu_ar_social_sciences
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _ar_template_yaml
+process_docs: !function utils.process_stem
+task: global_mmlu_ar_stem
@@ -0,0 +1,18 @@
+from functools import partial
+
+
+CATEGORIES = ["Business", "Humanities", "Medical", "Other", "STEM", "Social Sciences"]
+
+
+def process_docs(dataset, category):
+    return dataset.filter(lambda x: x["subject_category"] == category)
+
+
+process_functions = {
+    f"process_{category.lower().replace(' ', '_')}": partial(
+        process_docs, category=category
+    )
+    for category in CATEGORIES
+}
+
+globals().update(process_functions)
@@ -0,0 +1,16 @@
+dataset_path: CohereForAI/Global-MMLU-Lite
+dataset_name: bn
+test_split: test
+fewshot_split: dev
+fewshot_config:
+  sampler: default
+output_type: multiple_choice
+doc_to_text: "{{question.strip()}}\nA. {{option_a}}\nB. {{option_b}}\nC. {{option_c}}\nD. {{option_d}}\nAnswer:"
+doc_to_choice: ["A", "B", "C", "D"]
+doc_to_target: answer
+metric_list:
+  - metric: acc
+    aggregation: mean
+    higher_is_better: true
+metadata:
+  version: 0.0
@@ -0,0 +1,13 @@
+group: global_mmlu_bn
+task:
+  - global_mmlu_bn_business
+  - global_mmlu_bn_humanities
+  - global_mmlu_bn_medical
+  - global_mmlu_bn_other
+  - global_mmlu_bn_stem
+  - global_mmlu_bn_social_sciences
+aggregate_metric_list:
+  - metric: acc
+    weight_by_size: True
+metadata:
+  version: 0.0
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _bn_template_yaml
+process_docs: !function utils.process_business
+task: global_mmlu_bn_business
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _bn_template_yaml
+process_docs: !function utils.process_humanities
+task: global_mmlu_bn_humanities
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _bn_template_yaml
+process_docs: !function utils.process_medical
+task: global_mmlu_bn_medical
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _bn_template_yaml
+process_docs: !function utils.process_other
+task: global_mmlu_bn_other
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _bn_template_yaml
+process_docs: !function utils.process_social_sciences
+task: global_mmlu_bn_social_sciences
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _bn_template_yaml
+process_docs: !function utils.process_stem
+task: global_mmlu_bn_stem
@@ -0,0 +1,18 @@
+from functools import partial
+
+
+CATEGORIES = ["Business", "Humanities", "Medical", "Other", "STEM", "Social Sciences"]
+
+
+def process_docs(dataset, category):
+    return dataset.filter(lambda x: x["subject_category"] == category)
+
+
+process_functions = {
+    f"process_{category.lower().replace(' ', '_')}": partial(
+        process_docs, category=category
+    )
+    for category in CATEGORIES
+}
+
+globals().update(process_functions)
@@ -0,0 +1,16 @@
+dataset_path: CohereForAI/Global-MMLU-Lite
+dataset_name: de
+test_split: test
+fewshot_split: dev
+fewshot_config:
+  sampler: default
+output_type: multiple_choice
+doc_to_text: "{{question.strip()}}\nA. {{option_a}}\nB. {{option_b}}\nC. {{option_c}}\nD. {{option_d}}\nAnswer:"
+doc_to_choice: ["A", "B", "C", "D"]
+doc_to_target: answer
+metric_list:
+  - metric: acc
+    aggregation: mean
+    higher_is_better: true
+metadata:
+  version: 0.0
@@ -0,0 +1,13 @@
+group: global_mmlu_de
+task:
+  - global_mmlu_de_business
+  - global_mmlu_de_humanities
+  - global_mmlu_de_medical
+  - global_mmlu_de_other
+  - global_mmlu_de_stem
+  - global_mmlu_de_social_sciences
+aggregate_metric_list:
+  - metric: acc
+    weight_by_size: True
+metadata:
+  version: 0.0
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _de_template_yaml
+process_docs: !function utils.process_business
+task: global_mmlu_de_business
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _de_template_yaml
+process_docs: !function utils.process_humanities
+task: global_mmlu_de_humanities
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _de_template_yaml
+process_docs: !function utils.process_medical
+task: global_mmlu_de_medical
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _de_template_yaml
+process_docs: !function utils.process_other
+task: global_mmlu_de_other
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _de_template_yaml
+process_docs: !function utils.process_social_sciences
+task: global_mmlu_de_social_sciences
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _de_template_yaml
+process_docs: !function utils.process_stem
+task: global_mmlu_de_stem
@@ -0,0 +1,18 @@
+from functools import partial
+
+
+CATEGORIES = ["Business", "Humanities", "Medical", "Other", "STEM", "Social Sciences"]
+
+
+def process_docs(dataset, category):
+    return dataset.filter(lambda x: x["subject_category"] == category)
+
+
+process_functions = {
+    f"process_{category.lower().replace(' ', '_')}": partial(
+        process_docs, category=category
+    )
+    for category in CATEGORIES
+}
+
+globals().update(process_functions)
@@ -0,0 +1,16 @@
+dataset_path: CohereForAI/Global-MMLU-Lite
+dataset_name: en
+test_split: test
+fewshot_split: dev
+fewshot_config:
+  sampler: default
+output_type: multiple_choice
+doc_to_text: "{{question.strip()}}\nA. {{option_a}}\nB. {{option_b}}\nC. {{option_c}}\nD. {{option_d}}\nAnswer:"
+doc_to_choice: ["A", "B", "C", "D"]
+doc_to_target: answer
+metric_list:
+  - metric: acc
+    aggregation: mean
+    higher_is_better: true
+metadata:
+  version: 0.0
@@ -0,0 +1,13 @@
+group: global_mmlu_en
+task:
+  - global_mmlu_en_business
+  - global_mmlu_en_humanities
+  - global_mmlu_en_medical
+  - global_mmlu_en_other
+  - global_mmlu_en_stem
+  - global_mmlu_en_social_sciences
+aggregate_metric_list:
+  - metric: acc
+    weight_by_size: True
+metadata:
+  version: 0.0
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _en_template_yaml
+process_docs: !function utils.process_business
+task: global_mmlu_en_business
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _en_template_yaml
+process_docs: !function utils.process_humanities
+task: global_mmlu_en_humanities
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _en_template_yaml
+process_docs: !function utils.process_medical
+task: global_mmlu_en_medical
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _en_template_yaml
+process_docs: !function utils.process_other
+task: global_mmlu_en_other
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _en_template_yaml
+process_docs: !function utils.process_social_sciences
+task: global_mmlu_en_social_sciences
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _en_template_yaml
+process_docs: !function utils.process_stem
+task: global_mmlu_en_stem
@@ -0,0 +1,18 @@
+from functools import partial
+
+
+CATEGORIES = ["Business", "Humanities", "Medical", "Other", "STEM", "Social Sciences"]
+
+
+def process_docs(dataset, category):
+    return dataset.filter(lambda x: x["subject_category"] == category)
+
+
+process_functions = {
+    f"process_{category.lower().replace(' ', '_')}": partial(
+        process_docs, category=category
+    )
+    for category in CATEGORIES
+}
+
+globals().update(process_functions)
@@ -0,0 +1,16 @@
+dataset_path: CohereForAI/Global-MMLU-Lite
+dataset_name: es
+test_split: test
+fewshot_split: dev
+fewshot_config:
+  sampler: default
+output_type: multiple_choice
+doc_to_text: "{{question.strip()}}\nA. {{option_a}}\nB. {{option_b}}\nC. {{option_c}}\nD. {{option_d}}\nAnswer:"
+doc_to_choice: ["A", "B", "C", "D"]
+doc_to_target: answer
+metric_list:
+  - metric: acc
+    aggregation: mean
+    higher_is_better: true
+metadata:
+  version: 0.0
@@ -0,0 +1,13 @@
+group: global_mmlu_es
+task:
+  - global_mmlu_es_business
+  - global_mmlu_es_humanities
+  - global_mmlu_es_medical
+  - global_mmlu_es_other
+  - global_mmlu_es_stem
+  - global_mmlu_es_social_sciences
+aggregate_metric_list:
+  - metric: acc
+    weight_by_size: True
+metadata:
+  version: 0.0
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _es_template_yaml
+process_docs: !function utils.process_business
+task: global_mmlu_es_business
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _es_template_yaml
+process_docs: !function utils.process_humanities
+task: global_mmlu_es_humanities
@@ -0,0 +1,4 @@
+# Generated by _generate_configs.py
+include: _es_template_yaml
+process_docs: !function utils.process_medical
+task: global_mmlu_es_medical