specify repetition penalty

2 years ago · f076e2fa42
parent 024146bc82
commit f076e2fa42
4 changed files with 4 additions and 0 deletions
--- a/eval/evaluate_chat_ceval.py
+++ b/eval/evaluate_chat_ceval.py
@ -31,6 +31,7 @@ def load_models_tokenizer(args):
        args.checkpoint_path, trust_remote_code=True
    )
    model.generation_config.do_sample = False  # use greedy decoding
+    model.generation_config.repetition_penalty = 1.0  # disable repetition penalty
    return model, tokenizer

 def process_before_extraction(gen, question, choice_dict):
--- a/eval/evaluate_chat_gsm8k.py
+++ b/eval/evaluate_chat_gsm8k.py
@ -129,6 +129,7 @@ if __name__ == "__main__":
        args.checkpoint_path, trust_remote_code=True
    )
    model.generation_config.do_sample = False  # use greedy decoding
+    model.generation_config.repetition_penalty = 1.0  # disable repetition penalty

    test = dataset["test"]

--- a/eval/evaluate_chat_humaneval.py
+++ b/eval/evaluate_chat_humaneval.py
@ -93,6 +93,7 @@ if __name__ == "__main__":
        args.checkpoint_path, trust_remote_code=True
    )
    model.generation_config.do_sample = False  # use greedy decoding
+    model.generation_config.repetition_penalty = 1.0  # disable repetition penalty

    f_output = jsonlines.Writer(open(args.sample_output_file, "w", encoding="utf-8"))

--- a/eval/evaluate_chat_mmlu.py
+++ b/eval/evaluate_chat_mmlu.py
@ -35,6 +35,7 @@ def load_models_tokenizer(args):
        args.checkpoint_path, trust_remote_code=True
    )
    model.generation_config.do_sample = False  # use greedy decoding
+    model.generation_config.repetition_penalty = 1.0  # disable repetition penalty
    return model, tokenizer