scandeval.task_utils.multiple_choice_classification

Utility functions related to the multiple-choice classification task group.

Classes

MultipleChoiceClassificationTrainer — Trainer subclass for question answering tasks.

Functions

Bases : Trainer

Trainer subclass for question answering tasks.

Methods

source method MultipleChoiceClassificationTrainer.evaluate(eval_dataset: Dataset | None = None, ignore_keys: list[str] | None = None, metric_key_prefix: str = 'eval') → dict[str, float] | None

Evaluate the model on the given dataset.

Parameters

eval_dataset : Dataset | None —

The dataset to evaluate on. If None, then use the stored evaluation dataset.
ignore_keys : list[str] | None —

The keys to ignore when computing the metrics.
metric_key_prefix : str —

The prefix to use for the metric keys.

Returns

source prepare_examples(examples: BatchEncoding, tokenizer: PreTrainedTokenizer) → BatchEncoding

Prepare the features.

Parameters

examples : BatchEncoding —

The examples to prepare.
tokenizer : PreTrainedTokenizer —

The tokenizer to use to prepare the examples.

Returns

source postprocess_predictions_and_labels(predictions: np.ndarray, dataset: Dataset) → tuple[Predictions, Labels]

Postprocess the predictions and labels.

Parameters

Returns