Skip to main content
Published Online:https://doi.org/10.1026/0044-3409.213.2.77

Zusammenfassung. Auf der Grundlage des Multifacetten-Rasch-Modells (Linacre, 1989; Linacre & Wright, 2002) wird eine Systematik von Methoden präsentiert, die eine detaillierte Untersuchung der psychometrischen Qualität von Beurteilungen in verschiedenen Anwendungsbereichen (z.B. bei Leistungs- oder Eignungsbeurteilungen) erlauben. Wesentliche Ziele sind: (a) Messung der Strenge der Beurteiler, der Fähigkeit der beurteilten Personen und der Schwierigkeit von Aufgaben und Kriterien in einem einheitlichen Bezugssystem, (b) Konstruktion fairer Leistungsmaße durch Berücksichtigung der Beurteilerstrenge sowie der Aufgaben- bzw. Kriterienschwierigkeit, (c) Erfassung der Konsistenz des Bewertungsverhaltens, (d) Prüfung weiterer Beurteilereffekte (z.B. zentrale Tendenz und Halo-Effekte), (e) Analyse von Interaktionseffekten und differenziellen Facettenfunktionen. Perspektiven für die Entwicklung und Anwendung möglichst objektiver, genauer und fairer Beurteilungsverfahren werden diskutiert.


Evaluation of ratings: Psychometric quality assurance via many-facet Rasch measurement

Abstract. Building on the many-facet Rasch measurement model (Linacre, 1989; Linacre & Wright, 2002), this paper presents a general framework of statistical procedures suitable for a detailed analysis of the psychometric quality of rating data collected in various kinds of applied settings (e.g., performance assessment). Major goals are: (a) measuring severity (or leniency) of raters, ability of examinees, difficulty of tasks and items (or criteria) in a single frame of reference, (b) deriving fair measures of examinee ability by taking rater severity, task and item difficulty into account, (c) assessing the degree of rater consistency, (d) detecting other rater effects (e.g., central tendency and halo effects), (e) analyzing interaction effects and differential facet functioning. Perspectives for the development and application of rating systems being as objective, precise, and fair as possible are discussed.

Literatur