Skip to main content
Published Online:https://doi.org/10.1024//1010-0652.17.34.245

Zusammenfassung: Die Evaluation der akademischen Lehre ist gekennzeichnet durch die Anwendung von Fragebogeninventaren unter unterschiedlichen Bedingungen (Zeitpunkte, Lehrende, Veranstaltungstypen, ...). Die Gütekriterien dieser Verfahren werden jedoch meist als allgemein gültig angegeben. Mit der Generalisierbarkeitstheorie (GT) und im Weiteren der multivariaten Reliabilitäts- und Validitätstheorie (MRVT) von Wittmann (1985) wird diese implizite Annahme der Bedingungskonstanz der Reliabilität selbst empirisch prüfbar. Im Rahmen eines Projektes zur Evaluation des Studiengangs “Forstwissenschaft” 1996 in Freiburg beurteilten 59 Studierende des 2.Semesters und 38 Studierende des 8.Semesters wiederholt zeitlich gestaffelte Blocklehrveranstaltungen mit dem “Heidelberger Inventar zur Lehrevaluation” (HILVE). Es zeigte sich zwar eine hohe multivariate totale Reliabilität und Generalisierbarkeit des HILVE-Inventars, dennoch waren nicht unerhebliche Dispositionseffekte und eine hohe Variabilität des studentischen Urteils innerhalb und zwischen Lehrveranstaltungen nachweisbar. Der HILVE erweist sich jedoch als änderungssensitiv für die Anwendung in der Lehrevaluation.


Multivariate Reliability- and Generalizability Theory in Teaching Evaluation Research

Summary: The evaluation of academic teaching takes place under varying conditions (timepoints, teachers, types of courses,...) using evaluation inventories. The validation criteria of measures are supposed to be generally valide. The generalizability theory (GT) and further the multivariate reliability and validation theory (MRVT) of Wittmann (1985) makes this implicit assumptions of constancy of conditions to a empirical testable hypothesis. A project for a evaluation of the new curriculum “Forest Science” 1996 in Freiburg serves as a database: 59 students of the 2.semester, 38 students of the 8.semester rated repeatedly time-sequential block courses on the “Heidelberg Inventory of teaching evaluation”(HILVE). High multivariate total reliability and generalizability of the HILVE-inventory can be shown. But there is a high variability of student judgments within and between courses. However, the HILVE is proven as change sensitive for the objective of teaching evaluation.

References

  • Brennan, R.L. (2001). Generalizability theory. . New York: Springer. First citation in articleCrossrefGoogle Scholar

  • Cardinet, J. , Tourneur, Y. , Allal, L. (1981). Extension of generalizability theory and its application in educational measurement.. Journal of Educational Measurement, 18, 183– 204 First citation in articleCrossrefGoogle Scholar

  • Cronbach, L.J. , Gleser, G.C. , Nanda, H. , Rajaratnam, N. (1972). The dependability of behavioral measurements. Theory of generalizability of scores and profiles. . New York: Wiley. First citation in articleGoogle Scholar

  • Kromrey, H. (1994). Evaluation der Lehre durch Umfrageforschung? Methodische Fallstricke bei der Messung von Lehrqualitäten durch Befragungen von Vorlesungsteilnehmer.. In P. Mohler (Hrsg.), Universität und Lehre - Ihre Evaluation als Herausforderung an die Empirische Sozialforschung (S.91-114). Münster: Waxmann. First citation in articleGoogle Scholar

  • Kromrey, H. (2001). Studierendenbefragungen als Evaluation der Lehre? Anforderungen an Methodik und Design.. In U. Engel (Hrsg.), Hochschulranking. Qualitätsbewertung von Studium und Lehre (S.121-176). Frankfurt: Campus. First citation in articleGoogle Scholar

  • Marcoulides, G.A. , Goldstein, Z. (1992). The optimization of multivariate generalizability studies with budget constraints.. Educational and Psychological Measurement, 53, 301– 308 First citation in articleCrossrefGoogle Scholar

  • Marsh, H.W. (1984). Students' evaluations of university teaching: Dimensionality, reliability, validity, potential bias and utility.. Journal of Educational Psychology, 76, 707– 754 First citation in articleCrossrefGoogle Scholar

  • Marsh, H.W. , Roche, L.A. (1997). Making students' evaluation of teaching effectiveness effective. The critical issues of validity, bias and utility.. American Psychologist, 52, 1187– 1197 First citation in articleCrossrefGoogle Scholar

  • Mutz, R. (2001). Studienreform als Programm. Programmevaluation zur Akzeptanz des reformierten Studiengangs Forstwissenschaft bei Lehrenden und Studierenden. . Landau: Empirische Pädagogik. First citation in articleGoogle Scholar

  • Nußbaum, A. (1984). Multivariate generalizability theory in educational measurement: An empirical study.. Applied Psychological Measurement, 8, 219– 230 First citation in articleCrossrefGoogle Scholar

  • Renkl, A. , Helmke, A. (1993). Prinzip, Nutzen und Grenzen der Generalisierungstheorie.. Empirische Pädagogik, 7, 63– 85 First citation in articleGoogle Scholar

  • Rindermann, H. (1996). Untersuchungen zur Brauchbarkeit studentischer Lehrevaluationen: Analysen der Validität und zu Auswirkungen ihres Einsatzes anhand des Heidelberger Inventars zur Lehrveranstaltungsevaluation (HILVE). . Landau: Empirische Pädagogik. First citation in articleGoogle Scholar

  • Rindermann, H. (1998). Generalisierbarkeit studentischer Veranstaltungsbeurteilungen. Sind Lehrevaluationen generalisierbar auf andere Veranstaltungen eines Dozenten oder auf inhaltsgleiche Parallelveranstaltungen verschiedener Dozenten?. Psychologie in Erziehung und Unterricht, 44, 216– 234 First citation in articleGoogle Scholar

  • Rindermann, H. , Amelang (1994). Das Heidelberger Inventar zur Lehrveranstaltungsevaluation (HILVE). . Heidelberg: Ansanger. First citation in articleGoogle Scholar

  • Schweizer, K. (1986). Aggregation und Vorhersagbarkeit. Vom Nutzen des Aggregationsansatzes für die Persönlichkeitsforschung. . Rheinfelden: Schäuble. First citation in articleGoogle Scholar

  • Shavelson, R.J. , Webb, N.M. , Rowley, G.L. (1989). Generalizability Theory.. American Psychologist, 44, 922– 932 First citation in articleCrossrefGoogle Scholar

  • Spiel, C. , Gössler, P.M. (2000). Zum Einfluss von Biasvariablen auf die Bewertung universitärer Lehre durch Studierende.. Zeitschrift für Pädagogische Psychologie, 14, 38– 47 First citation in articleLinkGoogle Scholar

  • Staufenbiel, T. (2000). Fragebogen zur Evaluation von universitären Lehrveranstaltungen durch Studierende und Lehrende.. Diagnostica, 46, 169– 181 First citation in articleLinkGoogle Scholar

  • Stemmler, G. , Fahrenberg, J. (1989). Psychophysiological assessment: Conceptual, psychometric, and statistical issues.. In G. Turpin (Ed.), Handbook of clinical psychophysiology (pp.71-104). Chichester: Wiley. First citation in articleGoogle Scholar

  • Sun, A. , Valiga, M. , Gao, X. (1997). Using generalizability theory to assess the reliability of student ratings of academic advising.. Journal of Experimental Education, 65, 367– 379 First citation in articleCrossrefGoogle Scholar

  • Webb, N. , Shavelson, R. (1981). Multivariate generalizability of general educational development ratings.. Journal of Educational Measurement, 18, 13– 22 First citation in articleCrossrefGoogle Scholar

  • Wittmann, W.W. (1985). Evaluationsforschung. . Heidelberg: Springer-Verlag. First citation in articleCrossrefGoogle Scholar

  • Wittmann, W.W. (1988). Multivariate reliability theory: Principles of symmetry and successful validation strategies.. In J.R. Nesselroade & R.B. Cattell (Eds.), Handbook of multivariate experimental psychology (2nd ed., pp.505-560). New York: Plenum. First citation in articleCrossrefGoogle Scholar

  • Wittmann, W.W. (1990). Brunswik-Symmetrie und die Konzeption der Fünf-Datenboxen - Ein Rahmenkonzept für umfassende Evaluationsforschung.. Zeitschrift für Pädagogische Psychologie, 4, 241– 252 First citation in articleGoogle Scholar