farbwelt

Beurteilung und Beurteilungsverzerrungen

Kindern muss Wissen so vermittelt werden, dass es beurteilbar ist. Lehrpersonen erhalten mit dem Beurteilungsauftrag eine hohe Verantwortung für die Schülerinnen und Schüler und steuern dadurch individuelle Schülerbiografien. Entsprechend wichtig ist es, Beurteilungs­verzerrungen möglichst zu minimieren. Von Markus P. Neuenschwander.

Zweck der Leistungsbeurteilung: Selektion und Förderung

Markus P. Neuenschwander

Markus P. Neuenschwander

Leiter des Forschungszentrums Lernen und Sozialisation der PH FHNW, Professor für Pädagogische Psychologie und Mitglied der Institutsversammlung des Instituts für Bildungswissenschaften der Universität Basel.

Die Lehrerin verteilt in der 6. Klasse die Aufgabenhefte für einen Mathematiktest. Manche Kinder sind ängstlich, andere gespannt, wieder andere freuen sich, nun ihre Fähigkeiten zeigen zu können. Die Lehrerin hofft, dass die Kinder gut abschneiden. Sie möchte einerseits trotz des laufenden Übertrittsverfahrens möglichst wenige Tests machen, um die Lernzeit nicht unnötig zu reduzieren. Sie möchte aber andererseits eine solide Beurteilungsbasis für die Übertrittsempfehlung erhalten. Traditionell werden zwei Funktionen der Leistungsbeurteilung unterschieden: summative Leistungsbeurteilung und förderorientierte Beurteilung. 

Summative Leistungsbeurteilung 

Die summative Leistungsbeurteilung resultiert aus der Selektionsfunktion der Schule. Man kann sich zwar eine obligatorische Schule ohne Selektionsfunktion gut vorstellen, was einige Länder auch praktizieren (zum Beispiel Finnland). In der Schweiz jedoch erhält die Schule den Auftrag zur Selektion – wenn auch in kantonalen Varianten. Lehrpersonen sollen beispielsweise aufgrund einer summativen Leistungsbeurteilung entscheiden, ob Kinder in das nächste Schuljahr befördert werden, ob sie eine Sonderschulung erhalten, welchem Niveau sie beim Übertritt in die Sekundarstufe I zugewiesen werden oder ob sie ins Gymnasium übertreten dürfen. Aufgrund der Selektion sollen Kinder in einem zu ihren Fähigkeiten passenden Schulumfeld unterrichtet werden, und die Leistungsheterogenität der Klasse soll abnehmen. Um die Zuweisung zu einem Schul­niveau der Sekundarstufe I zu ermöglichen, haben daher Lehrpersonen den Auftrag, die Leistungen – in manchen Kantonen auch die Selbst- und Sozialkompetenzen – der Kinder möglichst objektiv zu beurteilen. Eine Lehrperson führt in Zusammenarbeit mit ihren Kolleginnen und Kollegen der gleichen Klassenstufe beispielsweise einen Test durch, um den Wissensstand der Kinder klassenübergreifend zu erfassen und dadurch Grundlagen für eine solide Übertrittsempfehlung in die Sekundarstufe I zu erhalten. 

Förderorientierte Beurteilung 

Kinder in leistungsschwachen Klassen haben bessere Chancen auf gute Noten und haben im Selektionsverfahren dadurch einen Vorteil.

Die förderorientierte Beurteilung ist Teil der schulischen Förderung der Kinder. Durch eine förderorientierte Beurteilung erhalten Lehrpersonen prozessbezogene Informationen über jedes einzelne Kind der Klasse, sodass sie die Unterrichtsinhalte und -methoden spezifisch auf den Stand der Kompetenzen der einzelnen Kinder ihrer Klasse ausrichten können. Dazu gehört, dass Lehrpersonen den Kindern individuell Rückmeldung geben, wie sie ihr Lernen und ihre Kompetenzen verbessern können. Studien belegen, dass ein adaptiver Unterricht, der an den Interessen und Fähigkeiten der Kinder angepasst ist, guter Unterricht ist (Hattie, 2009). Entsprechend ist die förder­orientierte Beurteilung beziehungsweise Rückmeldung an die Lernenden ein Merkmal für hohe Unterrichtsqualität. Eine Lehrperson bespricht beispielsweise mit einzelnen Kindern der Klasse einen Aufsatz und gibt individuell Hinweise, wie der Schreibstil verbessert werden kann. Summative und förderorientierte Beurteilung haben also unterschiedliche Funktionen, die im Folgenden näher erläutert und einander gegenübergestellt werden. 

Bezugsgruppenabhängigkeit von Noten 

Studien zeigen, dass sich die durchschnittlichen Leistungen einer Klasse deutlich von den durchschnittlichen Leistungen von vergleichbaren anderen Klassen unterscheiden können. Die Notendurchschnitte dieser Klassen können aber trotz der grossen Leistungsunterschiede gleich sein. Die durchschnittlichen Klassennoten hängen also nicht mit den durchschnittlichen Klassenleistungen zusammen. Das heisst, der Notendurchschnitt einer Klasse sagt nichts über die durchschnittlichen Leistungen dieser Klasse aus. In unserer Studie «Wirkungen der Selektion» gibt es Kinder, die für eine bestimmte Leistung eine 6 (sehr gut) erhielten, während Kinder aus anderen Klassen mit der gleichen Leistung eine 4 (genügend) bekamen. Dieses Phänomen zeigte sich in der gleichen Studie auch an folgender Beobachtung: Die Leistungen von Kindern, die zwischen der 5. und der 7. Klasse in die Bezirksschule (Schulform mit hohen Anforderungen) übertraten, nahmen deutlich stärker zu als die Leistungen von Kindern, die im gleichen Zeitraum in die Realschule (Schulform mit Grundanforderungen) übertraten. Die durchschnittlichen Noten dieser Kinder veränderten sich aber gerade gegenläufig zu den im Rahmen der Studie getesteten Leistungen: Die Noten der Kinder sanken nach dem Übertritt in die Bezirksschule, während die Noten der Kinder nach dem Übertritt in die Realschule aufgrund der vergleichsweise tieferen Anforderungen deutlich anstiegen (Neuenschwander, 2016). 

Vermutlich lohnt es sich, die Qualität des eigenen Feebacks gegenüber den Kindern zu überprüfen. Hier ist ein wichtiger Teil der Qualität pädagogischer Arbeit der Lehrpersonen verborgen.

Die Beispiele illustrieren, dass die Noten, die eine wichtige Grundlage für schulische Selektionsentscheidungen bilden, durch Vergleiche mit den Bezugsgruppen der Klasse und des Schulniveaus stark verzerrt sind. Kinder in leistungsschwachen Klassen haben bessere Chancen auf gute Noten und haben im Selektionsverfahren dadurch einen Vorteil. Entsprechend gibt es Familien, die in eine Schulgemeinde umziehen, wo die Leistungsanforderungen in der Schule tiefer sind, sodass ihre Kinder bessere Chancen auf Zuweisung in ein anforderungshohes Schulniveau (zum Beispiel Bezirksschule) erhalten. Eine mögliche Massnahme gegen diese Beurteilungsverzerrungen sind kantonale Leistungstests, die von Lehrpersonen freiwillig eingesetzt werden und ihnen helfen, die Leistungen einer Klasse im Vergleich zu anderen Klassen genau einzuschätzen. Solche Leistungstests können überdies in die Entscheidungsfindung bei der Selektion in ein Niveau der Sekundarstufe I einfliessen (vergleiche Aargauer Modell).

Ermessensspielraum

Neben der Bezugsgruppenabhängigkeit von Noten gibt es bei der summativen Leistungsbeurteilung weitere Formen von Beurteilungsverzerrungen. Beurteilungsverzerrungen treten eher auf, wenn die Leistungen nicht kriterienbasiert bewertet werden, sondern einen Ermessensspielraum enthalten. Wenn bei einer Mathematikaufgabe einzig das Ergebnis richtig/falsch bewertet wird, ist der Ermessensspielraum gleich Null. Wenn der Lösungsweg auch bewertet wird – was unter förderorientierten Gesichtspunkten wünschenswert sein kann – entsteht ein Ermessensspielraum, der Urteile verzerren kann. Oder: Wenn Lehrpersonen die mündlichen Schülerbeiträge während des Unterrichts beurteilen, entsteht bei der Beurteilung ein Ermessensspielraum, vor allem wenn die Bewertungskriterien nicht klar definiert worden sind. Oder: Beim Errechnen der Zeugnisnoten gewichten manche Lehrpersonen die Noten aus ihren Tests und den Gesamteindruck des Kindes unterschiedlich, was zu verzerrten Beurteilungen (Noten) führen kann. 

Studien belegen ausserdem, dass jene Kinder bei gleichen Testergebnissen bessere Zeugnisnoten erhalten, die aus hohen sozialen Schichten stammen, die einen hohen Status in der Klasse haben, mehr Lernunterstützung von den Eltern erhalten und wenig prüfungsängstlich sind (Neuenschwander, 2014). Es hat sich in mehreren Studien gezeigt, dass das familiäre Umfeld eines Kindes die Leistungserwartungen von Lehrpersonen an das Kind beeinflusst. Dies wirkt sich in der Leistungsbeurteilung und in Selektionsentscheidungen aus. In der Psychologie spricht man von einer selbsterfüllenden Prophezeiung, wenn sich Kinder aufgrund der Erwartungen von Lehrpersonen in eine bestimmte Richtung verändern. 

Beurteilen vs. fördern

Eine weitere Herausforderung für die summative Beurteilung folgt aus dem Doppelauftrag der Schule: der Selektion und der Förderung. Lehrpersonen müssen Lerninhalte in einer Art vermitteln, dass deren Überprüfung objektiv und zuverlässig beurteilt werden kann. Der Zwang zur Beurteilung beeinflusst die Fördermöglichkeiten. Beispielsweise kann eine Begegnung von Primarschulkindern mit einem Wildhüter eine wichtige Primärerfahrung vermitteln, die aber nicht objektiv beurteilbar ist. Oder die persönliche Auseinandersetzung eines Jugendlichen der Sekundarstufe I mit einem Roman kann die Persönlichkeitsentwicklung vorantreiben, was sehr wertvoll ist, aber nicht angemessen beurteilt werden kann. Manche Lehrpersonen versuchen, diesen Zuwachs an Erfahrung und Entwicklung intuitiv zusätzlich über den Gesamteindruck der Schülerin oder des Schülers zu beurteilen. Dieser Gesamteindruck unterliegt aber den erwähnten Beurteilungsverzerrungen. 

Vermutlich kann eine gewisse Differenz zwischen den Förderzielen und den beurteilbaren Kompetenzen nicht aufgehoben werden. Geschickt entwickelte Leistungstests können aber die Ergebnisse von Lernprozessen annäherungsweise gut eruieren, auch wenn sie nicht alle Wissens- und Erfahrungsformen direkt messen. Diese Tests, die kriterial und idealerweise klassenübergreifend ausgewertet werden, sind weniger starken Beurteilungsverzerrungen unterworfen und führen daher zu gerechteren Urteilen. 

Förderorientierte Beurteilung und Feedback

Im Unterschied zur summativen Leistungsbeurteilung hat die förderorientierte Beurteilung die Funktion, den Lernprozess eines Kindes zu optimieren. Wenn Schülerinnen und Schüler eine Mathematikaufgabe gelöst haben, geben Lehrpersonen oft eine Rückmeldung mit dem Ziel, dass diese motiviert eine neue Aufgabe angehen und das mathematische Thema besser verstehen. Studien zeigten, dass die Art des Feedbacks die Lernmotivation und die Leistungen eines Kindes wesentlich beeinflussen. Insbesondere erfolgen wichtige Feedbacks oft indirekt oder nonverbal. Lehrpersonen können einerseits ermutigend einem Schüler oder einer Schülerin eine kritische Rückmeldung geben mit dem Hinweis, dass sie dem Kind eine bessere Leistung zutrauen und dadurch zu besseren Leistungen anspornen. Andererseits können Lehrpersonen in anderen Situationen einem Kind mit einem Lob indirekt vermitteln, dass es mit einer bescheidenen Leistung zufrieden sein darf, und dass sie dem Kind keine besseren Leistungen zutrauen. 

Feedbacks gegenüber Schülerinnen und Schülern hängen von Erwartungen an das Kind ab, aber auch von den Erwartungen, die sie seitens der Eltern des Kindes wahrnehmen. Kinder aus tiefen sozialen Schichten oder mit Migrationshintergrund erhalten tendenziell weniger ermutigende Rückmeldungen als einheimische Kinder aus höheren sozialen Schichten. Rückmeldungen an ein Kind werden auch von dessen Geschlecht beeinflusst. Kinder, die oft Klassenregeln brechen, erhalten zudem tendenziell negativere Leistungsrückmeldungen als angepasste Kinder. Rückmeldungen sind daher oft Beziehungsbotschaften und zeigen einem Kind, ob es von der Lehrperson geschätzt wird oder nicht. Sie sind sowohl für den Selbstwert und die Motivation wichtig als auch bezüglich der Zufriedenheit des Kindes in der Klasse oder mit der Leistung. Viele Kinder nehmen die Rückmeldungen einer Lehrperson sehr feinfühlig wahr, gelten diese nun ihnen selbst oder ihren Kolleginnen und Kollegen in der Klasse. Gerade weil im Alltag Rückmeldungen oft spontan und unreflektiert gegeben werden, unterliegen sie Vorurteilen und Stereotypen und verstärken daher soziale Ungleichheit in der Klasse, selbst wenn dies gar nicht beabsichtigt ist. 

Individuelles Feedback ist nicht nur im Klassenunterricht wirksam, sondern vor allem auch in individualisierenden Formen, zum Beispiel in einer Einzel- oder Gruppenarbeit. Aufgrund der Beurteilung einer gelösten Aufgabe geben Lehrpersonen in einem individualisierten Unterricht mehr oder weniger anspruchsvolle neue Aufgaben (zum Beispiel in Mathematik) und steuern dadurch den Lernprozess, den ein Kind durchlaufen darf. Ein Kind hat anhand von anspruchsvollen Aufgaben die Möglichkeit, zusätzliches Wissen aufzubauen und seine Kompetenzen zu vertiefen. Förderorientierte Beurteilung soll also dem Kind nicht nur zeigen, ob eine Aufgabe richtig oder falsch gelöst worden ist, sondern primär Hinweise geben, wie ein neuer Lernschritt, der spezifisch auf den individuellen Kenntnisstand des Kindes aufbaut, aussehen kann. Es ist dies eine Form, wie Lehrpersonen den individuellen Lernprozess ihrer Schülerinnen und Schüler steuern und optimieren können. Förderorientierte Beurteilung und Feedback sind daher integraler Teil des Lernprozesses. Vermutlich lohnt es sich, die Qualität der eigenen Feedbacks gegenüber den Kindern zu überprüfen. Hier ist ein wichtiger Teil der Qualität pädagogischer Arbeit von Lehrpersonen verborgen. 

Ausblick

Solange der Staat am Selektionsauftrag der Schule festhält, müssen Lehrpersonen summative Leistungsbeurteilungen abgeben. Diese steuern die Schulkarriere und die Berufseinstiegschancen der Schülerinnen und Schüler. Lehrpersonen erhalten mit dem Beurteilungsauftrag eine hohe Verantwortung für die Schülerinnen und Schüler und steuern dadurch individuelle Schülerbiografien. Entsprechend wichtig ist es, Beurteilungsverzerrungen möglichst zu minimieren. Eine kritische Reflexion der Beurteilungsverzerrungen, der Einsatz von Hilfsmitteln wie vergleichende Leistungstests und kriteriale, transparente Beurteilungs­anlässe können dabei helfen. 

Neben der summativen Leistungsbeurteilung bleibt die Förderung der Kinder der primäre Kernauftrag der Lehrpersonen. Dafür sind unter anderem eine förderorientierte Beurteilung und individuelles, prozessorientiertes und konstruktives Feedback erforderlich. Lehrpersonen können das Lernen ihrer Schülerinnen und Schüler stark begünstigen, indem sie ihnen regelmässig ermutigendes Feedback geben, das sich spezifisch auf den individuellen Lernstand der Schülerinnen und Schüler bezieht, das motiviert und einen neuen Lernschritt auszulösen vermag. Die Arbeit an einer konstruktiven Feedback-Kultur wird damit zu einem wichtigen Auftrag der Unterrichts- und Schulentwicklung.

Literatur

Hattie, J. (2014). Lernen sichtbar machen für Lehrpersonen. Hohengehren: Schneider.

Neuenschwander, M. P. (2014). Selektionsentschei­dungen beim Übergang in die Sekundarstufe I und in den Arbeitsmarkt im Vergleich. In M. P. Neuenschwander (Ed.), Selektion in Schule und Arbeitsmarkt (pp. 63–98).Zürich: Rüegger.

Neuenschwander, M. P. (2016). Bildungsungleichheit am Beispiel der Leistungsentwicklung in Deutsch und Mathematik beim Übergang in die Sekundarstufe I. In B. Ziegler (Ed.), (Un-) Gleichheiten in der Demokratie (pp. 95–118).Zürich: Schulthess-Verlag.

AnhangGröße
PDF icon Download dieses Beitrages (PDF)1.74 MB