KMK-konformer Leitfaden für faire Beurteilung
Warum Bewertung der kritischste Teil von Mathetests ist
In der Praxis entstehen Ungerechtigkeiten häufig nicht durch die Aufgaben, sondern durch die Bewertung. Typische Probleme:
- zu starker Fokus auf das Endergebnis
- unklare Teilpunkte
- unterschiedliche Maßstäbe zwischen Parallelklassen
- fehlende Bewertung von Denkprozessen
👉 Die KMK fordert jedoch ausdrücklich die Bewertung von Prozesskompetenzen wie Argumentieren, Darstellen und Problemlösen.
KI hilft, diese Anforderungen systematisch umzusetzen.
KMK-Grundlagen der Leistungsbewertung (Sek I)
Zentrale Prinzipien
- Kompetenzorientierung
- Transparenz
- Vergleichbarkeit
- Nachvollziehbarkeit
Bewertet werden laut KMK:
- inhaltsbezogene Kompetenzen (z. B. Algebra, Geometrie)
- prozessbezogene Kompetenzen (z. B. Argumentieren)
👉 Ein KMK-konformer Test bewertet beides.
Bewertungsdimensionen in KI-Mathetests
1️⃣ Ergebnisqualität
- korrektes Ergebnis
- sinnvolle Einheiten
- angemessene Genauigkeit
2️⃣ Lösungsweg
- strukturierte Darstellung
- mathematisch korrektes Vorgehen
- Zwischenschritte nachvollziehbar
3️⃣ Argumentation & Darstellung
- Begründungen
- Skizzen/Graphen
- verständliche Sprache
👉 KI ermöglicht, diese Dimensionen vorab klar zu definieren.
Empfohlene Punktegewichtung (Best Practice)
| Bewertungsbereich | Anteil |
|---|---|
| Lösungsweg | 40–45 % |
| Ergebnis | 30–35 % |
| Argumentation/Darstellung | 20–30 % |
➡️ Diese Gewichtung ist KMK-nah und bundesweit akzeptiert.
Beispiel: Punktevergabe bei einer Gleichungsaufgabe
Aufgabe:
Löse die Gleichung: 4(x − 2) = 2x + 6
Bewertungsvorschlag
| Kriterium | Punkte |
|---|---|
| Korrekte Umformung | 4 Punkte |
| Korrektes Ergebnis | 3 Punkte |
| Saubere Darstellung/Begründung | 3 Punkte |
| Gesamt | 10 Punkte |
👉 Ein falsches Endergebnis kann trotzdem Teilpunkte erhalten – zentral für Fairness.
Kompetenzniveaus und Bewertung
KI-Tests können Aufgaben klar einem Niveau zuordnen:
| Niveau | Bewertungsfokus |
|---|---|
| Grundlegend | Korrektes Anwenden |
| Standard | Zusammenhänge & Struktur |
| Erweitert | Begründung & Transfer |
Wichtig: Niveaus steuern die Aufgaben, nicht die Benotung einzelner Schüler.
Bewertungsraster (Rubrics) – der größte Vorteil von KI
Was ist ein Bewertungsraster?
Ein Raster beschreibt:
- was bewertet wird
- wie viele Punkte es gibt
- wann Punkte vergeben werden
Warum KI hier hilft
- Raster werden vor dem Test festgelegt
- Gleiche Kriterien für alle Klassen
- Klare Rückmeldung an Schüler
➡️ Mehr Transparenz, weniger Diskussionen.
Typische Fehler bei klassischer Bewertung
| Klassischer Fehler | KI-Lösung |
|---|---|
| ❌ Nur Ergebnis zählt | ✔️ Feste Bewertungslogik |
| ❌ Uneinheitliche Teilpunkte | ✔️ Reproduzierbare Tests |
| ❌ Fehlende Begründungskriterien | ✔️ Konsistente Punktevergabe |
Differenzierung & Vergleichbarkeit
Mit KI lassen sich:
- ✅ gleiche Kompetenzen
- ✅ unterschiedliche Zahlen
- ✅ identische Bewertungskriterien
kombinieren.
👉 Ideal für:
- Parallelklassen
- Nachschreibetermine
- Individuelle Förderung
Checkliste: KMK-konforme Bewertung mit KI
☐ Kompetenzziele festlegen
☐ Bewertungsdimensionen definieren
☐ Punkte transparent verteilen
☐ Raster kommunizieren
☐ Rückmeldung ermöglichen
FAQ
Ist KI-Bewertung rechtlich zulässig?
Ja. KI unterstützt die Struktur – die pädagogische Entscheidung trifft die Lehrkraft.
Dürfen KI-Tests benotet werden?
Ja, wenn sie kompetenzorientiert und transparent sind.
Sind die Kriterien bundesweit einsetzbar?
Ja, bei Orientierung an den KMK-Standards.
Fazit
KI-gestützte Bewertung macht Mathematiktests fairer, transparenter und vergleichbarer. Sie hilft Lehrkräften, die KMK-Anforderungen konsequent umzusetzen – ohne zusätzlichen Aufwand.



