Warum FelloFish? Eine PRISMA-Analyse aus der KI-Schulpreis-Schule

Wenn eine Schule ein KI-Tool flächendeckend einsetzt, ist die spannendere Frage nicht welches, sondern warum genau dieses. Am Carl-Fuhlrott-Gymnasium (CFG) in Wuppertal, das im Januar 2026 mit dem ersten Preis des KI-Schulpreises in der Kategorie Gesamtkonzept ausgezeichnet wurde, ist FelloFish kein isoliertes Zusatztool, sondern neben anderen KI-Anwendungen und einem starken Fokus auf den Aufbau digitaler Mündigkeit ein integraler Bestandteil unseres KI-Schulkonzeptes. Diese Verankerung ist nicht zufällig entstanden, sondern konsequent aus unserer PRISMA-Analyse hervorgegangen.

Was PRISMA leistet und wie wir damit arbeiten

PRISMA ist ein Modell für dynamische Schulentwicklung im Zeitalter des Wandels. Es entstand aus der Einsicht, dass starre KI-Konzepte angesichts der rasanten Entwicklung schneller veralten, als sie umgesetzt sind. Was Schulen stattdessen brauchen, ist ein Rahmen, der Entscheidungen strukturiert und trotzdem beweglich bleibt, ein Rahmen, der neue Entwicklungen aufnehmen kann, ohne jedes Mal bei null zu beginnen. Das Modell bündelt sechs Perspektiven, die bei jeder KI-Integration bewusst mitgedacht werden müssen: Potenziale, Risiken, Integration, Skills, Mehrwert, Analyse. Diese Perspektiven sind kein Ablaufplan, sondern, wie der Name andeutet, ein Prisma. Je nach Blickwinkel auf eine Maßnahme werden andere Aspekte sichtbar.

Aus dieser Architektur ergibt sich eine klare Arbeitslogik. Die ersten beiden Bausteine, P und R, dienen der ganzheitlichen Analyse: Welche Potenziale bietet eine KI-Anwendung für Lernen und Schule realistisch, und welche Risiken muss man dabei mitdenken? Erst auf dieser Grundlage greifen die folgenden vier Bausteine als konkrete Planungsperspektive für Schul- und Unterrichtsentwicklung. Wie wird eine Anwendung sinnvoll integriert (I), welche Kompetenzen braucht es dafür (S), wo entsteht ein echter pädagogischer Mehrwert (M), und wie überprüfen wir empirisch, ob dieser Mehrwert tatsächlich eintritt (A)?

Abbildung 1: Das PRISMA Modell nach Felix Urban

Diese Doppelstruktur macht PRISMA tragfähig auf unterschiedlichen Ebenen. Wir nutzen das Modell am CFG für globale Schulentwicklungsentscheidungen ebenso wie für die Fachschaftsarbeit oder die Planung einzelner Unterrichtsreihen. PRISMA schützt uns dabei vor zwei typischen Fehlern im Umgang mit KI in Schule: vor der Technikgläubigkeit („KI wird alles lösen") ebenso wie vor dem Abwehrreflex („Dann verbieten wir es eben"). Stattdessen zwingt das Modell zur entscheidenden Frage: Was ist der pädagogische Gewinn einer KI-Anwendung in Schule und Unterricht, und wie sichern wir ihn dauerhaft ab?

Genau dieser Frage haben wir auch die Einführung von FelloFish unterzogen. Die folgenden sechs Abschnitte zeigen, warum sich das Tool nicht trotz, sondern gerade wegen dieser Analyse durchgesetzt hat.

P – Potenziale: Was FelloFish realistisch leisten kann

Im Schulalltag liegt der größte ungenutzte Lernhebel weniger in spektakulären KI-Anwendungen als in einer banal klingenden Größe: Feedback. Die Wirksamkeit hochwertigen Feedbacks gehört zu den am besten belegten Befunden der empirischen Bildungsforschung. Hattie und Timperley (2007) haben bereits früh herausgearbeitet, dass Feedback zu den wirksamsten Einflussfaktoren auf Lernen gehört. Bei der Förderung von Schreibkompetenz weist es nach Graham und Perin (2007) eine hohe Effektstärke von 0,80 auf. Die große Metaanalyse von Wisniewski, Zierer und Hattie (2020) bestätigt diesen Befund und zeigt zugleich, dass Qualität und Passung des Feedbacks entscheidend sind. Lernwirksam ist nicht die Note am Ende, sondern das, was die Autoren als „High Information Feedback" bezeichnen: Rückmeldungen, die Lernenden Orientierung über Ziel, aktuellen Stand und nächste Schritte liefern.

Genau dieses Feedback gelingt im Schulalltag selten in der nötigen Dichte. Zu große Lerngruppen, zu wenig Zeit, zu heterogene Lernstände, das Zeit-Ressourcen-Dilemma ist real und wird auch durch ein noch so engagiertes Kollegium nicht aufgelöst. Was im System fehlt, ist nicht die pädagogische Einsicht, sondern die strukturelle Möglichkeit.

„FelloFish setzt an exakt dieser Lücke an. Das Potenzial liegt in kriteriengeleitetem, unmittelbarem und lernförderlichem Feedback, das prozessbegleitend statt erst summativ erfolgt.“

Schüler erhalten nicht erst am Ende einer Lernphase ein abschließendes Urteil, sondern während des Arbeitsprozesses eine konkrete, verständliche und unmittelbare Rückmeldung. Die aktuelle Metaanalyse von Kaliisa et al. (2025) zeigt zudem, dass KI-generiertes Feedback im Lernertrag dem menschlichen Feedback nicht unterlegen ist. Für uns folgt daraus kein Entweder-oder, sondern eine produktive Ergänzung: In Verbindung mit einer aktiven Rückmeldungs- und Überarbeitungskultur entfaltet KI-Feedback seine eigentliche Stärke.

R – Risiken: Was FelloFish vermeiden hilft und was bedacht werden muss

Risiken im Sinne von PRISMA sind alle Aspekte, die Lernprozesse hemmen oder pädagogische Grundüberzeugungen verletzen können. Dazu gehören die Auslagerung des eigenen Denkens an die KI (Cognitive Offloading), algorithmische Verzerrungen, Datenschutzfragen, Halluzinationen und das Problem der Übervertrauensbildung. Für ein Feedback-Tool kommt eine spezifische Sorge hinzu, die wir bewusst reflektiert haben: Das KI-Feedback könnte schlechter angenommen werden oder gänzlich anders ausfallen als jenes der bewertenden Lehrkraft. Diese Reibung zwischen maschineller Rückmeldung und Lehrerurteil ist kein theoretisches Konstrukt, sondern ein praktisches Risiko, das die Akzeptanz im Klassenraum entscheidet.

„FelloFish adressiert die genannten Risiken in mehrfacher Hinsicht. Es reduziert das Risiko des Cognitive Offloadings, weil es nicht Lösungen ausgibt, sondern Rückmeldungen zu eigenen Lernprodukten gibt. Lernende bleiben Autoren ihrer Texte.“

Diese Differenz ist entscheidend, denn Bastani et al. (2025) konnten in einem groß angelegten Experiment zeigen, dass generative KI in einer ungerahmten Standard-Konfiguration zwar kurzfristig die Übungsleistung steigert, aber den langfristigen Kompetenzaufbau hemmt. Der OECD Digital Education Outlook 2026 spricht in diesem Zusammenhang vom „Crutch-Effekt". FelloFish ist gerade deshalb so überzeugend, weil es nicht die Auslagerung des Denkens fördert, sondern die Auseinandersetzung mit dem eigenen Lernprodukt sichtbar macht.

Hinzu kommt: FelloFish entzieht der schwierigen Frage nach KI-Detektion ihre Schärfe. Fleckenstein et al. (2024) zeigen, dass Lehrkräfte KI-Texte in studentischen Essays nur begrenzt zuverlässig identifizieren und ihre Trefferquote überschätzen. Es ist produktiver, KI prozessbezogen sichtbar einzubinden, als sie verdeckt zu bekämpfen, und genau das ermöglicht FelloFish. Auch den Datenschutz adressiert das Tool strukturell durch ein schulgerechtes Datenschutzkonzept, ein Punkt, der für uns als öffentliche Schule nicht verhandelbar war.

I – Integration: Wie FelloFish in den Fachschaften ankommt

Die Integration eines KI-Tools ist im PRISMA-Modell keine Tool-Frage, sondern die synthetische Antwort auf Potenziale und Risiken. Sie liegt am CFG nicht in der Hand einzelner Enthusiasten und auch nicht in einer Top-down-Entscheidung der Schulleitung, sondern in der Verantwortung der Fachschaften und der einzelnen Lehrkraft.

„Wer FelloFish wann und wofür einsetzt, entscheidet sich dort, wo Unterricht tatsächlich entsteht.“

Damit diese Verantwortung nicht ins Leere läuft, ist sie strukturell unterstützt. In den Fachschaften steuern unsere KI-Fachkoordinatorinnen und KI-Fachkoordinatoren die Auseinandersetzung mit PRISMA und prüfen, an welchen fachspezifischen Stellen FelloFish einen Beitrag leisten kann. Diese Arbeit wird durch die KI-Schulkoordination begleitet, ergänzt durch niedrigschwellige Formate wie eine regelmäßige KI-Sprechstunde im Lehrerzimmer, in der Kolleginnen und Kollegen ihre konkreten Fragen zum Tool und seinem Einsatz klären können. So entsteht keine kollegiale Überforderung, sondern eine kollegiale Gelegenheit zur fachgebundenen Auseinandersetzung mit dem Werkzeug.

Bei der Einführung des Tools in den Unterricht muss zudem das in R markierte Risiko mitgedacht werden, dass KI-Feedback anders ausfallen oder anders aufgenommen werden könnte als jenes der Lehrkraft. Hier ist in der Praxis zu beobachten, dass FelloFish, je nachdem, wie die Feedbackkriterien von der Lehrkraft beschrieben wurden, vor allem erst einmal umfangreicher rückmeldet als ein einzelner Mensch im Schulalltag leisten kann. Diese Quantität ist eine Chance, kann aber auch überfordern oder dem Lehrerurteil zu widersprechen scheinen. Lehrkräfte besprechen mit ihren Lerngruppen daher vor dem ersten Einsatz, welchen Status FelloFish-Rückmeldungen haben, wie sie sich zu späteren Bewertungen verhalten und wie sie produktiv genutzt werden. Genau diese Einbettung entscheidet, ob das Tool als Konkurrenz zur Lehrkraft missverstanden oder als ergänzendes Werkzeug verstanden wird.

S – Skills: Welche Kompetenzen FelloFish bei Lehrkräften und Schülern voraussetzt

„KI-Feedback wirkt nicht durch bloße Verfügbarkeit. Es setzt Kompetenzen voraus, sowohl auf Seiten der Lehrkraft als auch auf Seiten der Lernenden.“

Auf Seiten der Lehrkräfte braucht es zunächst die technische Bedienkompetenz im Umgang mit dem Tool. Bedeutsamer aber ist ein realistisches Verständnis der Funktionsweise: Was bewertet FelloFish, wie bewertet es, und wo liegen seine Grenzen? Eine Lehrkraft, die FelloFish einsetzt, muss in der Lage sein, die Bewertungskriterien so zu beschreiben, dass das Tool fachlich tragfähig zurückmeldet, und sie muss diagnostisch einschätzen können, wo die Rückmeldungen der Lerngruppe weiterhelfen und wo sie nachjustiert werden müssen.

Auf Seiten der Lernenden ist die zentrale Kompetenz die produktive Kritikfähigkeit: Rückmeldungen aufnehmen, einordnen, abwägen und produktiv in den eigenen Text überführen. Hinzu kommt der konstruktive Umgang mit dem Tool selbst und das angemessene Einordnen seiner Antworten. Genau dies fordern und befördern wir regelmäßig nach dem FelloFish-Einsatz im Unterricht.

Diese Kompetenzen entstehen nicht nebenher. Sie sind Teil unserer kollegialen Fortbildungsarbeit und in unsere Arbeit zur KI-Mündigkeit eingebunden.

M – Mehrwert: Wo es pädagogisch wirklich besser wird

Im PRISMA-Modell sind Potenziale (P) und Mehrwert (M) untrennbar miteinander verbunden, markieren jedoch unterschiedliche Stadien des Unterrichtsentwicklungsprozesses. Während P das Versprechen oder die pragmatische Erwartungshaltung beschreibt, fungiert M als Hypothese: Was wird durch den KI-Einsatz pädagogisch besser, und rechtfertigt dieser Nettogewinn die spezifischen neuen Risiken? Ein bloßer Gleichstand zum analogen Unterricht reicht angesichts der unvermeidbaren neuen Risiken nicht aus. Der Mehrwert muss diese rechtfertigen.

„Bei FelloFish liegt der Mehrwert für uns vor allem darin, dass prozessbezogenes Lernen gestärkt wird. Lernen wird stärker als Überarbeiten, Verbessern, Weiterdenken und erneutes Erproben erfahrbar. Feedback verliert seinen bedrohlichen Charakter als „Urteil" und wird zum Werkzeug der Gestaltung.“

Der Schüler empfängt nicht mehr passiv eine Note, sondern nutzt die Rückmeldung aktiv, um seinen Entwurf iterativ zu verbessern. Damit wandelt er sich vom Objekt der Bewertung zum Subjekt seines Lernprozesses, ein Mündigkeitsgewinn, der für uns im Zentrum jeder KI-Integration steht.

Hinzu kommt ein klarer Beitrag zur Chancengerechtigkeit und individuellen Förderung. Schüler können in ihrem eigenen Tempo arbeiten und Rückmeldungen mehrfach aufgreifen. Für heterogene Lerngruppen ist besonders wertvoll, dass Rückmeldungen niedrigschwellig, sprachlich entlastet und individuell anschlussfähig gestaltet werden können. FelloFish unterstützt damit nicht nur leistungsstarke Schüler bei der Verfeinerung ihrer Arbeiten, sondern hilft auch jenen, die mehr Struktur, sprachliche Entlastung oder zusätzliche Orientierung benötigen.

Bedeutsam ist dabei, dass FelloFish weder Lehrerurteil noch Peer-Rückmeldung ersetzt. Im Gegenteil. Besonders stark wirkt das Tool dort, wo kokonstruktiv im Zusammenspiel von FelloFish, Mitschülern und Lehrkraft eine produktive Rückkopplungsschleife entsteht. Auf diese Weise vergrößern sich Frequenz und Qualität von Feedback, ohne dass Individualisierung oder pädagogische Beziehung verloren gingen. Im Gegenteil: Wir gewinnen Spielraum für genau diese.

A – Analyse: Warum wir die Wirksamkeit nicht behaupten, sondern prüfen

Wenn wir als Mehrwert die Hypothese aufstellen, dass eine KI-Integration das Lernen qualitativ verbessert, darf diese Annahme nicht im Ungefähren bleiben. Die Phase der Analyse dient dazu, diese Hypothese empirisch zu überprüfen und Schulentwicklung aus dem Bereich der Anekdoten in den Bereich der Evidenz zu überführen.

Die Absicherung erfolgt dabei auf zwei Ebenen. Zum einen stützen wir uns auf den aktuellen Forschungsstand, der den Einsatz von FelloFish auch unabhängig von unserer Schule legitimiert. Die bereits erwähnte Metaanalyse von Kaliisa et al. (2025) zeigt, dass KI-Feedback dem menschlichen Feedback im Lernertrag nicht unterlegen ist. Fleckenstein et al. (2024) belegen positive Effekte KI-gestützten Schreibfeedbacks auf die Schreibleistung; Hattie und Timperley (2007) sowie Wisniewski, Zierer und Hattie (2020) ordnen Feedback grundsätzlich als einen der wirksamsten Einflussfaktoren auf Lernen ein. Diese Befunde sind unsere externe Absicherung. Sie machen sichtbar, dass wir mit FelloFish nicht im pädagogischen Experimentierfeld arbeiten, sondern auf einer empirischen Grundlage.

Zum anderen prüfen wir den Einsatz schulintern entlang mehrerer Dimensionen: Nutzungsmuster, subjektiv wahrgenommene Lerneffektivität, Wirkung auf akademische Integrität, Kompetenzentwicklung, Abhängigkeit und Wohlbefinden sowie die Tragfähigkeit der schulischen Rahmenbedingungen. Begleitend testen wir derzeit im Beta-Stadium unsere selbst entwickelte App Klassenradar, ein eigenes Diagnostik-Tool, das Lernstände und Förderbedarfe noch passgenauer sichtbar macht. FelloFish fügt sich in diese Entwicklung ideal ein, weil es diagnostische Hinweise mit konkreten Förderimpulsen im Lernprozess verbindet.

„Diese Form dynamischer, evidenzbasierter Schulentwicklung ist das Gegenmodell zu Tool-Implementierungen, die ihre Wirksamkeit voraussetzen, statt sie zu prüfen.“

PRISMA macht hier sichtbar, was tatsächlich wirkt, und ermöglicht eine produktive Neujustierung. Falls sich in der Analyse zeigte, dass FelloFish die in M formulierte Hypothese nicht einlöst, wäre die Konsequenz konsequenterweise ein Rückbau oder eine Anpassung. Nicht aber ein Festhalten allein deshalb, weil bereits viel Zeit, Fortbildung und strukturelle Vorarbeit in das Tool geflossen sind. Diese Fehlannahme, dass bereits investierter Aufwand zukünftige Entscheidungen rechtfertigt, kennt die Ökonomie als Sunk-Cost-Logik, und sie ist auch in Schulentwicklung verbreitet: Tools werden weitergenutzt, weil man sie schon kennt, nicht weil sie wirken. PRISMA stellt diese Logik bewusst in Frage.

„Bisher zeigt unsere Analyse jedoch das Gegenteil: FelloFish ist für unsere Schule unverzichtbar geworden, weil es individuelles Lernen stärkt, Basiskompetenzen fördert, die Qualität und Frequenz von Feedback deutlich erhöht, Lehrkräfte entlastet und unsere schulische Feedback-Kultur nachhaltig bereichert.“

Vom Modell zur eigenen Werkzeugwahl

Was wir mit diesem Text zeigen wollten, ist weniger eine Empfehlung als eine Begründung. Das Tool hat sich für uns aus einer systematischen Analyse heraus ergeben und im Schulalltag bewährt.

„FelloFish unterstützt genau die Art von Schule, die wir entwickeln wollen: lernwirksam, reflektiert, menschlich zugewandt und zugleich offen für die produktive Nutzung neuer Technologien.“

Ob das Tool auch für andere Schulen die richtige Wahl ist, lässt sich aus unserer Position heraus nicht beurteilen. Was wir aber teilen können, ist die Methode, mit der wir zu unserer Entscheidung gekommen sind. Wer das PRISMA-Modell für die eigene Schule, eine Fachschaft oder einzelne Unterrichtsreihen nutzen möchte, findet im Original-PRISMA-Artikel sowohl die theoretische Begründung als auch die dort verlinkte Strukturvorlage zur PRISMA-Fachintegration.

Diese Tabelle bildet die sechs Bausteine als Spalten ab und führt mit Leitfragen durch jede Perspektive. Sie eignet sich besonders für die fachschaftsinterne Arbeit und macht aus der abstrakten Analyselogik ein konkretes Arbeitswerkzeug, mit dem auch andere Schulen ihre eigene, begründete Tool-Entscheidung treffen können.

Literatur

Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without guardrails can harm learning: Evidence from high school mathematics. Proceedings of the National Academy of Sciences, 122(26), e2422633122.

Fleckenstein, J., Meyer, J., Jansen, T., Keller, S. D., Köller, O., & Möller, J. (2024). Do teachers spot AI? Evaluating the detectability of AI-generated texts among student essays. Computers and Education: Artificial Intelligence, 6, 100209.

Graham, S., & Perin, D. (2007). Writing Next: Effective Strategies to Improve Writing of Adolescents in Middle and High Schools. A Report to Carnegie Corporation of New York. New York: Carnegie Corporation.

Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81–112.

Kaliisa, R., Misiejuk, K., López-Pernas, S., & Saqr, M. (2025). How does artificial intelligence compare to human feedback? A meta-analysis of performance, feedback perception, and learning dispositions. Educational Psychology.

OECD (2026). OECD Digital Education Outlook 2026: Exploring Effective Uses of Generative AI in Education. OECD Publishing.

Urban, F. (2026). PRISMA – Ein Modell für dynamische Schulentwicklung im Zeitalter des Wandels. felixurban.com. Online: Link zum Artikel

Wisniewski, B., Zierer, K., & Hattie, J. (2020). The Power of Feedback Revisited: A Meta-analysis of Educational Feedback Research. Frontiers in Psychology, 10, 487662.

Autor

Felix Urban ist Gymnasiallehrer für Deutsch, Erziehungswissenschaft, Philosophie und Informatik sowie KI-Schulkoordinator am Carl-Fuhlrott-Gymnasium in Wuppertal. Er entwickelt evidenzbasierte Konzepte zur Integration von Künstlicher Intelligenz in Schule und Unterricht und treibt die digitale Schulentwicklung strategisch voran. Neben seiner Arbeit im Bildungsbereich nutzt er KI gezielt zur Realisierung eigener Projekte, unter anderem für die Noten- und Diagnostik-App „Klassenradar“ oder den Aufbau einer KI-Plattform für intelligentes Wissensmanagement (Corviqa). Er ist außerdem als Speaker und Unternehmensberater tätig und Mitautor des Buches “Produktives Streiten - Auswege aus einer defizitären Debattenkultur”.