Dänische Forscher haben in sieben europäischen Ländern Umfragen unter Studierenden zum Umgang mit Text-Matching-Software (TMS) gemacht. Solche Programme können Plagiate erkennen, Passagen in Texten, die aus anderen Quellen abgeschrieben worden sein könnten, ohne den Ursprung zu nennen. Ein Ergebnis der Befragung, die jetzt im International Journal for Educational Integrity veröffentlicht wurde: Etwa die Hälfte der Studierenden fürchtet, zu Unrecht beschuldigt zu werden. Woher kommen diese Sorgen und was kann helfen? Fragen an Mikkel Willum Johansen, Co-Autor der Studie.
SZ: Ihre Befragungen haben ergeben, dass sich die Hälfte aller Studierenden schon mal Sorgen wegen TMS gemacht hat. Warum so viele?
Mikkel Willum Johansen: Das Regelwerk der Universitäten sieht für Plagiate und Betrug oft harte Strafen vor, wie zum Beispiel Exmatrikulation. Gepaart mit dem Umstand, dass die Studierenden oft nicht wissen, was mit diesen automatisch generierten Textähnlichkeitswerten geschieht, erzeugt dies Unsicherheit und Angst.
Aber wenn man richtig zitiert, dann hat man doch nichts zu befürchten.
Oft ist den Studierenden nicht klar, was erlaubt ist und was nicht. Frühere Studien haben gezeigt, dass Studierende Zitationsregeln eher lernen, wenn TMS eingeführt wurde. In unserer Studie haben wir aber einen anderen Effekt gesehen: Manche Studierende zitieren übermäßig viel aus Angst, mit Plagiatsvorwürfen konfrontiert zu werden. Andere versuchen, die Software auszutricksen, indem sie sich deren Schwächen zunutze machen. In solchen Fällen lernen die Studierenden nicht, wie man gute wissenschaftliche Texte schreibt, sie lernen nur, mit der Software umzugehen. Wenn Lehrende sich nur auf die Programme verlassen, kann und wird dies ausgenutzt werden.
Was genau ist denn ein Plagiat?
Es gibt keine weltweit einheitliche Definition. Der Europäische Verhaltenskodex für Integrität in der Forschung bietet nicht verpflichtende Leitlinien und definiert Plagiat als „die Nutzung von Arbeiten und Ideen anderer Personen ohne angemessene Angabe der ursprünglichen Quelle“.
Und wie kann die sogenannte Text-Matching-Software Plagiate erkennen?
Diese Software zeigt ganz einfach an, wie viel Überlappung es zwischen zwei Texten gibt. In vielen Fällen sind Textübereinstimmungen legitim, zum Beispiel bei korrekter Zitierweise oder wenn Studierende Aufgabenstellungen wiedergeben. Übersetzungen etwa aus dem Englischen ins Deutsche oder Umformulierungen, die ohne Quellenangabe als Plagiat gelten, kann TMS hingegen nicht erkennen. Auch kopierte Ideen oder Bilder zählen als Plagiate, wenn sie nicht zitiert werden. Die Software kann daher Plagiatserkennung nur unterstützen.
Wenn die Software solche Mängel hat, warum wird sie dann eingesetzt?
Studien zeigen, dass der Einsatz von TMS abschreckend auf vorsätzliches Plagiieren wirkt, aber nur dort, wo es zuvor keine Maßnahmen zur Vermeidung von Plagiaten gab. Darüber hinaus ist TMS ein unterstützendes Werkzeug zur Plagiatserkennung für Lehrende. Hinterfragen diese die Ergebnisse der Software hingegen nicht kritisch, ist das ein Problem.
In welchen Szenarien wird TMS in Bachelorstudiengängen eingesetzt?
Die Software ist oft automatisch in Lernplattformen integriert, wo Studierende ihre Aufgaben hochladen. Lehrende erhalten dann Textähnlichkeitswerte, die sie interpretieren können.
Was folgern Sie aus Ihrer Studie?
Text-Matching Software ist keine Wunderwaffe im Kampf gegen Plagiate. Sie ist aber ein hilfreiches Werkzeug, das mit Bedacht eingesetzt werden sollte. Die Studierenden müssen wissen, wie die Software funktioniert und wie sie eingesetzt wird. Darüber hinaus sollten Lehrende immer klarmachen, was sie bei verschiedenen Arbeitsaufträgen von den Studierenden erwarten. Kommunikation ist das A und O!
Wie denken Sie, verändert sich dieses Thema mit dem Aufkommen von KIs wie Chat-GPT?
Generative KI wird das Problem verschärfen. Regeln, wie „keine Hilfe von generativer KI erlaubt“, müssen verständlich und durchsetzbar sein. TMS überprüfen den Grad der Textübereinstimmung, KI-Scanner arbeiten viel komplexer. Diese Systeme können nur sagen, ob es wahrscheinlich ist, dass ein Text mit einer KI generiert wurde, aber sie können das nicht mit Sicherheit sagen. Mit dem Aufkommen von KI wird der ganze Sachverhalt noch viel komplizierter und Transparenz wird noch wichtiger.