Von: Christian Chiarcos

Christian Chiarcos — Tue, 13 Apr 2021 17:25:12 +0000

Der Beitrag ist ja nun schon etwas älter, aber ich habe ihn gerade erst gesehen.

Leider beruht er auf einem Missverständnis darüber, was dieser Text ist und sein soll. Ehrlich gesagt wurde nie etwas anderes behauptet, als dass wir extraktive Textzusammenfassung und Paraphrasierung machen, das steht genau so im Vorwort. Der Beitrag ist auch keineswegs, originell zu schreiben (das ist sehr einfach), sondern *verifizierbar* zusammenzufassen.

Tatsächlich ist die Extraktion (= „Textklau“) systembedingt bei 100% (!), und ist *immer* (für jeden einzelnen Satz) mit Quellenangabe gekennzeichnet (besagtes Paper wird wohl „[29]“ sein), für den Fall, dass längere Phrasen wörtlich übereinstimmen, sogar als wörtliche Rede (wie oben „The stability …“). Dass da nur 41% Textübereinstimmung herauskommen, zeigt eigentlich, wie gut die Paraphrasierung funktioniert, denn 59% hält er für originell (ich gehe mal davon aus, dass Turnitin auf das komplette Springer-Archiv zugreift, das war die einzige Datenquelle). Was man übrigens auch in Ihrem Ausschnitt sieht, ist, dass die Sätze nicht absatzweise extrahiert wurden, sondern immer wieder von Beiträgen aus anderen Quellen unterbrochen werden. Ein wichtiger Beitrag des Verfahrens besteht denn auch in der Reorganisation vorhandener Information, in der Gewichtung, Auswahl und Kombination unterschiedlicher Quellen liegt der Mehrwert und das durch das Verfahren generierte neue Wissen.

Das ganze so nah an den Quellen zu halten war übrigens keine ganz freiwillige Entscheidung, sondern die Fachkollegen, die die Ergebnisse verschiedener Verfahren evaluiert haben, die wir entwickelt haben, haben sich letztlich für eines entschieden, dass sehr eng an der ursprünglichen Formulierung blieb. Die Herausforderung war, eine Abstraktionsebene zu finden, die einerseits originell genug war, um rechtssicher zu sein (wofür man diesen Text hält, das wurde geprüft), andererseits keine unverifizierten Informationen enthält (was beim Paraphrasieren leicht passieren kann).

Ich kann verstehen, wie das Missverständnis zustandekommt, aber der Begriff „Plagiat“ ist schon wegen der systematischen Quellenangabe unangemessen. Sie haben lediglich nachvollzogen, wie das Verfahren funktioniert (und wie es auch beschrieben wurde, wir sind da ganz transparent).

Ich kann Sie übrigens beruhigen: Wir arbeiten aktuell daran, das damalige extraktive Verfahren durch ein abstraktives zu ersetzen. Direkten Text-Reuse wird es damit nicht mehr geben.

Kommentare zu: „Wichtiger Meilenstein“ für Springer Nature entpuppt sich als Plagiat: Von einem Algorithmus „verfasstes“ Buch ist Textklau

Von: Christian Chiarcos