unlängst berichtet habe, kommt es nun offenbar doch zu der von Ihrem werten Plagiatsgutachter lange geforderten Revolution: zur Plagiatssuche in Google Books. Gemeint ist damit, dass es bislang nicht möglich war, ein File upzuloaden und es direkt mit den rund 25 Millionen Dokumenten (genaue Zahlen weiß man nicht) der Google Buchsuche abzugleichen.
Bisherige Bemühungen Ihres Plagiatsgutachters scheiterten: Ein Google-Books-Manager schrieb, er werde mein Anliegen mit seinen „folks“ besprechen, gehört habe ich nie wieder etwas von ihm oder den folks. Führende Plagiatssoftware-Anbieter können alleine schon aus ökonomischen Gründen nicht mit Google zusammenarbeiten, weil Google die freie und kostenlose Nutzung einfordert. So müssen sich auch weltweit führende Anbieter wie Turnitin oder Vorreiter in Deutschland wie PlagScan mit Yahoo!- bzw. bing-Suchresultaten begnügen. Die Google Buchsuche, der wertvollste Schatz für den Abgleich, blieb bis dato fast gänzlich ausgespart. Eine unbefriedigende Situation.
Nun hat Google selbst begonnen, die Buchsuche für wissenschaftliche Zwecke zu öffnen, mit seinem NGram-Viewer und den entsprechenden freien Rohdaten. Das wissenschaftliche Interesse ist hier aber nicht: wer hat in der Geschichte des gedruckten Wissens von wem abgeschrieben (und umgekehrt: wer war besonders originell?); sondern: welche Karrieren machten Wörter und Wortgruppen mit bis zu fünf Wörtern am Stück in den vergangenen Jahrhunderten (5-grams)? Die neue Wissenschaft der Wörterevolution hat immerhin schon einen schönen Namen bekommen: Culturomics nach dem Vorbild der Genomics. Die Linguisten freut’s. Was mich und einige andere allerdings interessieren würde, ist die Plagianomics oder eben die Originomics.
Es ist bekannt, dass Google mitunter junge Start-Up-Unternehmen mit neuen Ideen gewähren lässt. Und so musste ein neuer Software-Anbieter, Unplag aus der Ukraine, antreten, um etwas voranzubringen. Noch steht auf deren Webseite groß: „Powered by bing/Yahoo!“. Aber schon im zweiten Quartal 2016 könnte da auch stehen: „Powered by Google Books“.
Wie Unplag-Manager Ivan Klymenko Ihrem werten Plagiatsgutachter exklusiv verraten hat, habe man sich auf einen Deal mit Google geeinigt: Unplag wird den Dokumenten-Abgleich mit der Buchsuche als kostenlosen Dienst anbieten, allerdings nur bis zu einem gewissen, noch im Detail auszuhandelnden Tages-Abfragevolumen. Dass Unplag mit diesem kostenlosen Service neue Kunden für seine Bezahl-Services gewinnen will, ist ja nicht schändlich. Bei Treffern wird auf die entsprechenden Buchseiten direkt in Google Books verlinkt; und wenn die Software-Entwickler gut sind, werden die Textübereinstimmungen auch noch markiert werden. Es wird in keinem Fall mehr angezeigt werden, als die Buchsuche jetzt schon anzeigen kann, und die Buchseiten werden weiter in einem „non-editable“ Modus präsentiert werden, sagt Ivan Klymenko.
Man darf gespannt sein, wie das Tool konkret aussehen wird, wenn es wirklich kommt. Auf jeden Fall würde es eine herausragende Innovation für das Jahr 2016 darstellen. Und Ihr werter Plagiatsgutachter träumt indes schon vom nächsten Schritt: Alle 25 Millionen Dokumente, die Google Books bislang eingescannt hat, sollten untereinander verglichen werden, also Dokument 1 mit den 24 Millionen 999.999 anderen – und das mit jedem Dokument. Ich wette, dass man so viele originelle Denker und Forscher als plumpe Abschreiber enttarnen könnte, und die Geschichte des Plagiats wäre neu zu schreiben. Vielleicht könnten umgekehrt so auch Metriken für Originalität und Innovation entwickelt werden.
Um Neuigkeiten zu erzählen, muss man mitunter auf eigene Werke verweisen: Wie ich in „Telepolis“