<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	
	>
<channel>
	<title>
	Kommentare zu: &#8222;Wichtiger Meilenstein&#8220; für Springer Nature entpuppt sich als Plagiat: Von einem Algorithmus &#8222;verfasstes&#8220; Buch ist Textklau	</title>
	<atom:link href="https://plagiatsgutachten.com/blog/wichtiger-meilenstein-fuer-springer-nature-entpuppt-sich-als-plagiat-von-einem-algorithmus-verfasstes-buch-ist-textklau/feed/" rel="self" type="application/rss+xml" />
	<link>https://plagiatsgutachten.com/blog/wichtiger-meilenstein-fuer-springer-nature-entpuppt-sich-als-plagiat-von-einem-algorithmus-verfasstes-buch-ist-textklau/</link>
	<description>Sachverständiger für Plagiatsprüfung</description>
	<lastBuildDate>Tue, 13 Apr 2021 17:25:12 +0000</lastBuildDate>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>
	<item>
		<title>
		Von: Christian Chiarcos		</title>
		<link>https://plagiatsgutachten.com/blog/wichtiger-meilenstein-fuer-springer-nature-entpuppt-sich-als-plagiat-von-einem-algorithmus-verfasstes-buch-ist-textklau/#comment-4253</link>

		<dc:creator><![CDATA[Christian Chiarcos]]></dc:creator>
		<pubDate>Tue, 13 Apr 2021 17:25:12 +0000</pubDate>
		<guid isPermaLink="false">https://plagiatsgutachten.com/blog/?p=2910#comment-4253</guid>

					<description><![CDATA[Der Beitrag ist ja nun schon etwas älter, aber ich habe ihn gerade erst gesehen. 

Leider beruht er auf einem Missverständnis darüber, was dieser Text ist und sein soll. Ehrlich gesagt wurde nie etwas anderes behauptet, als dass wir extraktive Textzusammenfassung und Paraphrasierung machen, das steht genau so im Vorwort. Der Beitrag ist auch keineswegs, originell zu schreiben (das ist &lt;a href=&quot;https://openai.com/blog/better-language-models/&quot; rel=&quot;nofollow ugc&quot;&gt;sehr einfach&lt;/a&gt;), sondern *verifizierbar* zusammenzufassen.

Tatsächlich ist die Extraktion (= &quot;Textklau&quot;) systembedingt bei 100% (!), und ist *immer* (für jeden einzelnen Satz) mit Quellenangabe gekennzeichnet (besagtes Paper wird wohl &quot;[29]&quot; sein), für den Fall, dass längere Phrasen wörtlich übereinstimmen, sogar als wörtliche Rede (wie oben &quot;The stability ...&quot;). Dass da nur 41% Textübereinstimmung herauskommen, zeigt eigentlich, wie gut die Paraphrasierung funktioniert, denn 59% hält er für originell (ich gehe mal davon aus, dass Turnitin auf das komplette Springer-Archiv zugreift, das war die einzige Datenquelle). Was man übrigens auch in Ihrem Ausschnitt sieht, ist, dass die Sätze nicht absatzweise extrahiert wurden, sondern immer wieder von Beiträgen aus anderen Quellen unterbrochen werden. Ein wichtiger Beitrag des Verfahrens besteht denn auch in der Reorganisation vorhandener Information, in der Gewichtung, Auswahl und Kombination unterschiedlicher Quellen liegt der Mehrwert und das durch das Verfahren generierte neue Wissen.

Das ganze so nah an den Quellen zu halten war übrigens keine ganz freiwillige Entscheidung, sondern die Fachkollegen, die die Ergebnisse verschiedener Verfahren evaluiert haben, die wir entwickelt haben, haben sich letztlich für eines entschieden, dass sehr eng an der ursprünglichen Formulierung blieb. Die Herausforderung war, eine Abstraktionsebene zu finden, die einerseits originell genug war, um rechtssicher zu sein (wofür man diesen Text hält, das wurde geprüft), andererseits keine unverifizierten Informationen enthält (was beim Paraphrasieren leicht passieren kann).

Ich kann verstehen, wie das Missverständnis zustandekommt, aber der Begriff &quot;Plagiat&quot; ist schon wegen der systematischen Quellenangabe unangemessen. Sie haben lediglich nachvollzogen, wie das Verfahren funktioniert (und wie es auch beschrieben wurde, wir sind da ganz transparent). 

Ich kann Sie übrigens beruhigen: Wir arbeiten aktuell daran, das damalige extraktive Verfahren durch ein abstraktives zu ersetzen. Direkten Text-Reuse wird es damit nicht mehr geben.]]></description>
			<content:encoded><![CDATA[<p>Der Beitrag ist ja nun schon etwas älter, aber ich habe ihn gerade erst gesehen. </p>
<p>Leider beruht er auf einem Missverständnis darüber, was dieser Text ist und sein soll. Ehrlich gesagt wurde nie etwas anderes behauptet, als dass wir extraktive Textzusammenfassung und Paraphrasierung machen, das steht genau so im Vorwort. Der Beitrag ist auch keineswegs, originell zu schreiben (das ist <a target="_blank" rel="noopener noreferrer" href="https://openai.com/blog/better-language-models/" rel="nofollow ugc">sehr einfach</a>), sondern *verifizierbar* zusammenzufassen.</p>
<p>Tatsächlich ist die Extraktion (= &#8222;Textklau&#8220;) systembedingt bei 100% (!), und ist *immer* (für jeden einzelnen Satz) mit Quellenangabe gekennzeichnet (besagtes Paper wird wohl &#8222;[29]&#8220; sein), für den Fall, dass längere Phrasen wörtlich übereinstimmen, sogar als wörtliche Rede (wie oben &#8222;The stability &#8230;&#8220;). Dass da nur 41% Textübereinstimmung herauskommen, zeigt eigentlich, wie gut die Paraphrasierung funktioniert, denn 59% hält er für originell (ich gehe mal davon aus, dass Turnitin auf das komplette Springer-Archiv zugreift, das war die einzige Datenquelle). Was man übrigens auch in Ihrem Ausschnitt sieht, ist, dass die Sätze nicht absatzweise extrahiert wurden, sondern immer wieder von Beiträgen aus anderen Quellen unterbrochen werden. Ein wichtiger Beitrag des Verfahrens besteht denn auch in der Reorganisation vorhandener Information, in der Gewichtung, Auswahl und Kombination unterschiedlicher Quellen liegt der Mehrwert und das durch das Verfahren generierte neue Wissen.</p>
<p>Das ganze so nah an den Quellen zu halten war übrigens keine ganz freiwillige Entscheidung, sondern die Fachkollegen, die die Ergebnisse verschiedener Verfahren evaluiert haben, die wir entwickelt haben, haben sich letztlich für eines entschieden, dass sehr eng an der ursprünglichen Formulierung blieb. Die Herausforderung war, eine Abstraktionsebene zu finden, die einerseits originell genug war, um rechtssicher zu sein (wofür man diesen Text hält, das wurde geprüft), andererseits keine unverifizierten Informationen enthält (was beim Paraphrasieren leicht passieren kann).</p>
<p>Ich kann verstehen, wie das Missverständnis zustandekommt, aber der Begriff &#8222;Plagiat&#8220; ist schon wegen der systematischen Quellenangabe unangemessen. Sie haben lediglich nachvollzogen, wie das Verfahren funktioniert (und wie es auch beschrieben wurde, wir sind da ganz transparent). </p>
<p>Ich kann Sie übrigens beruhigen: Wir arbeiten aktuell daran, das damalige extraktive Verfahren durch ein abstraktives zu ersetzen. Direkten Text-Reuse wird es damit nicht mehr geben.</p>
]]></content:encoded>
		
			</item>
	</channel>
</rss>
