Login
Anmelden
Shop

So erkennt PlagAware Kopien und Plagiate Ihrer Webseite

Das Wichtigste im Überblick

Funktionsweise PlagAware fahndet nach Webseiten, die Teile Ihres Contents wortgleich vewenden. Dazu werden Wortgruppen Ihrer Webseite ("Phrasen") gezielt gesucht und die Ergebnisse detailliert ausgewertet. Webseiten, die als verdächtig eingestuft werden, werden Ihnen farbig markiert im Benutzerbereich angezeigt.


So werden Ihnen potenzielle Plagiate angezeigt
So können Sie abschätzen, wie viele Plagiate voraussichtlich erkannt werden

Ein Blick hinter die Kulissen von PlagAware

Information Die Algorithmen von PlagAware wurden über einen langen Zeitraum entwickelt, getestet und optimiert, um zu der Leistungsfähigkeit zu gelangen, die Ihnen heute zur Verfügung steht. Bitte haben Sie deshalb Verständnis dafür, dass wir an dieser Stelle lediglich einen groben Überblick über die Wirkungsweise unserer Algorithmen geben können.

Auswahl einer Suchphrase aus Ihrem angegebenen Content

In einem ersten Schritt wird eine quasi-zufällige Phrase aus Ihren Inhalten innerhalb der PlagAware-Tags ausgewählt. Dabei versucht PlagAware, einen möglichst "typischen" Ausschnitt Ihrer Webseite zu wählen. Dieser ist beispielsweise gekennzeichnet durch "relevante" Begriffe, eine geringe Dichte von HTML-Tags und weiteren Eigenschaften.

Suche nach den ausgewählten Phrasen

Auf der Basis der ausgewählten Suchphrasen werden mögliche "Kandidaten" potenzieller Plagiate Ihrer Website identifiziert. In den meisten Fällen sind diese "Kandidaten" absolut harmlos, verwenden also keine Auzüge Ihres überwachten Contents. Deshalb erfolgt ein weiterer Schritt, der die gefundenen Websites genauer analysiert.

Auslesen und Auswerten der gefundenen Webseiten

Die Liste der potenziellen Kopien und Plagiate Ihrer Webseite und Inhalte werden nun einzeln automatisiert gelesen und in ein einheitliches Format gewandelt. Dabei werden beispielsweise HTML- und Javascript-Tags entfernt. Unsere Algorithmen vergleichen anschließend Wort für Wort zwischen Ihrer Webseite und dem potenziellen Plagiat. Dabei wird eine Klassifizierung der möglichen Kopie in Matching Words (MW) und Matching Phrases (MP) wie folgt vorgenommen:

Begriff Bedeutung
Matching Words (MW) Anzahl der übereinstimmenden Worte. Es werden dabei jedoch nur Worte berücksichtigt, die in einer "Matching Phrase" (siehe unten) liegen.
Matching Phrases (MP) Anzahl der übereinstimmenden Phrasen. Unter einer Phrase wird eine Aneinandereihung von Wörtern verstanden. Satz- und Sonderzeichen werden dabei nicht brücksichtigt.

Aufbereiten von Plagiaten und Kopien

Wird mit dem MW-Wert ein Schwellwert von ca. 20 Worten erreicht, wird die Seite als potenzielles Plagiat nzw. als potenzielle Kopie eingestuft. Der Content der Seite wird zusammen mit dem Inhalt der überwachten Seite in einer Datenbank gespeichert, die Übereinstimmungen werden zum besseren Vergleich farblich hervorgehoben.

Copyright (c) 2010 by sitelift internet services
Letzte Änderung: 24.10.14
Partnerseiten: Plagiarism Assessment | Webkatalog | Artikelverzeichnis | Babykleidung | Finanzierung | Kindergeld
DB: 1, Session: 0, Session A: 4, Session B: 0, Page: 0, PageStats: 1, Page: 0, PreHeader: 0, Header: 0, Left: 0, Content: 0, PageStats: 0, Right: 9, Footer: 1, Total: 16