Was ist ein Stoppwort?
In Computing- und Online -Anwendungen ist ein Stop Word ein Wort, das während der Verarbeitung einer Textart herausgefiltert wird, z. B. während der Online -Initiierung einer Suche. Die Idee hinter dieser Art der Filterung ist es, die Suchanfragen zu beschleunigen, indem sie gemeinsame Sprachartikel von der Anfrage weglassen. Stattdessen verwendet die Suchmaschine einen einfachen Marker, um das Vorhandensein des Wortes in der Textzeichenfolge zu bemerken, verhindern jedoch nicht, dass das Vorhandensein dieses Markers diese Seite in die Suchergebnisse einbezieht.
Eine Möglichkeit, zu verstehen, wie Stoppwörter die Funktion von Suchmaschinen komplizieren können, besteht darin, die Tatsache zu berücksichtigen, dass die Engine bei der Durchführung einer Suche jedes Wort berücksichtigt, das in der vom Benutzer eingereichten Suchanforderung enthalten ist. Im Rahmen dieser Überlegung sucht der Motor nach Seiten, die jedes Wort enthalten. Das heißt, wenn die Suchanforderung drei Wörter enthält, macht die Engine drei Sweeps des Internets, eVentuell Priorität für die Seiten, die alle drei Wörter enthalten.
Zum Beispiel würde eine Suche wie „Das Haus auf dem Hügel“ erfordern, dass die Engine in der Sequenz nach jedem Wort suchte, wobei einige sogar eine Suche auf dem Stoppwort „das“ zweimal ausführen. Dies nimmt Zeit und Ressourcen in Anspruch, die bei anderen Schlüsselwortsuche umgeleitet werden könnten, die andere Endbenutzer derzeit durchführen. Durch die Verwendung von Markierungen zum Ersetzen von „und“ und „Ein“ während der Suche kann die Engine weniger Ressourcen widmen und weiterhin Ergebnisse zurückgeben, die den Endbenutzer sehr wahrscheinlich erfüllen.
Während das Stop -Wort manchmal als Poison Word bezeichnet wird, ist es wirklich nichts Besonderes, dass Sprachartikel in den Text einbezogen werden, um Suchvorgänge durchzuführen. Die Verwendung eines Stoppworts oder Wörter als Teil der Suchanforderung kann den Prozess der Suchmaschinenindizierung bei ATTE komplizierenErlisten, Daten abzurufen, die den Suchkriterien entsprechen. Dennoch ist der Endbenutzer wahrscheinlich keinen großen Unterschied in der Informationsextraktion, die letztendlich zurückgegeben wird.
Es gibt keine harte und schnelle Stopp -Word -Auflistung, die allgemein von allen Suchmaschinen verwendet wird. In der Tat verwenden einige Suchmaschinen überhaupt keine Art von Stopp -Wortliste als Teil der Aufgabe der natürlichen Sprachverarbeitung. Andere Motoren nutzen jedoch die Stop -Word -Liste ausreichend als Mittel zur effizienteren Zuweisung von Ressourcen, während die Suchmaschinenergebnisse, die korrekt sind und wahrscheinlich für Suchanfragen von Personen, die eine bestimmte Engine verwenden, eingereicht werden, sehr geeignet sind.