Co je stop slovo?

V počítačích a online aplikacích je zastavovací slovo slovo, které je odfiltrováno během zpracování určitého typu textu, například při zahájení online vyhledávání. Myšlenka tohoto typu filtrování, známá jako jedna součást zpracování přirozeného jazyka nebo NLP, je pomoci urychlit vyhledávání vynecháním běžných řečových článků z požadavku. Vyhledávací stroj místo toho používá jednoduchou značku k zaznamenání přítomnosti slova v textovém řetězci, ale nebrání přítomnosti této značky v zahrnutí dané stránky do výsledků vyhledávání.

Jedním ze způsobů, jak porozumět tomu, jak mohou stopová slova zkomplikovat funkci vyhledávačů, je vzít v úvahu skutečnost, že při provádění vyhledávání vezme motor v úvahu každé slovo, které je zahrnuto v žádosti o vyhledávání předložené uživatelem. V rámci této úvahy vyhledá motor stránky obsahující každé slovo. To znamená, že pokud požadavek na vyhledávání obsahuje tři slova, provede stroj tři rozmítání Internetu, případně upřednostní stránky, které obsahují všechna tři slova.

Například vyhledávání, jako je „dům na kopci“, by vyžadovalo, aby motor provedl vyhledávání v každém slově v sekvenci, přičemž někteří dokonce provedou vyhledávání v zastavovacím slově „the“ dvakrát. To zabírá čas a prostředky, které by mohly být přesměrovány na pomoc při jiných vyhledáváních klíčových slov, která v současné době provádějí ostatní koncoví uživatelé. Použitím značek, které nahradí „a“ během vyhledávání, může motor věnovat méně zdrojů a stále vracet výsledky, které s vysokou pravděpodobností uspokojí koncového uživatele.

Zatímco slovo stop je někdy označováno jako jedovaté slovo , není nic zvláštního špatného na zahrnutí článků řeči do textu použitého pro vyhledávání. Použití zastavovacího slova nebo slov jako součásti požadavku vyhledávání může komplikovat proces indexování vyhledávače při pokusu o načtení dat, která splňují vyhledávací kritéria. Koncový uživatel však pravděpodobně neuvidí velký rozdíl v extrakci informací, která je nakonec vrácena.

Neexistuje žádný pevný a rychlý seznam stop slov, který je všeobecně používán všemi vyhledávači. Ve skutečnosti některé vyhledávače vůbec nepoužívají seznam zastavovacích slov jako součást úkolu zpracování přirozeného jazyka. Jiné motory však budou hojně využívat seznam zastavených slov jako prostředek k efektivnějšímu přidělování zdrojů, přičemž budou stále vracet výsledky vyhledávače, které jsou přesné a pravděpodobně budou vysoce vhodné pro žádosti o vyhledávání předložené kýmkoli, kdo používá konkrétní motor.

JINÉ JAZYKY

Pomohl vám tento článek? Děkuji za zpětnou vazbu Děkuji za zpětnou vazbu

Jak můžeme pomoci? Jak můžeme pomoci?