Co je to zastávky?
V počítačových a online aplikacích je A Stop Word slovo, které se filtruje během zpracování nějakého typu textu, například během zahájení vyhledávání online. Myšlenkou tohoto typu filtrování, známá jako jedna složka zpracování přirozeného jazyka nebo NLP, je pomoci urychlit vyhledávání vynecháním společných řečových článků z žádosti. Místo toho vyhledávač používá jednoduchý značka k zaznamenávání přítomnosti slova v textovém řetězci, ale nebrání přítomnosti této značky v zahrnutí této stránky do výsledků vyhledávání.
Jedním ze způsobů, jak pochopit, jak mohou slova zastavit, je zvážit skutečnost, že při provádění vyhledávání bude motor zvážit každé slovo, které je zahrnuto do žádosti o vyhledávání předložené uživatelem. V rámci této úvahy motor hledá stránky obsahující každé slovo. To znamená, že pokud žádost o vyhledávání obsahuje tři slova, motor dělá tři zametání internetu, eVentavě upřednostňují stránky, které obsahují všechna tři slova.
Například vyhledávání, jako je „dům na kopci“, by vyžadovalo, aby motor prohledal každé slovo v sekvenci, přičemž některé dokonce dvakrát probíhaly vyhledáváním na stop „The“. To vyžaduje čas a zdroje, které by mohly být odkloněny k pomoci při jiných vyhledáváních klíčových slov, které ostatní koncoví uživatelé v současné době provádějí. Použitím značek k nahrazení „the“ a „on“ může během vyhledávání motor věnovat méně zdrojů a stále vrátit výsledky, které je vysoce pravděpodobné, že koncového uživatele uspokojí.
Zatímco Stop Word je někdy označováno jako Poison Word , ve skutečnosti není nic zvlášť špatného zahrnout články řeči do textu používaného pro provádění vyhledávání. Použití slova nebo slov v rámci žádosti o vyhledávání může komplikovat proces indexování vyhledávače při ATTEMPTING k načtení dat, která splňují kritéria vyhledávání. Přesto koncový uživatel pravděpodobně nebude vidět velký rozdíl v extrakci informací, která se nakonec vrátí.
Neexistuje žádný těžký a rychlý seznam slov, který všeobecně používají všechny vyhledávače. Ve skutečnosti některé vyhledávače nepoužívají žádný typ seznamu Stop Word jako součást úkolu zpracování přirozeného jazyka. Jiné motory však budou zcela využívat seznam stop Word jako prostředek k přidělování zdrojů efektivnějším způsobem, přičemž stále vracejí výsledky vyhledávače, které jsou přesné a pravděpodobně budou velmi vhodné pro požadavky na vyhledávání předložené kdokoli pomocí konkrétního motoru.