Hoe kies ik de beste open source zoekmachine?
Het kiezen van een open source-zoekmachine voor een website kan moeilijk zijn, deels omdat - aan de buitenkant - ze allemaal relevante resultaten weergeven op basis van een zoekterm, dus ze lijken allemaal op elkaar. Het hebben van een incrementele index, waarmee nieuwe lijsten dynamisch kunnen worden geïndexeerd, voorkomt dat beheerders de hele index opnieuw genereren. Stopwoorden, vooral voor grote websites, zijn krachtige hulpmiddelen voor een open source-zoekmachine, omdat gebruikers hiermee de resultaten kunnen beperken. Een fuzzy-zoekfunctie betekent dat de zoekmachine vergelijkbare resultaten kan vinden op basis van het trefwoord, hoewel de resultaten niet exact overeenkomen met het trefwoord. Classificatiesystemen bepalen hoe elke aanbieding wordt weergegeven en moeten weerspiegelen hoe de hoofdwebsite werkt.
Wanneer een open source-zoekmachine wordt gebruikt, wordt een index geladen met alle verschillende vermeldingen en websites die kunnen worden doorzocht via de zoekmachine. Hoewel deze lijst normaal gesproken lang is, wordt deze meestal langer naarmate de website wordt gebruikt. Wanneer de index moet groeien, moet de beheerder normaal gesproken de hele index opnieuw genereren en alle nieuwe websites en vermeldingen toevoegen. dit kost tijd en veel middelen. Met een incrementele index worden nieuwe lijsten dynamisch toegevoegd en is er geen reden om de gehele index opnieuw te genereren; de beheerder hoeft alleen de nieuwe informatie toe te voegen.
Als iemand een zoekterm in de open source-zoekmachine typt, krijgt hij of zij vaak relevante resultaten. Dit is niet altijd het geval en de resultaten kunnen een neiging hebben tot irrelevante informatie. Als de gebruiker bijvoorbeeld naar piraten zoekt, vindt hij of zij alleen websites over piratenfilms en geen historische informatie over piraten. Een stopwoord stelt de gebruiker in staat om een "-" te plaatsen voor een woord, wat de zoekmachine vertelt om resultaten met dat trefwoord te blokkeren.
Een fuzzy-zoekfunctie klinkt slecht, maar het is een handig hulpmiddel dat door veel open source-programma's wordt gebruikt. Zonder dit kan de zoekmachine alleen zoeken naar websites en lijsten die direct het trefwoord weergeven. Een fuzzy-zoekopdracht levert vergelijkbare resultaten op als het trefwoord, zodat de gebruiker bredere resultaten ontvangt.
Het open source ranking systeem is hoe de zoekmachine de relevantie bepaalt. Sommige zoekmachines baseren relevantie op het aantal keren dat een trefwoord is gebruikt, bij het maken van de aanbieding of website, het aantal links dat naar die ene website verwijst, of andere willekeurige waarden. De beheerder moet een zoekmachine kiezen die weerspiegelt hoe de website zelf werkt. Als de hoofdwebsite bijvoorbeeld gebruikers toestaat vermeldingen te plaatsen, werkt een op datum gebaseerde zoekmachine meestal het beste.