Home Internet De evolutie van “Search”

De evolutie van “Search”

108

Iedereen is bekend met het zoeken naar informatie op het internet via Google.com. Generaliseren is meestal niet goed, maar deze stelling durf ik wel te doen (zeer jonge kinderen en zeer oudepersonen daargelaten). We worden ook dagelijks geconfronteerd met zoekfuncties wanneer we aankopen willen doen op commerciële sites zoals Amazon, Bol.com, Wehkamp.nl, etc.
Zoeken zit diep in ons wezen. Iedereen zoekt iedere dag wel naar iets. Zelfs onze pre-historische voorouders zochten iedere dag… naar eten.

Er zijn verschillende redenen waarom wij zoeken. Meestal ben je op zoek naar iets specifieks en weet je dat het ergens moet liggen, zoals wanneer je op zoek bent naar je autosleutels. Een andere keer ben je op zoek naar iets, maar weet je niet precies wat, zoals bij het zoeken naar een geschikt kledingstuk. Je neust dan wat door de rekken totdat je hebt gevonden wat je zocht. Een andere manier van zoeken is, als je iets nog niet weet, maar waarvan je wel iets wilt weten, zoals de feiten van een historische gebeurtenis, een geboortedag van iemand of een bepaald onderwerp zoals een vakantieland. Het kan echter ook voorkomen dat we zoeken naar informatie over een bepaald onderwerp en daarbij worden gewezen op verbanden of gerelateerde onderwerpen waarvan we niet eens wisten dat er een relatie bestaat.
Zoeken naar informatie waarbij we worden ondersteund door technologische hulpmiddelen, zien we sinds het “digitale tijdperk” steeds veranderen en beter worden.

In dit artikel wil ik jullie meenemen in de evolutie van deze digitale hulpmiddelen en dan met name de gebruikersgerichte oplossingen die wij in ons dagelijks werk tegenkomen.

Fase 1a: zoeken binnen “velden”
Nog niet zolang geleden was dit de manier waarop je naar bestanden kon zoeken. De zoekopdracht werd beperkt tot één veld, hier de bestandsnaam, en één informatiesysteem of bron.

Zoeken binnen velden

In andere applicaties zoals bibliotheeksystemen was deze manier van zoeken ook gemeengoed. De medewerker kon zoeken binnen één veld tegelijk, bijvoorbeeld de titel van een document of record. Sorteren of op de een of andere manier filteren van de resultaten was niet mogelijk. Je moest van tevoren weten welke woorden in de verschillende velden werden gebruikt om een document of bestand terug te vinden. Alleen specialisten of mensen die de “content” kenden waren zo in staat om informatie te vinden.

Fase 1b: full-text search over meerdere velden
De volgende fase bestond uit de mogelijkheid om “full-text” (volledige teksten worden doorzocht op het voorkomen van de termen in de zoekvraag) te zoeken. In deze oplossing werden alle velden die aan een document of bestand zijn gekoppeld (metadata) doorzocht. Ook hier gold weer de beperking dat ieder informatiesysteem apart moest worden doorzocht.

Full text search over meerdere velden

In het voorbeeld is binnen een bepaald systeem gezocht naar de term “Brookline”. In bepaalde resultaten is deze term ook terug te zien, zoals in de titel of in de beschrijving. De gegevens van de resultaten die werden gepresenteerd stonden vast. Omdat de zoekopdracht over alle velden van de documenten ging, ontstond de situatie dat de velden die voor de zoekresultaten werden gepresenteerd deze zoektermen niet hoefden te bevatten. Dit maakt het voor de gebruiker zeer lastig om te bepalen waarom een bepaald resultaat wordt getoond.

Fase 1c: full-text search over meerdere bronnen
De tijd van de grote internet zoekmachines brak aan. Altavista, Hotbot, Yahoo en… Google. Voor het eerst konden mensen met één zoekopdracht over verschillende bronnen (lees: websites) zoeken.
De Enterprise Search markt (zoeken in de informatie binnen organisaties) werd in die tijd gedomineerd door Verity, Autonomy en Endeca. Die producten konden al vanaf 1996 zoeken over verschillende bronnen in organisaties.

Full text search over meerdere bronnen

De resultaten van alle gevonden documenten van alle bronnen werden in één resultaatlijst gepresenteerd. Het probleem eerder van het niet altijd kunnen tonen van de overeenkomst tussen de zoekopdracht en de gevonden documenten werd opgelost door de zogenaamde “contextuele samenvatting”. De zoekmachine maakt een samenvatting van het deel van de tekst in het document dat de zoekwoorden bevat.
Deze techniek is zeer belangrijk: het geeft de zoeker een directe terugkoppeling van de relevantie. De tekst rondom de zoekwoorden geeft een terugkoppeling en de mogelijkheid om de zoekvraag aan te passen, omdat je direct kan zien in welke context je zoekwoorden voorkomen.

Een resultatenlijst zonder de mogelijkheid om “in te zoomen” op bepaalde specifieke resultaten gaat echter ook maar zover. Wat nou als je wilt zoeken op alleen afbeeldingen, of een bepaald soort website. Naar mate de hoeveelheid doorzochte informatie toenam, stuitte dit al snel op beperkingen. Om te kunnen vinden wat je zoekt zijn meer mogelijkheden nodig.

PS. In een volgende post ga ik in op de specifieke eisen aan en kenmerken en verschijningsvormen van “enterprise search”.

Edwin Stauthamer is gespecialiseerd in het onderwerp “Enterprise Search” en werkt voor InfoKnowlegde.

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in