Inhoud

De werking van zoekmachines

Het internet, of beter gezegd, het World Wide Web, bestaat uit miljarden pagina's. Zonder zoekmachine zou het vrijwel onmogelijk zijn om impulsief informatie op internet te zoeken. Je zou afhankelijk zijn van domeinnamen die je op de reclame hoort of je zou domeinnamen moeten gokken en hopen dat je op een nuttige site komt. Zoekmachines helpen ons te vinden wat we zoeken, of eigenlijk, wat de zoekmachinedenktdat we zoeken.

In dit artikel ga ik in op dewerkingvanzoekmachines. Als je het over een zoekmachine hebt heb je het meestal over een zoekmachine die webpagina's zoekt op het World Wide Web. Dat is niet het enige type zoekmachine. In dit artikel beperk ik me echter tot dewerking van zoekmachinesdie webpagina's zoeken. De basale taken die een WWW zoekmachine uitvoert om zichzelf zoekmachine te mogen noemen zijn eigenlijk vrij eenvoudig en altijd hetzelfde.

  • Zoekmachinesonthouden informatieover een hele hoop pagina's. Welke informatie dat allemaal kan zijn kom ik later uitgebreid op terug. Dat 'onthouden' van informatie gaat met behulp van een database. Een database is een verzameling van gerelateerde tabellen waar je volledig automatisch informatie (onder andere) in op kunt slaan en uit kunt halen. Een zoekmachine heeft een grote database waar informatie in staat over alle webpagina's die zijn aangeleverd, dit deel van de zoekmachine wordt ook wel de 'index' genoemd.
  • Zoekmachineskrijgen informatie over webpagina's aangeleverddoor 'spiders'. Spiders zijn programma's die het web afstruinen op zoek naar webpagina's om te indexeren (in de index te stoppen). Ze volgen links op interessante pagina's en verspreiden zich zo over het web. Dit proces heet 'web crawling'. Een spider bezoekt nieuwe pagina's, maar ook bestaande. Zo groeit de index constant en blijven reeds ge├»ndexeerde pagina's actueel.
  • Niet onbelangrijk:in een zoekmachine moet je kunnen zoeken. Zoekmachines voor het web hebben daarvoor een zoekpagina. Bijvoorbeeld google.nl, of ilse.nl. De zoekwoorden die de bezoeker invoert worden door de zoekmachine vergeleken met de informatie in de index. Zijn er pagina's die qua onderwerp overeenkomen met de opgegeven zoekwoorden, dan worden ze weergegeven in volgorde van relevantie. Over deze relevantie is een hoop te doen. Het is natuurlijk heel interessant om te weten hoe je je pagina's relevant maakt voor een bepaald onderwerp. Dit betekent namelijk een hoge positie in de zoekresultaten en daar kun je geld mee verdienen, of eeuwige roem natuurlijk.

De werking van zoekmachines laat zich wel globaal beschrijven en het is heel goed mogelijk om met je kennis van de werking van een zoekmachine pagina's hoog te laten eindigen in de zoekresultaten. Een deel van de werking van een zoekmachine blijft echter altijd verborgen en daarom is het soms gokken of een bepaalde pagina's het goed zullen doen in een zoekmachine. In de volgende pagina's ga ik in op wat ik voor de leuk even 'het zoekmachineproces' noem: de werking van zoekmachines van het maken van een pagina tot het gevonden worden van die pagina in de zoekmachine.