Tel trefwoorden in een internet pagina

Trefwoord teller

Om meer bezoekers te krijgen op web pagina is het belangrijk de pagina te optimaliseren zodat zoekrobots zoals Google de pagina gemakkelijk kunnen vinden. De beste manier om veel bezoekers te krijgen is paginas te maken waar veel informatie op staat van goede kwaliteit. In zo een geval bevat de pagina veel relevante trefwoorden (keywords) en als de pagina goed is zullen anderen vaak links naar de pagina plaatsen. Veel zoekrobots houden rekening met trefwoorden op een pagina en met het aantal verwijzingen (links) naar die pagina. Op deze pagina heb ik een PHP script dat helpt om trefwoorden op een web pagina te tellen (meer informatie beneden).

Web pagina URL:
Minimum aantal:

Trefwoorden (>= 2) in: http://www.minkukel.com/nl/index.htm

binaire bommel copyright decimale denkraam english klok kukel lezertjes liedjes lyrische marten minkukel mixer pluskukels search teller toonder trefwoord weet woorden ©

Internet paginas bevatten vaak honderden woorden. Sommige van deze woorden zijn erg algemeen en komen in bijna iedere tekst voor, maar een aantal woorden zijn altijd erg karakteristiek voor de inhoud van de pagina. Dit zijn de trefwoorden (zoekwoorden of "keywords") waar mensen naar zoeken als ze (bijvoorbeeld met Google) proberen een pagina te vinden. In een webpagina over auto's verwachten we woorden zoals "auto", "model", "motor" en "stuurbekrachtiging", maar in een tekst over regenwormen komen die woorden meestal niet voor.

Ik vind het vaak handig om in andere internet paginas naar trefwoorden te zoeken die relevant kunnen zijn voor mijn eigen paginas. Maar lezen en tellen kost veel tijd, dus ik was al snel op zoek naar een script of programma dat trefwoorden kan vinden en tellen en dat vervolgens een overzicht kan geven van de woorden die het vaakst voorkomen en dus belangrijker zijn voor die pagina.

In eerste instantie heb ik even op het internet gezocht en vond een paar toepassingen die dit kunnen doen, maar omdat ik iets wilde dat gratis en eenvoudig is besloot ik om zelf maar een script te maken om trefwoorden te vinden en tellen. Gelukkig hoefde ik niet het wiel helemaal opnieuw uit te vinden. Ik vond op internet een paar scripts die ik met wat aanpassingen kon gebruiken. Het idee is eenvoudig: in een formulier vul je de URL van een website in, het script leest de pagina, het haalt alle woorden uit de tekst, en het telt de frequentie van (bijna) alle woorden op de pagina. Uiteraard worden de erg algemene woorden zoals "de", "het", "een", "in", "voor" en "en" (die in vrijwel elke tekst voorkomen) genegeerd.

Om het script een beetje handiger te maken (want er zijn nu eenmaal korte en lange teksten) is er een optie voor de gebruiker om woorden die slechts weinig keren voorkomen eruit te filteren. Bijvoorbeeld als de gebruiker voor het "minimum aantal" 3 kiest zal het script alleen woorden laten zien die op zijn minst drie keer in de tekst voorkomen. Als 1 wordt gekozen als "minimum aantal" zal het script alle woorden in de tekst tonen (behalve de algemene woorden die genegeerd worden). Voor paginas met veel tekst is het vaak handig om het "minimum aantal" wat hoger te kiezen zodat je niet honderden woorden te zien krijgt.

Het script zou een frequentie tabel kunnen maken van al de woorden, maar ik vond het wel een leuk idee (niet mijn idee) om de meer frequente woorden in een groter lettertype te tonen. Je krijgt dan in een keer een visueel overzicht van alle woorden in de tekst en de belangrijkste trefwoorden springer eruit. Je kunt vervolgens met de cursor boven een woord bewegen om de frequentie van dat specifieke trefwoord te zien.

Hoe je die script kunt gebruiken? Tiep de URL van een website die je wil analyseren in de box. Gebruik de volledige naam, inclusief http:// aan het begin. Eventueel kun je eerst naar de betreffende pagina surfen en de URL kopieren. Daarna kies je een "minimum aantal" (om minder frequente woorden eruit te filteren) en vervolgens klik je op het "tel trefwoorden" knopje. Dan even wachten, vooral als het een grotere pagina betreft. Het script heeft uiteraard meer tijd nodig om woorden van een grote pagina te tellen. De default URL is de Nederlandse startpagina van "http://www.minkukel.com/nl/index.htm".

Oh ... en als je een niet bestaande URL invult krijg je een waarschuwing te zien van het PHP script. Geeft niet, gewoon de URL corrigeren en opnieuw proberen.

Woorden die genegeerd worden door het script

Hier is een alfabetische lijst van Nederlandse woorden die door het script genegeerd worden. het zijn algemene woorden die niet als trefwoord herkend worden. Als je nog meer van dit soort woorden tegenkomt, stuur me dan een berichtje.

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, a, aan, aantal, af, al, alle, alleen, allemaal, allen, alles, als, ander, andere, b, beetje, beide, beiden, ben, bent, beschikbaar, besloten, best, beste, beter, bijna, bijvoorbeeld, boven, c, correct, d, daar, daarom, dag, dan, dank, dat, de, deden, deed, deel, denk, denken, denkt, deze, dezelfde, die, ding, dit, doe, doen, doet, door, drie, dus, e, echt, echter, een, eens, eerst, eerste, eigen, eind, elk, elke, en, er, erg, ergens, erom, even, f, g, ga, gaan, gaat, gebruik, gebruiken, gebruikt, geef, geen, gemaakt, gemakkelijk, genoeg, getal, geven, gevonden, geweest, ging, gingen, gisteren, goed, goede, groot, grote, h, haar, hard, heb, hebben, heeft, heel, helemaal, hen, het, hier, hij, hoe, hoogst, hoogstwaarschijnlijk, hun, i, ieder, iedere, iedereen, iets, ik, in, indien, is, j, je, jij, jou, jouw, juist, jullie, k, kan, keek, kijk, kijken, klein, kleine, kleintje, kom, komt, kort, kreeg, krijg, krijgen, kunnen, kwam, kwamen, l, laatst, laatste, lang, leuk, leuke, links, m, maak, maakt, maakte, maar, maat, maken, me, meer, meest, meeste, men, menu, met, meteen, midden, mij, mijn, minder, minst, minste, misschien, moeilijk, moet, mooi, mooie, morgen, n, na, naam, naar, nadat, nam, namelijk, namen, nee, neem, neemt, nemen, niet, nieuw, nieuwe, nodig, nou, nu, nummer, o, of, ok, omdat, omdat, onder, onder, ongeveer, onjuist, ons, ons, onze, ook, op, origineel, oud, oude, over, p, per, plaats, problem, punt, q, r, rechts, resultaat, resultaten, rond, s, samen, sinds, slecht, slechter, slechts, slechtst, slechtste, smal, smalle, sommige, special, stil, t, tamelijk, te, terug, teveel, tijd, toch, top, tussen, twee, twist, u, uit, v, van, vandaag, veel, verscheidene, verschillend, verschillende, vind, vinden, voor, voorbeeld, voorbeelden, w, waar, waarom, waarschijnlijk, want, waren, wat, we, weg, weinig, wel, weten, wie, wij, wil, wisten, wit, x, y, z, zacht, zag, zagen, zal, zat, ze, zeker, zet, zetten, zich, zie, zien, ziet, zij, zijn, zit, zitten, zo, zoals, zodat, zou, zwart