Internet Introductie
2. Hoe werkt een website?

Het world wide web (www) laat toe om informatie op andere computers te lezen. Deze informatie staat op een webserver die geconnecteerd is met het internet.

Als je bijvoorbeeld http://student.vub.ac.be/~bertbibber/project/list.html opvraagt, gaat  je browser de url het internet insturen (1), deze request legt dan een lange weg af op zoek naar de webserver student.vub.ac.be (2). De webserver vraagt dan de file list.html op van de fileserver (3), deze file staat onder de persoonlijke directory van bert bibber (voor de VUB is dit in de directory public_html) en onder de subdirectory project.

Zo heet onze webserver parallel.vub.ac.be, als je http://parallel.vub.ac.be (http is het webprotocol) intikt in je browser, maakt die een connectie met onze server. Deze gaat dan in de folder (van het filesysteem) htdocs op zoek naar de file index.html, dit geeft de eerste pagina van onze website. De naam van de webfolder (hier: htdocs) en de startpagina (hier: index.html) wordt ingesteld op de webserver, dit kan ook public_html zijn. Als je de url http://parallel.vub.ac.be/education/pc/oefeningen.html intikt gaat de server op zoek naar de file examen.html in de subfolder education, pc van de webfolder htdocs, met http://parallel.vub.ac.be/education/pc/ krijg je de file index.html van die folder, enzovoorts...
Als lid van het lab parallelle systemen heb ik ook eigen schijfruimte op de fileserver parallel.vub.ac.be onder de naam jan, met http://parallel.vub.ac.be/~jan kom je in mijn folder my_htdocs en krijg je mijn startpagina index.html. Zo hebben ook alle VUB-studenten schijfruimte op de server student.vub.ac.be van het rekencentrum. Je mail wordt hier bewaard en hier kan je ook je eigen website zetten, onder de folder public_html, waarbij je je startpagina's welcome.html noemt (ipv. index.html) (Zie documentatie hierover).
Het meest gebruikte formaat om informatie op het web te zetten is html, hierover meer in de volgende tekst. Een webpagina komt dus overeen met een file op de webserver, wel worden prenten & beelden in aparte files gehouden. Zo moet een prent die meerdere malen voorkomt maar 1x gedownload worden en, interessant voor een trage internetverbinding, wordt eerst de tekst gedownload en getoond vooraleer daarna de beelden in te lassen.
Naast de statische html heb je ook andere formaten met meer mogelijkheden. Met flash voeg je animaties toe aan je website. Met javascript kan je een programmaatje draaien op de client-zijde waarmee je dan bijvoorbeeld interactieve webpagina maakt ($ voorbeeld). De file wordt van de server gedownload en op de client uitgevoerd. Andersom kan je met asp of cgi programma's draaien op de server en zo bijvoorbeeld dynamisch een pagina genereren ($ bijvoorbeeld search engine) of informatie die de gebruiker ingeeft opslaan in een database ($ bijvoorbeeld). Zo kan je ook een teller aan je website toevoegen, die het aantal bezoeken registreert (info).

Search engines zoals www.google.com dienen om informatie op te zoeken op het internet. Zij indexeren alle websites op trefwoorden, hiervoor scannen ze de informatie van de pagina's, maar ook de meta-informatie zoals titel, auteur, beschrijving en keywords van de pagina's (zie volgende tekst). Intussen is het internet al zo uitgebreid dat het een poos duurt vooraleer een engine alle nieuwe pagina's kan indexeren, na ongeveer een jaar kon je mijn pagina vinden met google.
$$ hoe hoog je komt op de lijst

www.vub.ac.be, www.yahoo.com zijn domeinnamen die je moet laten registreren en waarvoor je meestal abonnementsgeld betaald. Voor .be (staat voor belgie) is dit via www.dns.be. Elk land heeft zo zijn tweeletterige uitgang.
Mogelijke uitgangen:

  • .com    voor wereldwijde commerciele instellingen
  • .be   voor organisatie/instellingen/personen van belgie
  • .ac.be  voor academische instellingen van belgie
  • .org   staat voor organisatie
  • .net
  • .tk   staat voor het eilandje Tokelau, zij stellen hun domeinnamen gratis ter beschikking via www.dottk.tk. Op 5 minuten kan je een naam registreren, voor zover die nog niet bestaat. Je moet wel een reclamepopup toelaten en je moet elke 3 maanden minstens 90 bezoeken of hits bereiken. Zie www.uurrooster.tk , of www.exvragen.tk (beide gemaakt door Hans Ingelberts, 2e kan) . Hiervoor krijg je wel geen webruimte ter beschikking, maar geef je het adres waar je website echt staat, in dit geval op de lycos webserver. Verder laat ik mijn website op het rekencentrum (http://homepages.vub.ac.be/~jlemeire) automatisch doorsturen naar parallel via een scriptje (zie website kookboek).

  • MEER: streaming audio/video versus download


    Website Onderdelen