Le Web (World Wide Web, « toile d’araignée » créé en 1989 par Tim
Berners-Lee) est un réseau mondial de serveurs de documents divers
(textes, images, vidéos, sons, etc.) accessibles principalement par des navigateurs
Web (clients). Les documents sont repérés par des adresses appelées
URL. Ils peuvent contenir des liens vers d’autres documents
(système hypertexte).
Structure d'une URL:
- Le Web s’appuie sur le réseau Internet. Clients (navigateurs web) et serveurs
(serveurs web) communiquent par le protocole HTTP ou sa version sécurisée
HTTPS : le client envoie une requête HTTP au serveur avec l’adresse URL
souhaitée ; le serveur lui envoie une réponse avec le document demandé ou un message
d’erreur.
- Une page Web est un type de document qui décrit à la fois le contenu d’un document et
sa mise en pages. Les pages Web utilisent le langage de balises HTML
(Hypertext Markup Language) pour le fond et le langage CSS pour le
forme (Cascading Style Sheet).
Le Web contient des milliards de pages et il est constitué de millions de sites. Pour
pouvoir trouver de l’information dans cette masse de données, les
moteurs de recherche parcourent le Web pour créer un
index à partir des contenus.
L’index permet de répondre aux requêtes des utilisateurs:
le moteur recherchera dans son index toutes les pages qui contiennent les mots
de la requête.
Le moteur de recherche classera ensuite les réponses par ordre de
pertinence (grace à un algorithme de
classement utilisant l'importance des mots dans chaque page, la
popularité des pages, le profil de l’utilisateur...)
L’accès à la plupart des sites Web est gratuit. Pour financer les coûts d’hébergement,
mais aussi de production des contenus, beaucoup de sites font appel à la
publicité. Afin que les annonceurs puissent cibler ces publicités en
fonction du profil de l’utilisateur, les sites Web sont amenés à collecter des
données personnelles.
Certaines données personnelles sont fournies volontairement par l’utilisateur (par
exemple, lorsqu’il crée un compte sur un site Web), mais la plupart sont
collectées à son insu. Le système le plus courant est le cookie,
qui permet de repérer les pages visitées par un même utilisateur, d’une page à
l’autre et d’un site à l’autre. Grâce au RGPD et aux options des
navigateurs, il est possible de réduire ce traçage en réglant les paramètres
de sécurité.
Tout le monde peut mettre des contenus (vidéos, textes, images,...) sur le Web. Et si
l’on souhaite utiliser un contenu dont on n’est pas l’auteur, il faut respecter les
droits de celui qui l’a créé. En général, cela nécessite son
autorisation, à moins que le contenu ne soit dans le domaine public.
Si l’on veut autoriser la republication d’un contenu dont on est l’auteur, on peut
utiliser une licence. La licence Creative Commons est souvent
utilisée sur le Web. Elle permet de spécifier, par exemple, que toute republication
doit inclure la mention explicite de l’auteur.