Qu'est-ce qu'une URL ?
Une URL, ou Uniform Resource Locator, est l'adresse utilisée pour accéder à des ressources sur internet, comme des sites web, des images ou des vidéos. Elle sert de moyen pour accéder à ces ressources via le réseau internet. Une URL contient les informations nécessaires qui indiquent au navigateur ou à l'application la manière de récupérer la ressource souhaitée.
Les URL constituent le fondement technique de l'internet tel qu'on le connaît aujourd'hui. Lorsque l'on connecte deux URL entres elles on créé un lien. L'invention de ces liens (hypertexte pour les intimes) est l'idée deTim Berners-Lee que certains surnomment "le père d'internet".
Ces liens tissent une toile d'où internet tire son nom (le web), ils sont aussi à l'origine du succès de Google Search qui a été le premier à intégrer cette information dans son algorithme via le désormais célèbre, le PageRank.
Pourquoi les URL sont importantes pour le SEO ?
Les URL sont à votre SEO ce que votre carte d'identité est à votre personne. :
- elles identifient votre contenu : il existe une et une seule URL pour chaque contenu présent sur internet
- elles authentifie ce contenu : vous êtes le propriétaire du domaine, par voie de conséquence ce contenu est le vôtre (sauf dans le cas d'un hack ou d'un cas de typosquatting)
=> TODO : typosquatting
=> TODO : hacking
Ces deux qualités sont appréciées des moteurs de recherche et plus particulièrement des crawlers.
Il faut bien comprendre que chaque URL est unique, donc une URL ou un paramètre c'est une page de plus à crawler pour les moteurs de recherche.
=> TODO : trailing slash
=> TODO : www vs domaine nu
Cette opération étant coûteuse pour les crawlers une recommandation courante en SEO consiste à ne pas créer plus d'URL que de pages utiles. On appelle ça le budget de crawl.
Pour se faire il faut pour chaque URL créée :
- S'assurer que son contenu est utile
- Qu'elle n'a pas de page en doublon
- Qu'elle ne fait pas concurrence à une autre page sur le même sujet
=> TODO : duplication
Le cycle de vie d'une URL
Une URL ça vit dans le temps :
- une modification dans le backoffice
- une erreur humaine
- un bug
- un produit qui n'est plus disponible
- un script qui modifie les pages
- etc...
Par conséquent il est possible qu'une URL à un instant T n'existe plus à un instant T+1. Dans ce cas les serveur vont (sauf exception) retourner des codes de réponses spécifiques pour indiquer des changements : ce sont les fameuses 404 ou 301.
✨ En savoir plus : les codes de réponse HTTP
C'est quoi une bonne URL ?
Les composants d'une URL
- Schéma (ou protocole) : il indique la méthode utilisée pour accéder à une ressource. Les exemples courants incluent 'http', 'https', 'ftp', etc. Le schéma est suivi de ://
- Le HTTP n'est pas encrypté, les informations circulent donc librement sur le réseau et quelqu'un de mal intentionné peut facilement les consulter
- A contrario le HTTPS est lui encrypté et sécurisé. Reconnaissable à sont verrou 🔒 vert, aujourd'hui une vaste majorité d'internet utilise se protocole.
- Sous-domaine : C'est une extension du domaine principal. Il est facultatif et précède souvent le domaine principal pour spécifier différentes sections ou services d'un site web. Exemple : "blog" dans "blog.exemple.com"
- On parle domaine nu lorsque qu'il n'y a pas de sous domaine, il est tout à fait possible d'accéder à une URL sans sous-domaine.
- On peut ajouter autant de sous-domaine que l'on veut, ainsi 2024.blog.baptiste-wallerich.fr est un nom de domaine tout à fait valide
- Domaine : identifie de façon unique le site web. Il est suivi d'une extension de domaine qui peut indiquer la nature ou l'origine géographique de la ressource, comme .com pour commercial, .org pour organisation, .fr pour la France...
- Les extensions génériques sont regroupée sous le terme gTLD pour Generic Top Level Domains
- Les extensions de pays sont regroupée sous le terme ccTLD pour Country Code Top Level Domains
- Chemin d'accès : Après le domaine, le chemin indique l'emplacement spécifique de la ressource sur le serveur. Il est souvent structuré comme une hiérarchie de dossiers séparés par des barres obliques '/'.
- Paramètres de requête : ils commencent toujours par un point d'interrogation '?' et sont souvent utilisés pour spécifier des options ou des filtres. Ils sont constitués de paires clé-valeur séparées par des signes égal =. Chaque paire est séparée par un signe &.
- Fragment (parfois appelé ancre) : facultative et précédée d'un dièse #, l'ancre fait référence à une section spécifique d'une URL.
✨ En savoir plus : les noms de domaines
👀 Remarque : d'un point de vue purement technique le chemin d'accès (4) et les paramètres de la requête (5) sont identiques : on les regroupe souvent sous le terme "slug"
Exemple d'une URL décomposée

Discussions