Le retaitement de texte est une des actions les plus récurrentes en SEO, j'ai préparé ici un outil avec un bon nombre de traitements possibles ce que j'ai appelé des recettes :
Suppression
- Suppression des mots creux (stop words : le, la, est, et, ou...)
- Déduplication
- Suppression du / en fin d'URL
- Nettoyage du texte
Extraction
- Extraction des URL
- Extraction des domaines
- Extraction des slugs
- Extraction de la dernière partie du slug
- Extraction des paramètres d'URL
Modification
- Rechercher et remplacer
- Inverser l'ordre des mots
- Formater un texte en slug
- Extraire les n-grams
- Combiner des listes
- Mélanger des listes
- Changer les espaces en sauts de ligne
- Trier les lignes
- Encoder ou décoder un URL
- Compter le nombre d'occurence
- Enlever le HTML
Discussions