Q: Quand devrais-je utiliser une regex plutôt que des méthodes de chaîne simples ?

Pour des recherches simples de chaînes fixes, String.prototype.includes() ou indexOf() est plus rapide et plus lisible qu'une regex. Recourez à une regex lorsque vous avez besoin de correspondance de motifs (par exemple, « commence par un chiffre »), d'alternance (correspondre à 'cat' ou 'dog'), de classes de caractères (correspondre à n'importe quelle voyelle), de quantificateurs (correspondre à un ou plusieurs chiffres) ou de groupes de capture pour extraire des sous-correspondances. La regex excelle dans les tâches de validation, d'extraction et de transformation où le motif cible a une structure qui ne peut pas s'exprimer par une seule chaîne littérale.

Q: En quoi la regex JavaScript diffère-t-elle de PCRE (Python, PHP, Perl) ?

La variante de regex de JavaScript est similaire à PCRE mais présente quelques différences notables. JavaScript ne prend pas en charge les groupes atomiques, les quantificateurs possessifs ni les motifs récursifs. L'assertion \K (keep) disponible dans PCRE est absente de JavaScript. Les groupes de capture nommés utilisent la syntaxe (? ...) en JavaScript, contre (?P ...) en Python. Le drapeau global (g) en JavaScript affecte la propriété à état lastIndex de l'objet RegExp, ce qui peut provoquer des bugs subtils lors de la réutilisation d'un objet regex dans une boucle.

Q: Quels sont les drapeaux disponibles et que font-ils ?

Les principaux drapeaux de regex JavaScript sont : g (global), trouver toutes les correspondances au lieu de s'arrêter à la première ; i (insensible à la casse), traiter les majuscules et les minuscules comme équivalentes ; m (multiligne), faire correspondre ^ et $ aux limites de ligne plutôt qu'aux limites de chaîne ; s (dotAll), faire correspondre le point (.) aux sauts de ligne ; u (Unicode), activer la correspondance Unicode complète et les échappements de point de code ; et d (indices), inclure les indices de début et de fin de chaque correspondance et groupe de capture dans le résultat.

Q: Y a-t-il une limite de longueur pour la chaîne de test ou le motif ?

Aucune limite stricte n'est imposée par l'outil, mais des motifs très longs ou des chaînes de test très volumineuses peuvent rendre le navigateur peu réactif, surtout si le motif comporte des quantificateurs imbriqués susceptibles de déclencher un retour sur trace catastrophique. Les motifs à retour sur trace non borné sur de grandes entrées peuvent consommer le CPU indéfiniment. Si l'onglet du navigateur se fige, fermez-le et rouvrez-le. Pour un usage en production, testez toujours les motifs de regex contre des entrées adverses avant de les déployer.

Q: Puis-je l'utiliser pour tester un motif de remplacement ?

Oui. Saisissez une chaîne de remplacement dans le champ de remplacement et l'outil affiche un aperçu en direct de la sortie après application de String.prototype.replace (pour la première correspondance) ou replaceAll (avec le drapeau g). La syntaxe de remplacement standard est prise en charge : $1 et $2 pour les groupes de capture numérotés, $ pour les groupes de capture nommés, $& pour toute la chaîne correspondante, $` pour le texte avant la correspondance et $' pour le texte après la correspondance.

Question 1

Ma saisie est-elle envoyée à un serveur ?

Accepted Answer

Non. L'expression régulière est évaluée entièrement dans votre navigateur à l'aide du moteur natif RegExp de JavaScript. Votre motif, votre chaîne de test et tout modèle de remplacement ne quittent jamais votre appareil et ne sont jamais transmis sur le réseau.

Question 2

Quelle variante de regex cet outil utilise-t-il ?

Accepted Answer

Cet outil utilise le moteur de regex JavaScript (ECMAScript) via le constructeur natif RegExp. Il prend en charge toutes les fonctionnalités standard d'ES2024, y compris les groupes de capture nommés (?<name>...), les assertions arrière lookbehind ((?<=...) et (?<!...)), le drapeau dotAll (s), le drapeau Unicode (u), le drapeau d'indices (d) et le drapeau v récemment ajouté pour la notation d'ensembles Unicode. Il ne prend pas en charge les fonctionnalités propres à PCRE comme les motifs récursifs ou les quantificateurs possessifs.

Question 3

Quand devrais-je utiliser une regex plutôt que des méthodes de chaîne simples ?

Accepted Answer

Pour des recherches simples de chaînes fixes, String.prototype.includes() ou indexOf() est plus rapide et plus lisible qu'une regex. Recourez à une regex lorsque vous avez besoin de correspondance de motifs (par exemple, « commence par un chiffre »), d'alternance (correspondre à 'cat' ou 'dog'), de classes de caractères (correspondre à n'importe quelle voyelle), de quantificateurs (correspondre à un ou plusieurs chiffres) ou de groupes de capture pour extraire des sous-correspondances. La regex excelle dans les tâches de validation, d'extraction et de transformation où le motif cible a une structure qui ne peut pas s'exprimer par une seule chaîne littérale.

Question 4

En quoi la regex JavaScript diffère-t-elle de PCRE (Python, PHP, Perl) ?

Accepted Answer

La variante de regex de JavaScript est similaire à PCRE mais présente quelques différences notables. JavaScript ne prend pas en charge les groupes atomiques, les quantificateurs possessifs ni les motifs récursifs. L'assertion \K (keep) disponible dans PCRE est absente de JavaScript. Les groupes de capture nommés utilisent la syntaxe (?...) en JavaScript, contre (?P...) en Python. Le drapeau global (g) en JavaScript affecte la propriété à état lastIndex de l'objet RegExp, ce qui peut provoquer des bugs subtils lors de la réutilisation d'un objet regex dans une boucle.

Question 5

Quels sont les drapeaux disponibles et que font-ils ?

Accepted Answer

Les principaux drapeaux de regex JavaScript sont : g (global), trouver toutes les correspondances au lieu de s'arrêter à la première ; i (insensible à la casse), traiter les majuscules et les minuscules comme équivalentes ; m (multiligne), faire correspondre ^ et $ aux limites de ligne plutôt qu'aux limites de chaîne ; s (dotAll), faire correspondre le point (.) aux sauts de ligne ; u (Unicode), activer la correspondance Unicode complète et les échappements de point de code ; et d (indices), inclure les indices de début et de fin de chaque correspondance et groupe de capture dans le résultat.

Question 6

Y a-t-il une limite de longueur pour la chaîne de test ou le motif ?

Accepted Answer

Aucune limite stricte n'est imposée par l'outil, mais des motifs très longs ou des chaînes de test très volumineuses peuvent rendre le navigateur peu réactif, surtout si le motif comporte des quantificateurs imbriqués susceptibles de déclencher un retour sur trace catastrophique. Les motifs à retour sur trace non borné sur de grandes entrées peuvent consommer le CPU indéfiniment. Si l'onglet du navigateur se fige, fermez-le et rouvrez-le. Pour un usage en production, testez toujours les motifs de regex contre des entrées adverses avant de les déployer.

Question 7

Puis-je l'utiliser pour tester un motif de remplacement ?

Accepted Answer

Oui. Saisissez une chaîne de remplacement dans le champ de remplacement et l'outil affiche un aperçu en direct de la sortie après application de String.prototype.replace (pour la première correspondance) ou replaceAll (avec le drapeau g). La syntaxe de remplacement standard est prise en charge : $1 et $2 pour les groupes de capture numérotés, $<name> pour les groupes de capture nommés, $& pour toute la chaîne correspondante, $` pour le texte avant la correspondance et $' pour le texte après la correspondance.

Question 8

Qu'est-ce que le retour sur trace catastrophique et comment l'éviter ?

Accepted Answer

Le retour sur trace catastrophique survient lorsqu'un moteur de regex explore un nombre exponentiel de chemins de correspondance possibles sur une chaîne qui ne correspond pas au motif. Il provient généralement de quantificateurs imbriqués sur des classes de caractères qui se chevauchent, par exemple (a+)+ sur une longue chaîne de caractères 'a' suivie d'un caractère qui ne peut pas correspondre. Pour l'éviter : privilégiez les motifs atomiques, utilisez des quantificateurs possessifs s'ils sont disponibles, évitez l'ambiguïté sur ce à quoi chaque partie du motif peut correspondre, et testez toujours avec des entrées conçues pour échouer en plus d'entrées conçues pour réussir.

Question 9

Quelle est la différence entre un groupe capturant et un groupe non capturant ?

Accepted Answer

Un groupe capturant (...) correspond au motif à l'intérieur des parenthèses et stocke le texte correspondant afin qu'il puisse être référencé ultérieurement via $1, $2 ou les indices de groupe. Un groupe non capturant (?:...) regroupe le motif à des fins de quantification ou d'alternance sans stocker la correspondance, ce qui le rend légèrement plus efficace. Les groupes nommés (?...) sont des groupes capturants qui peuvent être référencés par leur nom ($ dans les remplacements, match.groups.name dans le code JavaScript) plutôt que par leur indice.

Question 10

Quelle est une erreur fréquente de débutant avec les expressions régulières ?

Accepted Answer

L'une des erreurs les plus fréquentes est d'oublier d'échapper le point (.) lorsqu'on veut un point littéral. Le point dans une regex correspond à n'importe quel caractère (sauf le saut de ligne par défaut), donc un motif comme 3.14 correspondra aussi à 3X14 ou 3-14. Écrivez 3\.14 pour correspondre à un point littéral. Une autre erreur fréquente est d'omettre le drapeau global (g) et de se demander pourquoi seule la première correspondance est surlignée. Un troisième écueil consiste à ancrer avec ^ et $ et à être surpris qu'ils ne correspondent aux limites de ligne que lorsque le drapeau multiligne (m) est activé.

Testeur et Débogueur de Regex

Exemples

Questions fréquentes

À propos de Testeur et Débogueur de Regex

De la théorie des langages formels à grep

Testeur et Débogueur de Regex

Exemples

Questions fréquentes

À propos de Testeur et Débogueur de Regex

De la théorie des langages formels à grep

Outils associés

Validateur et formateur JSON

Validateur et formateur XML