Qui ne s’est jamais retrouvé devant une « ERREUR 404”, nous expliquant que Google n’a pas trouvé le fichier que nous cherchons ? Ces erreurs relèvent en réalité d’une information qu’un serveur web transmet à votre navigateur d’internaute. Elles font partie d’un ensemble de codes HTTP qui signalent une erreur relative à l’accès de votre navigateur à une page web. Si, en termes techniques, on parle d’erreurs “côté client”, il s’agit de réelles erreurs SEO.
Qu’est-ce qu’une erreur HTTP en code 4xx ?
Pour qu’un internaute accède aux pages web d’un site internet, il utilise un navigateur. Ce dernier reçoit des informations par le biais d’un protocole de transmission. Le protocole de transmission Hypertext Transfer Protocol, ou HTTP, comprend une série de codes à 3 chiffres. On les appelle des codes d’État.
Ces codes d’état transmettent différents types d’information, selon leurs catégories. Les codes dont le premier chiffre est 1 communiquent de simples informations. Les codes en 2xx transmettent quant à eux des succès. Les codes d’état en 3xx signalent cette fois des redirections. Les codes 5xx, de leur côté, relèvent des erreurs serveurs.
Les codes en 4xx, enfin, sont des “codes erreur du client HTTP”. Ces codes erreurs HTTP recoupent en fait des refus d’accès de l’internaute à la page web.
En tant que webmaster, vous pouvez personnaliser les pages d’erreur 400 pour que l’utilisateur comprenne ce qui lui arrive. Vous pouvez, par exemple, afficher un message du type “Oups, la page que vous cherchez est introuvable”. Si vous ne le faites pas, le navigateur de l’internaute affiche simplement le code erreur et son intitulé. Par exemple : “404 – file not found” pour “fichier introuvable ».
Quelles sont les erreurs HTTP 400 les plus courantes ?
Il existe une trentaine de code d’état 400 signifiant une erreur côté client. Certains sont connus, comme le célèbre 404-error. D’autres restent plus spécifiques, comme l’error 451 Celle-ci stoppe une tentative d’accès à une ressource illégale, comme par exemple une page web censurée par les autorités. Nous passons ici en revue les plus fréquentes.
L’erreur HTTP 404, la plus célèbre des erreurs code 4xx
Le code d’état 404 signifie que la page web demandée n’a pas été trouvée, ou n’existe pas. Souvent, c’est la mention “file not found” qui s’affiche. L’internaute peut également se retrouver face aux messages “HTTP 404 Not Found” ou “The requested URL was not found.”
Cette page d’erreur s’affiche quand la page cherchée n’est pas trouvée par le serveur. Cela peut arriver si l’URL a été mal orthographiée, ou si le webmaster a supprimé la page. Ce type d’erreur apparaît aussi si une redirection a été mal rédigée.
En termes de référencement naturel, les erreurs 404 ont le désavantage de nourrir le taux de rebond. Une situation qui pourrait faire croire aux robots Google que votre site internet n’est pas de bonne qualité.
Par ailleurs, les moteurs de recherche n’interprètent pas les erreurs 404 comme des suppressions définitives. Ils peuvent ainsi garder ces pages plusieurs mois dans leurs index. Pour une suppression définitive, préférez un code 410 : “The requested resource is gone and won’t be coming back”.
Pour détecter ces erreurs SEO, vous pouvez procéder à un audit de site internet en ligne. En cas de doute, vous pouvez également faire analyser votre site web par une agence digitale comme Staenk.
Les autres erreurs 4xx de vos internautes
L’autre code erreur côté client le plus connu est le 400 : “Bad request”. Celui-ci signifie à l’utilisateur que la requête qu’il a tapée contient un caractère spécial ou une faute de frappe qui l’invalide.
Vient ensuite l’erreur HTTP 401, qui indique un accès non-autorisé, “unauthorized”. Ce code d’état s’affiche quand l’internaute transmet des identifiants invalides. Cette erreur s’affiche aussi si l’authentification HTTP n’est pas encore mise en place au lancement d’un site.
L’erreur HTTP 403 désigne quant à elle un accès interdit, ou “forbidden”. Cette fois, le problème ne se situe pas au niveau de l’URL ou des identifiants, mais à celui de la permission d’accès. Il peut par exemple s’agir d’une page web réservée à un affichage interne à l’entreprise. Toutes ces erreurs ont un impact sur le référencement naturel. Leur affichage gêne effectivement l’indexation de vos pages web par les Google bots. Il leur donne aussi l’impression que votre site internet est de mauvaise qualité.