ITSkillsCenter
SEO & Référencement

Guide pratique : Le fichier robots.txt expliqué simplement

2 min de lecture

Le fichier robots.txt : le gardien de votre site

Le fichier robots.txt est un simple fichier texte placé à la racine de votre site qui indique aux robots des moteurs de recherche quelles parties de votre site ils peuvent ou ne peuvent pas explorer. C’est la première chose que Googlebot consulte avant de crawler votre site.

📍 Où le trouver ?

Votre robots.txt est toujours accessible à : https://votresite.sn/robots.txt

Allez vérifier le vôtre maintenant — vous pourriez avoir des surprises.

Syntaxe de base du robots.txt

# Commentaire (ignoré par les robots)

# S’applique à tous les robots

User-agent: *

Disallow: /wp-admin/

Allow: /wp-admin/admin-ajax.php

# S’applique uniquement à Googlebot

User-agent: Googlebot

Disallow: /recherche/

# Sitemap (toujours en dernier)

Sitemap: https://votresite.sn/sitemap_index.xml

Les directives expliquées

Directive Signification Exemple
User-agent Le robot ciblé (* = tous) User-agent: Googlebot
Disallow Interdit l’accès à un chemin Disallow: /prive/
Allow Autorise un chemin (exception) Allow: /prive/public.html
Sitemap URL du sitemap XML Sitemap: https://site.sn/sitemap.xml
Crawl-delay Délai entre les requêtes (Bing) Crawl-delay: 10

Robots.txt optimal pour WordPress

User-agent: *

Disallow: /wp-admin/

Allow: /wp-admin/admin-ajax.php

Disallow: /wp-login.php

Disallow: /wp-register.php

Disallow: /*?s=

Disallow: /tag/

Disallow: /author/

Disallow: /cart/

Disallow: /checkout/

Disallow: /my-account/

Disallow: /wp-json/

Disallow: /?feed=

Sitemap: https://votresite.sn/sitemap_index.xml

Erreurs critiques à éviter

❌ Erreur N°1 : Bloquer tout le site

User-agent: *

Disallow: /

Cela bloque TOUT votre site. Souvent laissé par erreur après le développement. Vérifiez immédiatement !

❌ Erreur N°2 : Bloquer les fichiers CSS/JS

Google a besoin d’accéder aux CSS et JS pour rendre votre page. Ne les bloquez jamais.

❌ Erreur N°3 : Confondre robots.txt et noindex

Disallow empêche le crawl mais PAS l’indexation. Si une page a des backlinks, Google peut l’indexer sans la crawler. Utilisez la balise noindex pour empêcher l’indexation.

Tester votre robots.txt

  1. Google Search Console → Paramètres → robots.txt (rapport)
  2. Entrez une URL pour vérifier si elle est bloquée ou autorisée
  3. Corrigez les erreurs signalées

Exercice pratique

🎯 Vérifiez votre robots.txt en 10 minutes

  1. Ouvrez votresite.sn/robots.txt dans votre navigateur
  2. Vérifiez qu’il ne contient pas Disallow: /
  3. Vérifiez que le lien Sitemap est présent et correct
  4. Testez dans Google Search Console
  5. Comparez avec le modèle WordPress optimal ci-dessus
  6. Modifiez via votre plugin SEO (Yoast ou Rank Math) ou directement via FTP
#crawl #indexation #robots.txt
Besoin d'un site web ?

Confiez-nous la Création de Votre Site Web

Site vitrine, e-commerce ou application web — nous transformons votre vision en réalité digitale. Accompagnement personnalisé de A à Z.

À partir de 350.000 FCFA
Parlons de Votre Projet
Publicité

Articles Similaires