Les fichiers .htaccess et robots.txt
- Le fichier .htaccess
- Création et utilisation d'un fichier .htaccess
- Exemple de redirection
- Editer le fichier .htaccess
- Taille du fichier .htaccess
- Liens
Page vérifiée le 10/05/2017
Ce sont deux fichiers qui peuvent être très utiles.
Ils se placent à la racine du site.
.htaccess :
Le fichier htaccess a trois utilisations principales :
- faire une redirection de page (lorsqu'on a modifié l'emplacement d'une page)
- limiter l'accès avec un mot de passe,
- paramétrer une page d'erreur 404,
Il sert également à
- compresser les pages
- maintenir les fichiers du site dans le cache (voir ma page : Vitesse de
chargement : Méthodes
Voir aussi le site Seomix.fr :
Seomix.fr - Htaccess
: performances et temps de chargement
Une page très complète sur la configuration du htaccess pour améliorer les performances
- Compression Gzip : Deflate ou Mod_Gzip
- Cache et headers : Expire headers (ExpiresActive On) et Cache-control (FilesMatch...) - Etags (FileETag)
- Sécurité : Protection du fichier .htaccess (deny, CHMOD 644) et protection des répertoires
(Options -Indexes)
(voir aussi, ci-dessus, la méthode pour protéger l'accès au fichier .htaccess.
Openclassroom.com - Le .htaccess et ses fonctionnalités
"Un .htaccess est un fichier qui sert à indiquer des commandes pour le serveur, c'est un fichier de configuration pour Apache..."
.htaccess chez Free et chez Orange :
Chez Free et Orange, pour les pages perso, les possibilités d'utilisation du .htaccess peuvent varier.
Le .htaccess chez Free :
les.pages.perso.chez.free.fr - Le .htaccess des pages perso
Création et utilisation d'un fichier .htaccess :
.htaccess est un fichier particulier à cause de son nom :
- il commence par un point
- il n'a pas d'extension.
Il est impossible de le créer avec Windows en utilisation normale.
En voici donc un modèle :
Exemple de redirection avec un fichier .htaccess :
Le fichier contient la ligne suivante :
Redirect permanent /index.htm http://www.aidewindows.net/
Cette ligne est constituée de 3 parties :
Redirect permanent | la commande de redirection |
/index.htm | le fichier à rediriger. ici, le fichier index.htm du site |
http://www.aidewindows.net/ | l'adresse de redirection |
Evidemment, cette commande n'est donnée qu'à titre d'exemple !
Elle est à modifier suivant ses besoins.
AddDefaultCharset :
Cette commande permet d'imposer un codage de caractère :
Exemple : AddDefaultCharset UTF-8
A vérifier et à rechercher sur Google.
Editer le .htaccess :
Pour éditer le fichier .htaccess, on peut utiliser :
- Notepad++ = un Bloc-notes amélioré
- HTAccess Editor = une page web où l'on peut créer un fichier .htaccess.
Notepad++ :
Notepad++ est un éditeur de texte.
Voir ma page : Utilitaires bureautique - Notepad++
HTAccess Editor :
Créer un fichier htaccess en ligne très facilement !
Site officiel :
http://www.htaccesseditor.com/fr.shtml
Path-Tech.fr - Créez rapidement et facilement tous vos fichiers .htaccess
Taille du fichier .htaccess :
Le fichier .htaccess est tellement utile que sa taille peut augmenter de manière conséquente.
Voir sur Google
webmasterworld.com - Apache Web Server Forum - .htaccess file size
Webmaster-hub.com -Taille du fichier .htaccess et performances ?
Liens :
Webmaster-hub.com - Le fichier .htaccess
"Ce simple fichier texte [1] vous permet d'ajuster finement certains paramètres de votre
serveur Apache tels que les redirections, les réécritures d'URL, les redirections et
les restrictions d'accès."
.htaccess - contrôler les réactions du serveur sur fr.selfhtml.org
Voir aussi :
Alexandre.alapetite.net - Redirection Web en HTTP et HTML
robots.txt :
Le fichier robots.txt permet de gérer l'accès des robots d'indexation au site.
Il permet notamment d'interdire l'accès à certains dossiers ou certains fichiers.
Un fichier robots.txt se crée facilement avec le Bloc-notes.
Exemple de fichier robots.txt :
User-agent: *
Disallow: /images/
Cette commande interdira l'accès du dossier images aux robots d'indexation.
On peut ajouter d'autres dossiers.
Liens :
Fr.selfhtml.org - robots.txt - contrôler les robots sur fr.selfhtml.org
anti aspirateur de site :
Je sais que certains (beaucoup ?) sites utilisent un anti aspirateur de site..
Ceci pour lutter contre les robots (bad bots) qui aspirent l'intégralité d'un site en consommant
toute la bande passante.
Webmaster-hub.com - Script anti aspirateur
webmaster-hub.com - Compter le nombre de visiteurs simultanés sans base de données
Ceci dit, le risque est de bloquer outre mesure le référencement du site par Google. Dans ce cas, le mieux est l'ennemi du bien (voir forum.webrankinfo.com)
Certains considèrent qu'une liste de robots à exclure serait la solution la meilleure ?
- Index : Créer sa page web : Perfectionnement
- Tests, conformité, validité
- Vitesse de chargement : Page Speed
- Vitesse de chargement : Les méthodes
- Ajouter des fonctionnalites
- Gestion, statistiques - Liens
- Nom de domaine
- Hébergement
- Publicité
- Le fichier sitemap.xml - XML-Sitemap
- XML Sitemap Generator
- Restrictions, interdictions et redirection de pages
- Les fichiers .htaccess et robots.txt
http://www.google.fr/webmasters