OVH Community

Bienvenue sur votre espace communautaire. Posez des questions, recherchez des informations, publiez du contenu et interagissez avec d’autres membres OVH Community.

Bannir un nom de domain via le fichier htaacess


#1

bonjour

je souhaiterai bloquer ou bannir un nom de domain qui point vers mon site, j'ai un taux de rebond éléver et dans les logs de ovh j'ai souvent c'est lignes la :

217.182.132.179 www.boutique-pcland-officiel.fr - [10/May/2017:06:54:14 +0200] "GET /ou-acheter-pc-sur-mesure/ HTTP/1.1" 404 34007 "-" "Mozilla/5.0 (compatible; AhrefsBot/5.2; +http://ahrefs.com/robot/)"
164.132.161.42 www.boutique-pcland-officiel.fr - [10/May/2017:06:55:20 +0200] "GET /produit/acheter-cle-uplay-ghost-recon-wildlands/?share=facebook HTTP/1.1" 403 212 "-" "Mozilla/5.0 (compatible; AhrefsBot/5.2; +http://ahrefs.com/robot/)"
83.149.126.98 www.boutique-pcland-officiel.fr - [10/May/2017:06:56:30 +0200] "GET /robots.txt HTTP/1.1" 403 182 "-" "Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)"
217.182.132.186 www.boutique-pcland-officiel.fr - [10/May/2017:06:57:32 +0200] "GET /produit/pc-bureau-terra-pc-4000/?add_to_wishlist=4259 HTTP/1.1" 200 68730 "-" "Mozilla/5.0 (compatible; AhrefsBot/5.2; +http://ahrefs.com/robot/)"

ce qu'il me déplais car j'utilise pas Ahrefs.com,
sa serait même un bote, puis l'ip change

c'est assez chiant

merci de vos réponse


#2

Bonjour,

et concrètement cela servirait à quoi de le bloquer ce NDD ?
CAr si vous suivez le lien qu'il donne il explique que c'est un crawler (même titre que mj12bot.com / googlebot etc…) et qui respecte le robots.txt qu'il suffit donc d’alimenter (comme l'explique leur site encore une fois).

Cordialement, janus57


#3

bonjour @janus57 tu as vus le site ? je n'y vais pas moi sur ce type de site. d'autre part j'ai tout le temps une connexion de dubai qui reste sur la page home, par jour y viens bien 5 a 7 fois et sa fais monter mon taux de rebond pour rien


#4

Le taux de rebond ce n'est que des statistiques internes pour toi...

Sinon quel est le problème ?
La procédure pour qu'il ne vienne plus est expliquée ici https://ahrefs.com/fr/robot

Si c'est l'anglais Google traduction suffit amplement pour ce genre de phrase..


#5

je comprend le les lignes son mis dans mon robots.txt il parle de 1 semaine le temps que le bot comprenne qui doit plus passer,

ben c'est pas moi qui demande de faire passer le bot sur mon site, pour sa que je veux le bloquer

oui en quelque sorte


#6

C'est le principe du Web.. Le site est ouvert à tous vents.
Si tu ne veux plus du robot tu remplis le robots.txt et tu attends quelques heures/jours..

Remplir le htaccess de lignes pour bloquer tel ou tel site ne fera que ralentir ton site au final..


#7

Bonjour,

ah car vous avez demandé à "majestic.com" (mj12bot.com) alors de passer sur votre site ?
Idem pour les centaines de milliers de robots qui existe ? Idem pour les robots de bruteforce ?

Comme l'a dit @Buddy c'est le bruit de fond de l'internet, et encore là ils sont gentils il respectent le robots.txt, d'autre non (et change de domaine/ip régulièrement).

Cordialement, janus57


#8

sa viens de eux visiblement http://semalt.com/

Sribnokilska St 3a, Kyiv, 02095 Ukraine
me reste plus qu'a bloquer leur bot


#9

ErrorDocument 403 default

SetEnvIfNoCase User-Agent AhrefsBot bad_bot
<IfModule !mod_authz_core.c>
deny from env=bad_bot
</IfModule>