Bonjour à tous,
Je suis face à une situation qui me dépasse totalement. J'ai acheté un NDD et un hébergement mutualisé il y a quelques semaines, réalisé une installation en un clic pour le module wordpress et commencé mon taf. Pour l'instant tout va bien.
J'ai ensuite mis en place un outil d'analyse de logs et là , les choses dérapent ! Je retrouve dans mes logs (sur seolyzer mais aussi sur les statistiques dispo sur ovh) des **urls et des répertoire n’appartenant absolument pas à mon site**.
**_Exemple:_** j'ai ce chemin d'url : /realtree-camo-bedding/realtree-camo-bedding-realtree-camo-twin-bedding-set/ qui remonte dans mes logs alors que je n'ai aucune page associé à celle-ci (mon site contient une dizaine de page pour l'instant, j'en connais toutes les urls)
De même, j'ai des répertoires wp-content/uploads/2018/ et wp-content/uploads/2019/ qui sont crawlé alors qu'ils ne sont pas liés à mon site.
Quand je me connecte via FTP et que je regarde dans mon repertoire wp-cotent/uploads/ je retrouve uniquement un sous-sous-répertoire /2020/ lié à mon activité actuelle et contenant les images que j'ai téléchargé via mon BO, mais aucune aucune trace d'un répertoire /2018/ ou /2019/)
Je suis donc un petit peu perdu sur les origines possibles de ce problème, qui entraîne une grosse masse de page en 404 et accapare plus 60% de mes logs, et sur les solutions possibles.
Si quelqu'un à des idées, je suis preneur, en sachant que je n'ai pas de grande connaissance technique.
Merci d'avance pour votre aide :)
Répertoire et Chemin d'url inconnu
Sujets apparentés
- Serveur non sécurisé, celui-ci ne supporte pas FTP sur TLS
63936
03.09.2018 14:46
- Connexion à mon compte client
58031
13.02.2019 09:51
- reCAPTCHA erreur pour le propriétaire du site : clé de site non valide
49980
14.02.2019 16:17
- [FAQ] Comment mettre à jour mon site pour supporter Apache 2.4 ?
34338
28.07.2017 11:39
- Ce site est inaccessible Impossible de trouver l'adresse DNS du serveur
29792
16.10.2016 16:24
- Augmenter taille PHP Post Max Size sur mutualisé ?
28248
04.12.2019 21:52
- The requested URL / was not found on this server
27851
02.03.2017 18:25
- NextCloud sur mutualisé
27213
07.04.2017 08:42
- Deploy d'un projet Node JS
27077
12.10.2016 20:18
- Passage en php 7.4
24849
30.06.2020 05:05
> installation en un clic pour le module wordpress
tu as donc un WP désuet, malpropre et mal installé
> realtree-camo-bedding...
ça peut dû à une infection
Hello,
Merci pour ton retour, j'ai désinstallé le module et supprimé tous les éléments avant de relancer une installation à la mano. Ca n'a pas résolu le problème. Je retrouve toujours dans mes logs des chemins d'urls qui n'existent pas sur mon site.
Est ce qu'il est possible qu'il y ait un bug sur l'hébergement et qu'il y ait des "résidus" d'un site anciennement hébergé ?
Quand je regarde les éléments, ça ressemble à un site de déco anglophone fait sur un wordpress. On retrouve les même type d'url (/tag/ /wp-content/ etc)
> Je retrouve toujours dans mes logs des chemins d'urls qui n'existent pas sur mon site.
bien sûr, des "bots" ou des "zombies" peuvent continuer de tester
on a toujours pas d'éléments pour vérifier, notamment ce qu'il peut y avoir dans les index de moteurs de recherche
> Est ce qu'il est possible qu'il y ait un bug sur l'hébergement
non
> résidus" d'un site anciennement hébergé
certains virus _furtifs_ se font passer par un Wp ou un Joomla
mais on parle dans le vide
> Quand je regarde les éléments,
je croyais que tu avais tout effacé? (base y compris)
Oui, j'ai bien tout effacé et supprimé la BDD, mais SEOlyzer conserve l'historique des logs j'ai donc une trace des urls qui étaient crawlé.
J'ai d'ailleurs lancé un crawl classique avec screamingfrog et aucune trace de ces urls dans mon maillage
donc plus de soucis?
de toutes façons, sans vouloir donner d'url, on parle dans le vide
Si toujours un soucis, ces urls ressortent dans les logs. C'est justement ce que je comprends pas. Ou les bots trouvent ces urls. C'est un mystère. Je peux en donner quelques exemples, en effet ça sera peut-être plus concret :
https://detoutebeaute.org/bohemian-bedding-sets/bohemian-bedding-sets-buy-bohemian-bedding-set-king-double-size-sanded-cotton-flower-printed-duvet-winter-warm-from-reliable-bohemian-duvet-sets-uk/ (crawlé hier soir)
ou ça : https://detoutebeaute.org/tag/matouk-linens-fall-river-ma/ (crawlé le 22/05 avant la suppression de la BDD)
Et pour compléter, il les crawl d’abord en http puis est rediriger vers l'https
```text > Ou les bots trouvent ces urls
dans leur "mémoire" pour les bots ou programmés si zombies
> Je peux en donner
```text
curl --head https://detoutebeaute.org/bohemian-bedding-sets/bohemian-bedding-sets-buy-bohemian-bedding-set-king-double-size-sanded-cotton-flower-printed-duvet-winter-warm-from-reliable-bohemian-duvet-sets-uk/
HTTP/2 404
curl --head https://detoutebeaute.org/tag/matouk-linens-fall-river-ma/
HTTP/2 404
```
donc pas de soucis: 404
typique _infection Seo_, déjà vu ```
D'accord, et il y a un remède à ces infections ou la seule solution est d'attendre que les bots comprennent que ces urls sont mortes ?
Dois-je les rediriger vers une page existante ou les laisser faire leur vie ?
Je pose beaucoup question, désole, ça me dépasse totalement ^^
> il y a un remède à ces infections
est-ce utile de dépenser de l'énergie pour ça?
si oui, traiter chaque erreur en 410 gone
> les laisser faire leur vie
c'est le plus simple d'autant que ton site n'était pas indexé