Répertoire et Chemin d'url inconnu
BMPCreated with Sketch.BMPZIPCreated with Sketch.ZIPXLSCreated with Sketch.XLSTXTCreated with Sketch.TXTPPTCreated with Sketch.PPTPNGCreated with Sketch.PNGPDFCreated with Sketch.PDFJPGCreated with Sketch.JPGGIFCreated with Sketch.GIFDOCCreated with Sketch.DOC Error Created with Sketch.
question

Répertoire et Chemin d'url inconnu

Par
GarryL
Créé le 2020-05-23 06:03:48 (edited on 2024-09-04 12:29:42) dans Hébergements Web

Bonjour à tous,

Je suis face à une situation qui me dépasse totalement. J'ai acheté un NDD et un hébergement mutualisé il y a quelques semaines, réalisé une installation en un clic pour le module wordpress et commencé mon taf. Pour l'instant tout va bien.

J'ai ensuite mis en place un outil d'analyse de logs et là , les choses dérapent ! Je retrouve dans mes logs (sur seolyzer mais aussi sur les statistiques dispo sur ovh) des **urls et des répertoire n’appartenant absolument pas à mon site**.

**_Exemple:_** j'ai ce chemin d'url : /realtree-camo-bedding/realtree-camo-bedding-realtree-camo-twin-bedding-set/ qui remonte dans mes logs alors que je n'ai aucune page associé à celle-ci (mon site contient une dizaine de page pour l'instant, j'en connais toutes les urls)

De même, j'ai des répertoires wp-content/uploads/2018/ et wp-content/uploads/2019/ qui sont crawlé alors qu'ils ne sont pas liés à mon site.

Quand je me connecte via FTP et que je regarde dans mon repertoire wp-cotent/uploads/ je retrouve uniquement un sous-sous-répertoire /2020/ lié à mon activité actuelle et contenant les images que j'ai téléchargé via mon BO, mais aucune aucune trace d'un répertoire /2018/ ou /2019/)

Je suis donc un petit peu perdu sur les origines possibles de ce problème, qui entraîne une grosse masse de page en 404 et accapare plus 60% de mes logs, et sur les solutions possibles.

Si quelqu'un à des idées, je suis preneur, en sachant que je n'ai pas de grande connaissance technique.

Merci d'avance pour votre aide :)


9 réponses ( Latest reply on 2020-05-26 07:07:14 Par
kyodev
)

> installation en un clic pour le module wordpress

tu as donc un WP désuet, malpropre et mal installé

> realtree-camo-bedding...

ça peut dû à une infection

Hello,

Merci pour ton retour, j'ai désinstallé le module et supprimé tous les éléments avant de relancer une installation à la mano. Ca n'a pas résolu le problème. Je retrouve toujours dans mes logs des chemins d'urls qui n'existent pas sur mon site.

Est ce qu'il est possible qu'il y ait un bug sur l'hébergement et qu'il y ait des "résidus" d'un site anciennement hébergé ?

Quand je regarde les éléments, ça ressemble à un site de déco anglophone fait sur un wordpress. On retrouve les même type d'url (/tag/ /wp-content/ etc)

> Je retrouve toujours dans mes logs des chemins d'urls qui n'existent pas sur mon site.

bien sûr, des "bots" ou des "zombies" peuvent continuer de tester
on a toujours pas d'éléments pour vérifier, notamment ce qu'il peut y avoir dans les index de moteurs de recherche

> Est ce qu'il est possible qu'il y ait un bug sur l'hébergement

non

> résidus" d'un site anciennement hébergé

certains virus _furtifs_ se font passer par un Wp ou un Joomla

mais on parle dans le vide

> Quand je regarde les éléments,

je croyais que tu avais tout effacé? (base y compris)

Oui, j'ai bien tout effacé et supprimé la BDD, mais SEOlyzer conserve l'historique des logs j'ai donc une trace des urls qui étaient crawlé.

J'ai d'ailleurs lancé un crawl classique avec screamingfrog et aucune trace de ces urls dans mon maillage

donc plus de soucis?
de toutes façons, sans vouloir donner d'url, on parle dans le vide

Si toujours un soucis, ces urls ressortent dans les logs. C'est justement ce que je comprends pas. Ou les bots trouvent ces urls. C'est un mystère. Je peux en donner quelques exemples, en effet ça sera peut-être plus concret :

https://detoutebeaute.org/bohemian-bedding-sets/bohemian-bedding-sets-buy-bohemian-bedding-set-king-double-size-sanded-cotton-flower-printed-duvet-winter-warm-from-reliable-bohemian-duvet-sets-uk/ (crawlé hier soir)

ou ça : https://detoutebeaute.org/tag/matouk-linens-fall-river-ma/ (crawlé le 22/05 avant la suppression de la BDD)

Et pour compléter, il les crawl d’abord en http puis est rediriger vers l'https

```text > Ou les bots trouvent ces urls

dans leur "mémoire" pour les bots ou programmés si zombies


> Je peux en donner

```text
curl --head https://detoutebeaute.org/bohemian-bedding-sets/bohemian-bedding-sets-buy-bohemian-bedding-set-king-double-size-sanded-cotton-flower-printed-duvet-winter-warm-from-reliable-bohemian-duvet-sets-uk/
HTTP/2 404

curl --head https://detoutebeaute.org/tag/matouk-linens-fall-river-ma/
HTTP/2 404
```
donc pas de soucis: 404
typique _infection Seo_, déjà vu ```

D'accord, et il y a un remède à ces infections ou la seule solution est d'attendre que les bots comprennent que ces urls sont mortes ?

Dois-je les rediriger vers une page existante ou les laisser faire leur vie ?

Je pose beaucoup question, désole, ça me dépasse totalement ^^

> il y a un remède à ces infections

est-ce utile de dépenser de l'énergie pour ça?
si oui, traiter chaque erreur en 410 gone

> les laisser faire leur vie

c'est le plus simple d'autant que ton site n'était pas indexé