Come gestire gli errori 404

by francesco 1.2K views0

Ultimo aggiornamento 19 Aprile 2024

Il codice di risposta 4XX, solitamente 404 (ma ce ne sono tanti di questa classe) sono veri e propri buchi nella struttura dei link interni del tuo sito web. Vediamo come si presentano e come vanno gestiti.

La Search Console ci mostra le pagine 404 sia sotto la voce Errori, che sotto la voce Escluse, entrambe raggiungibili dalla copertura indice.

Errori 404

Quando le trovi nella voce Errori è perché la sitemap sta inviando link rotti a Google. Approfittiamo quindi per ricordare che le sitemap NON devono inviare a Google link rotti, link che reindirizzano ad altri, link a pagine canonicalizzate, link a pagine bloccate da robots.txt e link a pagine in noindex. NO.

Diciamo anche un’altra cosa. Talvolta le pagine segnalate come errori 404 in copertura indice, non sono più presenti in sitemap, solo che la Search Console non se n’è ancora accorta. C’è quindi spesso un disallineamento che può comportare la visualizzazione di un errore che di fatto non c’è più. In quel caso richiedi una convalida e spera che la macchina infernale ne prenda atto.

Escluse 404

Può invece capitare di trovare le pagine 404 fra le escluse in copertura indice. In questo caso Google ha preso atto che la pagina non è più raggiungibile e l’ha deindicizzata. Si tratta di un processo abbastanza normale, soprattutto per i siti che generano e cancellano spesso grandi quantità di contenuti come i grandi shop online o i siti web di annunci. Fisiologicamente queste risultanze vengono segnalate tra le escluse per un certo tempo, dopodiché spariscono anche da lì, perché Googlebot smette di richiederle. Quando cancelli una pagina puoi lasciarla in 404 oppure assegnarle un codice status 410 (gone) che comunica la fine definitiva di quel contenuto. Nella mia esperienza i tempi che occorrono a far uscire una 4xx dalla sfera di interesse di Google non dipendono tanto dal fatto che le vanga assegnato un 404 o un 410, ma dalla vitalità (frequenza) generale della scansione, dal numero di pagine, dalle visite, anche dalle prestazioni. Insomma, quanto più un sito web è vitale e partecipato, tanta più attenzione gli sarà destinata da Google in termini di copertura dell’indice.

Provo a darti un suggerimento: fai una scansione del tuo sito web con Screaming frog (o similari) e cerca tutti i percorsi che restituiscono lo status 404. Una volta trovati li devi gestire. Gestirli significa che devi ripararli se possibile, sostituirli con altri pertinenti, altrimenti devi rimuoverli dal codice. Questo passaggio è importante, perché se non lo fai, le eventuali escluse dall’indice perché 404 resteranno lì per sempre a impiegare risorse di scansione, dal momento che Google bot continuerà a vederle nel codice del sito.

Un altra cosa che non farei è creare reindirizzamenti. Se nel codice del tuo sito web c’è un link rotto e invece di ripararlo lo reindirizzi a una pagina buona, quel percorso finirà tra le voci di esclusione per reindirizzamento e resterà lì a impiegare risorse di scansione per sempre. Non dico dunque che una vecchia pagina non debba reindirizzare a una nuova pertinente, dico semplicemente che i percorsi interni effettivamente visibili nel codice del tuo sito, dovrebbero sempre condurre direttamente a pagine raggiungibili.

Va da sé che se una pagina rimossa otteneva backlink, sarà opportuno creare un reindirizzamento verso una pagina pertinente e raggiungibile, in modo da consolidare i segnali di rilevanza verso quest’ultima.

Tutto qui.

Se hai domande in particolare, scrivimele qui sotto in un commento.

A presto!