Trovare e tagliare i contenuti inutili

by Francesco 1.320 views14

Sono quelle pagine che allontanano il tuo progetto web dai significati per i quali viene riconosciuto e classificato da Google. Per capirci, se il tuo blog sulla SEO contiene 100 articoli, di cui 70 parlano di taglio e cucito, c’è qualcosa che non va.

tagliare pagine inutili
tagliare pagine inutili

La situazione è molto diffusa. Ne accennavo l’altro ieri parlando del piano editoriale SEO: gli articoli che non seguono il piano editoriale, quelli “estemporanei” possono appesantire la struttura di scansione portando i posizionamenti a peggiorare via via che aumentano di numero. Ma come fare a capire quali sono dopo anni di pubblicazioni miste?

 

Semplice, chiedi a Google

Occorre verificare l’eventuale discrasia tra pagine indicizzate e pagine che ricevono traffico. Il primo passaggio è controllare lo stato dell’indicizzazione sulla Search Console e confrontare questo numero con quello delle pagine indicizzate secondo l’operatore di ricerca site:

 

stato dell'indicizzazione
stato dell’indicizzazione

 

Operatore di ricerca site:

operatore site:
operatore site:

 

Nel primo caso Google dichiara 565 pagine indicizzate, nel secondo 569, quindi i valori sono sostanzialmente allineati, ma questo non vuol dire che Google ritenga tutti i miei articoli meritevoli di traffico. Per verificare puoi aprire Google Analytics e compiere il seguente passaggio:

Comportamento –> Contenuti –> Pagine di destinazione

Dimensione secondaria –> Acquisizione –> Sorgente mezzo

 

Richiamando i primi 1.000 risultati avrai tutte le pagine del tuo sito web con tutte le sorgenti di traffico. A questo punto devi filtrarle per sorgente Google / Organic, escludendo le altre. Ora hai tutte le pagine del tuo sito web che ricevono “effettivamente” traffico da motore di ricerca, nel mio caso solo 391 articoli ricevono traffico da Google, gli altri no.

 

Come individuare di preciso le pagine

A questo punto non ti resta che procedere per differenza. Io utilizzo Screaming Frog per estrarre in formato excel tutti gli URI (gli URI sono gli indirizzi web subito dopo il primo slash) delle pagine del mio blog. Di fianco a questa colonna incollo quella scaricata da Google Analytics, comprendente tutti gli URI che ricevono traffico. Una volta cancellati i contenuti ripetuti (con un filtro excel) tra le celle delle due colonne, ho una lista esatta delle pagine web che evidentemente non piacciono a Google.

Nel mio caso la maggior parte delle pagine in questione sono editoriali e pagine di diario, dal momento che a me piace raccontare anche un po’ la mia vita attraverso il blog. Ora posso decidere cosa farne, se accorpare, tagliare, modificare o lasciare tutto com’è.

Su siti web più grandi questo lavoro può richiedere mesi, ma ti assicuro che una volta fatto, migliora davvero le cose.

Un’altra bella caccia al tesoro!

 

  • “Nel mio caso la maggior parte delle pagine in questione sono editoriali e pagine di diario” che – per come la vedo io – sono proprio gli articoli che contribuiscono a differenziarti da tanti altri e valorizzano il “tuo brand”. Che fai, li togli? =) E’ una domanda seria…. vivo una situazione simile (in tutt’altro contesto).

    • E in effetti non credo proprio che taglierò via quelle pagine. 😉

      • Mi sembra cosa buona e giusta =)
        Forse ci potrebbe essere uno step successivo nella ricerca: prendo gli articoli che non ricevono traffico da Google e controllo se comunque ricevono visualizzazioni attraverso altri percorsi (altre sorgenti di traffico o attraverso percorsi interni di navigazione). Se nemmeno gli utenti se li cagano allora valuto di eliminarli, se invece gli utenti li leggono allora li tengo nonostante per Google non abbiano valore.

  • carlo411

    Menomale che le chiamano pulizie di primavera 🙂

    Casualmente è un lavoro che sto facendo anche io da qualche settimana sui siti più anziani. Ottima spiegazione Francesco.

  • Ciro Kurush Bocchetti

    Non taglierò le mie Note narrative! 😀

  • vito_maria

    Nel caso in cui le pagine indicizzate da google e visualizzate tramite il comando “site:” non combacino con quelle dello “stato dell’indicizzazione” nella search console che si fa, come ci si comporta?

    • Se il Site: ne riporta molti di meno è un segnale che Google vede contenuti duplicati, copiati, inutili, ridondante o in altra misura malgestiti.

    • Se il Site: ne riporta molti di meno è un segnale che Google vede contenuti duplicati, copiati, inutili, ridondanti o in altra misura malgestiti.

  • Grazie per queste guide incentrate sul “togliere”. M’hai scoperta, lo dico in maniera interessata e se posso approfitto di questo spazio per chiederti un consiglio.

    Cerco di non farti perder tempo: ho un blogghettino da 2 lire che “mi trascino dietro” da 10 anni, da quando giustificavo il testo per farlo sembrare più carino e non avevo idea di cosa fosse un tag title. (Non che ora sappia chissà cosa, però almeno ho smesso di giustificare 🙂 ). Ovviamente la maggior parte di questi articoli è completamente inutile, scritta male, piena di html a caso. Zavorra. Seguendo questo tuo tutorial non mi ha sorpresa scoprire che 2/5 degli articoli non acchiappa una visita da mesi (sì, corrispondono a quelli più vecchi e vergognosi). Eliminarli tutti assieme porterebbe ad una cofanata di 404, che -credo- non aiuterebbe. Ma se li mettessi tutti in “no index” e “no follow” (serranda giù, come scrivi nel tuo libro) in attesa di revisione o decimazione, risolverei qualcosa?

    Grazie mille.