LSI Latent Semantic Indexing

by francesco 2.7K views1

Oggi affrontiamo il tema delle corrispondenze e di come queste debbano essere sviluppate da un documento all’altro allo scopo di ampliare un campo semantico per una parola chiave di interesse.

Parliamo di indicizzazione semantica latente, algoritmo LSI.

seo latent semantic indexing
seo latent semantic indexing

 

Premessa: questa casa non è un albergo

Ok, me ne rendo conto, gli articoli che scrivo non sono facili. Dopo aver pubblicato quello su come usare un contenuto altrui per fare SEO ho ricevuto il messaggio di un vecchio e carissimo amico (e collega) di Milano che mi ha fatto i complimenti perché evidentemente sto diventando proprio bravo, motivo per il quale non aveva capito una mazza. 

Non dovete pensare a questo blog come a un sito web da leggere ogni tanto quando capita, perché in effetti si corre il rischio di perdere parecchie informazioni. Su Seogarden pubblico periodicamente TUTTI i riscontri del mio lavoro (teorie, esperimenti e tecniche consolidate) e lo faccio con l’intento di condividere ogni cosa, perché un mercato in cui tutti i SEO ottengono risultati, è un mercato in cui anche la domanda di SEO aumenta. Quello che manca oggi non sono i potenziali clienti, ma la fiducia nel nostro mestiere, proprio a causa del fatto che ci sono troppi operatori che non riescono a ottenere buoni risultati.

Quindi in definitiva per capire bene quello che scrivo qui, soprattutto rispetto alla semantica, devi leggere tutti gli articoli sulla semantica (magari uno di questi giorni li categorizzo così si capisce pure dove sono). E veniamo all’argomento di oggi.

Indicizzazione semantica latente

È un metodo per scoprire i concetti nascosti nei dati di documenti web. Ogni documento e termine (ogni parola) viene poi espressa in un vettore con elementi corrispondenti a questi concetti. Ogni elemento nel vettore fornisce un grado di partecipazione del documento o termine nel concetto corrispondente.

L’obiettivo non è semplicemente descrivere il concetto, ma riuscire a rappresentare il documento e il termine in modo unificato per le similarità o per le relazioni semantiche tra documento e documento, documento e termine, termine e termine.

Ok, si, in effetti questo è un po’ difficile. Proviamo a spiegare:

Strategia LSI

Dopo aver individuato una o più domande latenti, cioè ripetiamolo, domande inevase circa un argomento molto discusso su blog e forum pertinenti rispetto alla nostra keyword d’interesse, si deve estrapolarne un concetto, che possiamo definire concetto latente, perché riesce ad associarsi perfettamente alle domande latenti. A questo passaggio, che è proprio l’analisi semantica latente (LSA), segue sempre l’indicizzazione semantica latente. Possiamo a questo punto creare un contenuto su di un sito d’appoggio, quindi non sul sito che si vuole posizionare. Questo contenuto, oltre a descrivere l’intero campo semantico di rilevanza per Google, sviluppando tutti gli argomenti a partire dalle chiavi secondarie che posso intercettare attraverso ubersuggest, conterrà le rappresentazioni semantiche ampliate di tutti i concetti che girano intorno alla parola chiave che intendo posizionare, ma che compaiono in rete solo come domande latenti. 

In sostanza, oltre a rispondere per bene a tutte le domande esplicite rispetto alla mia key di interesse, si fornisce un’interpretazione nuova, diversa ed estremamente utile di un oggetto di conoscenza, legata alle domande latenti che si sviluppano nelle piazze digitali in cui si discute di problematiche relative alla keyword (in realtà a tutto l’ambito) che intendo posizionare. Utilizzando questa tecnica il campo semantico si amplia

Importante: prima di tutto sul sito da posizionare, opportunamente strutturato, va generato un contenuto che associ nel modo più forte possibile il nostro concetto latente alla parola chiave d’interesse, si dovranno creare dei riferimenti univoci al contenuto d’appoggio, nello specifico al nuovo concetto espresso.

Importantissimo: per sviluppare il processo di indicizzazione semantica latente, occorre iniettare testi fuori dal sito d’interesse in termini di co-occorrenze tra concetto latente e parola chiave sui blog e forum in cui avvengono le discussioni pertinenti. Chiaramente i link in ingresso puliti non fanno male per niente. Ovviamente si tratta di capire cosa e quali sono i link puliti. Rispetto a questo cerco di muovermi sfruttando le geometrie vettoriali anche in termini ipertestuali e non solo semantici.

Per questo servirebbe l’esperienza di un SEO, cosa che immagino tu sia, se sei arrivato vivo fin qui. 😉