Prendendo spunto da un post di Enrico Altavilla su GT do il via ad un test sull’indicizzazione di una pagina in base alla tipologia di testo fornita.

Nel mio caso fornirò al motore di ricerca una pagina con le seguente caratteristiche:

  1. La pagina è in lingua italiana
  2. Ogni coppia consecutiva di parole presenti nel testo non da nessun risultato su google (se cercata tra virgolette)

Questa seconda caratteristica in particolare si basa sul concetto opposto a quello delle catene di Markov, ovvero un testo formato da coppie che non sono sensate in una determinata lingua non sarà una buona simulazione di quella lingua.

Quindi il test si propone di vedere se esiste uno svantaggio nell’indicizzazione di un testo che pur usando parole italiane le struttura in un modo che google non riconosce come italiano.

Inoltre se la pagina dovesse venire indicizzata sarebbe interessante analizzare che tipo di posizionamento avrà, essendo completamente priva di competitività per qualunque sequenza di parole presenti nella pagina (coppie, triple, quadruple).

Ci sono vari test e varie analisi da poter effettuare, ma prima di tutto bisogna partire: ecco il link.