Test: indicizzazione del testo [anti-Markov] Tuesday, Oct 3 2006
Dentro il Motore 12:43 pm
Prendendo spunto da un post di Enrico Altavilla su GT do il via ad un test sull’indicizzazione di una pagina in base alla tipologia di testo fornita.
Nel mio caso fornirò al motore di ricerca una pagina con le seguente caratteristiche:
- La pagina è in lingua italiana
- Ogni coppia consecutiva di parole presenti nel testo non da nessun risultato su google (se cercata tra virgolette)
Questa seconda caratteristica in particolare si basa sul concetto opposto a quello delle catene di Markov, ovvero un testo formato da coppie che non sono sensate in una determinata lingua non sarà una buona simulazione di quella lingua.
Quindi il test si propone di vedere se esiste uno svantaggio nell’indicizzazione di un testo che pur usando parole italiane le struttura in un modo che google non riconosce come italiano.
Inoltre se la pagina dovesse venire indicizzata sarebbe interessante analizzare che tipo di posizionamento avrà, essendo completamente priva di competitività per qualunque sequenza di parole presenti nella pagina (coppie, triple, quadruple).
Ci sono vari test e varie analisi da poter effettuare, ma prima di tutto bisogna partire: ecco il link.
Trackback URI



Questo blog è parte del network
November 25th, 2006 at 12:03 pm
Geniale questo test. Mi tolgo il cappello, K.
Google ha indicizzato la pagina: è al #1 per “immatricolamento” e al #3 per “yottagrammo”.
Per altre key (es. “encefalogramma”) invece è molto più indietro, ma questo probabilmente è dovuto all’assenza di tematizzazione.
November 25th, 2006 at 3:20 pm
Anti-Markov…
Vi segnalo un interessante esperimento del nostro [B]Kerouac3001[/B]:
[URL=”http://www.kerouac3001.com/test-indicizzazione-del-testo-anti-markov-13.htm”][B] » Test: indicizzazione del testo [anti-Mar……
November 28th, 2006 at 6:54 pm
Dunque, arrivati ad un mese di distanza, possiamo dire che Google lo ha eliminato dai risultati di ricerca. Può essere che, contando sul fatto dell’immensità del DB, non riscontrando nessuna analogia all’italiano, la pagina venga riconosciuta come spam (o è colpa di un linguaggio non naturale)?
March 5th, 2007 at 5:25 pm
spero che non sia uno scherzo