Conflitto tra & e il comando site di Google Sunday, Oct 14 2007
Dentro il Motore 8:18 pm
Stavo cazzeggiando come al solito, quando ho deciso di passare il mio tempo libero in un modo più improduttivo ed ancora meno edificante del solito. Così, senza neanche chiedermi il perché, ho deciso di utilizzare il comando site di google per verificare l’esistenza di TLD composti da un solo carattere. Ovviamente nessuna persona sana di mente avrebbe utilizzato il comando site per verificare una cosa del genere; sarebbe stato più sensato effettuare una ricerca su wikipedia. Ma io non sono una persona sana di mente (per fortuna).
Dunque ho lanciato la query site:a e con mio enorme stupore la ricerca ha avuto esito positivo e il dr. Google mi ha proposto una decina di pagine web che potevano soddisfare la mia ricerca.
Ma quando sono andato a controllare la TLD di quelle pagine web ho scoperto che non si trattava di un .a (ovviamente). Ma allora perché il signor Google ha deciso di fornirmi quei risultati? Dove ha recuperato l’estensione .a?
La risposta è arrivata subito dopo. Tutte quelle pagine web avevano la stessa caratteristica: almeno uno dei sottodomini che componevano l’url iniziava per a&.
Esempio: a&ciao.pippo.it oppure il.mio.dominio.a&.pluto.com
Facendo altre ricerche mi è sembrato come se google considerasse la & in modo equivalente al primo “/” in un dominio e quindi i caratteri tra l’inizio di quel sottodominio e la & venivano considerati come la TLD del dominio in questione.
Altre ricerche interessanti sono le seguenti:
site:&
site: 
site:_
In realtà la & non è un carattere consentito all’interno di un sottodominio quindi quelle pagine sono irraggiungibili.
Si tratterà di un glitch?
Non si sa.
Ora come ora in ogni caso questa informazione è totalmente inutile, ma a volte anche informazioni inutili possono essere utilizzate a proprio vantaggio: sia per fare considerazioni sugli algoritmi che regolano il funzionamento del motore, sia per sfruttare il glitch in modo da ottenere risultati favorevoli ai propri scopi.
In questo momento non mi vengono in mente nessuna idea su come utilizzare quest’informazione. Se qualcuno ha qualche intuizione può tranquillamente dire la sua.
Trackback URI



Questo blog è parte del network
October 14th, 2007 at 10:01 pm
Non sapevo fosse consentito registrare nomi di dominio con la “e commerciale”…
Almeno in Italia secondo il NIC, che è il nostro ccTLD: http://www.nic.it/faq/faq-nomi.html#nomi5
October 14th, 2007 at 11:11 pm
@DAG: e chi ha detto il contrario, scusa? Rileggi che magari capisci meglio quello che ho scritto.
“Facendo altre ricerche mi è sembrato come se google considerasse la & in modo equivalente al primo “/” in un dominio e quindi i caratteri tra l’inizio di quel sottodominio e la & venivano considerati come la TLD del dominio in questione.”
—–
non ho mai detto che si può registrare un nome a dominio con la “e commerciale”:
“In realtà la & non è un carattere consentito all’interno di un sottodominio quindi quelle pagine sono irraggiungibili.”
October 15th, 2007 at 12:46 am
Scusa, forse mi sono espresso male.
Anzi togli il “forse”: mi sono espresso male e tra l’altro non avevo verificato una “cosa”.
Dopo quanto letto nel post, ho cercato anch’io:
>> site:a
il risultato è stato
>> www.a&mgoodies.too.it
quindi di getto ho scritto quello che ho scritto…
Lì per lì ho pensato che la regola sul nome dei domini fosse cambiata nel corso degli anni, quindi domini di vecchia data avessero ancora caratteri non ammessi…
A me è successo con l’indirizzo e-mail: il mio cognome è D’Aguanno… Nel 1995/96 avevo la posta elettronica con l’apostrofo (ora non ammesso)…
Solo in seguito ho cliccato su risultato di Google ed ho capito cosa intendevi.
Ciao.
October 15th, 2007 at 3:36 pm
Una scoperta totalmente inutile (forse
) ma assolutamente affascinante.
poichè neanche io sono sano di mente, farò altre prove su questo stile…
October 24th, 2007 at 11:04 am
ovviamente io ho fatto di più, sono andato molto oltre. ho scoperto infatti che la & viene fuori anche ricercando site:z …. hihihi perdonatemi.
January 14th, 2008 at 11:07 pm
Ragazzi controllate:
cercate su Google “site:a”, non ci sono risultati…