Reputazione

Tutti i grandi portali e i grandi servizi online che prevedono la possibilità per qualsiasi utente di inserire dei propri messaggi all’interno del loro archivio, fanno uso di complessi sistemi per stabilire la verità e la qualità dell’informazione inserita.

Per fare un esempio banale: ebay usa un sistema di gestione della reputazione basato sui feedback, che permette ai potenziali acquirenti di farsi un’idea sull’onestà di un venditore, basandosi sui commenti lasciati dagli altri acquirenti nelle precedenti transizioni.

Gran parte dei portali che basano i loro contenuti su sistemi di reputazione hanno un problema fondamentale: permettono all’utente di creare più identità.

Tramite questo problema è possibile creare più account allo scopo di raccogliere tramite inganni il consenso di una larga fetta della “popolazione” che fa parte di quel portale, in modo da incrementare la propria reputazione e sfruttare in seguito questa allo scopo di far passare alcuni messaggi come se fossero di alta qualità.

Questa tecnica è nota con il termine Sybil Attack, il cui nome che deriva da una serie televisiva molto nota in america Sybil (nonché dal libro da cui è stata tratta questa storia).
Dato che esistono molti servizi online che utilizzano la reputazione all’interno dei loro algoritmi, mi risulta difficile essere allo stesso stempo chiaro e quanto più generico possibile. Conviene, dunque, focalizzarsi su una sola tipologia di servizi in cui il sybil attack è usato con maggiore frequenza: i social sites.

Da del.icio.us a digg, da reddit a oknotizie, tutti i servizi di social bookmarking utilizzano la reputazione come sistema per individuare lo spam e catalogare i contenuti in base alla loro qualità.

Probabilmente mentre alcuni di questi servizi basa i propri algoritmi su sistemi che permettono di calcolare il consenso attorno ad un determinato contenuto, altri basano i propri algoritmi su sistemi per eleggere automaticamente dei leaders, ed altri ancora aggiungono a tutto questo anche dei sistemi per attribuire privilegi agli users in funzione della loro reputazione.

Per quanto possano essere diversi, tutti questi sistemi hanno ugualmente il punto debole di cui abbiamo parlato prima: la possibilità di creare più account per ogni persona e di non poter verificare con certezza assoluta che un account corrisponda ad una determinata persona.

Il secondo punto debole che allo stesso tempo è il punto di forza che gli permette di mantenere un alto livello di qualità con il minomo sforzo possibile è il non conoscere la verità o la qualità di un contenuto in base a valori fissi, ma in base a valori variabili per lo più stabiliti tramite la reputazione degli utenti che hanno approvato quel determinato contenuto.

Questo significa che la verità e la qualità sono oggetti manipolabili dall’utente che può decidere di modificarli in funzione delle proprie necessità.

Sybil

Mi limito a scrivere questo post come input di studio per chi ha voglia di documentarsi, cosa che farò anch’io che come voi ho appena scoperto queste teorie.

Prossimamente mi ripropongo di continuare questo discorso analizzando il problema dei generali bizantini, ma prima preferirei essere sicuro di averlo ben capito io stesso, in tutte le sfumature e le possibili applicazioni.

Allo stesso tempo spero di riuscire a tradurre sia il pdf che vi ho linkato sia altri 3 documenti che vi linko a fine post.

Anzi spero che ci sia qualche anima buona che mi aiuti nella traduzione visto che per tradurre articoli di quelle dimensioni mi ci vogliono 100/200 euro cadauno, soldi che sono allo stesso tempo sia felice di spendere sia desideroso di risparmiare.
Quindi si accettano collaborazioni e/o proposte di sconti :D

Come promesso prima aggiungo qui i link di approfondimento che ritengo utili: