Vorrei segnalarvi un interessante documento di Terrence A. Brooks sulla natura del significato nel Web in un epoca googlecentrica. In esso Google viene descritto come un aggregatore di senso.
Questo tipo di aggregazione è possibile su Internet perchè in essa esistono tanti oggetti semantici distinti e relativamente facili da catturare. I meccanismi di raccolta e lettura di questi oggetti sparsi per la Rete però introducono problemi legati alla possibile manipolazione (o contaminazione) delle informazioni che li costituiscono. Per questo il successo di Google è legato alla segretezza dei suoi algoritmi di parsing e di analisi delle pagine. Le modalità con cui questo motore di ricerca manipola le informazioni vengono spesso modificate e sono divulgate in modo decisamente superficiale.
Del suo funzionamento sappiamo poco. E’ la combinazione del PageRank di una pagina, il suo uso delle parole che costituiscono la frase cercata e il testo dei link ipertestuali che puntano ad essa che permettono a Google di scommettere sulla validità del suo contenuto in relazione alla richiesta dell’utente utente. La predominanza di Google sugli altri motori di ricerca è un chiaro segno della bontà di queste scommesse. Ma questo è (più o meno) tutto ciò che sappiamo del suo modo di giocare.
Si parla anche di molte altre cose nel suddetto articolo (si accenna anche al link farming, ma allora esiste davvero! …).
collegamenti memetici: Google PageRank algorithm in Python