Utente:Aubrey/Cat

Da Wikisource.

Ogni testo è un punto, in un livello a sè stante. In sè è assoluto.

La catalogazione/categorizzazione è una struttura di qualche tipo in un livello/dimensione differente, che NOI creiamo per comprendere meglio il mondo. Di per sè è una creazione totalmente umana, non esiste: ma è naturale in noi catalogare (cf. Perec), e quindi lo facciamo sempre, quando parliamo, e quando pensiamo. Ne viene che esistono infiniti sistemi di catalogazioni, tutti incoerenti/incompleti: non esiste la catalogazione perfetta.

Quello che io credo è che esista il mondo (anche il mondo dei libri, dunque) là fuori e che il modello concettuale catalogatorio "migliore", più completo ma anche completamente inutile sia una rete totale, il fatto che ogni cosa, per qualcuno, può essere l'elemento di più (forse tutti) le classi/insiemi/categorie/tag.


Credo che esista questa miriade di punti, inconoscibili, collegati a tutti gli altri, che sono i "fatti", e poi ci siano nuvole di insiemi che li contengono e si intersecano eternamente: la cosa andrebbe vista in infinite dimensioni, perchè lo stesso insieme che contiene due fatti distinti, lontani nello spazio e nel tempo, dovrebbe essere rappresentato come un unico insieme con due elementi. Quindi la mia visualizzazione è impossibile: un gomitolo n-dimensionale, che si raggomitola su sè stesso infinite volte. Senza contare che esistone le cosiddette prospettive/opinioni/punti di vista: la stessa sequenza di fatti può essere vista sotto punti di vista diversi e cambiare significato, perchè noi non cogliamo mai nessuno fatto nella sua totale complessità, e catalogare è sempre ridurre: se volessimo comprenderlo totalmente dovremmo creare un'altro insieme, in una generazione infinita per ogni fatto per tutti i fatti.

Senza contare che queste prospettive/punti di vista dell' ultragomitolo sarebbero anche loro, in un certo senso, catalogabili, utilizzerebbero gli stessi insieme/tag/categorie, e quindi ci sarebbe altra ambiguità.

Insomma, un casino. Non esiste un modello concettuale coerente per questo, almeno che io sappia: la teoria degli insiemi è meno potente di tutto questo: i paradossi arrivano (ovviamente...) con l'autoreferenzialità, con gli insieme che sono insiemi di sè stessi. Oltre questo, che sarebbe probabilmente risolvibile, ci sono limiti tecnici: un elemento è è un elemento o è un sottoinsieme, mentre ogni tanto ci sono elementi (instances) che appartengono ad un insieme da una parte, e dall'altre sarebbero essi stessi un insieme o un sottinsieme. Il fatto poi che le gerarchie (padre di padre di padre) siano di due tipi, e una goda della proprietà transitiva (A contiene B che contiene C, so A contiene C) e quell'altra no (differenza fra "A kind of" e "is a"), rende il tutto complicato.

Le gerarchie strette hanno i loro problemi da sempre. Non ne parlo neanche.

Con le tag i problemi sono sempre gli stessi: eliminando la categorizzazione verticale, si rimane con innumerevoli foglie, e dato che vengono usate come folksonomies, la gente usa parole diverse per dire la stessa cosa (rpoblema dei sinonimi) e parle uguali per dire cose diverse (problema degli omonimi). Se io provassi a correggere questa cosa in forma di thesaurus, avrei comunque i problemi di Shirky, che dice giiustamente che se per me profano queer=gay, per un membro della comunità queer quest'uguaglianza è tutt'altro che vera. Il grado di esperienza/conoscenza (v. articolo Sara) è fondamentale, perchè cambia/aggiunge/toglie significato alle stesse parole.

Di qui si arriva in un baleno al problema recall vs precision, che sono inversamente proporzionali: pensa alle tag di delicious. Più tag metti, più aumenti la recall, il fatto che quel documento sia in qualche modo correlato con certi argomenti/tag/dimensioni e ritieni utile che possa essere "inciampato" da vari sentieri differenti. Aumenti la probabilità di serendipity. La precisione vorrebbe invece che tu mettessi soltanto tag specifiche e pensate, e ci arrivassi da pochi selezionati sentieri. Non queer, ma gay. Questo è uno degli aspetti in cui si può vedere l'effettiva inversa proporzionalità di R&P.


Ovviamente, ci sono dimensioni/aspetti differenti, più utili di altri, che vale la pena differenziare e che causano meno ambiguità: uno può dividere/classificare (e qui ritorno ai libri che è meglio) per ordine alfabetico, geograficamente (spazio), per anno/secolo (tempo), per genere (cosa è), per argomento (di cosa parli?).

Su Wikisource le prime le facciamo già. La cateoria di argomento, di per sè, è un mondo totalmente complesso, per cui quello che ho detto prima si ripete anche qui.



Non dimenticare il principio di Shirky, che vale anche qui: la struttura delle categorie è basata su quello che si ha. Non cerco di organizzare il mondo a priori, mi baso su quello che ho. In questo siamo uguali alla Library of Congress (che equipara l'Africa a uno staterello): una questione di numeri, di quanti testi ho appartenenti ad una certa categoria. La cosa diversa è che qui siamo decisamente più dinamici. Provando ad essere il più possibile aperti (con una struttura più orizzontale per gli argomenti, per esempio), possiamo sempre creare nuove categorie. Non è facile per niente: bisognerebbe cercare di comprendere le caratteristiche di un sistema aperto (che è sistema, quindi organizzato, ma rimane aperto.--> dove avevo letto qualcosa del genere, nelle "La rete della vita"--> sempre lì si va a finire.