Two weeks went past on travels and thoughts.
Pensate all’aspetto temporale della semantica. Avete assegnato un soggetto ad un volume appena catalogato. O un tag ad un post su un blog. O una keyword ad una risorsa web su un virtual reference desk. Quindi, avete usato un sistema a base semantica, ne avete estratto una parte, l’avete usata per connotare un certo oggetto, o meglio un certo aspetto di un oggetto. Normale. Ma la descrizione, in questo senso, è spazio. Il tempo, al più, è una delle categorie fondamentali, come ad es. nella classificazione a faccette (v. C. Gnoli, Classificazione a faccette, Roma, AIB, 2004 – oppure questa interessante pagina di Luca Rosati). Ad es. Gnoli (op. cit., pp. 12-13) scrive:
Ranganathan pervenne a identificare cinque categorie fondamentali, altamente generali e astratte, che denominò:
personalità, materia o proprietà, energia, spazio, tempo. (…) I successivi studi del Classification research group (…) portarono ad una riformulazione delle categorie fondamentali in una lista più articolata e con termini parzialmente modificati: oggetti, specie o tipi, parti, materiali, proprietà, processi, operazioni, agenti, spazio, tempo.
All’interno dello schema PMEST, la categoria più affine al tempo è l’energia, poi dettagliata, appunto, in processi e operazioni. Per il resto, si tratta di categorie prevalentemente spaziali, che non danno il senso del divenire. Ma anche le categorie “temporali” (l’energia e il tempo stesso) sono piuttosto spazializzate. Questo è un filone interessante della nostra cultura: il tempo può essere rappresentato nello spazio, ma la percezione occidentale (scusate la banalità dell’aggettivo) è articolata sullo spazio, il tempo entra come variabile che definisce una successione di stati (“stati” appunto, non “fluenti” o “scorrenti”).
Di conseguenza, nello schema PMEST, il tempo è il tempo statico, uno snapshot. Così, mi pare, nella maggior parte dei sistemi di soggettazione e di classificazione e nei tesauri in uso presso le biblioteche ed i database bibliografici. Il tempo è al massimo una proprietà dello spazio.
Eppure, potrebbe essere il contrario. Potremmo partire dal tempo, per descrivere e visualizzare le proprietà dello spazio. O spazio e tempo potrebbero essere due aspetti di un’unica interpretazione dell’universo, come nella teoria della relatività di Einstein. Oppure, più semplicemente, si può pensare alle varie teorie e modelli relativi al “temporal tagging”, all’estrazione di pattern temporali dall’analisi del linguaggio naturale tramite il Natural Language Processing, alla generazione automatizzata di timelines a partire da resoconti di eventi storici. Oppure, e forse qui abbiamo l’esempio più interessante, di un’analisi essenzialmente temporale e processuale dell’evoluzione dei concetti.
Pensiamo ad un database di letteratura scientifica. Oggi possiamo analizzare separatamente le due dimensioni, spazio e tempo: cercare tutti gli articoli che sono “accomunati” dalla stessa voce di tesauro, e poi filtrare per un intervallo di tempo. Ma non riusciamo ad analizzare – e quindi a sintetizzare – la dinamica della generazione delle idee. Certo, abbiamo la possibilità di usare un’analisi citazionale. Ma ci sono due problemi:
- Spesso il valore aggiunto dell’informazione “x cita y” è piuttosto scarso. Una citazione può aggiungere poco al pensiero originale.
- Al contrario, y può basarsi su x senza citarlo esplicitamente.
In altre parole, la dinamica della generazione delle idee può essere mostrata con un’operazione semantica, di analisi genealogica dei concetti e delle idee. Genealogia multidimensionale, peraltro, che non può limitarsi a stabilire un solo “lineage” (concetto di Van De Sompel e Lagoze), ma molti e intricati percorsi. Inoltre, questo tipo di analisi genealogica dovrebbe supportare il conflitto delle interpretazioni rispetto alla genesi dei concetti gli uni dagli altri. Diversi piani temporali, con intersezioni ed overlaps possibili, potrebbero consentire di visualizzare le relazioni tra le teorie, le loro dipendenze reciproche ed insospettate. Ma la cosa più interessante è che queste dimensioni potrebbero essere riesplorate e ridefinite ogni volta partendo da un diverso input. Prendiamo un articolo: usiamo i metadati semantici assegnati: partiamo da ognuno di essi per esplorare le relazioni di quell’articolo con altri a partire da un suo particolare aspetto (disposto sull’asse PMEST semplice o modificato): ogni volta si genererà un reticolo potenzialmente inesauribile di relazioni. Complicabili ad libitum con sistemi di ranking, di gestione della reputazione, ecc. Ad es. l’articolo x potrebbe essere un precursore per l’argomento a, ma un banale e non originale epigono per gli argomenti b e c. Si potrebbero scoprire presupposti nascosti e bias latenti nelle teorie più diffuse, avendo il tempo e la pazienza di esplorare reticoli (compito comunque ben più appagante che non scavare tra le citazioni).
Per fare tutto questo, però, la dimensione del tempo è fondamentale. Leggiamo ad es. in un ottimo articolo introduttivo di I. Mani et al. (2004) a proposito di ontologie temporali:
Ontologies of time form a basic ingredient in representations for temporal reasoning.
Both instant-based and interval-based representations have been used, sometimes in combination. Intervals are attractive because our linguistic and commonsense notions of events have durations, although these durations might sometimes be very short. Instants are attractive because our logics have traditionally conceived of the truth of a proposition as evaluated at an instant; they are also needed for modeling events involving continuouschange [Galton 1990]. However, identifying the truth value of a proposition in terms of the beginning and end of an event is also problematic. Depending on the representation and the choice of primitive (intervals or instants, or both), a variety of different temporalrelations between times can be defined; for more comparison of interval and instant based ontologies (see van Bentham [1983] and Vila [1994]).
Allen’s [1984] well-known interval-based approach (see also Allen and Kautz [1985] and Allen and Ferguson [1997]) defines 13 mutually-exclusive temporal relations among intervals: before and after, overlaps and overlapped-by, starts and started-by, finishes and finished-by, during and contains, meets and met-by, and equal.
Pensate a un web 2.0 in cui la semantica consenta di gestire relazioni temporali oltre che spaziali, ma le une non separatemente dalle altre. Superate lo stupore, e pensate a che cosa vuol dire.
Poter vedere il tempo, e sentire scorrere lo spazio, vedere i namespaces comunicare tra loro ma anche generarsi e dissolversi. Creare parole che sono self-aware del modo in cui sono state usate altrove. Come si può pensare, questo: quanto può essere inquietante, anche. Ma in fondo, non più di un viaggio. Della sensazione, appunto, che stai vedendo un luogo nello scorrere di un tempo (vedere un luogo nello scorrere del senso delle parole, che cambiano) – in una notte, magari, dal finestrino, o nel sorgere del sole che ti presenta un paesaggio come sequenza di stati, che evolvono, infinitamente, gli uni negli altri a ogni minimo cambiamento di valore della variabile “luce”, o “temperatura”, o “vento”. Istanti e intervalli, appunto. Fisica e filosofia. Matematica e musica. Tagging e poesia. O – direbbe Yeats – danzatore, e danza.