OA UNITO – pomeriggio – liveblogging II

6 Dicembre, 2007 di elemarangoni

Sessione pomeridiana.

I lavori del pomeriggio si aprono con l’intervento di Paolo Gardois, che ha per oggetto Aperto, l’archivio istituzionale di Unito. Seguirà l’interevento di Viviana Mandrile, dedicato alle tesi di dottorato, mentre nel prosieguo del pomeriggio si ritornerà al confronto con realtà di ricerca che in modo diverso hanno a che fare con l’open access e gli strumenti digitali, con esperienze nel campo della fisica, della storia e della filologia.

 

Paolo riprende il filo del discorso dalle nuove prospettive che si aprono per le biblioteche e degli strumenti concreti a disposizione.

Il Repository può essere definito come ‘an online locus’; le funzioni di un deposito istituzionale possono essere ricondotte a 2: – la disseminazione dell’informazione scientifica, tramite il protocollo OAI-PMH, attraverso internet; – ma si tratta di qualcosa di più di un ‘magazzino’.

Si propone quindi un modello teorico di flusso, dal producer agli utenti, articolato in inserimento, gestione dei dati e storage, preservation e infine accesso.

All’inizio l’accesso era semplice dowload, ora (come emerso in mattinata) la prospettiva è quella del riuso, del rimodellamento.

Le catene del valore: van de sompel parla delle catene del valore accademico, per indicare i processi di generazione ed elaborazione della conoscenza in ambito accademico; si parla poi di supply chain anche per l’accesso all’informazione: sempre più la necessità è di conoscenza ‘on demand’ piuttosto che immagazzinata.

La tendenza è quella dell’accesso aperto nel senso che i dati tendono a diventare commodities, materie prime che, pur con determinati costi, si danno per scontate, sempre disponibili, a partire dalle quali si costruiscono diverse catene di valore.

Come Aperto può creare valore?

All’interno della nostra istituzione uno dei modi in cui Aperto può interagire con flussi di lavoro interni all’istituzione è l’interazione con il Catalogo delle pubblicazioni della ricerca di Ateneo, con l’obiettivo di far inserire solo una volta i metadati. Altro campo è quello dell’archiviazione delle tesi di dottorato e di laurea. Vi sono anche potenzialità di collaborazione con altre istituzioni e potenzialmente col territorio

 

Le potenzialità del repository si misurano però anche con scelte in merito all’architettura del sistema (scelte in merito alla creazione di un unico repository o di diverse installazioni per funzioni diverse; caratteristiche delle diverse versioni del software).

Gli archivi devono ‘servire’ ai ricercatori, fornire dei servizi, quali la possibilità di ottenere lo scarico di metadati in formati bibliografici diversi, il collegamento con altri siti o servizi (il portale d’ateneo; collegamento col sistema di credenziali unificato di ateneo) e devono fornire sufficienti garanzie di sicurezza e preservazione.

Gli ‘scenari globali’ proposti sono una panoramica sul ‘valore aggiunto’ potenzialmente fornito da Aperto che richiamano il ‘mondo piatto’ (Friedman, 2006) aperto a nuove forme di partecipazione e collaborazione collettiva alla fruizione e costruzione della conoscenza. Cominciano ad essere proposti nuovi modelli teorici per interpretare tali potenzialità e mutamenti: l’invito è quello di cominciare assieme, bibliotecari e docenti, ad affrontare ed interpretare il nuovo mondo piatto che si sta delineando.

 

Viviana Mandrile presenta le Linee guida elaborate dalla CRUI in merito alla pubblicazione delle tesi di dottorato, documento approvato a fine novembre.

Le linee guida della CRUI si propongono l’istituzione di un servizio nazionale.

 

Perché le tesi di dottorato sono interessanti per l’OA? Sono un prodotto della ricerca originale e innovativo, nascono in formato digitale, ma sono ‘letteratura grigia’, difficilmente accessibili e pertanto non hanno l’impatto che meriterebbero per il loro valore. Il vantaggio per l’istituzione che le raccoglie è quello di valorizzare meglio il proprio prodotto mentre per l’autore rappresentano il primo passo della propria carriera, che potrebbe essere meglio valorizzato.

All’estero la raccolta di tali lavori è maggiormente sviluppata ed esiste dal 2006 un gruppo di lavoro europeo per integrare le varie realtà nazionali (metadati integrati per favorire l’accessibilità).

In Italia esistono 18 archivi istituzionali gestiscono l’archiviazione delle tesi, ma in tutto le tesi depositate sono meno di 2000: molti archivi sono quindi da sviluppare e ancora da popolare.

Sinora le tesi sono state raccolte negli archivi in aggiunta al deposito amministrativo e su base volontaria, col metodo del self archiving. Nel gruppo Crui, a partire dalle ‘buone pratiche’, è emerso come l’obbligo di deposito dia buoni risultati.

Il quadro normativo presenta difficoltà, per la sovrapposizione di norme diverse, anche in contrasto per la stratificazione storica delle leggi: la legge del 1941 fa rientrare le tesi nella disciplina del diritto d’autore, come opere orginali; mentre la disciplina del dottorato di ricerca impone l’obbligo del deposito per i singoli atenei alla biblioteca nazionale. La legge sul deposito legale, mirando a pubblicizzare le tesi, incentiva la raccolta anche tramite supporti informatizzati (2006).

Il gruppo Crui ha cercato un’armonizzazione tra le varie norme, per conciliare necessità di dare pubblicità alle tesi e diritto d’autore:

gli atenei hanno facoltà di rendere obbligatorio il deposito delle tesi di dottorato nei repositry istituzionali (rendendolo esplicito nei bandi di dottorato). Vi sono poi casi particolari, sottoposti ad un ‘embargo’ di max 12 mesi nel caso di contenuti brevettabili, o che debbano essere pubblicati con altri canali o qualora ci siano interessi di terzi.

 

Standardizzazione ed interoperabilità: è stato creato un formato di metadati standard a cui gli atenei sono invitati ad attenersi per garantire l’interoperabilità. Nell’estate 2007 una circolare ministeriale ha avviato la raccolta automatizzata in formato digitale delle tesi da parte delle biblioteche.

 

Il caso di Chimica: il progetto è nato su base volontaria per arricchire Aperto e migliorare il servizio catalografico. Anche da tale progetto è emerso come sia necessario superare l’archiviazione su base volontaria.

La proposta è di una strategia a 3 livelli: – comunicaione; – organizzazione (integrazione con SCU e Db delle segreterie, flussi di lavoro di ateneo); – conservazione e innovazione: occorre un regolamento di deposito (su formati, metadati, valorizzazione, integrazione con altri servizi quali Trova@unito).

OA UNITO – pomeriggio

6 Dicembre, 2007 di Paolo Gardois

Sono sopravvissuto, ho finito l’intervento, ora aspettiamo le domande.

Riemergo dai pensieri e dalle sensazioni colte dal link con la platea, rapido ed emozionante come sempre, e ascolto Viviana dire che in Italia sono state pubblicate OA negli IR solo 1400+ tesi di dottorato. Diversa la situazione in Olanda (10.000+). Si sono usate in Europa delle policies di deposito obbligatorio, ma Viviana rileva soprattutto il fatto che le normative, che da noi sono molte e intricate. Ultimamente però anche in Italia leggi e regolamenti hanno fatto considerevoli passi avanti. Ora la pubblicazione delle tesi è possibile previa modifica dei bandi di ammissione al dottorato, ma temporaneamente è possibile comunque previa liberatoria da parte del dottorando, che prende atto delle policy OA di un Ateneo. Alcuni tipi di tesi possono essere sottoposti ad embargo (brevetti, pubblicazione presso editori, dati sensibili, dovere di assolvere a diritti di terzi riguardo al materiale contenuto nella tesi).

Parlando poi dell’esperienza di deposito volontario delle tesi in AperTO, si rileva quanto segue: servono policy di deposito obbligatorio delle tesi; comunicazione con i dottorandi; creazione di adeguati flussi di lavoro; regolamento di deposito per formati file e schemi metadati, questi ultimi da concordare con le biblioteche nazionali; maggior integrazione con Trova@unito, per rendere linkabili con il resolver le citazioni contenute nelle tesi con i fulltext citati.
Tra chiacchiere e intervista con la web TV di Ateneo, mi perdo quasi tutto del modo in cui i fisici passano la mattinata, raccontato da L. Magnea, che tra l’altro ci fa vedere come un fisico usa ArXiv e Spires. Ottima la parte sulla psicopatologia della citazione: i nuovi strumenti online fanno misurare i ricercatori con domande inquietanti, come: “chi mi ha citato ieri?”. Inquietante soprattutto perché la domanda diventa quotidiana. Del resto, dai, anche con i blog ne sappiamo qualcosa, eh…

Nota conclusiva dell’intervento: la peer review è davvero valutata nel modo giusto? Come assegnarle un valore economico, dato che è davvero l’unica funzione di utilità sociale a cui assolvono gli editori, oggi?

Purtroppo (o per fortuna) i social networks non sono fatti di soli bit, e devo dire che mi sono perso gli interventi su Reti Medievali chiacchierando con colleghi e docenti — ma ho parlato di OA, naturalmente :-)

Molto interessante, comunque, il rapporto tra RM e Firenze University Press: tutto il materiale pubblicato sul sito viene pubblicato da FUP, in digitale o a richiesta anche in formato cartaceo. Il punto forte di RM rispetto ad iniziative analoghe, consiste nel fatto che la risorsa non è solo un repository o una realtà di e-publishing, ma un punto di incontro per specialisti di tutto il mondo.

P. Provero, del dipartimento di Genetica di UNITO, parla di OA e bioinformatica. C’è una forte insoddisfazione rispetto al processo tradizionale di peer-reviewing, che deve diventare + aperto. Il gruppo di Provero pubblica la maggior parte dei lavori su riviste OA: provenendo da fisica, è abbastanza naturale. BMC garantisce una peer-review di qualità, e abbastanza rapida (1-2 mesi) – e quando il lavoro è stato letto con cura e arrivano suggerimenti utili, lo si vede subito!

L’insoddisfazione viene spesso dall’anonimità dei reviewers, che possono commettere abusi. BMC garantisce commenti non anonimi e l’intera storia relativa alla pubblicazione dell’articolo, comprese le osservazioni dei reviewers, sono pubblicati. Problemi: difficile trovare referee, e tendenza ad avere report + positivi del normale. Altre riviste (PlOS) garantiscono possibilità di peer review anonima, ma occorre giustificare perché. Di solito, chi vuol mantenere l’anonimato, lo fa x paura di ritorsioni (pensate a un referee giovane che critica il lavoro di un ricercatore affermato). Non è ovvio quindi che il peer review anonimo garantisca davvero la trasparenza. Nature ha invece adottato il modello del Community Peer Review, poco utile e con pochi commenti –> abbandonato. Biology Direct ha invece adottato il metodo della Open and Permissive Peer Review: l’autore deve trovare 3 membri dell’editorial board disposti a fare 1 report; l’articolo può pubblicare anche se i report sono negativi; pubblica comunque sempre insieme ai report, firmati. Dove invece non si usa la peer review, i commenti sono infestati da pseudoscienza e trash (Philica).

Quanto all’accesso ai dati di ricerca, essi sono fondamentali in biologia e biologia molecolare. Questi dati sono accessibili tramite gli ormai tradizionali db, da swissprot a ensembl. Questi db sono la base della bioinformatica, che sarebbe impossibile se i dati non fossero pubblici. Questi db contengono moli enormi di conoscenza inesplorata – esplorarla è il compito della bioinformatica, che lo fa tramite software opensource al 99%. Questo, più che le pubblicazioni open, è ciò che ha davvero rivoluzionato la bioinformatica.

Non provo nemmeno, purtroppo, a bloggare l’ultimo intervento. La scuola materna mi aspetta. E la lucidità se ne va. La giornata è stata intensa. Le connessioni neuronali si sono attivate. Le reti sociali anche. Adesso proviamo a lavorarci. Come dice Wallace, lo yoyo del sole sta scendendo. Penserò camminando per le strade di Torino. Mescolando le luci arancio e le pietre dei palazzi, con le idee, come sempre, e oggi un po’ di più.

Open Access all’Università di Torino: esperienze e modelli di comunicazione scientifica. Sessione del mattino

6 Dicembre, 2007 di Paolo Gardois

Liveblogging again.

Il piacere di seguire e raccontare un evento. Aula magna di Unito. Oltre 130 persone. Sono appollaiato in alto a sinistra e vedo tutta la sala. Mi distraggo come al solito al gioco del chic’èchinonc’èenonc’èancoraeforsearriva. Non tanto da non sentire il Rettore che rimarca l’importanza dello SBA e della gestione della conoscenza in un Ateneo degli anni duemila, e il Direttore Amministrativo parlare della rilevanza dell’accesso aperto per gestire correttamente la spesa pubblica negli atenei ed evitare di vendere la conoscenza a pezzetti. Le logiche di mercato, continua il DirAmm, producono logiche di monopolio e non sono un modello di business accettabile: occorre equilibrare difesa del copyright e difesa dei beni comuni. Inoltre, l’OA è anche un elemento di un modello di razionalizzazione e omogeneizzazione culturale e organizzativa. Le biblioteche sono centrali per sviluppi scientifici interdisciplinari, e devono avere un ruolo nella ricerca e anche di ricerca.

Il delegato del rettore per le biblioteche, rimarca l’importanza di un ruolo propositivo dei bibliotecari nella gestione dei cambiamenti relativi alla produzione e comunicazione scientifica.

Franco Bungaro, responsabile dello Staff Sviluppo Collezioni e Metadati dell’Università di Torino, affronta il tema dell’enorme aumento del costo dei periodici scientifici. Il report del Library Journal, Serial Wars (2007), evidenzia un aumento del 300% del costo dei periodici nell’ultimo trentennio, al netto dell’inflazione! Da dove origina questa dinamica? Secondo Guedon, dall’ombra lunga di Oldenburg, inventore dei periodici scientifici. Dagli anni ’30 in poi nasce il concetto di core journals, anche grazie al Science Citation Index. L’impact factor è attribuito di fatto ai periodici, aumentando in tal modo l’inelasticità del mercato, data dalla concentrazione della maggior parte del valore aggiunto in (relativamente) poche testate.

Uno strumento per abbattere i costi sembrava quella dei consorzi, che però non hanno funzionato per questo, come sottolinea anche Bergstrom, nella parabola degli anarchici.

Entro questa logica, si può solo difendersi, diminuendo il valore complessivo delle collezioni acquistate. Occorre quindi rivolgersi all’Open Access, che tra l’altro è anche il modello e l’obiettivo per cui Internet è nata. L’OA, tra l’altro, funziona più di quanto si pensi. In DOAJ ci sono ca. 3000 riviste, e gli archivi istituzionali stanno crescendo. Questo genera conflitti con l’editoria tradizionale, e l’elemento tecnologico non gioca più a favore degli editori.

Mentre litigo con la connessione wireless, Stefano Bianco, dell’INFN ci parla del modello SCOAP. La comunità dei fisici è relativamente piccola (20.000 scienziati) e strettamente interconnessa. In questa comunità la peer review è essenziale per la certificazione. In particolare nella fisica delle alte energie si hanno 6 riviste in tutto, di 4 editori, uno scenario ideale per un’iniziativa come Scoap, che abbiamo già commentato al Berlin 5. In SCOAP, reinstradare i fondi di abbonamento favoriranno una competizione tra editori e quindi un miglioramento dell’offerta. SCOAP sarà una miscela di membership istituzionale e di sponsorship. Il 45% delle comunità (o meglio delle agencies istituzionali) hanno già accettato di fare un pledge (un pagherò), soprattutto in area tedesca ed europea in genere. In fondo si tratta di un modello institutions pay, ma l’elemento di novità è nel fare una gara, e nel fatto che tutti i Paesi devono partecipare. Ci si aspetta una riduzione complessiva dei costi e la disponibilità open access dei lavori pubblicati. Interessante lo scorporo delle riviste disponibili in SCOAP dai pacchetti (così le istituzioni non pagheranno 2 volte). Il CERN pubblica l’80% degli articoli su queste riviste, quindi ha un potere notevole nei confronti degli editori.

Secondo De Martin (Presidente del SBA del Politecnico di Torino), nel mondo cartaceo l’Università generava conoscenza e ne fruiva utilizzando un unico canale, gli editori commerciali. Il digitale genera una spinta verso la multimedialità, e inoltre i prodotti utili sono generati da milioni di produttori, non più poche centinaia. La produzione di informazione si orizzontalizza, così anche la produzione, e soprattutto il riuso. Occorre disaccoppiare pubblicazione (open) e peer review: prima la pubblicazione, e poi, come servizio “overlay”, la peer review. Cambia comunque la comunicazione scientifica, con i blog scientifici e anche con Facebook. Di conseguenza:

  • le biblioteche universitarie devono e possono concentrarsi sul selezionare, rendere accessibili e tramandare i contenuti;
  • l’università comunica in maniera più trasparente, ad es. attraverso i materiali didattici; e i docenti possono essere maggiormente conosciuti tramite le loro competenze specifiche.

Giulio Lughi, dell’Università di Torino, ragiona sull’ipotesi di un sistema di archiviazione integrato per i prodotti multimediali. Il multimedia era fortemente legato a grandi aggregati industriali, fino ad anni recenti, e questo aspetto era collegato ad una certa passività dello spettatore. Il digitale genera una cultura visuale, e dà anche la possibilità di segmentare, modulare e rendere più granulari i testi. Interessante il punto di vista di un esperto umanista nel collegare gli ipertesti alla programmazione orientata agli oggetti, alla logica dei database: reticolarità, estrazione in tempo reale con query, ecc. cambiano la natura del testo. Esiste un substrato testuale stabile da cui noi traiamo la nostra esperienza del testo: da Saussure (paradigma vs sintagma) all’inconscio di Freud, alla semiotica di Propp, alle strutture profonde di Chomsky, molta della cultura epistemologica del novecento si basa su questo assunto (e aggiungerei lo strutturalismo).

Questa modularità è penetrata in profondità nel testo, pensiamo a XML e ai metadati, ma anche agli oggetti multimediali. Solo se ho oggetti codificati in modo sistematico posso farli funzionare in una rete o in un sistema complessivo.

CSI e Regione Piemonte stanno ragionando sulla interoperabilità dei dati e la condivisione dei metadati, in un’ottica di integrazione, con apertura ai cittadini, tra Università e Pubblica Amministrazione.

Dopo il coffee break, la tavola rotonda.

Vittorio Valli parla di una rivista OA di ambito economico, che costa 2000 $ all’anno, grazie al lavoro volontario di editors e referees. Importantissimo avere tempi di pubblicazione il più possibile rapidi.

Sergio Margarita (direttore LIASES – UNITO). Il liases lavora su software Open Source e di Open Content: riusabilità, basata sul modello SCORM. Margarita rileva il fatto che i docenti presenti in sala sono un’esigua minoranza. Per lo sviluppo dell’OA ci vogliono:

  • un preciso modello di business, o sostenibilità: l’OA ha un modello difficile da sostenere. L’OA è un movimento antisistema, in quanto va contro gli interessi di molti stakeholders; questo va rovesciato in un modello win-win, come ad es. SCOAP;
  • un aspetto culturale: intervenire in modo incisivo sulla resistenza di docenti e ricercatori a diffondere ad accesso aperto i propri contenuti.

Luca Tamagnone, ricercatore biomedico, sottolinea l’importanza dell’Impact Factor nella scelta delle riviste su cui pubblicare. Importante il lavoro culturale per far conoscere l’OA ai ricercatori. LT è favorevole al modello authors pay, purché modifichi significativamente lo stato di cose.

M. Barbera, parla dei corpora, oggetti ibridi tra software e testi. L’esperimento condotto in materia ad UNITO si è basata sull’idea di copyleft e ha utilizzato licenze Creative Commons – share alike, che a suo parere costituiscono un buon compromesso tra tutela del diritto del singolo e diffusione della cultura come bene comune.

A. Piga esprime il punto di vista del reviewer, lavoro svolto gratuitamente e sempre più richiesto da un sempre maggior numero di riviste. Una variabile fondamentale per il reviewer è la variabilità: non solo si lavora gratis, ma x le riviste con IF più elevato si deve rispondere rapidissimamente alla proposta di review (elevata competizione tra reviewers). Perché? Fare il reviewer dà molti privilegi nell’ambito della ricerca.

A questo punto mi viene in mente: la peer review è il cuore del problema. Ma:

  • è possibile standardizzarne i metodi?
  • e a questo punto, è possibile pensare ad una post-publication peer review di massa?

Intanto ascolto l’intervento di E. Giglia, che sottolinea diversi aspetti relativi all’open access, esprimendo disaccordo con alcuni relatori ed aggiungendo alcuni elementi relativi al business model OA. Le risposte: Bianco conferma che SCOAP è difficilmente esportabile, tranne che in microcosmi con le stesse caratteristiche della comunità HEP.
Margarita: ma se l’OA è perfetto, allora perché la maggior parte degli autori e degli utenti usano software proprietari e pubblicano su riviste a pagamento? Ci vuole un lavoro culturale lungo, intervenendo sulle singole rigidità, di autori e lettori.

R. Caterina parla dell’ambito giuridico. C’è una netta scissione tra la pubblicazione sul web, che riguarda aspetti innovativi ma non conta per i concorsi, e le pubblicazioni sulle riviste giuridiche tradizionali. Nel campo giuridico prevale la seconda tendenza, e questo non facilita le dinamiche OA. Ci vogliono policies che aiutino in tal senso.

De Martin: attenzione, l’OA è all’inizio, ed è un processo che altererà equilibri vecchi di 450 anni; un po’ di pazienza. Però, occorre anche partire dalle radici del problema: un cambiamento tecnologico ha aperto prospettive di disseminazione impensate: quindi partiamo da ciò che si potrebbe fare, e poi arriviamo a ciò che si dovrebbe fare.

Faccio la domanda. Risponde Lughi, per primo. Ci sono diversi impatti mediatici tra discipline di nicchia e discipline più ampie. Nelle discipline umanistiche la peer review viene già fatta ex post, dal pubblico e dal mercato. Piga: pro e contro nell’aprire la peer review. Es.: ricercatori africani che pubblicano un lavoro interessante, ma scritto magari non con tutti i crismi. In questo caso aprire significa togliere valore ai ricercatori. In altri casi prevalgono i pro, dove non ci sono interessi economici preponderanti. In molti blog ci sono descrizioni dettagliate di esperimenti [questo dobbiamo farlo anche noi!!]. Dove ci sono interessi economici importanti, è impossibile aprire, sia la sperimentazione sia il processo di validazione.

Tamagnone: l’IF non è un dogma, può anche essere un limite alla diffusione iniziale dei contenuti OA, ma con il tempo potrà invertirsi la situazione. A parità di IF, già oggi sono da preferire riviste OA. La peer review è anche collegata all’IF della rivista, quanto più è alto l’IF, tanto più dettagliata ed approfondita dev’essere la peer review. Giglia sottolinea che le riviste di BMC permettono di rivedere i pre-publication comments.

OA Unito – the road to get there

5 Dicembre, 2007 di Paolo Gardois

Dunque, a quanto pare, domani c’è il convegno sull’Open Access all’Università di Torino. :-)

Quindicizerosei. Sto scrivendo l’intervento. Parto da Wikipedia, absit iniuria verbis, ma forse è meglio usare fonti introduttive – non mi aspetto una platea di specialisti, almeno l’intento degli organizzatori era divulgativo, spero di non aver capito male. La voce inglese (quella italiana, devo dire, mi convince di meno, molto meno chiara anche se le cose ci sono) è sintetica e chiara, un buon punto di partenza. Occorre aggiungere qualcosa sui workflow, sui modelli teorici, sull’OAI-PMH. Certo, sapessi usare il maledetto Visio, mi piacerebbe fare quelle belle slide piene di bidoncini colorati che fanno sempre una certa impressione, con le architetture di sistema, vabbè, imparerò prima o poi…

A proposito di OAI-PMH e copertura di fonti OA, interessante l’abbozzo di analisi in DigitalKoans, ora non ho tempo di vedere se in letteratura qualcuno ha colto lo spunto… Sull’interoperabilità tra IR, obbligatoria un’occhiata ai seguenti links: ORE, Interoperability across scholarly repositories.

Però così ancora non ci siamo. Serve un quadro teorico per comprendere che gli OA sono (o possono/potrebbero essere) più che dei database molto ben accessibili sul web. Allora usiamo OAIS come riferimento. Il full paper è il documento di riferimento, anche se il punto centrale è lo schema delle entità funzionali (ad es. su Ukoln). Qui abbiamo gli elementi di base per capire come/dove si può generare valore e a quale livello – e qui comincia il difficile.

Ho provato a fare un ragionamento partendo da quattro scenari, per analizzare il valore aggiunto: organizzativi, tecnici, globali e futuri. E’ un casino comunque: però volevo rendere la complessità di un argomento, piuttosto che fare un’operazione di marketing dell’IR. Vedremo.

E alla fine, diciottozeronove, dopo una decina di telefonate, qui c’è la bibliografia degli articoli citati (è meno barbarico metterli qui che imbottirne una mezza dozzina di slide…):

Ovviamente non è una bibliografia sull’OA in senso stretto, diciamo che riguarda di più il contesto, proprio come il paper che proporrò domani.

Per finire: che cosa mi aspetto:

  • flame e passioni scatenate sulla peer review
  • idee nuove (almeno per me…) sui bisogni degli utenti
  • interesse istituzionale
  • fare cose, vedere ‘ggente

A domani.

Dai soggetti al tagging: un problema di quantità?

21 Novembre, 2007 di Paolo Gardois

Riprendo una frase della citazione di Mani dal post di 2 gg fa.

Instants are attractive because our logics have traditionally conceived of the truth of a proposition as evaluated at an instant

Mi era sfuggito il senso reale di questa frase. In effetti, l’epistemologia riporta alla logica, alle funzioni per stabilire la verità delle proposizioni. In fondo l’idea che sta dietro al tagging o alla soggettazione ha a che fare con la verità, almeno in quanto adeguamento di una descrizione ad un oggetto descritto. Ogni tag è un istante, un punto nel tempo, ma anche nel senso in cui diciamo “ho colto il punto”. Pensate ad esempio alla nozione di aboutness come fondamentale nella catalogazione semantica: una soggettazione, un tagging dovrebbe essere quanto più possibile circale rispetto alle dimensioni dell’oggetto da descrivere. Di qui gli schemi come PMEST, appunto, che fanno da infrastruttura per la aboutness, la precisione descrittiva.

Quello che mi interessa, però, è capire come la ridondanza descrittiva, la sovrapposizione di tag ed etichette genera un effetto di accumulo che migliora – o peggiora – la comprensione. E’ anche una questione di quantità. Se alcuni tag aiutano la comprensione, troppi tag ci fanno perdere per vie laterali. Certo, molti tag aiutano il reperimento di un oggetto in un sistema di information retrieval, perché ci permettono di arrivarci partendo da diversi concetti, o sostenendo diverse associazioni di idee – ma un’associazione debole, o troppo soggettiva od arbitraria o “poetica” rispetto ad un contenuto può sviarci (certo, questo ci dà fastidio solo se non desideriamo essere sviati, se abbiamo un’attitudine “serendipitous” allora è diverso…).

E’ un problema non risolto della catalogazione semantica, della soggettazione, della classificazione.  Esistono linee guida su come usare i tesauri. Pubmed, per es., prevede una suddivisione delle voci di tesauro assegnate ad un record, in modo che solo poche siano caratterizzate come “major topics“, il che equivale a dire che molti termini possono descrivere aspetti secondari di un articolo medico, ma solo alcuni ne individuano la tematica fondamentale.

Però, qui, abbiamo una distinzione fondamentale tra uso di soggettari e vocabolari controllati e l’uso del linguaggio naturale come fonte di etichette per oggetti disponibili sul web. In fondo la vera differenza non è tanto qualitativa (varianti, polisemie, ecc. – in qualche modo, parzialmente, gestibili con strumenti automatici), ma piuttosto quantitativa. Nel momento in cui ogni parola può fare da etichetta – tag – nel momento in cui milioni di utenti possono etichettare un singolo oggetto, c’è bisogno di un ulteriore layer – a sua volta semantico – per stabilire relazioni tra i tag, che a questo punto diventano un universo a parte, anche sganciato dagli oggetti descritti.

Insomma, in qualche modo diventano un nuovo tesauro, solo ricostruito a posteriori, e dinamico in una maniera molto più imprevedibile. Se con il passaggio dai soggettari ai tesauri ci siamo mossi dalla pre- all post-coordinazione (posto che si tratti di un passaggio anche cronologico, oltre che logico), con il tagging generalizzato, di massa, siamo passati ad una creazione di ontologie ex-post, che forse possono diventare il vero valore aggiunto per un’analisi multidimensionale di grandi social networks. Si potrebbe provare – o per meglio dire qualcuno di certo ci avrà già provato…