NEWS
ENCODING METRICAL INSCRIPTIONS
Foggia, 14-15 novembre 2024
leggiIscrizioni greche d'Italia - Campania I
Presentazione del volume di Paola Lombardi
leggiSAEG IX - Seminario Avanzato di Epigrafia Greca 2025
Roma, 8-10 gennaio 2025
leggiRESOCONTI
Bologna EpiDoc Workshop 2019
Bologna, 27-31 maggio 2019
Resoconto di Matteo Rivoli
leggiSAEG 5° Seminario Avanzato di Epigrafia Greca
Torino, 18-20 gennaio 2017
Resoconto di Francesca Giovagnorio
leggiEpiDoc Workshop Bologna 2016
Bologna, 12-14 settembre 2016
Resoconto di Irene Nicolino
leggiEAGLE-Epidoc Workshop
Alma Mater Studiorum Università di Bologna, May 26th-29th, 2014
Resoconto di Giuditta Mirizio
Nel corso di quattro piacevoli giornate di fine Maggio allietate da prime ciliegie di stagione e da un ricco buffet, si è svolto l’EAGLE-EpiDoc workshop, organizzato presso il Dipartimento di Storia Culture Civiltà dell’Università di Bologna da Alice Bencivenni, Lucia Criscuolo, Giovanni Geraci. A dirigere i lavori Pietro Liuzzo (EAGLE Project, Rodopis) e Ljuba Merlina Bortolani (Universität Heidelberg), affiancati dal loro trainers team composto da: Gabriel Bodard (King’s College London), James Cowey (Universität Heidelberg); Andrea Zanni (CRR-MM Università di Bologna/Wikimedia Italia); Alice Bencivenni, Elisabetta Ballesi, Laura Giunchedi, Simone Agrimonti, Riccardo Dallaj, Stefano Tropea (Università di Bologna). Il workshop, giunto alla sua terza edizione nella sede bolognese, dopo le precedenti del 2011 (per cui si veda il resoconto di Alice Bencivenni) e del 2013 (per cui si veda il resoconto di Stefano Tropea), ha questa volta ampliato il suo raggio di partecipazione, estendendosi non solo a studenti e ricercatori, di varia provenienza nazionale, ventiquattro in tutto, ma anche internazionale: il corso si è dunque svolto in lingua inglese ed ha avuto un’impronta fin da subito interattiva e stimolante in più direzioni.
L’avvio al mondo della digitalizzazione e all’edizione digitale di testi epigrafici e papiracei ha costituito l’obiettivo principale del workshop, che si è indirizzato a membri appartenenti a vari settori della realtà accademica, aventi l’interesse e la curiosità comuni di acquisire informazioni e competenze sulle possibilità offerte dall’applicazione delle tecnologie digitali alle scienze documentarie dell’antichità. In particolare, l’attenzione si è concentrata sull’illustrazione di EpiDoc, un sistema di marcatura dei testi tramite l’utilizzo di tags (marcatori), che rispettano la sintassi XML (eXtensible Markup Language). Nello specifico EpiDoc, che è una declinazione particolare degli standard della TEI (Text Encoding Initiative), ha fin da subito rivelato i suoi vantaggi per l’editore epigrafista (-papirologo), in grado di strutturare e descrivere il testo e i suoi metadati con l’utilizzo di marcatori dotati di significati semantici, da selezionare in base alle esigenze di dettaglio e profondità descrittiva con cui si intende caratterizzare la propria edizione.
Dopo i saluti iniziali e l’introduzione di Lucia Criscuolo e di Alice Bencivenni si è aperto il workshop con un programma mirante ad alternare momenti di spiegazioni teoriche a sperimentazioni ed esercizi pratici dei princìpi illustrati. L’ampio spazio dedicato alle domande ed ai legittimi dubbi ha dato vita anche a momenti di approfondimento e chiarificazione, utili senz’altro all’intero uditorio.
La prima intensa giornata di corso è stata finalizzata, nella sua prima parte, a fornire una visione di insieme sui fondamenti di EpiDoc e ad agevolare il primo approccio alla sua grammatica “human readable”. L’esemplificazione del funzionamento di marcatura di un tale set di codifica si è svolta tramite la presentazione diretta di alcune parti delle Guidelines: all’interno della sezione di trascrizione del testo, si è preso avvio dai basilari modi di codificazione della struttura del testo fino a giungere a quelli riguardanti la trascrizione del testo stesso. Le corrispondenze con i sistemi di convenzioni editoriali note all’epigrafista (Leida e Krummrey-Panciera) hanno fatto da guida per meglio chiarire la resa di vari fenomeni, tra i quali caratteri ambigui o andati perduti, integrati o ripristinati, cancellati in antichità; o ancora di simboli, abbreviazioni parzialmente o totalmente espanse; infine di speciali caratteristiche formali del testo, come apici, caratteri sopralineati o rovesciati, lettere claudiane e legature. Nel pomeriggio, poi, ad un esempio di completa marcatura di un testo è seguita l’installazione del software Oxygen XML Editor, usato per facilitare la codifica in XML e per applicare e validare lo schema EpiDoc alla grammatica scelta. È a questo punto che l’entusiasta ed incuriosito pubblico si è trasformato in attore, iniziando a metter mano alle parti testuali di alcune IGCyr, le iscrizioni della Cirenaica greca, in corso di digitalizzazione all’interno del più ampio progetto internazionale Inscriptions of Libya di cui l’Università di Bologna fa parte. Al termine della prima giornata i partecipanti sono stati anche istruiti sulle modalità di configurazione della trasformazione di file in formato XML in file formato HTML, HyperText Markup Language (procedimento che è stato trattato più in dettaglio nel corso della terza giornata).
La seconda giornata è stata dedicata alla spiegazione della struttura dei dati storici e descrittivi di EpiDoc: dettagliata considerazione hanno ricevuto i metadati e la loro organizzazione, in particolare quella relativa alle differenti parti di cui è composto il testo, alla sua descrizione, al layout, ai numeri di inventario e di “repository”. A questo punto, a conferma dei vantaggi derivanti dal tagging specifico di EpiDoc che permette di tener conto di informazioni aggiuntive in modo automatizzato, è risultata significativa l’illustrazione del concetto di Authority List: esso rappresenta un mezzo che consente di indicizzare e sistematizzare i metadati di un’iscrizione e di riunirli in modo coerente e ordinato in un vocabolario controllato (Controlled Vocabulary), a cui far riferimento per garantire la consistenza e la coerenza di informazioni potenzialmente ripetibili. Necessario si rende però anche l’“alignment”, “l’allineamento”, ad External Controlled Vocabularies (ad esempio, per quanto riguarda i toponimi: Pleiades, Geonames, DBpedia etc..), la cui priorità nella costruzione di un nuovo vocabolario è indispensabile non solo per raggiungere un criterio di coerenza interna di strutturazione dei dati, ma anche per uniformarli ad uno standard comune, rendendoli riutilizzabili, e accessibili dunque a qualsiasi utente che abbia scelto un criterio di indicizzazione diverso, nello stesso tempo arricchendoli di ulteriori riferimenti autorevoli. Il progetto EAGLE (Europeana Network of Ancient Greek and Latin Epigraphy) a tale proposito ha già creato sette controlled vocabularies (“Type of Inscription”, “Object Type”, “Material”, “Writing”, “Decoration”, “State of Preservation”, “Dating Criteria”). SKOS (Simple Knowledge Organization System) è il “namespace”, non TEI, utilizzato per la costruzione di vocabolari plurirelazionali che viene impiegato da progetti come EAGLE: lo sviluppo e la pubblicazione di vocabolari che definiscono non solo valori preferiti e valori alternativi, ma anche URI stabili per i vari concetti è un punto chiave per lo sviluppo di linked open data. Naturale è stato, infatti, il riferimento ai principi per la produzione di LOD (Linked Open Data), una ulteriore modalità di condivisione e pubblicazione di dati che viene auspicata, in quanto favorisce la creazione di relazioni tali da far diventare la rete un enorme database relazionale dove ogni entità è descritta da un nome unico e possibilmente è anche inferibile e leggibile. Si è passati poi ad approfondire la sezione concernente i dati geografici, passando in rassegna la situazione attuale di progetti che si occupano anche della descrizione delle informazioni geografiche (EDH, UBI ERAT LUPA, EDB,) e di gazetteers (Arachne, Trismegistos, Pelagios, Pleiades), mettendo nuovamente l’accento sulla necessità di rimando ad un’unicità dei dati che conferisca loro stabilità. La marcatura semantica ha poi ricevuto una dettagliata esposizione, affidata a Ljuba Merlina Bortolani, la quale ha introdotto la questione della indicizzazione dei termini, tracciando, come punto di partenza, una fondamentale differenza di tagging tra Words e Names, che può generare una prima lemmatizzazione di “parole” e “nomi propri” per l’appunto; l’annotazione e relativa indicizzazione delle persone realmente attestate nel testo meritano invece un tag diverso, “PersName”. In un secondo momento Gabriel Bodard, in collegamento Skype da Londra, ha sviluppato l’indagine, articolando il suo intervento in varie parti, finalizzate ad illustrare i meccanismi di indicizzazione delle persone in un testo, attraverso la creazione di Internal Authorities, liste prosopografiche interne da pre-configurare e collegare poi ad External Prosopographies, come ad esempio il Lexicon of Greek Personal Names. Il progetto in fieri di SNAP Dragon (Standard for Networking Ancient Prosopography) è stato poi oggetto di una speciale menzione, in quanto sarà in grado di definire i criteri per produrre dati interscambiabili su nomi e persone, servendosi inizialmente dei tre repertori il Lexicon of Greek Personal Names, Trismegistos e la Prosopographia Imperii Romani, attribuendo loro una nuova entry che colleghi le corrispondenze tra le entrate degli stessi.
La sessione pomeridiana è stata aperta da una ricapitolazione della procedura di annotazione di un testo completo, durante la quale sono state appianate alcune questioni, in particolare riguardo agli attributi “certainty” e “precision”, che rivelano il grado di accuratezza delle informazioni. Pietro Liuzzo è poi passato ad illustrare il progetto EAGLE che si pone l’obiettivo di unificare e uniformare in un unico archivio i dati provenienti da vari progetti di ricerca, per armonizzarne i contenuti e i modelli: esso è parte di EUROPEANA, una biblioteca digitale che raccoglie milioni di oggetti digitalizzati da musei, archivi, biblioteche d’Europa. In questo senso EpiDoc rappresenta lo standard usato anche da Eagle per il formato iniziale di consegna dei metadati per l’aggregazione in Europeana, che lo integra con CIDOC CRM (Conceptual Reference Model), un linguaggio che si presta alla descrizione degli eventi e dei concetti usati nella documentazione del patrimonio culturale. I dati così aggregati vengono esposti in EDM (European Data Model), un modello di metadati già in linked open data. La collaborazione con Wikimedia Italia è tanto essenziale per garantire l’arricchimento del testo con foto, traduzioni e altri dati che siano accessibili e reperibili sul web, quanto lo è il contributo che da essa EGALE stesso può ricevere. Ed è a questo punto che il coinvolgente e affascinante intervento di Andrea Zanni, presidente di Wikimedia Italia, ha catturato l’attenzione dell’uditorio ed ha invitato al dibattito. I princìpi alla base di una tale associazione no profit, un bene comune il cui fine è di condividere e dare accesso al sapere e alla conoscenza, sono stati analizzati e problematizzati: la prerogativa della qualità dei dati inseriti da un qualsiasi utente viene bilanciata ed assicurata da alcuni parametri, come il Consensus, il Neutral Point of View e le References esterne su cui ci si basa. Tali elementi sono in grado di garantire un’accuratezza sufficiente per la community, la quale, supremo controllore, detiene in ogni momento la possibilità di intervenire a modificare l’informazione, rendendola costantemente dibattuta e aggiornata. Una visione dinamica di conoscenza, dunque, che presuppone in ogni caso l’interesse e la volontà del lettore di farsi spontaneo produttore e promotore della stessa. Al termine della coinvolgente discussione, il giovane gruppo ha constatato quanto sia facile inserire i contenuti sull’ EAGLE MediaWiki e su Wikimedia Commons, avendo il compito di associare ad alcune delle immagini di iscrizioni presenti in rete il corrispettivo link da recuperare in un database di riferimento.
Una conclusiva analisi teorica ha caratterizzato infine la mattinata della terza giornata dei lavori che ha preso avvio dall’importante chiarificazione della diversità dei concetti di URI, Unique Resource Identifier e URL, Unique Resource Locator, utile premessa alla successiva spiegazione della trasformazione di un file XML in HTML, attraverso il linguaggio XSLT (eXtensible Stylesheet Language). Proprio quest’ultimo ha ricevuto successiva attenzione, per la sua qualità di linguaggio usato per le trasformazioni da XML a qualsiasi altro tipo di formato codificato. In particolare XPath, un ulteriore codice usato per ricercare ed evidenziare una posizione precisa all’interno di un file XML, è stato oggetto di presentazione, in quanto indispensabile componente di XSLT per l'identificazione dei punti nel codice su cui applicare funzioni ed operazioni. La chiara relazione di James Cowey, in collegamento Skype da Heidelberg, ha in seguito concluso l’iniziazione al mondo della digitalizzazione di manufatti antichi con l’introduzione alla piattaforma di Papyri.info e alla storia dell’inserimento di papiri online. Dopo i progetti intrapresi dalla Duke University negli anni ottanta del secolo scorso, è stato il nuovo sistema creato da Joshua D. Sosin ad imporsi: esso contempla l’immissione congiunta di testo e metadati per mezzo di un linguaggio, Leiden+, un sistema di marcatura testuale semplificato e accessibile che permette di servirsi di tags basati appunto sulle convenzioni di Leida e automaticamente convertibili in XML in modo bidirezionale (sia L+ → XML, che XML→ L+). Con tale linguaggio si sono nel pomeriggio confrontati gli entusiasti ricercatori, ai quali sono stati assegnati degli ostraka (O. Petr. Mus.), le cui nuove edizioni dovevano essere inserite attraverso l’Editor. La garanzia di controllo di qualità è in questo caso assicurata dalla presenza di un Editorial Board che verifica, rivede, corregge ed approva i dati inseriti.
La quarta ed ultima giornata è stata interamente dedicata all’esercizio pratico sulle iscrizioni della Cirenaica, sulle quali l’ormai euforico pubblico ha avuto modo di concretizzare le nozioni passate in rassegna nei giorni precedenti, coadiuvato e supportato da un team disponibile e generoso di chiarificazioni e precisazioni. Si è conclusa così un’altra esperienza assai preziosa e formativa per un gruppo di cultori delle scienze antichistiche, avviati ad un mondo, quello della tecnologia informatica, che rappresenta ormai il futuro anche delle discipline documentarie, e con cui confrontarsi è non solo vantaggioso ma anche intrigante.