Il Progetto Pilota KNOT
KNOT è un progetto pilota triennale (2022-2025) incaricato di indagare le modalità per integrare il patrimonio culturale digitale (PCD) degli Atenei italiani in I.PaC, l'infrastruttura nazionale in fase di realizzazione da parte dell'Istituto Centrale per la Digitalizzazione dei Beni Culturali (ICDP) - Digital Library.
Considerando la mancanza di consenso all'interno degli Atenei e tra di esse su ciò che costituisce il loro patrimonio culturale digitale, il progetto KNOT ha scelto di concentrare la sua indagine sugli oggetti digitali (scholarly digital objects) creati dalla ricerca accademica nell'ambito delle scienze umane, e in particolare delle Digital Humanities, come esempio interessante ma inesplorato di PCD esistente. Il nostro approccio fa riferimento alle definizioni di PCD fornite dall'UNESCO [1] e dall'ICDP [2], nonché alle intuizioni del settore del patrimonio culturale, per considerare gli oggetti digitali come una forma che va oltre i semplici dati e contiene molteplici agenzie e distribuzioni spazio-temporali [3]. In quanto tali, gli oggetti in cui siamo interessati comprendono collezioni di informazioni (come gli dataset) e forme digitali che consentono l'interazione con le informazioni, da software e servizi di dati come interfacce di ricerca o API a strumenti di visualizzazione e annotazione. Questo ci permette di andare oltre il contesto scientifico in cui questi oggetti sono più comunemente intesi e di guardare al valore patrimoniale che potrebbe essere trovato nel loro "serbatoio di significato" [3]: l'attività che li ha prodotti, le relazioni con le informazioni che codificano, i nuovi contesti che creano per queste informazioni e i modi in cui possono favorire l'acquisizione di nuova conoscenza da questa combinazione di contesto e informazioni.
I risultati attesi del progetto includono un data model per supportare la descrizione e la valorizzazione di questi oggetti digitali come DCH, un'applicazione web che mostra l'implementazione del data model e i potenziali modi per integrare i dati prodotti dal progetto nell'infrastruttura nazionale e una serie di linee guida per la raccolta, la gestione, l'arricchimento e il riutilizzo di questi scholarly digital objects.
Di seguito una panoramica più dettagliata delle attività e dei risultati in ciascuna fase del progetto.
Primo Anno (2023)
Il primo anno è stato incentrato sui dati, con i seguenti obiettivi:
- Raccolta, classificazione e categorizzazione dei dati, eterogenei e rappresentativi del tema centrale, da includere nel progetto pilota.
- Elaborazione di un data model per descrivere i dati selezionati e riflettere l'argomento centrale del progetto. Questo modello deve essere informato dagli approcci esistenti e dai requisiti del progetto e deve consentire una rete di collegamenti semantici, anche attraverso la riconciliazione con i record di autorità e i vocabolari controllati.
- Definizione di domande di ricerca e di competenza rispetto alle quali il data model può essere testato per garantire la sua capacità di abilitare una rete di collegamenti semantici che rappresentino le relazioni e facilitino la scoperta di conoscenza latente.
- Creazione di un knowledge graph, accessibile tramite SPARQL endpoint, che rappresenta i scholarly digital objects come esempi del PCD degli Atenei e di un flusso di lavoro per la raccolta, la normalizzazione, la bonifica e la trasformazione dei dati in RDF.
Inoltre il primo anno ha incluso anche il seguente lavoro che è continuato e ha alimentato le fasi successive:
- Collaborazione con il dipartimento DISI come parte di un gruppo di lavoro con CINECA per esplorare le potenzialità di integrazione dei dati pilota in I.PaC e collaborazione con il dipartimento DBC per esplorare le problematiche relative alla classificazione del PCD affrontate dagli Atenei italiani.
- Interviste con accademici italiani per esplorare le sfide che devono affrontare nella creazione e nella gestione di scholarly digital objects nati dalla ricerca umanistica.
Il primo anno ha prodotto i seguenti risultati:
- Un piccolo censimento di fonti e dati eterogenei (scholarly digital objects e i loro progetti) che rappresentano il tema centrale del pilota, usato per sviluppare il data model e knowledge graph.
- Un data model per descrivere scholarly digital objects come PCD, compresi gli strumenti necessari come ontologie e vocabolari controllati pubblicati in RDF.
- Sviluppo di un catalogo su piccola scala che utilizza il data model per descrivere i risultati del censimento e generare un knowledge graph degli scholarly digital objects e attività.
Secondo Anno (2024)
Il secondo anno è stato incentrato sul cataloguo, con i seguenti obiettivi:
- Valutazione di potenziali servizi per estrarre nuova conoscenza dai dati e riconciliare le informazioni con i sistemi di gestione della ricerca istituzionali esistenti.
- Distribuzione e ulteriore sviluppo del Catalogo KNOT.
- Sviluppo di un repository per ospitare e distribuire i vocabolari controllati KNOT e garantirne la FAIR-ness.
- Sviluppo di un documento di lavoro per le linee guida attese alla fine del progetto, che tragga spunto dalle intuizioni acquisite durante il primo anno sulle questioni di visibilità, categorizzazione e classificazione degli scholarly digital objects.
Il secondo anno ha prodotto i seguenti risultati:
- Distribuzione del Catalogo KNOT, che utilizza l'applicazione di catalogazione CLEF e presenta un knowledge graph degli scholarly digital objects e attività creati nel dominio delle scienze umanistiche italiane che include records per 100 progetti di ricerca, 35 oggetti digitali e 96 servizi web.
- Pubblicazione di visualizzazioni del knowledge graph del Catalogo KNOT, che mostrano alcuni degli aspetti più interessanti del dataset.
- Estensione delle funzionalità di CLEF, come la possibilità di generare pagine per entità utilizzate per il controllo di autorità e la riconciliazione.
- Ulteriore sviluppo del KNOT Data Model e dei vocabolari controllati, compresa una versione semplificata del modello di dati adattata ai limiti delle funzionalità di CLEF.
- Sviluppo di un'applicazione, basata su Skosmos, per pubblicare i vocabolari controllati KNOT e per un potenziale uso esteso come repository per tutti gli artefatti semantici prodotti da /DH.ARC.
Terzo Anno (2025)
Il terzo anno è incentrato sull'integrazione con I.PaC e sulla produzione di linee guida, con i seguenti obiettivi:
- Integrazione dei dati e dei metadati del progetto nella piattaforma I.PaC attraverso la continua collaborazione con il gruppo di lavoro DISI e CINECA.
- Pubblicazione delle linee guida per la descrizione e la valorizzazione degli scholarly digital objects come patrimonio culturale.
- Distribuzione del repository /DH.ARC Vocabularies e pubblicazione di linee guida interne per il suo continuo utilizzo.
Journal Articles
Giacomini, Sebastiano, Marilena Daquino, Francesca Tomasi, and Laurent Antoine Fintoni. 2025. “CLEF 2.0. Solutions for Native Linked Data Cataloguing of Italian Digital Cultural Heritage.” JLIS.It 16 (1): 108–26. https://doi.org/10.36253/jlis.it-611.
Conference Proceedings
Sabba, Fiammetta, Francesca Tomasi, Silvia Tripodi, and Laurent Antoine Fintoni. 2023. “L’Università Di Bologna a Supporto Dell’ecosistema Digitale Della Cultura Presso Il Ministero Della Cultura.” In Visioni Future: Next Generation Library - Vol.1, 45–50. Editrice Bibliografica. https://hdl.handle.net/11585/947326.
Fintoni, Laurent Antoine. 2024. "Rethinking Scholarly Digital Objects as Cultural Heritage: The KNOT Project."" In Me.Te. Digitali. Mediterraneo in rete tra testi e contesti, Proceedings del XIII Convegno Annuale AIUCD2024, 582–587. https://dx.doi.org/10.6092/unibo/amsacta/7927.
Datasets
Fintoni, Laurent, Marilena Daquino, and Francesca Tomasi. “KNOT Controlled Vocabularies”. Digital Humanities Advanced Research Center, University of Bologna, March 25, 2025. https://doi.org/10.5281/zenodo.15082216.
Fintoni, Laurent, Francesca Tomasi, and Marilena Daquino. “KNOT Catalogue Knowledge Graph”. Digital Humanities Advanced Research Center, University of Bologna, March 17, 2025. https://doi.org/10.5281/zenodo.15037686.
References
[1] “Records of the General Conference, 32nd Session, Paris, 29 September to 17 October 2003, v. 1: Resolutions.” UNESCO, 2004. https://unesdoc.unesco.org/ark:/48223/pf0000133171.[2] Docs Italia. “01_Piano nazionale di digitalizzazione del patrimonio culturale | Piano nazionale di digitalizzazione del patrimonio culturale.” Accessed January 28, 2024. https://docs.italia.it/italia/icdp/icdp-pnd-docs/it/v1.1-febbraio-2023/index.html.
[3] Cameron, Fiona. The Future of Digital Data, Heritage and Curation in a More-than Human World.London ; New York:Routledge/Taylor & Francis Group, 2021. ZA4080.4.