Il Progetto Pilota KNOT

KNOT è un progetto pilota triennale (2023-2025) incaricato di indagare le modalità per integrare il patrimonio culturale digitale degli Atenei italiani nell'infrastruttura nazionale in fase di realizzazione da parte dell'Istituto Centrale per la Digitalizzazione dei Beni Culturali (ICDP) - Digital Library.

Considerando la mancanza di consenso all'interno degli Atenei e tra di esse su ciò che costituisce il loro patrimonio culturale digitale (PCD), il progetto KNOT ha scelto di concentrare la sua indagine sugli oggetti digitali (scholarly digital objects) creati dalla ricerca accademica nell'ambito delle scienze umane, e in particolare delle Digital Humanities, come esempio interessante ma inesplorato di PCD esistente. Il nostro approccio fa riferimento alle definizioni di PCD fornite dall'UNESCO [1] e dall'ICDP [2], nonché alle intuizioni del settore del patrimonio culturale, per considerare gli oggetti digitali come una forma che va oltre i semplici dati e contiene molteplici agenzie e distribuzioni spazio-temporali [3]. In quanto tali, gli oggetti in cui siamo interessati comprendono collezioni di informazioni (come gli dataset) e forme digitali che consentono l'interazione con le informazioni, da software e servizi di dati come interfacce di ricerca o API a strumenti di visualizzazione e annotazione. Questo ci permette di andare oltre il contesto scientifico in cui questi oggetti sono più comunemente intesi e di guardare al valore patrimoniale che potrebbe essere trovato nel loro "serbatoio di significato" [3]: l'attività che li ha prodotti, le relazioni con le informazioni che codificano, i nuovi contesti che creano per queste informazioni e i modi in cui possono favorire l'acquisizione di nuova conoscenza da questa combinazione di contesto e informazioni.

I principali risultati attesi dal progetto pilota sono un'applicazione web che mostra una prima adozione della nuova infrastruttura nazionale (compresa l'integrazione dei dati e i servizi) e una serie di linee guida per la raccolta, la gestione, l'arricchimento e il riutilizzo di questi scholarly digital objects.

Il progetto KNOT è suddiviso in tre fasi annuali, ciascuna con un proprio obiettivo:

Di seguito una panoramica più dettagliata delle attività e dei risultati attesi in ciascuna fase del progetto.

Primo Anno (2023)

Il primo anno è stato incentrato sui dati, con i seguenti obiettivi:

  • Raccolta, classificazione e categorizzazione dei dati, eterogenei e rappresentativi del tema centrale, da includere nel progetto pilota.
  • Elaborazione di un data model per descrivere i dati selezionati e riflettere l'argomento centrale del progetto. Questo modello deve essere informato dagli approcci esistenti e dai requisiti del progetto e deve consentire una rete di collegamenti semantici, anche attraverso la riconciliazione con i record di autorità e i vocabolari controllati.
  • Definizione di domande di ricerca e di competenza rispetto alle quali il data model può essere testato per garantire la sua capacità di abilitare una rete di collegamenti semantici che rappresentino le relazioni e facilitino la scoperta di conoscenza latente.
  • Creazione di un knowledge graph, accessibile tramite SPARQL endpoint, che rappresenta i scholarly digital objects come esempi del PCD degli Atenei e di un flusso di lavoro per la raccolta, la normalizzazione, la bonifica e la trasformazione dei dati in RDF.

Inoltre, il primo anno comprende anche i seguenti obiettivi che proseguiranno nelle fasi successive:

  • Ricerca sulle tecniche per l'estrazione di nuova conoscenza da dati eterogenei. Questa ricerca sarà condotta in collaborazione con il dipartimento DISI e nell'ambito di un gruppo di lavoro con il CINECA, in linea con gli obiettivi e le esigenze dell'infrastruttura della Digital Library.
  • Interviste con accademici italiani per esplorare le sfide che devono affrontare nella creazione e nella gestione di scholarly digital objects nati dalla ricerca umanistica.
  • Creazione di un documento di lavoro per le linee guida previste alla fine del progetto, attingendo alle intuizioni acquisite durante lo sviluppo del data model, come le questioni relative alla visibilità, alla categorizzazione e alla classificazione.

Il primo anno ha prodotto i seguenti risultati:

  • Un piccolo censimento di fonti e dati eterogenei (scholarly digital objects e i loro progetti) che rappresentano il tema centrale del pilota, usato per sviluppare il data model e knowledge graph.
  • Un data model per descrivere scholarly digital objects come PCD, compresi gli strumenti necessari come ontologie e vocabolari controllati in RDF.
  • Un catalogo e un knowledge graph basato sul data model e sui dati selezionati, che può fungere da prima versione dell'applicazione web finale.

Secondo Anno (2024)

Il secondo anno è incentrato sull'applicazione, con i seguenti obiettivi:

  • Integrazione dei dati e metadati nella piattaforma nazionale I.PaC.
  • Valutazione di potenziali servizi per estrarre nuova conoscenza dai dati e riconciliare le informazioni con i sistemi di gestione della ricerca istituzionali esistenti.
  • Sviluppo continuato del catalogo.

Terzo Anno (2025)

Il terzo anno è incentrato sui servizi, con i seguenti obiettivi:

  • Definire una suite di servizi da proporre agli utenti tramite l’applicazione, diversi nella loro offerta e potenzialità, per permettere l’acquisizione di nuova conoscenza.
  • Integrazione dei servizi e dell'app nella piattaforma nazionale.

References

[1] “Records of the General Conference, 32nd Session, Paris, 29 September to 17 October 2003, v. 1: Resolutions.” UNESCO, 2004. https://unesdoc.unesco.org/ark:/48223/pf0000133171.
[2] Docs Italia. “01_Piano nazionale di digitalizzazione del patrimonio culturale | Piano nazionale di digitalizzazione del patrimonio culturale.” Accessed January 28, 2024. https://docs.italia.it/italia/icdp/icdp-pnd-docs/it/v1.1-febbraio-2023/index.html.
[3] Cameron, Fiona. The Future of Digital Data, Heritage and Curation in a More-than Human World.London ; New York:Routledge/Taylor & Francis Group, 2021. ZA4080.4.