The KNOT Data Model - Moduli

KNOT-DM può essere trattato come un insieme di moduli interconnessi che descrivono diversi aspetti dei progetti di ricerca accademici come patrimonio culturale digitale. Ogni modulo lavora su uno o più dei tre segmenti che compongono il data model e può essere usato per descrivere: l'attività del progetto di ricerca; le entità che un progetto di ricerca ha usato e generato (i suoi output e input); gli agent e i luoghi coinvolti; le relazioni tra le attività, le entità, gli agent e i luoghi; le modalità di accesso agli output della ricerca; i concetti relativi alla classificazione delle attività e degli output. Tutte queste informazioni dovrebbero aiutare a rispondere alle domande su chi, cosa, dove, quando e come che si riferiscono al tema centrale del progetto KNOT.

Si raccomanda di leggere prima la sezione Struttura, che fornisce una panoramica dei tre segmenti che compongono KNOT-DM, anche se alcune informazioni sono ripetute in questa sezione.

La seguente legenda si applica a tutte le rappresentazioni grafiche e le evidenziazioni testuali basate sul "Graphical Framework for OWL Ontologies" [1]: una casella gialla indica una classe, una freccia blu indica una object property, una freccia verde indica una data property, una freccia nera indica un predicato tra due entità e un punto rosa indica un'istanza di una classe (anche chiamato individuo).

I moduli utilizzano la piattaforma di analisi ALCIDE come esempio. ALCIDE è stato un progetto triennale condotto da due laboratori di ricerca della Fondazione Bruno Kessler con l'obiettivo di creare una piattaforma online per l'analisi del discorso politico, utilizzando come esempio gli scritti del politico italiano Alcide de Gasperi.

È possibile scaricare le versioni RDF (formattate in Turtle) di tutti gli esempi dei moduli e le versioni graph.ml di tutti i diagrammi direttamente dal nostro GitHub.

Il progetto di ricerca come attività

All'interno di KNOT-DM i progetti di ricerca sono concettualizzati come una forma di attività che utilizza e genera entità.

La descrizione dell'attività accademica avviene attraverso due dei tre segmenti: provenienza accademica, utilizzando la classe Activity di PROV-O che rappresenta l'attività di ricerca complessiva, e patrimonio culturale, utilizzando la classe D7 Digital Machine Event di CRMdig che rappresenta sotto-attività più specifici all'interno dell'attività complessiva. Queste due classi e segmenti sono collegati tramite prov:wasInformedBy.

KNOT-DM non cerca di registrare tutte le informazioni possibili sul progetto di ricerca come attività, ma piuttosto un livello di base che è quasi sempre pubblicamente disponibile nella documentazione di un progetto, come ad esempio dove e quando il progetto ha avuto luogo, chi è stato coinvolto e quali "cose" sono state usate e o generate.

Si raccomanda di iniziare a descrivere l'individuo che rappresenta l'attività complessiva prima di descrivere l'individuo o gli individui che rappresentano sotto-attività più specifici.

L'attività complessiva

prov:Activity rappresenta il progetto di ricerca nel contesto della provenienza accademica.

Devono essere registrate le seguenti informazioni di base: il titolo (dct:title), le date di inizio e fine (prov:startedAtTime, prov:endedAtTime, formattate come xsd:date), il luogo o i luoghi in cui si è svolta (prov:atLocation), gli agent coinvolti (prov:wasAssociatedWith), l'argomento o il soggetto principale (dct:subject), le entità e/o concetti che ha usato o generato (prov:used, prov:generated), qualsiasi concetto o altra entità che lo abbia influenzato (prov:wasInfluencedBy) e qualsiasi altro progetto di ricerca o attività specifica che l'ha informata (prov:wasInformedBy).

  • Per il titolo, si raccomanda di usare quello più evidente nella documentazione pubblica del progetto, con la consapevolezza che potrebbe differire da come il progetto viene indicato altrove. L'obiettivo è quello di essere precisi e coerenti.
  • Per quanto riguarda le date di inizio e fine, a volte possono essere difficili da accertare. Se non sono disponibili date complete, si dovrebbe registrare almeno un anno (con un valore di 01 se uno o entrambi i mesi e la data sono sconosciuti).
  • Opzionalmente si può usare foaf:homepage per registrare la homepage del sito web che documenta il progetto di ricerca e dct:referencedBy per connettere la ricerca a qualsiasi publicazione.

Esempio

Dalla documentazione pubblica di ALCIDE possiamo dedurre le seguenti informazioni sull'attività: il soggetto è il politico italiano Alcide de Gasperi e concetti relativi alle discipline accademiche coinvolte nel progetto (in questo caso Storia Politica); si è svolta principalmente a Trento; ha coinvolto cinque ricercatori e un web designer; ha creato tre entità - un sito web, un corpus e una piattaforma di analisi - e ne ha utilizzata un'altra - un'edizione in quattro volumi dei discorsi e degli scritti di de Gasperi. Ha anche utilizzato alcune tecnologie specifiche nella creazione della sua piattaforma di analisi, che possono essere referenziate attraverso l'uso di concetti del Thesaurus tecnologico KNOT.

Ha anche risuato una NLP pipeline per italiano creata da un altro progetto di ricerca chiamato Tint e per quanto riguarda le sotto-attività, la documentazione mostra che una versione digitale dell'edizione è stata la fonte per la creazione del corpus, a sua volta integrato nella piattaforma di analisi. Possiamo quindi scegliere di rappresentare ciascuna di queste fasi - digitalizzazione, creazione del corpus, creazione della piattaforma - come una sotto-attività*. Gli aspetti concettuali di queste attività possono essere riferiti al livello del progetto utilizzando i concetti della tassonomia TaDiRAH.

Il modo in cui dettagliare gli individui che rappresentano il luogo, gli agent e le entità è spiegato nei rispettivi moduli, mentre le sotto-attività sono illustrate nel passo successivo.

Il diagramma riportato nella figura 1 rappresenta questa prima fase, con alcune semplificazioni per mantenerlo leggibile (è incluso solo un agent), seguito dal suo equivalente in RDF in formato Turtle (con tutti gli agenti).

FIG 1. Descrizione dell' progetto ALCIDE come attività.
            @prefix : <http://purl.org/knot/ontology/data/> .
            @prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
            @prefix prov: <http://www.w3.org/ns/prov#> .
            @prefix crmdig: <https://projects.ics.forth.gr/isl/CRMext/CRMdig_v3.2.2.rdfs#> .
            @prefix dct: <http://purl.org/dc/terms/> .
            @prefix kth: <http://purl.org/knot/thesaurus#> . 
            
            :alcide a prov:Activity ;
            dct:title "ALCIDE (Analysis of Language and Content In a Digital Environment)"@en ;
            dct:subject :alcide_de_gasperi, <https://w3id.org/italia/controlled-vocabulary/classifications-for-universities/academic-disciplines/MSC-14-B> ;
            prov:startedAtTime "2015/01/01"^^xsd:date ;
            prov:endedAtTime "2018/12/31"^^xsd:date ;
            prov:atLocation :trento ;
            prov:wasAssociatedWith :maurizio_cau, :matteo_largaiolli, :sara_tonelli, :giovanni_moretti, :rachele_sprugnoli, :matteo_moretti ;
            prov:generated :alcide_corpus, :alcide_website, :alcide_platform ;
            prov:used :alcide_edition, kth:apachetomcat, kth:mysql, kth:react ;
            prov:wasInformedBy :edition_digitization, :corpus_creation, :platform_creation, :tint ;
            prov:wasInfluencedBy tadirah:annotating, tadirah:programming, tadirah:gathering .
            
            :trento a prov:Location .
            :maurizio_cau a prov:Agent .
            :matteo_largaiolli a prov:Agent . 
            :sara_tonelli a prov:Agent . 
            :giovanni_moretti a prov:Agent . 
            :rachele_sprugnoli a prov:Agent . 
            :matteo_moretti a prov:Agent .
            :alcide_corpus a prov:Entity . 
            :alcide_website a prov:Entity . 
            :alcide_platform a prov:Entity .
            :alcide_edition a prov:Entity .
            :alcide_de_gasperi a prov:Entity .
            :edition_digitization a crmdig:D7_Digital_Machine_Event . 
            :corpus_creation a crmdig:D7_Digital_Machine_Event . 
            :platform_creation a crmdig:D7_Digital_Machine_Event .
            :tint a prov:Activity .
          

Sotto-attività

KNOT-DM utilizza CIDOC CRM e le sue estensioni CRMdig e LMRoo (FKA FRBRoo) per dettagliare ciò che è accaduto durante il progetto di ricerca. L'obiettivo è quello di mettere in relazione queste informazioni con il dominio più ampio del patrimonio culturale e di creare un collegamento tra l'attività del progetto di ricerca e il tema centrale del progetto KNOT.

crmdig:D7_Digital_Machine_Event rappresenta sotto-attività, o task, all'interno di una più ampia prov:Activity. È implicito che queste attività siano state condotte da un agente umano, in un luogo specifico, su un dispositivo come un computer, e che abbiano utilizzato un oggetto digitale e/o un software per creare un nuovo oggetto digitale. Queste due classi sono collegate tramite prov:wasInformedBy, che è stato esteso in KNOT-DM per includere D7 nel suo range. Questa connessione fornisce "informazioni di dipendenza" suggerendo "che l'attività informata ha usato un'entità generata dall'attività informante" e può essere usata per creare una "catena di provenienza" basata sulle attività [2]. Questa catena viene utilizzata per descrivere sotto-attività come, ad esempio, la digitalizzazione di un oggetto fisico o la creazione di un oggetto digitale da altri oggetti digitali.

Ci sono due punti importanti da notare:

  • La documentazione di PROV-O afferma che le informazioni sulle dipendenze create da prov:wasInformedBy non richiedono ulteriori dettagli sulle attività o entità coinvolte. KNOT-DM suggerisce che se sono disponibili informazioni su queste ultime, allora dovrebbero essere descritte secondo i requisiti.
  • Il segmento sul patrimonio culturale di KNOT-DM è stato progettato per fornire un livello di base di informazioni su ciò che accade durante un progetto di ricerca e per descrivere gli oggetti digitali creati in un contesto di patrimonio culturale. L'obiettivo non è quello di descrivere le specificità del progetto di ricerca in modo assoluto, ma piuttosto di fornire una panoramica degli eventi e oggetti chiave che si riferiscono direttamente al patrimonio culturale e di rendere possibile un'ulteriore descrizione tramite CIDOC, se necessario. Nei casi in cui le informazioni sull'attività e sui risultati possono essere carenti, si può seguire la raccomandazione PROV-O di cui sopra e creare istanze delle sotto attività e dei loro risultati senza dettagli o con dettagli minimi (si consiglia di dare agli individui almeno un label).

Devono essere registrate le seguenti informazioni di base sulle istanze di D7: un titolo (rdfs:label), quali oggetti digitali sono stati utilizzati e/o creati (crmdig:L10_had_input, crmdig:L11_had_output, crmdig:L23_used_software), dove si sono svolte (crm:P7_took_place_at), da chi sono state effettuate (P14_carried_out_by) e il loro tipo (P2_has_type).

A seconda del livello di informazioni disponibili su un progetto di ricerca, possono essere utilizzate anche due sottoclassi di D7. Nel caso della digitalizzazione, crmdig:D2_Digitization_Process può registrare anche l'oggetto fisico utilizzato e l'oggetto digitale creato (crmdig:L1_digitized, crmdig:L20_has_created). crmdig:D10_Software_Execution può essere utilizzata per descrivere le attività in cui un computer ha utilizzato un software o altre operazioni su un oggetto digitale, registrando sia l'oggetto digitale di partenza (crmdig:L2_used_as_source) sia il software utilizzato, come ad esempio la creazione di visualizzazioni di dati o di un dataset.

  • Il titolo delle sotto-attività deve essere indicato nel contesto del record che si sta creando e di ciò che si sta descrivendo, utilizzando un linguaggio naturale (ad esempio, "digitalizzazione di libri"). Si raccomanda di mantenerlo sintetico.
  • Il tipo di sotto-attività dovrebbe utilizzare un concetto di un vocabolario controllato appropriato, come ad esempio Tadirah, che offre un ampio insieme di concetti relativi alle attività di ricerca digitale nelle scienze umane.
  • Nel caso dei luoghi e degli agent coinvolti nelle attività D7, questi possono spesso essere gli stessi coinvolti nella prov:Activity. In tal caso, agli individui che li rappresentano dovrebbe essere assegnata la classe appropriata da PROV-O e CIDOC, come spiegato nella sezione Classi concettualmente simili della panoramica di KNOT-DM.

Esempio

Nel passo precedente abbiamo affermato che ALCIDE ha coinvolto tre sotto-attività, come istanze di D7. Possiamo ora dettagliarle ulteriormente: la digitalizzazione delle edizioni è un'istanza di D2 condotta dall'editore, il Mulino; la creazione del corpus è un'istanza di D10 e la creazione della piattaforma che incorpora il corpus è un'istanza di D7, entrambe condotte dai ricercatori. Possiamo quindi dire che D2 si è svolto a Bologna (sede dell'editore) mentre D10 e D7 si sono svolti a Trento. Possiamo aggiungere le classi di CIDOC alle istanze di luoghi e agent già create nel passo precedente e creare quelle nuove (il Mulino, Bologna). Infine, possiamo rappresentare i tipi di sottoattività utilizzando i stessi concetti di TaDiRAH che si possono usare al livello di attività.

Il modo in cui dettagliare le entità utilizzate e create da queste sotto-attività è trattato nel modulo Output & Input.

La Figura 2 rappresenta questa fase, con tutti gli agent precedentemente descritti raggruppati sotto un unico individuo per mantenerlo chiaro, seguito dal suo equivalente RDF (che incorpora gli elementi della fase precedente).

FIG 2. Descrizione delle sotto-attività dentro il progetto ALCIDE.
            @prefix : <http://purl.org/knot/ontology/data/> .
            @prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
            @prefix prov: <http://www.w3.org/ns/prov#> .
            @prefix crmdig: <https://projects.ics.forth.gr/isl/CRMext/CRMdig_v3.2.2.rdfs#> .
            @prefix dct: <http://purl.org/dc/terms/> .
            @prefix crm: <http://cidoc-crm.org/cidoc-crm/7.1.2/> .
            @prefix tadirah: <https://vocabs.dariah.eu/tadirah/> .
            @prefix frbroo: <http://iflastandards.info/ns/fr/frbr/frbroo/> .
            
            #the overall activity 
            
            :alcide a prov:Activity ;
            dct:title "ALCIDE (Analysis of Language and Content In a Digital Environment)"@en ;
            dct:subject :alcide_de_gasperi ;
            prov:startedAtTime "2015/01/01"^^xsd:date ;
            prov:endedAtTime "2018/12/31"^^xsd:date ;
            prov:atLocation :trento ;
            prov:wasAssociatedWith :maurizio_cau, :matteo_largaiolli, :sara_tonelli, :giovanni_moretti, :rachele_sprugnoli, :matteo_moretti ;
            prov:generated :alcide_corpus, :alcide_website, :alcide_platform ;
            prov:used :alcide_edition, kth:apachetomcat, kth:mysql, kth:react ;
            prov:wasInformedBy :edition_digitization, :corpus_creation, :platform_creation, :tint ;
            prov:wasInfluencedBy tadirah:annotating, tadirah:programming, tadirah:gathering .
            
            #the sub-activities or tasks 
            
            :edition_digitization a crmdig:D2_Digitization_Process ;
            rdfs:label "Digitization of de Gasperi edition"@en ;
            crm:P7_took_place_at :Bologna ;
            crm:P14_carried_out_by :il_mulino ;
            crmdig:L1_digitized :edition_item ;
            crmdig:L20_has_created :edition_digitized ;
            crm:P2_has_type tadirah:gathering .
            
            :corpus_creation a crmdig:D10_Software_Execution ;
            rdfs:label "Creation of de Gasperi corpus"@en ;
            crm:P7_took_place_at :trento ;
            crm:P14_carried_out_by :maurizio_cau, :matteo_largaiolli, :sara_tonelli, :giovanni_moretti, :rachele_sprugnoli ;
            crmdig:L2_used_as_source :edition_digitized ;
            crmdig:L11_had_output :alcide_corpus ;
            crm:P2_has_type tadirah:annotating .
            
            :platform_creation a crmdig:D7_Digital_Machine_Event ;
            rdfs:label "Creation of ALCIDE platform"@en ;
            crm:P7_took_place_at :trento ;
            crm:P14_carried_out_by :maurizio_cau, :matteo_largaiolli, :sara_tonelli, :giovanni_moretti, :rachele_sprugnoli, :matteo_moretti ;
            crmdig:L10_had_input :alcide_corpus ;
            crmdig:L11_had_output :alcide_platform ;
            crm:P2_has_type tadirah:programming .
            
            :trento a prov:Location, crm:E53_Place .
            :bologna a crm:E53_Place . 
            :il_mulino a crm:E39_Actor .
            :maurizio_cau a prov:Agent, crm:E39_Actor .
            :matteo_largaiolli a prov:Agent, crm:E39_Actor . 
            :sara_tonelli a prov:Agent, crm:E39_Actor . 
            :giovanni_moretti a prov:Agent, crm:E39_Actor . 
            :rachele_sprugnoli a prov:Agent, crm:E39_Actor . 
            :matteo_moretti a prov:Agent, crm:E39_Actor .
            :alcide_corpus a prov:Entity, crmdig:D1_Digital_Object . 
            :alcide_website a prov:Entity . 
            :alcide_platform a prov:Entity, crmdig:D1_Digital_Object .
            :alcide_de_gasperi a prov:Entity .
            :edition_item a frbroo:F5_Item . 
            :edition_digitized a crmdig:D9_Data_Object .
            :tint a prov:Activity .
          

Output e input della ricerca come entità

All'interno di KNOT-DM gli output di un progetto di ricerca (gli oggetti digitali creati) e gli input (gli oggetti utilizzati per farlo, come oggetti fisici o digitali, ma anche soggeti come figure o periodi storiche) sono concettualizzati in tutti tre segmenti come entità. Poiché il progetto KNOT è focalizzato sul patrimonio culturale digitale, lo scopo del modello è quello di registrare le informazioni sugli output solo come oggetti digitali.

Queste entità sono descritte utilizzando le classi pertinenti di ciascun segmento. Come descritto nella sezione Classi concettualmente simili, ciò significa che un individuo che rappresenta un prodotto della ricerca può appartenere a più classi, ognuna delle quali descrive un aspetto diverso della sua natura di entità: prov:Entity per la dimensione della provenienza; crmdig:D1_Digital_Object (e sottoclassi) per la dimensione del patrimonio culturale; e dcat:Dataset (e sottoclassi) o dcat:DataService per la dimensione dei dati pubblici.

Le entità sono collegate all'attività complessiva che le ha generate tramite prov:wasGeneratedBy, crmdig:L20_has_created e crmdig:L11_had_output (si veda il modulo Attività).

Il livello di informazioni da registrare su ogni entità varia a seconda del segmento utilizzato per descriverla, anche se si prevede un minimo condiviso, come il titolo/label, l'attività che l'ha generata e/o utilizzata, la relazione con altre entità, un URI per una rappresentazione accessibile e il tipo e/o le caratteristiche concettuali.

L'ordine di descrizione degli output dipende dall'utente. Per alcuni potrebbe essere più facile iniziare con i dati pubblici, in quanto consentono di descrivere il più dettagli su un'entità, alcuni dei quali possono essere riutilizzati altrove, mentre per altri potrebbe essere più facile seguire lo stesso approccio del modulo Attività e iniziare con la provenienza, seguita dal patrimonio culturale e infine dai dati pubblici (questo è l'approccio adottato dal presente modulo).

Entità di provenienza

prov:Entity rappresenta entità all'interno del segmento provenienza accademica, riferendosi alla loro provenienza all'interno dell'attività complessiva. Devono essere registrate le seguenti informazioni: un titolo (dct:title o rdfs:label), un valore (prov:value) e la relazione con un'attività o altre entità (prov:generated, prov:used,prov:wasInfluencedBy, prov:wasDerivedFrom, dct:subject).

  • Per il titolo, rdfs:label dovrebbe essere usato solo quando non c'è un titolo ufficiale disponibile e dovrebbe descrivere l'entità in modo succinto in linguaggio naturale e nel contesto del record che si sta creando.
  • prov:value dovrebbe sempre puntare a un URI che sia una rappresentazione accessibile dell'entità. In questo senso, agisce in modo simile a owl:sameAs.

I dettagli su come utilizzare le proprietà di relazione tra entità sono forniti nel modulo Relazioni.

Esempio

Nel modulo Attività abbiamo creato cinque istanze di prov:Entity che sono state generate o utilizzate dal progetto ALCIDE: tre rappresentano gli output del progetto (il sito web, il corpus* e la piattaforma di analisi), una rappresenta l'edizione in quattro volumi utilizzata per creare il corpus e una rappresenta Alcide de Gasperi come soggetto del progetto. A ciascuno di essi è stato assegnato un titolo (o un label nel caso del sito web e della piattaforma) e un URI corrispondente.

La Figura 1 rappresenta questa fase, insieme al suo equivalente RDF, incorporando gli aspetti rilevanti dell'individuo prov:Activity creato nel modulo Activity.

FIG 1. Descrizione delle entità create dall'attività ALCIDE.
              @prefix : <http://purl.org/knot/ontology/data/> .
              @prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
              @prefix prov: <http://www.w3.org/ns/prov#> .
              @prefix dct: <http://purl.org/dc/terms/> .
              @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
              
              #the overall activity 
              
              :alcide a prov:Activity ;
              dct:title "ALCIDE (Analysis of Language and Content In a Digital Environment)"@en ;
              dct:subject :alcide_de_gasperi,  ;
              prov:generated :alcide_corpus, :alcide_website, :alcide_platform ;
              prov:used :alcide_edition .
              
              #the entities used and/or generated
              
              :alcide_corpus a prov:Entity ;
              dct:title "De Gasperi's Corpus"@en ;
              prov:value <https://github.com/StefanoMenini/De-Gasperi-s-Corpus> .
              
              :alcide_website a prov:Entity ;
              rdfs:label "ALCIDE website"@en ;
              prov:value <https://alcidedigitale.fbk.eu/> .
              
              :alcide_platform a prov:Entity ;
              rdfs:label "ALCIDE platform"@en ;
              prov:value <https://alcidedigitale.fbk.eu/platform> .
              
              :alcide_edition a prov:Entity ;
              dct:title "A. De Gasperi, Scritti e discorsi politici, I-IV"@it ;
              prov:value <https://www.mulino.it/collana/scritti-discorsi-de-gasperi> .
              
              :alcide_de_gasperi a prov:Entity ;
              dct:title "Alcide de Gasperi"@it ;
              prov:value <https://viaf.org/viaf/32011324> .
            

Oggetti del patrimonio culturale digitale

crmdig:D1_Digital_Object e le sue sottoclassi rappresentano entità all'interno del segmento sul patrimonio culturale, riferendosi alle loro qualità di patrimonio culturale digitale e collegate alle specifiche sotto-attività che le hanno generate o utilizzate. La sottoclasse crmdig:D9_Data_Object si riferisce specificamente agli oggetti digitali creati da un'attività D2, mentre la sottoclasse crmdig:D14_Software si riferisce al software utilizzato o creato da un'attività D7.

Le seguenti informazioni devono essere registrate sulle istanze di D1: un titolo (dct:title o rdfs:label), a meno che l'oggetto non sia già un'istanza di una classe di un altro segmento con un titolo o un label già esistenti, la loro relazione con attività e altre entità (crm:P106_is_composed_of, crmdig:L10_had_input, crmdig:L11_had_output, crmdig:L1_digitized, crmdig:L2_used_as_source) e il loro tipo (crm:P2_has_type).

Inoltre, poiché un processo di digitalizzazione coinvolge anche un oggetto fisico, KNOT-DM include crm:E18_Physical_Object per descriverli se le informazioni sono disponibili. Gli oggetti fisici possono essere ulteriormente dettagliati utilizzando le classi dell'estensione LRMoo: frbroo:F5_Item (una sottoclasse di E18) e frbroo:F3_Manifestation, seguendo il modello WEMI di FRBR [3]. Infine, questo segmento include anche crm:E1_Entity (che comprende tutte le cose nell'universo di discorso di CIDOC CRM) che può essere collegato a D2, E18 o F3 per descrivere di cosa si tratta. Le seguenti informazioni dovrebbero essere registrate su queste classi: un titolo (dct:title o rdfs:label), un URI che è una rappresentazione accessibile dell'entità (owl:sameAs) e le loro relazioni con altre entità (crm:P129_is_about). Opzionalmente è possibile registrare anche il tipo di oggetto fisico utilizzando P2.

Esempio

Nel modulo Attività abbiamo descritto tre istanze di D7 che hanno informato l'intero progetto ALCIDE. Ora possiamo descrivere gli oggetti che hanno coinvolto: la digitalizzazione dell'edizione ha creato un'istanza di D9 digitalizzando un'istanza di F5*; mentre la creazione del corpus e della piattaforma hanno creato ciascuna un'istanza di D1, con il corpus che utilizza l'edizione digitalizzata come fonte e la piattaforma di analisi che utilizza il corpus come input. Ora possiamo anche affermare che il corpus è composto dall'edizione digitalizzata e che la piattaforma è composta dal corpus. Infine, possiamo anche dettagliare la manifestazione di F5, che rappresenta il contenuto complessivo e la forma di presentazione delle edizioni, che può a sua volta essere collegata all'istanza esistente che rappresenta Alcide de Gasperi, che è il soggetto della manifestazione. Le istanze di D1 possono essere collegate ai concetti dei vocabolari KNOT-DM per descrivere il loro tipo.

La Figura 2 rappresenta questo passaggio, seguito dal suo equivalente RDF, che incorpora gli aspetti rilevanti degli individui creati nel modulo Attività e le entità del passaggio precedente.

FIG 2. Descrizione degli oggetti digitali creati dalle sotto-attivatà di ALCIDE.
            @prefix : <http://purl.org/knot/ontology/data/> .
            @prefix prov: <http://www.w3.org/ns/prov#> .
            @prefix crmdig: <https://projects.ics.forth.gr/isl/CRMext/CRMdig_v3.2.2.rdfs#> .
            @prefix dct: <http://purl.org/dc/terms/> .
            @prefix crm: <http://cidoc-crm.org/cidoc-crm/7.1.2/> .
            @prefix frbroo: <http://iflastandards.info/ns/fr/frbr/frbroo/> .
            @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
            
            #CRMdig activities 
            :edition_digitization a crmdig:D2_Digitization_Process ;
            rdfs:label "Digitization of de Gasperi edition"@en ;
            crmdig:L1_digitized :edition_item ;
            crmdig:L20_has_created :edition_digitized .
            
            :corpus_creation a crmdig:D10_Software_Execution ;
            rdfs:label "Creation of de Gasperi corpus"@en ;
            crmdig:L2_used_as_source :edition_digitized ;
            crmdig:L11_had_output :alcide_corpus .
            
            :platform_creation a crmdig:D7_Digital_Machine_Event ;
            rdfs:label "Creation of ALCIDE platform"@en ;
            crmdig:L10_had_input :alcide_corpus ;
            crmdig:L11_had_output :alcide_platform .
            
            #Digital Objects created by the activities 
            
            :alcide_corpus a prov:Entity, crmdig:D1_Digital_Object ;  
            dct:title "De Gasperi's Corpus"@en ;
            prov:value <https://github.com/StefanoMenini/De-Gasperi-s-Corpus> ;
            crm:P106_is_composed_of :edition_digitized ;
            crm:P2_has_type <http://purl.org/knot/taxonomy#corpus> .
            
            :alcide_platform a prov:Entity, crmdig:D1_Digital_Object ;
            rdfs:label "ALCIDE platform"@en ;
            prov:value <https://alcidedigitale.fbk.eu/platform> ;
            crm:P2_has_type <http://purl.org/knot/taxonomy#digital_platform> ;
            crm:P106_is_composed_of :alcide_corpus .
            
            :edition_digitized a crmdig:D9_Data_Object ;
            rdfs:label "Digitized form of the edition"@en .
            
            :edition_item a frbroo:F5_Item ;
            dct:title "A. De Gasperi, Scritti e discorsi politici, I-IV"@it .
            
            :edition_manifestation a frbroo:F3_Manifestation .
            
            :alcide_de_gasperi a prov:Entity, crm:E1_Entity ;
            dct:title "Alcide de Gasperi"@it ;
            prov:value <https://viaf.org/viaf/32011324> .
          

Dati pubblici

dcat:Dataset (e la sua sottoclasse dcat:Catalog) rappresenta entità all'interno del segmento dei dati pubblici, riferendosi alle loro qualità di dati pubblici e collegandoli all'attività complessiva prov:Activity che li ha generati. In alcune situazioni, un'istanza di dcat:DataService può anche rappresentare un output della ricerca (accesso interattivo ai dati creati dal progetto), ma poiché la funzione principale di questa classe riguarda l'accesso, il suo utilizzo è dettagliato nel modulo Accesso.

KNOT-DM fa uso della maggior parte del modello DCAT per registrare informazioni sulle entità, come le loro caratteristiche tecniche e concettuali, la loro relazione con il progetto di ricerca che le ha create, le informazioni spazio-temporali che contengono o a cui si riferiscono e come possono essere accessibili e/o riutilizzate. Queste informazioni seguono vari livelli di requisiti (obbligatori, raccomandati, opzionali) basati sulle linee guida DCAT AP con alcuni aggiornamenti specifici per KNOT.

Il contenitore dei dati

dcat:Catalog rappresenta un contenitore per i risultati e la documentazione della ricerca. Deve essere un oggetto digitale che contiene metadati sul progetto e sui suoi risultati e/o ospita i dati e i servizi che descrive. È una sottoclasse di dcat:Dataset, il che implica che questo contenitore è esso stesso un dataset prodotto dall'attività di ricerca. Sulla base di questi requisiti, la sua rappresentazione più probabile nel mondo reale sarà il sito web ufficiale del progetto di ricerca*.

Devono essere registrate le seguenti informazioni: una descrizione (dct:description), il titolo (dct:title), l'editore (dct:publisher), i dataset che include (dcat:dataset), i sistemi di organizzazione della conoscenza utilizzati per classificare i dataset inclusi (dcat:themeTaxonomy) e i concetti utilizzati per classificare il catalogo stesso (dcat:theme).

Le informazioni raccomandate che dovrebbero essere registrate, se disponibili, includono: i servizi di dati che include, la sua homepage, la lingua usata nei metadati dei dataset, la licenza con cui il catalogo può essere (ri)usato, la data di rilascio e/o l'ultima data modificata (formattata come xsd:date), e l'area geografica che copre.

Le informazioni opzionali che possono essere registrate, se disponibili, includono: diriti di accesso, parole chiave, se il catalogo include un altro, se include un record di metadati su se stesso, una dichiarazione sui diritti, e il suo creatore.

La maggior parte, se non tutte, di queste informazioni dovrebbero essere disponibili nella documentazione pubblica esistente del progetto di ricerca. Quando qualcosa non è chiaro, si dovrebbe cercare di dedurre e utilizzare le informazioni più coerenti e logiche disponibili.

  • Nel caso di agent, per il catalogo la priorità è data alle organizzazioni.
  • Per quanto riguarda l'area geografica, poiché i progetti di ricerca possono spesso coprire più aree, si dovrebbe utilizzare il valore che rappresenta la sede principale o una sede che offre la maggiore copertura.

Per dettagli su come registrare le informazioni sui knowledge organization systems e concetti consultare il modulo Relazioni, la sezione Vocabolario controllato, o note sull'uso dell'ontologia.

Esempio

Il sito web pubblico di ALCIDE, che abbiamo descritto per la prima volta nel modulo Attività, è il catalogo del progetto in quanto include informazioni sulla ricerca e ospita una forma accessibile del dataset e del servizio dati, rappresentato dai individui del corpus e della piattaforma di analisi che abbiamo già descritto. Due nuovi individui sono stati creati per rappresentare i laboratori di ricerca di cui i ricercatori fanno parte e che hanno agito come creatori ed editori. Viene inoltre creato un individuo che rappresenta l'Italia per l'area geografica coperta dal catalogo (anche se i discorsi e gli scritti di de Gasperi coprono altre aree, l'Italia è stata scelta in quanto è la più rappresentata). Per la lingua e il tema si utilizzano i concetti dei vocabolari controllati, mentre la descrizione è tratta dal sito web.

La Figura 3 rappresenta questa fase, con alcune informazioni semplificate per mantenere la leggibilità del diagramma, seguito dal suo equivalente RDF che incorpora gli aspetti rilevanti degli individui già creati nelle fasi e nei moduli precedenti.

FIG 3. Descrizione del sito web ALCIDE come contenitore per i dati pubblici creati dal progetto.
            @prefix : <http://purl.org/knot/ontology/data/> .
            @prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
            @prefix prov: <http://www.w3.org/ns/prov#> .
            @prefix dct: <http://purl.org/dc/terms/> .
            @prefix dcat: <http://www.w3.org/ns/dcat#> .
            @prefix crmdig: <https://projects.ics.forth.gr/isl/CRMext/CRMdig_v3.2.2.rdfs#> .
            @prefix foaf: <http://xmlns.com/foaf/0.1/> .
            
            :alcide_website a dcat:Catalog, prov:Entity ;
            dct:description "La piattaforma ALCIDE (Analysis of Language and Content In a Digital Environment) nasce dalla collaborazione tra due centri di ricerca della Fondazione Bruno Kessler di Trento: l’Istituto storico italo-germanico e il gruppo Digital Humanities del Center for Information and Communication Technology. Storici e informatici umanistici hanno lavorato alla costruzione di un software originale di analisi del discorso, che unisce strumenti di analisi del linguaggio a modelli di visualizzazione di strutture dati complesse. La piattaforma consente diversi tipi di analisi automatica dei documenti: l’estrazione di concetti chiave, la ricerca testuale, il riconoscimento di nomi di persona e di luogo, la visualizzazione dei network, l’individuazione delle co-occorrenze, l’analisi della complessità sintattica e semantica dei testi. Il corpus dei documenti riprende integralmente l’edizione A. De Gasperi, Scritti e discorsi politici, I-IV, sotto la direzione scientifica di Paolo Pombeni, Bologna, il Mulino, 2006-2009."@it , "The ALCIDE platform (Analysis of Language and Content In a Digital Environment) was born from the collaboration between two research centers of the Bruno Kessler Foundation in Trento: the Italian-German Historical Institute and the Digital Humanities group of the Center for Information and Communication Technology. Humanities historians and computer scientists worked together on building speech analysis software that combines language analysis tools with visualization models of complex data structures. The platform allows different types of automatic document analysis: extraction of key concepts, text search, recognition of names of people and places, network visualization, identification of co-occurrences, and complex analysis of the syntax and semantics of texts. The corpus used the entire edition A. De Gasperi, Scritti e discorsi politici, I-IV, created under the scientific direction of Paolo Pombeni (Bologna, il Mulino, 2006-2009)."@en ;
            dct:publisher :dh_fbk ; 
            dct:title "ALCIDE website"@en ;
            rdfs:label "ALCIDE website"@en ;
            dcat:dataset :alcide_corpus ;
            dcat:service :alcide_platform ;
            foaf:homepage <https://alcidedigitale.fbk.eu/> ;
            prov:value <https://alcidedigitale.fbk.eu/> ;
            dct:language <http://publications.europa.eu/resource/authority/language/ITA> ;
            dct:issued "2018-12-31"^^xsd:date ;
            dct:spatial :italia;
            dcat:themeTaxonomy <http://publications.europa.eu/resource/dataset/data-theme>, <https://vocabs.dariah.eu/tadirah/en/>, <http://purl.org/knot/taxonomy#> ;
            dcat:theme <https://w3id.org/italia/controlled-vocabulary/classifications-for-universities/academic-disciplines/MSC-14-B>, <http://viaf.org/viaf/32011324> ;
            dct:creator :dh_fbk, :isig ;
            prov:wasGeneratedBy :alcide .
            
            :alcide_corpus a dcat:Dataset, prov:Entity, crmdig:D1_Digital_Object .
            :alcide_platform a dcat:DataService, prov:Entity, crmdig:D1_Digital_Object .
            :dh_fbk a foaf:Agent .
            :isig a foaf:Agent .
            :italia a dct:Location .
            :alcide a prov:Activity .
          

I dataset

dcat:Dataset rappresenta gli oggetti digitali creati da un progetto di ricerca. Questa classe vuole essere abbastanza flessibile da coprire la maggior parte dei tipi di oggetti digitali che un progetto può creare. Per questo motivo, anche se la parola dataset può implicare una certa limitazione, all'interno di KNOT-DM, essa copre tutto, da un pdf di un articolo a un training set annotato o a un software (una raccolta di codice, dati e documentazione).

Le seguenti informazioni devono essere registrate: una descrizione, il titolo, il tipo (dct:type) e i concetti usati per classificarlo.

Le informazioni raccomandate da registrare, se disponibili, comprendono: la distribuzione disponibile, l'editore (o gli editori), il creatore (o i creatori), le informazioni spaziali e temporali che copre, la licenza, un identificatore nel contesto del catalogo e l'attività che lo ha generato.

Le informazioni opzionali che possono essere registrate, se disponibili, comprendono: i dettagli dei diritti di accesso, le specifiche a cui è conforme, la documentazione, la frequenza di aggiornamento, il fatto che sia una versione di un altro dataset, le entità esterne che li fanno riferimento (come i documenti), la lingua o le lingue che include, gli identificatori esterni e la data di rilascio e/o la data dell'ultima modifica.

  • Nel caso di agent, per il dataset si deve dare priorità alle organizzazioni per i ruoli di editore e alle persone per i ruoli di creatore.
  • Una distribuzione deve essere inclusa solo se permette di scaricare direttamente il dataset (per maggiori dettagli, vedere il modulo Accesso).
  • Per la copertura spaziale e temporale, utilizzare il valore che rappresenta la località o il periodo di tempo principale o quello che offre la maggiore copertura.
  • Le entità esterne che fanno riferimento al dataset devono essere rappresentate tramite un URI valido.

Per i dettagli sui vocabolari controllati da utilizzare, consultare la sezione Vocabolari controllati.

Esempio

Sappiamo che il progetto ALCIDE ha creato un dataset: un corpus degli scritti e discorsi di de Gasperi. Come accennato nella prima sezione di questo modulo, questo corpus non è direttamente collegato ai siti ufficiali del progetto, ma è pubblicamente disponibile sul’ GitHub del laboratorio di ricerca, che ci fornisce la maggior parte delle informazioni necessarie, tra cui il titolo, la descrizione, le lingue trattate, i riferimenti esterni, le distribuzioni disponibili, la licenza, la data di rilascio, la documentazione e i diritti di accesso.

La Figura 4 rappresenta questa fase, con alcune informazioni semplificate per mantenere il diagramma leggibile, seguito dal suo equivalente RDF che incorpora gli aspetti rilevanti degli individui già creati nelle fasi e nei moduli precedenti.

FIG 4. Descrizione del corpus ALCIDE come dataset.
            @prefix : <http://purl.org/knot/ontology/data/> .
            @prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
            @prefix prov: <http://www.w3.org/ns/prov#> .
            @prefix dct: <http://purl.org/dc/terms/> .
            @prefix dcat: <http://www.w3.org/ns/dcat#> .
            @prefix crmdig: <https://projects.ics.forth.gr/isl/CRMext/CRMdig_v3.2.2.rdfs#> .
            @prefix foaf: <http://xmlns.com/foaf/0.1/> .
            @prefix crm: <http://cidoc-crm.org/cidoc-crm/7.1.2/> .
            
            :alcide_corpus a dcat:Dataset, prov:Entity, crmdig:D1_Digital_Object ;
            dct:description "A collection of Alcide De Gasperi's public documents with gold and silver annotation The corpus of Alcide De Gasperi's public documents is a collection of 2,762 documents issued between 1901 and 1954, which had been previously published in four volumes by Il Mulino but were not machine-readable. Our repository contains all documents in three formats: txt, XML and tab-separated. Raw txt files contain only the body of the documents, and may be straightforwardly used to extract embeddings or topics. XML files include metadata that cover not only the title, the date and the place of publication, but also key-concepts automatically extracted from each text (with the corresponding relevance score) and genre labels manually assigned by domain experts. Furthermore, the release includes silver annotation for lemma, part of speech, person names and place names with associated coordinates in a CoNLL-like format. The corpus is released under CC BY-NC-SA license. An online platform to explore the corpus without downloading it can be accessed at http://alcidedigitale.fbk.eu"@en ;
            dct:title "De Gasperi's Corpus"@en ;
            dcat:distribution :corpus_distribution ;
            dct:publisher :dh_fbk ; 
            dct:spatial :italia ;
            dct:temporal <https://www.wikidata.org/entity/Q6927> ; 
            dcat:theme <http://viaf.org/viaf/32011324>, <http://publications.europa.eu/resource/authority/data-theme/EDUC> ;
            dct:accessRights <http://publications.europa.eu/resource/authority/access-right/PUBLIC> ;
            dct:creator :sara_tonelli, :giovanni_moretti, :rachele_sprugnoli ;
            dct:conformsTo <http://data.europa.eu/r5r/> ;
            dct:identifier "Alcide Corpus"@en ;
            dct:isReferencedBy <https://api.semanticscholar.org/CorpusID:204921128> ;
            dcat:landingPage <https://github.com/StefanoMenini/De-Gasperi-s-Corpus> ;
            prov:value <https://github.com/StefanoMenini/De-Gasperi-s-Corpus> ;
            dct:language <http://publications.europa.eu/resource/authority/language/ITA> ;
            dct:issued "2019-07-16"^^xsd:date ;
            dct:type <http://purl.org/knot/taxonomy#corpus> ;
            crm:P2_has_type <http://purl.org/knot/taxonomy#corpus> ;
            prov:wasGeneratedBy :alcide ;
            dct:license <https://w3id.org/italia/controlled-vocabulary/licences/B19_CCBYNCSA40> .
            
            :corpus_distribution a dcat:Distribution .
            :dh_fbk a foaf:Agent .
            :italia a dct:Location .
            :sara_tonelli a prov:Agent, crm:E39_Actor, foaf:Agent . 
            :giovanni_moretti a prov:Agent, crm:E39_Actor, foaf:Agent . 
            :rachele_sprugnoli a prov:Agent, crm:E39_Actor, foaf:Agent .
            :alcide a prov:Activity .
          

Agent e luoghi

All'interno di KNOT-DM gli agent e i luoghi sono correlati alle attività e agli output: i primi rappresentano gli individui o le organizzazioni coinvolte in un'attività o nella creazione di output; i secondi rappresentano il luogo geografico in cui si è svolta un'attività o a cui si fa riferimento negli output.

La descrizione di agent e luoghi avviene in tutti tre segmenti di KNOT-DM. Perciò, come per le entità, un individuo che rappresenta un agente o un luogo può appartenere a più classi, ognuna delle quali descrive un aspetto diverso della sua natura : prov:Location e crm:E53_Place si riferiscono al luogo in cui un'attività si è svolta, mentre dct:Location si riferisce ai luoghi coperti dai dati; prov:Agent e crm:E39_Actor si riferiscono ad agent che hanno una qualche responsabilità nei confronti dell'attività stessa, di un'entità o di un altro agente, mentre foaf:Agent implica che un agent ha fatto qualcosa.

Si raccomanda di iniziare a descrivere l'attività e i risultati del progetto di ricerca, che richiederà la descrizione di agent e luoghi, se necessario.

Agent

prov:Agent, foaf:Agent, e crm:E39_Actor rappresentano le persone o le organizzazioni che hanno preso parte a un'attività o nella creazione di un entità. Su di loro dovrebbero essere registrate le seguenti informazioni: un nome o un titolo (rdfs:label o foaf:name), un URI che li rappresenta e che punta a un authority control riconosciuto, se disponibile (owl:sameAs), e la loro relazione con attività, entità o agent (prov:wasAssociatedWith, prov:actedOnBehalfOf, crm:P14_carried_out_by, dct:publisher, dct:creator, dct:contributor

I progetti di ricerca accademica possono spesso coinvolgere una moltitudine di agent, con ruoli diversi, dai ricercatori ai comitati scientifici o ai finanziatori. Per questo motivo, KNOT-DM limita gli agent che devono essere registrati agli autori e ai collaboratori, le persone direttamente coinvolte nell'attività di ricerca, e agli editori, spesso entità legali come università o laboratori che hanno reso disponibili i risultati della ricerca.

Nel caso delle persone, se esiste una chiara affiliazione a un'organizzazione, anche questa dovrebbe essere registrata, utilizzando prov:actedOnBehalfOf o org:memberOf insieme a org:Organization e org:OrganizationalUnit (sottoclassi di foaf:Agent) dell'ontologia Org, che sono incluse in KNOT-DM per questo scopo. In alternativa, le differenze tra agent umani e non umani coinvolti in un'attività prov:Activity possono essere rilevate da dct:contributor per i primi e prov:wasAssociatedWith per i secondi.

Esempio

Come descritto nei moduli precedenti, sappiamo che il progetto ALCIDE ha coinvolto cinque accademici, affiliati a due laboratori di ricerca (DH@FBK, ISIG) e due università (Cattolica e Trento), e un web designer. Inoltre, sul sito web si legge che i membri dell'ISIG hanno fornito supporto linguistico e storico, mentre i membri di DH@FBK hanno sviluppato i dati e il software. Un altro agent, il Mulino, editore dei testi utilizzati dal progetto, è stato creato nei moduli precedenti come responsabile della digitalizzazione dei testi.

Sulla base delle attività e dei risultati descritti nei moduli precedenti, è possibile registrare quanto segue sugli agent: i membri di entrambi i laboratori sono stati responsabili dell'attività del progetto e dei suoi risultati, comprese le due sotto-attività relative alla creazione del corpus e della piattaforma di analisi*; il Mulino è stato responsabile della sotto-attività relativa alla digitalizzazione del testo; DH@FBK ha pubblicato il progetto; ed entrambi i laboratori, insieme al web designer, hanno creato il sito web (il designer è incluso insieme alle organizzazioni perché non è stata indicata alcuna affiliazione). Infine, possiamo anche creare un nuovo individuo, che rappresenta la Fondazione Bruno Kessler a cui i laboratori appartengono.

La Figura 1 rappresenta la descrizione di uno di questi agenti, mostrando come tutti e tre i segmenti possano interagire, seguito dal suo equivalente RDF che descrive tutti gli agenti e incorpora elementi rilevanti dai moduli precedenti.

FIG 1. Descrizione di un agent coinvolto nel progetto ALCIDE.
            @prefix : <http://purl.org/knot/ontology/data/> .
            @prefix prov: <http://www.w3.org/ns/prov#> .
            @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
            @prefix crmdig: <https://projects.ics.forth.gr/isl/CRMext/CRMdig_v3.2.2.rdfs#> .
            @prefix dct: <http://purl.org/dc/terms/> .
            @prefix dcat: <http://www.w3.org/ns/dcat#> .
            @prefix crm: <http://cidoc-crm.org/cidoc-crm/7.1.2/> .
            @prefix owl: <http://www.w3.org/2002/07/owl#> .
            @prefix org: <http://www.w3.org/ns/org#> .
            
            #agents
            
            :maurizio_cau a prov:Agent, crm:E39_Actor, foaf:Agent ;
            rdfs:label "Maurizio Cau"@it ;
            owl:sameAs <https://viaf.org/viaf/222130465/> ;
            prov:actedOnBehalfOf :isig ;
            org:memberOf :isig .
            
            :matteo_largaiolli a prov:Agent, crm:E39_Actor, foaf:Agent ;
            rdfs:label "Matteo Largaiolli"@it ;
            owl:sameAs <https://viaf.org/viaf/1337155042813472402390/> ;
            prov:actedOnBehalfOf :uni_trento .
            
            :sara_tonelli a prov:Agent, crm:E39_Actor, foaf:Agent ;
            rdfs:label "Sara Tonelli"@it ;
            owl:sameAs <https://viaf.org/viaf/85162365719525460619/> ;
            prov:actedOnBehalfOf :dh_fbk ;
            org:memberOf :dh_fbk .
            
            :giovanni_moretti a prov:Agent, crm:E39_Actor, foaf:Agent ;
            rdfs:label "Giovanni Moretti"@it ;
            owl:sameAs <https://www.wikidata.org/wiki/Q107765378> ;
            prov:actedOnBehalfOf :dh_fbk ;
            org:memberOf :dh_fbk .
            
            :rachele_sprugnoli a prov:Agent, crm:E39_Actor, foaf:Agent ;
            rdfs:label "Rachele Sprugnoli"@it ;
            owl:sameAs <https://viaf.org/viaf/128151594450205351651> ;
            prov:actedOnBehalfOf :uni_cattolica .
            
            :matteo_moretti a prov:Agent, crm:E39_Actor, foaf:Agent ;
            rdfs:label "Matteo Moretti"@it ;
            owl:sameAs <https://viaf.org/viaf/13158628035922920251/> .
            
            :il_mulino a crm:E39_Actor ;
            rdfs:label "il Mulino"@it ;
            owl:sameAs <https://www.wikidata.org/wiki/Q3148465> .
            
            :uni_cattolica a prov:Agent ;
            rdfs:label "Università Cattolica"@it ;
            owl:sameAs <http://www.wikidata.org/entity/Q229022> .
            
            :uni_trento a prov:Agent ;
            rdfs:label "Università di Trento"@it ;
            owl:sameAs <http://www.wikidata.org/entity/Q930528> .
            
            :dh_fbk a prov:Agent, org:OrganizationalUnit ;
            rdfs:label "DH@FBK"@en ;
            owl:sameAs <https://dh.fbk.eu/> .
            
            :isig a prov:Agent, org:OrganizationalUnit ;
            rdfs:label "Istituto Storico Italo-Germanico"@it ;
            owl:sameAs <https://www.wikidata.org/wiki/Q1674874> .
            
            :fbk a org:Organization ;
            skos:preflabel "Fondazione Bruno Kessler"@it ;
            owl:sameAs <https://www.wikidata.org/wiki/Q3747148> ;
            org:hasUnit :isig, :dh_fbk .
            
            
            #research project 
            
            :alcide a prov:Activity ;
            dct:title "ALCIDE (Analysis of Language and Content In a Digital Environment)"@en ;
            prov:wasAssociatedWith :maurizio_cau, :matteo_largaiolli, :sara_tonelli, :giovanni_moretti, :rachele_sprugnoli, :matteo_moretti ;
            prov:generated :alcide_corpus, :alcide_website, :alcide_platform ;
            prov:wasInformedBy :edition_digitization, :corpus_creation, :platform_creation . 
            
            #sub activities within project 
            
            :edition_digitization a crmdig:D2_Digitization_Process ;
            crmdig:L20_has_created :edition_digitized ;
            crm:P14_carried_out_by :il_mulino .
            
            :corpus_creation a crmdig:D10_Software_Execution ;
            crmdig:L2_used_as_source :edition_digitized ;
            crmdig:L11_had_output :alcide_corpus ;
            crm:P14_carried_out_by :maurizio_cau, :matteo_largaiolli, :sara_tonelli, :giovanni_moretti, :rachele_sprugnoli .
            
            :platform_creation a crmdig:D7_Digital_Machine_Event ;
            crmdig:L10_had_input :alcide_corpus ;
            crmdig:L11_had_output :alcide_platform ;
            crm:P14_carried_out_by :maurizio_cau, :matteo_largaiolli, :sara_tonelli, :giovanni_moretti, :rachele_sprugnoli, :matteo_moretti .
            
            #research outputs 
            
            :alcide_corpus a dcat:Dataset, prov:Entity, crmdig:D1_Digital_Object ;
            dct:creator :maurizio_cau, :matteo_largaiolli, :sara_tonelli, :giovanni_moretti, :rachele_sprugnoli ;
            dct:publisher :dh_fbk .
            
            :alcide_website a dcat:Catalog, prov:Entity ;
            dct:creator :isig, :dh_fbk, :matteo_moretti ;
            dct:publisher :dh_fbk .
            
            :alcide_platform a dcat:DataService, prov:Entity, crmdig:D1_Digital_Object .
          

Luoghi

prov:Location, crm:E53_Place, e dct:Location rappresentano i luoghi in cui si è svolta l'attività del progetto di ricerca o che sono coperti dai suoi risultati. Devono essere registrate le seguenti informazioni: un nome (rdfs:label), un URI che punta al suo equivalente in Geonames per agire come authority control (owl:sameAs) e la sua relazione con l'attività o gli output (prov:atLocation, crm:P7_took_place_at, dct:spatial).

  • Per le attività si dovrebbe utilizzare la sede principale dei ricercatori in base alla loro affiliazione; l'obiettivo è quello di essere rappresentativi piuttosto che assolutamente precisi sul luogo in cui si è svolto un attività.
  • Per gli output, dato che possono coprire molte località, si dovrebbe usare la località primaria o quella che offre la copertura più ampia. Quindi, se un dataset copre vari Paesi europei, si può usare l'Europa come località, oppure se una raccolta di immagini si riferisce a più città all'interno di una singola regione, si può usare la regione. Se necessario, è possibile utilizzare più località.

Esempio

Il progetto ALCIDE si è svolto a Trento, sede principale dei due laboratori di ricerca coinvolti nell'attività. Inoltre, la digitalizzazione dei testi utilizzati nell'attività è avvenuta a Bologna e il dataset (corpus) copre l'Italia. Tutti questi individui sono già stati creati nelle fasi e nei moduli precedenti e possono ora essere completati con label ed URI di Geonames.

La Figura 2 rappresenta questa fase e come ogni luogo è collegato a un evento o a un output, seguito dal suo equivalente RDF.

FIG 2. Descrizione dei luoghi coinvolti nel progetto ALCIDE.
            @prefix : <http://purl.org/knot/ontology/data/> .
            @prefix prov: <http://www.w3.org/ns/prov#> .
            @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
            @prefix crmdig: <https://projects.ics.forth.gr/isl/CRMext/CRMdig_v3.2.2.rdfs#> .
            @prefix dct: <http://purl.org/dc/terms/> .
            @prefix dcat: <http://www.w3.org/ns/dcat#> .
            @prefix crm: <http://cidoc-crm.org/cidoc-crm/7.1.2/> .
            @prefix owl: <http://www.w3.org/2002/07/owl#> .
            
            #locations
            
            :trento a prov:Location, crm:E53_Place ;
            rdfs:label "Trento"@it ;
            owl:sameAs <https://www.geonames.org/3165243> .
            
            :bologna a crm:E53_Place ;
            rdfs:label "Bologna"@it ;
            owl:sameAs <http://www.geonames.org/3181928> .
            
            :italia a dct:Location ; 
            rdfs:label "Italia"@it ;
            owl:sameAs <http://www.geonames.org/3175395> .
            
            #activities and outputs they're related to
            
            :alcide a prov:Activity ;
            prov:generated :alcide_corpus, :alcide_website ;
            prov:wasInformedBy :edition_digitization, :corpus_creation, :platform_creation ;
            prov:atLocation :trento .
            
            :edition_digitization a crmdig:D2_Digitization_Process ;
            crm:P7_took_place_at :bologna .
            
            :corpus_creation a crmdig:D10_Software_Execution ;
            crm:P7_took_place_at :trento . 
            
            :platform_creation a crmdig:D7_Digital_Machine_Event ;
            crm:P7_took_place_at :trento . 
            
            #research outputs 
            
            :alcide_corpus a dcat:Dataset, prov:Entity, crmdig:D1_Digital_Object ;
            dct:spatial :italia .
            
            :alcide_website a dcat:Catalog, prov:Entity ;
            dct:spatial :italia . 
          

Accesso agli output come dati pubblici

Il segmento dati pubblici di KNOT-DM permette anche di descrivere come accedere agli output creati da un progetto di ricerca attraverso l'uso di due classi DCAT: dcat:Distribution e dcat:DataService.

Mentre queste due classi condividono alcune somiglianze concettuali in ciò che descrivono, hanno anche alcune differenze fondamentali, che sono trattate in dettaglio nella sezione sulla struttura di KNOT-DM. Una semplice sintesi è che una distribuzione può rappresentare solo una forma scaricabile di un dataset e quindi non può esistere senza il dataset, mentre un servizio dati rappresenta tutte le altre forme di accesso al dataset ed esiste come entità concettuale propria. Inoltre, non è necessario che il servizio dati rende disponibile una distribuzione.

Servizio dati - Accesso migliorato

dcat:DataService rappresenta l'accesso a un dataset tramite un insieme di operazioni che comportano l'elaborazione e/o l'interazione con i dati, sintetizzato come "offrire modi più intelligenti e interattivi per accedere ai dati." [4] Le rappresentazioni più comuni di questa classe nel mondo reale includono un'interfaccia di ricerca, come quelle che consentono all'utente di accedere al contenuto di un database relazionale, o un'API, che offre modalità avanzate di accesso e (ri)utilizzo dei dati.

Una cosa importante da notare è che, all'interno di KNOT-DM, un servizio dati può anche rappresentare un output di un progetto. Questo perché un servizio dati può essere un oggetto digitale creato durante l'attività di ricerca.

Le seguenti informazioni devono essere registrate su un servizio dati: un titolo (dct:title), il suo URL di accesso (dcat:endpointURL), il suo tipo e/o i concetti utilizzati per classificarlo (dct:type, dcat:theme) e il dataset che serve (dcat:servesDataset).

L'informazione raccomandata da registrare, se disponibile, è una risorsa che descrive i servizi disponibili all'endpoint (dcat:endpointDescription), come ad esempio una pagina di documentazione sul sito web.

Le informazioni opzionali che possono essere registrate, se disponibili, comprendono: i dettagli del diritto di accesso, una descrizione del servizio dati (che può riutilizzare la descrizione del catalogo se il servizio è anche parte del sito web che funge da catalogo), la licenza d'uso, le parole chiave e la data di rilascio e/o di ultima modifica.

  • Si raccomanda di utilizzare i concetti di un vocabolario controllato, come TaDiRAH, per registrare i tipi di attività di ricerca che gli utenti dei servizi di dati possono intraprendere attraverso la proprietà dcat:theme.

Esempio

Come illustrato nei moduli Attività e Output, uno dei risultati principali del progetto ALCIDE è stata una piattaforma di analisi online che consente agli utenti di interrogare il corpus utilizzando vari approcci, tra cui named entity recognition, la visualizzazione della rete e le co-occorrenze. Questa piattaforma rappresenta il servizio dati e può essere descritta come tale in aggiunta alle informazioni esistenti già registrate.

Le modalità di utilizzo delle proprietà relative ai vocabolari controllati sono descritte nel modulo Relazioni.

La Figura 1 rappresenta questo passaggio seguito dal suo equivalente RDF.

FIG 1. Descrizione del data service di ALCIDE.
            @prefix : <http://purl.org/knot/ontology/data/> .
            @prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
            @prefix prov: <http://www.w3.org/ns/prov#> .
            @prefix dct: <http://purl.org/dc/terms/> .
            @prefix dcat: <http://www.w3.org/ns/dcat#> .
            @prefix crmdig: <https://projects.ics.forth.gr/isl/CRMext/CRMdig_v3.2.2.rdfs#> .
            @prefix foaf: <http://xmlns.com/foaf/0.1/> .
            @prefix tadirah: <http://tadirah.dariah.eu/vocab/> .
            @prefix kth: <http://purl.org/knot/thesaurus#> .
            @prefix crm: <http://cidoc-crm.org/cidoc-crm/7.1.2/> .
            
            :alcide_platform a dcat:DataService, prov:Entity ;
            dcat:endpointURL <https://alcidedigitale.fbk.eu/platform/> ;
            prov:value <https://alcidedigitale.fbk.eu/platform/> ;
            dct:title "ALCIDE platform"@en ;
            rdfs:label "ALCIDE platform"@en ;
            dcat:endpointDescription <https://alcidedigitale.fbk.eu/> ;
            dcat:servesDataset :alcide_corpus ;
            dct:description "La piattaforma ALCIDE consente diversi tipi di analisi automatica dei documenti: l’estrazione di concetti chiave, la ricerca testuale, il riconoscimento di nomi di persona e di luogo, la visualizzazione dei network, l’individuazione delle co-occorrenze, l’analisi della complessità sintattica e semantica dei testi. Il corpus dei documenti riprende integralmente l’edizione A. De Gasperi, Scritti e discorsi politici, I-IV, sotto la direzione scientifica di Paolo Pombeni, Bologna, il Mulino."@it , "The ALCIDE platform allows different types of automatic document analysis: extraction of key concepts, text search, recognition of names of people and places, network visualization, identification of co-occurrences, and complex analysis of the syntax and semantics of t exts. The corpus used the entire edition A. De Gasperi, Scritti e discorsi politici, I-IV, created under the scientific direction of Paolo Pombeni (Bologna, il Mulino, 2006-2009)."@en ;
            prov:wasGeneratedBy :alcide ;
            dcat:theme tadirah:spatialAnalysis, tadirah:contentAnalysis, tadirah:networkAnalysis ;
            dct:type <http://purl.org/knot/taxonomy#digital_platform> ;
            crm:P2_has_type <http://purl.org/knot/taxonomy#digital_platform> ;
            dct:issued "2018-12-31"^^xsd:date .
          

Distribuzione - Scaricare l'output

dcat:Distribution rappresenta una forma scaricabile di un dataset e, come già detto, non può esistere senza di essa. Questa classe è quindi facoltativa, in quanto alcuni dataset potrebbero non essere disponibili per il download diretto.

La cosa principale da notare nell'uso di questa classe è che ogni istanza scaricabile di un dataset richiede la propria istanza di dcat:Distribution, in quanto possono offrire diverse rappresentazioni digitali del dataset, che si tratti di parti di un insieme o di codifiche diverse.

Devono essere registrate le seguenti informazioni: un URL di accesso (dcat:accessURL) e il suo formato (dct:format).

Le informazioni raccomandate da registrare, se disponibili, includono: una descrizione e una licenza di rilascio.

Le informazioni opzionali che possono essere registrate, se disponibili, includono: diriti di accesso, un servizio dati che dà accesso alla distribuzione, la sua dimensione in byte (usando xsd:decimal), il suo formato di compressione, una pagina che la documenta, un URL per il download diretto, un linguaggio usato nella distribuzione, uno standard a cui è conforme, il suo titolo, la sua data di rilascio e/o di ultima modifica, una dichiarazione sui diritti correlati e il suo stato.

  • Per quanto riguarda la descrizione, se non è disponibile, è necessario fornire un breve riassunto in linguaggio naturale.
  • Per il titolo, se non è disponibile, il titolo del dataset può essere riutilizzato con l'aggiunta di una breve descrizione del download (ad esempio "raw text files").
  • La proprietà opzionale per una pagina di documentazione non dovrebbe duplicare l'URL di accesso, ma piuttosto indirizzare a un documento che fornisca informazioni significative su come scaricare il dataset, su come è stata creata la distribuzione e/o su come utilizzarlo.

Esempio

Sulla base delle informazioni contenute nella pagina GitHub per il corpus creato dal progetto ALCIDE, sappiamo che sono disponibili tre distribuzioni, ciascuna delle quali rappresenta un diverso formato di codifica (raw text, XML e TSV). Queste distribuzioni non sono collegate al servizio dati, sono tutte compresse in formato ZIP e sono rilasciate con licenza CC (la stessa licenza con cui è disponibile il dataset).

Nel modulo Output & Input avevamo originariamente descritto la distribuzione come un singolo individuo, ma ora possiamo espanderla per rappresentare tutti e tre.

La Figura 2 rappresenta una delle tre distribuzioni, seguito dal suo equivalente RDF con tutte e tre.

FIG 2. Descrizione di una distribuzione del corpus ALCIDE.
              @prefix : <http://purl.org/knot/ontology/data/> .
              @prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
              @prefix prov: <http://www.w3.org/ns/prov#> .
              @prefix dct: <http://purl.org/dc/terms/> .
              @prefix dcat: <http://www.w3.org/ns/dcat#> .
              @prefix crmdig: <https://projects.ics.forth.gr/isl/CRMext/CRMdig_v3.2.2.rdfs#> .
              @prefix adms: <http://www.w3.org/ns/adms#> .
              
              :corpus_distro_txt a dcat:Distribution ;
              dcat:accessURL <https://github.com/StefanoMenini/De-Gasperi-s-Corpus>;
              dct:description "Raw txt files contain only the body of the documents, and may be straightforwardly used to extract embeddings or topics."@en ;
              dcat:compressFormat <http://publications.europa.eu/resource/authority/file-type/ZIP> ;
              dct:format <http://publications.europa.eu/resource/authority/file-type/TXT> ;
              dct:license <https://w3id.org/italia/controlled-vocabulary/licences/B19_CCBYNCSA40> ;
              dcat:byteSize "9420000.0"^^xsd:decimal ;
              dcat:downloadURL <https://github.com/StefanoMenini/De-Gasperi-s-Corpus/raw/master/txt-files.zip> ; 
              dct:language <http://publications.europa.eu/resource/authority/language/ITA> ; 
              dct:conformsTo  <http://publications.europa.eu/resource/authority/file-type> ;
              dct:issued "2019-07-16"^^xsd:date ;
              adms:status <http://purl.org/adms/status/Completed> ;
              dct:title "De Gasperi's Corpus - Raw Text Files "@en .
              
              :corpus_distro_xml a dcat:Distribution ;
              dcat:accessURL <https://github.com/StefanoMenini/De-Gasperi-s-Corpus>;
              dct:description "XML files include metadata that cover not only the title, the date and the place of publication, but also key-concepts automatically extracted from each text (with the corresponding relevance score) and genre labels manually assigned by domain experts."@en ;
              dcat:compressFormat <http://publications.europa.eu/resource/authority/file-type/ZIP> ;
              dct:format <http://publications.europa.eu/resource/authority/file-type/XML> ;
              dct:license <https://w3id.org/italia/controlled-vocabulary/licences/B19_CCBYNCSA40> ;
              dcat:byteSize "10500000.0"^^xsd:decimal ;
              dcat:downloadURL <https://github.com/StefanoMenini/De-Gasperi-s-Corpus/raw/master/xml-files.zip> ; 
              dct:language <http://publications.europa.eu/resource/authority/language/ITA> ; 
              dct:conformsTo  <http://publications.europa.eu/resource/authority/file-type> ;
              dct:issued "2019-07-16"^^xsd:date ;
              adms:status <http://purl.org/adms/status/Completed> ;
              dct:title "De Gasperi's Corpus - XML Files "@en .
              
              :corpus_distro_tsv a dcat:Distribution ;
              dcat:accessURL <https://github.com/StefanoMenini/De-Gasperi-s-Corpus>;
              dct:description "The release includes silver annotation for lemma, part of speech, person names and place names with associated coordinates in a CoNLL-like format."@en ;
              dcat:compressFormat <http://publications.europa.eu/resource/authority/file-type/ZIP> ;
              dct:format <http://publications.europa.eu/resource/authority/file-type/TSV> ;
              dct:license <https://w3id.org/italia/controlled-vocabulary/licences/B19_CCBYNCSA40> ;
              dcat:byteSize "17200000.0"^^xsd:decimal ;
              dcat:downloadURL <https://github.com/StefanoMenini/De-Gasperi-s-Corpus/raw/master/conll-files.zip> ; 
              dct:language <http://publications.europa.eu/resource/authority/language/ITA> ; 
              dct:conformsTo  <http://publications.europa.eu/resource/authority/file-type> ;
              dct:issued "2019-07-16"^^xsd:date ;
              adms:status <http://purl.org/adms/status/Completed> ;
              dct:title "De Gasperi's Corpus - TSV Files "@en .
              
              :alcide_corpus a dcat:Dataset, prov:Entity, crmdig:D1_Digital_Object ;
              dcat:distribution :corpus_distro_txt, :corpus_distro_tsv, :corpus_distro_xml .
            

Le relazioni tra i quattro concetti principali utilizzati in KNOT-DM - attività, entità, agent e luogo - possono essere espresse in vari modi in tutti e tre i segmenti del modello, utilizzando proprietà connettive che in pratica mettono in relazione le istanze di questi quattro concetti principali tra loro (come ad esempio dove si è svolta un'attività o chi ha creato un oggetto).

Inoltre, alcune di queste proprietà possono essere utilizzate per creare connessioni tra questi concetti e i concetti dei vocabolari controllati e degli authority record che sono correlati a soggetti, temi o classificazioni, come ad esempio il tipo di attività di ricerca, la licenza con cui un oggetto digitale è disponibile o la persona a cui un'entità fa riferimento.

Per un elenco dei vocabolari e degli authority record utilizzati da KNOT-DM, si veda la sezione Vocabolari Controllati.

Il seguente riassunto illustra tutte le connessioni pratiche possibili all’interno di KNOT-DM:

  • Attività ↔ Entità
    • prov:generated (e il suo inverso) collega un progetto di ricerca ai risultati che ha generato, mentre prov:used lo collega a un'entità (o concetto) che ha utilizzato (come oggetti fisici o digitali, figure storiche, periodi di tempo).
    • prov:wasInfluencedBy collega un progetto di ricerca a un'entità (o concetto) che lo ha influenzato.
    • dct:subject collega un progetto di ricerca all'entità (o al concetto) che ne è l'oggetto principale.
    • crmdig:L10_had_input, crmdig:L11_had_output, crmdig:L2_used_as_source, crmdig:L1_digitized, e crmdig:L20_has_created collegano una sotto-attività all'interno di un progetto di ricerca alle entità che ha utilizzato o creato.
    • crmdig:L60_documents collega un processo di digitalizzazione all'entità che documenta.
    • crmdig:L23_used_software collega una sotto-attività all'interno di un progetto di ricerca al software utilizzato per creare un oggetto digitale.

  • Attività ↔ Attività:
    • prov:wasInformedBy collega un progetto di ricerca a una sotto-attività al suo interno o a un altro progetto di ricerca che ha generato entità che ha utilizzato.

  • Attività ↔ Concetto
    • crm:P2_has_type collega una sotto-attività a un concetto che spiega di cosa si tratta, come il tipo di attività di ricerca.
    • dct:subject collega un progetto di ricerca a un concetto (o entità) che ne è l'oggetto principale.
    • prov:used collega un progetto di ricerca a un concetto (o entità) che ha utilizzato.
    • prov:wasInfluencedBy collega un progetto di ricerca a un concetto (o entità) che lo ha influenzato.

  • Attività ↔ Luogo
    • prov:atLocation collega un progetto di ricerca al luogo geografico in cui si è svolto.
    • crm:P7_took_place_at fa lo stesso per una sotto-attività.

  • Attività ↔ Agent
    • prov:wasAssociatedWith collega un progetto di ricerca a un agent che ne ha avuto la responsabilità.
    • crm:P14_carried_out_by fa lo stesso per una sotto-attività.

  • Entità ↔ Entità
    • prov:wasDerivedFrom collega due istanze di un'entità tra loro per indicare la derivazione o la trasformazione di un'entità in un'altra.
    • dct:relation può essere usato per collegare un dataset a una risorsa correlata, mentre le sue sotto proprietà offrono varie specificità, tra cui: collegare due cataloghi di dati tra loro (dct:hasPart); collegare dataset o distribuzioni al loro standard (dct:conformsTo); collegare un'istanza di un dataset a un'altra che ne è una versione, un'edizione o un adattamento (dct:hasVersion); e collegare un dataset a una risorsa esterna che lo referenzia (dct:isReferencedBy).
    • dcat:dataset, dcat:dataservice, e dcat:distribution (sotto-proprietà di dct:hasPart) collegano tra loro istanze delle classi catalog, dataset, distribution e data service all'interno di un progetto di ricerca.
    • dcat:servesDataset collega un servizio di dati ai dataset che rende disponibili.
    • dcat:accessService collega una distribuzione a un servizio dati attraverso il quale è disponibile.
    • dcat:accessURL, dcat:downloadURL, dcat:endpointURL e dcat:endpointDescription collegano una distribuzione o un servizio dati a una risorsa che dà accesso a file o servizi.
    • dcat:record collega un catalogo a un record di metadati.
    • crm:P106_is_composed_of collega due istanze di un oggetto digitale creato da una sotto-attività per indicare una parte di associazione.
    • crm:P129_is_about collega un oggetto o una manifestazione al suo soggetto, che può essere un'entità o un concetto.
    • foaf:homepage, foaf:page, e dcat:landingPage collegano un dataset, un catalogo, una distribuzione o un servizio di dati a una pagina web che lo descrive o che è il suo principale punto di accesso.
    • adms:identifier collega un dataset a un identificatore esterno, come quelli usati dai repository istituzionali.

  • Entità ↔ Agent
    • dct:creator e dct:publisher collegano un catalogo o un dataset agli agent che lo hanno creato e/o pubblicato.

  • Entità ↔ Luogo
    • dct:spatial collega un catalogo o un dataset all'area geografica che copre.

  • Entità ↔ Concetto
    • frbroo:R7_is_materialization_of collega un oggetto fisico alla sua manifestazione.
    • crm:P129_is_about collega un oggetto fisico o una manifestazione al suo soggetto, che può essere un'entità o un concetto.
    • dct:type, dcat:theme e crm:P2_has_type collegano le entità a un concetto di un vocabolario controllato che spiega di cosa si tratta o lo classifica.
    • dcat:themeTaxonomy collega un catalogo ai vocabolari controllati utilizzati dai suoi dataset.
    • dct:license collega un dataset, un catalogo, una distribuzione o un servizio di dati alla sua licenza.
    • dct:temporal collega un dataset o un catalogo al periodo di tempo che copre.
    • dct:format e dct:compressFormat collegano una distribuzione al suo formato di file.
    • dct:language collega un dataset, distribution o un catalogo alla lingua utilizzata nei metadati o nelle valori testuali.
    • dct:frequency collega un dataset alla frequenza con cui viene aggiornato.
    • dct:rights collega un dataset, un catalogo, una distribuzione o un servizio di dati a una dichiarazione di diritti sull'uso.
    • adms:status collega una distribuzione al suo stato di completamento.

  • Agent ↔ Agent
    • prov:actedOnBehalfOf, org:hasUnit, e org:memberOf collegano un agent a un altro per indicare l'affiliazione.


References

[1] Peroni, Silvio. “Graffoo - Graphical Framework for OWL Ontologies." n.d. Essepuntato.It. Accessed July 13, 2023. https://essepuntato.it/graffoo/.
[2] “PROV-O: The PROV Ontology." n.d. Www.w3.org. Accessed July 11, 2023. https://www.w3.org/TR/prov-o/.
[3] “The FRBR Model (Functional Requirements for Bibliographic Records).” 2003. Loc.gov. 2003. https://www.loc.gov/catdir/cpso/frbreng.pdf.
[4] Albertoni, Riccardo. n.d. “Data Catalog Vocabulary (DCAT) - Version 2.” Www.w3.org. Accessed June 19, 2023. https://www.w3.org/TR/vocab-dcat-2/.

Struttura

Scopri di più sui diversi segmenti che compongono il KNOT-DM.

Vocabolari Controllati

Scopri di più sui vocabolari controllati utilizzati in KNOT-DM, compresi quelli creati appositamente per il progetto.