Modèles de données

 

Un container : METS

Nous avons opté pour l'utilisation du schema METS (Metadata Encoding & Transmission Standard). Ce schema développé à l'initiative de la Bibliothèque du Congrès vise à représenter non pas l'objet numérique lui-même mais les métadonnées qui sont nécessaires à sa représentation, sa manipulation et sa transmission. METS est utilisé comme un container dans lequel sont référencées et organisées les métadonnées et les données elles-mêmes. Nous utilisons ce modèle à trois niveaux différents : pour représenter une collection (ensemble de fascicules), un fascicule (ensemble hiérarchisé de documents) et les documents eux-mêmes qui peuvent être considérés comme une suite de pages indépendantes ou un document complet.

Au sein de ce container, 4 éléments fondamentaux sont utilisés par Persée :

  • l'en-tête <metsHeader> qui permet de qualifier le document METS lui-même (date de création, etc) ;
  • les metadonnées descriptives <dmdSec> qui rassemble les différents groupes de métadonnées sous différents formats ;
  • la liste des ressources <fileGroup> (références aux fichiers ou URL) où sont stockées les données ;
  • la structure <structMap> qui permet d'associer et/ou de hiérarchiser les ressources.

Des profils ont été définis pour l'utilisation du METS à chacun des trois niveaux d'information. Ils sont disponibles en ligne aux URL suivantes : [à mettre à jour]

 

Des modèles pour chaque type de données

Granularité Nature des données Modèle(s) Remarques
Collection

Container

 

METS Agrégation de séries et de fascicules
Métadonnées Dublin Core
MarcXml
MODS
 
Numéro de revue /
Ouvrage
Container METS Agrégation de documents
Métadonnées Dublin Core
MarcXml
MODS
 
Contenu TeiCorpus Uniquement lorsqu'il s'agit d'un volume thématique
Document Container METS

Agrégation
- de documents struturés (en plein texte)
- de pages en mode image et texte

Métadonnées Dublin Core
MarcXml
MODS
 
Contenu
- Suite de pages
PNG
TXT
SVG
 
Contenu
- Document XML
TEI
Erudit-article
 

 

Pour en savoir plus à propos de ces modèles...

METS (Metadata Encoding & Transmission Standard)
http://www.loc.gov/standards/mets/

DC (Dublin Core Metadata Initiative)
http://dublincore.org/
MODS (Metadata Object Description Schema)
http://www.loc.gov/standards/mods/
MarcXml : http://www.loc.gov/standards/marcxml/
TEI (Text Encoding Inititive)
http://www.tei-c.org/
Erudit
http://www.erudit.org/