Skip to the content.

Encoder l'en-tête d'un fichier TEI avec Manu

Les métadonnées sont toutes les informations qui décrivent le fichier et qui permettent ainsi de l'identifier de manière pérenne. Le <teiHeader> regroupe plusieurs informations de nature différente:

L'une des grandes difficultés du <teiHeader> est de discerner les éléments qui relèvent de la source et les éléments qui documentent le fichier électronique lui-même, et de trouver l'équilibre entre la prose pour l'exploitation humaine et la structuration pour l'exploitation par la machine.


NB : La dénomination des éléments peut vous donner des informations sur leur usage et/ou leur contenu .
Parmi les 3 suffixes présents dans le teiHeader:


fileDesc

Élément obligatoire, le <fileDesc> contient la notice bibliographique complète du fichier électronique. Son modèle copie les standards établis pour le catalogage.

titleStmt

Le <titleStmt> regroupe les informations relatives au titre et l'ensemble des personnes ou institutions impliquées dans la production du fichier.

<titleStmt>
            <title type="main" xml:lang="san-Latn">Naimittikakriyānusandhāna</title>
            <title type="main">Exposition of Occasional Rites</title>
            <title type="sub" subtype="editorial">Digital Critical Edition and Translation of a Śaiva Ritual Manual</title>
 </titleStmt>

Les rôles de chacun peuvent être indiqués de manière générale en utilisant les éléments <respStmt> et <resp>, ou bien en mobilisant des éléments plus précis. Il n'y a pas de limites à la mention de responsabilité, mais il est recommandé de citer au moins l'auteur de l'œuvre, lorsqu'il est connu, et le créateur du fichier.

<titleStmt>
				<title>Tiruppattūr stela 1</title>
				<respStmt>
					<resp>EpiDoc encoding</resp>
					<persName ref="part:emfr">
						<forename>Emmanuel</forename>
						<surname>Francis</surname>
					</persName>
					<persName ref="part:vagi">
						<forename>Valérie</forename>
						<surname>Gillet</surname>
					</persName>
				</respStmt>
				<respStmt>
					<resp>intellectual authorship of edition</resp>
					<persName ref="part:emfr">
						<forename>Emmanuel</forename>
						<surname>Francis</surname>
					</persName>
					<persName ref="part:vagi">
						<forename>Valérie</forename>
						<surname>Gillet</surname>
					</persName>
				</respStmt>
			</titleStmt>
<titleStmt>
				<title type="main" xml:lang="kaw-Latn">R̥ṣiśāsana</title>
				<title type="main">Ordinance for the Sages</title>
				<title type="sub">Digital Critical Edition and Translation of an Old Javanese Legal text</title>
				<editor ref="part:masc">
					<forename>Marine</forename>
					<surname>Schoettel</surname>
				</editor>
				<respStmt>
					<resp>EpiDoc encoding</resp>
					<persName ref="part:masc">
						<forename>Marine</forename>
						<surname>Schoettel</surname>
					</persName>
				</respStmt>
			</titleStmt>

editionStmt

<editionStmt> regroupe les informations relatives à l’édition d’un texte, ses changements ou ses révisions par exemple. Il est optionnel, mais est recommandé par la TEI.

<editionStmt>
 <edition n="P2">Second draft, substantially
   extended, revised, and corrected.</edition>
</editionStmt>
<editionStmt>
 <edition>Student's edition, <date>June 1987</date>
 </edition>
 <respStmt>
  <resp>New annotations by</resp>
  <name>George Brown</name>
 </respStmt>
</editionStmt>

source: TEI Guidelines

extent

<extent> décrit la taille approximative d’un texte stocké sur son support, numérique ou non numérique, exprimé dans une unité quelconque appropriée. L'encodage de ces données est tout à fait optionnel.

<extent>between 1 and
 2 Mb</extent>
<extent>4.2 MiB</extent>
<extent>4532 bytes</extent>
<extent>3200 sentences</extent>
<extent>Five 90 mm High Density Diskettes</extent>

source: TEI Guidelines
Il est possible de structurer davantage le contenu de l'élément <extent>, mais ce n'est pas une pratique mobilisée par beaucoup de projets.

publicationStmt

Cette section regroupe des informations concernant la publication ou la diffusion d’un texte électronique. Bien que non imposé par le schéma, un document conforme à la TEI doit donner des informations sur le lieu de publication, l'adresse, l'identifiant, les droits de diffusion et la date, et dans cet ordre, après le nom de l'éditeur, du distributeur ou de l'autorité concernée.

<publicationStmt>
            <authority>DHARMA</authority>
            <pubPlace>Lyon (France) and Lexington, VA (USA)</pubPlace>
            <idno type="filename">DHARMA_CritEdSvayambhu</idno>
            <availability>
               <licence target="https://creativecommons.org/licenses/by/4.0/">
                  <p>This work is licenced under the Creative Commons Attribution 4.0 Unported Licence. To view a copy of the licence, visit https://creativecommons.org/licenses/by/4.0/ or send a letter to Creative Commons, 444 Castro Street, Suite 900, Mountain View, California, 94041, USA.</p>
                  <p>Copyright © 2019-2025 by Arlo Griffiths and Tim Lubin.</p>
               </licence>
            </availability>
            <date from="2019" to="2025">2019-2025</date>
 </publicationStmt>

serieStmt

<seriesStmt> regroupe toute information relative à la collection à laquelle appartient une publication. C'est un élément que l'on retrouve assez souvent en prose, plutôt que sous une forme structurée.

notesStmt

<notesStmt> rassemble toutes les notes fournissant des informations sur un texte, en plus des informations mentionnées dans d'autres parties de la description bibliographique. Il se structure par un ou plusieurs éléments <note>, chaque note correspondant à un unique sujet. On utilise cet élément, le plus souvent, lorsque l'on ne sait pas où mettre l'information.

sourceDesc

Partie obligatoire du <teiHeader>, <sourceDesc> décrit la source à partir de laquelle un texte électronique a été dérivé ou produit. On peut y trouver une description bibliographique pour un texte numérisé, une liste des témoins dans le cadre d'une édition critique de plusieurs manuscrits et ainsi de suite.

Pour être valide, le <sourceDesc> doit contenir l'un des éléments suivants:

<bibl>, <biblStruct>, et <biblFull> partagent des éléments enfants

Exemple avec une gradation d'un niveau de structuration de la donnée.

<sourceDesc>
<p>The Wild Ass​’s Skin by Honoré de Balzac. London : Dent, 1906. xv, 288 p. Translated by Ellen Marriage ; preface by George Saintsbury.</p>
</sourceDesc>
<sourceDesc>
<bibl>The Wild Ass​’s Skin by Honoré de Balzac. London : Dent, 1906. xv, 288 p. Translated by Ellen Marriage ; preface by George Saintsbury.</bibl>
</sourceDesc>
<sourceDesc>
<bibl><title>The Wild Ass​’s Skin</title> by <author>Honoré de Balzac</author>. <pubPlace>London</pubPlace> : <publisher>Dent</publisher>, <date when="1906">1906</date>. <extent>xv</extent>, <extent>288 p.</extent> Translated by <editor role="translator">Ellen Marriage</editor> ; preface by <editor role="preface">George Saintsbury</editor>.</bibl>
</sourceDesc>
<sourceDesc>
<biblStruct>
<monogr>
<title>The Wild Ass​’s Skin</title>
<author>Honoré de Balzac</author>
<editor role="translator">Ellen Marriage</editor>
<editor role="preface">George Saintsbury</editor>
<imprint>
<pubPlace>London</pubPlace>
<publisher>Dent</publisher>
<date when="1906">1906</date>
</imprint>
<extent>xv</extent>
<extent>288 p.</extent>
</monogr>
</biblStruct>
</sourceDesc>

Source: TEI by examples

Un exemple avec une liste de trois témoins, dont l'un est développé, pour une édition critique:

<sourceDesc>
            <listWit>
               <witness xml:id="A1">
                  <abbr type="siglum">A<hi rend="superscript">1</hi></abbr>
                  <msDesc>
                     <msIdentifier>
                        <settlement>Leiden</settlement>
                        <institution>Leiden University</institution>
                        <repository>Leiden University Libraries</repository>
                        <location>Special Collections</location>
                        <idno>Or. 23732</idno>
                     </msIdentifier>
                     <msContents>
                        <msItem>   
                           <author>Śāntarakṣita</author>   
                           <title>Vipañcitārthā</title>
<colophon xml:lang="san-Latn">samvata Ācū2 śrāvaṇa-kr̥ṣṇa-Ekādaśyāṁ likhitaṁ
mayā| rājādhirāja-parameśvara-parama-bhaṭṭārakaḥ śrīmad-ānandade
vapādīya-vijaya-rājye śubha-dine</colophon>
                        </msItem>
                        <summary><!-- summary of the witness’s contents --></summary>
                     </msContents>
                     <physDesc>  
                        <objectDesc>  
                           <p>Palm-leaf manuscript. 89 leaves in Siddhamātr̥kā script.</p>
                        </objectDesc>
 <handDesc>
<handNote xml:id= "A1_H1" scriptRef="class:38774 maturity:83213">
		<abbr type="hand">A<hi rend="superscript">1</hi>H<hi rend="subscript">1</hi></abbr>
			<p>main hand of the manuscript, black ink</p>
                             </handNote>
                         </handDesc>
                     </physDesc>
                     <history>
                        <p>The manuscript was apparently written in <origDate when="1152">1152 CE</origDate> and found, in June 1934, by Rāhula Sāṅkr̥tyāyana in the monastery of Kun-de-ling (Lhasa).</p>
                     </history>
                  </msDesc>
               </witness>
               <witness xml:id="A2">...</witness>
               <witness xml:id="B">...</witness>
            </listWit>
         </sourceDesc>

Cas particulier: un dérivé d'un fichier numérique

Lorsque l'on réutilise un fichier numérique, la TEI recommande de copier-coller les informations du <fileDesc> du fichier d'origine, dans le <sourceDesc> à l'aide d'un élément <biblFull>.

<sourceDesc>
 <biblFull>
 <!-- Copie complète du fileDesc du
fichier d'origine -->
 <titleStmt>
 <title/>
 <!-- [...] -->
 </titleStmt>
 <!-- [...] -->
 </biblFull>
 </sourceDesc>
<sourceDesc>
<biblFull>
		<titleStmt>
						<title>Stela from Glai Klaong Anâk</title>
						<editor>Arlo Griffiths</editor>
						<editor>Amandine Lepoutre</editor>
						<editor>William Southworth</editor>
					</titleStmt>
					<editionStmt>
						<p>First digital edition made by École française d'Extrême-Orient (EFEO), realized in collaboration with the Institute for the Study of the Ancient World (ISAW) at New York University as <ref target="https://isaw.nyu.edu/publications/inscriptions/campa/index.html">The Corpus of the Inscriptions of Campā, in 2010-2012.</ref>
						</p>
					</editionStmt>
					<publicationStmt>
						<authority>École française d'Extrême-Orient (EFEO)</authority>
						<idno type="filename">CIC019</idno>
						<availability>
							<licence target="http://creativecommons.org/licenses/by/3.0/">
								<p>Copyright (c) 2012 by Arlo Griffiths, Amandine Lepoutre &amp; William Southworth.</p>
								<p>This work is licensed under the Creative Commons Attribution 3.0 Unported License. To view a copy of this license, visit http://creativecommons.org/licenses/by/3.0/ or send a letter to Creative Commons, 444 Castro Street, Suite 900, Mountain View, California, 94041, USA.</p>
							</licence>
						</availability>
					</publicationStmt>
				</biblFull>
   <msDesc>[...]</msDesc>
</sourceDesc>

encodingDesc

Il explicite la relation entre la version électronique du texte et la ou les sources. Il permet de clarifier des choix éditoriaux, de transcription, de sélection du texte, etc. Il donne aussi des éléments plus techniques déclarant des styles pour le rendu, des pointeurs vers des ressources extérieures, des catégories et des vocabulaires utilisés par votre projet. C'est une partie le plus souvent commune à tous les fichiers. Vous y trouverez souvent le système de XInclude mobilisé ici, pour toute la section ou en partie.

Parmi les éléments enfants de cette section du teiHeader, les plus utiles pour des chercheurs sont:

<editorialDecl>
<normalization>
    <p>Original spelling and typography is retained, except that long s and ligatured
        forms are not encoded.</p>
</normalization>
<interpretation>
<p>The asterisk * is used to flag lemmata or forms of lemmata not recorded in the <title>Old Javanese-English Dictionary</title>.</p>
</interpretation>
</editorialDecl>

Un exemple avec XInclude

<encodingDesc>
   <projectDesc>
      <p>This project DHARMA has received funding from the European Research Council (ERC)
                  under the European Union's Horizon 2020 research and innovation programme (grant
                  agreement no 809994).</p>
   </projectDesc>
   <schemaRef type="guide"
              key="EGDv01"
              url="https://halshs.archives-ouvertes.fr/halshs-02888186"/>
   <listPrefixDef>
      <prefixDef ident="bib"
                 matchPattern="([a-zA-Z0-9\-\_]+)"
                 replacementPattern="https://www.zotero.org/groups/1633743/erc-dharma/items/tag/$1">
         <p>Public URIs with the prefix bib to point to a Zotero Group Library named
                      ERC-DHARMA whose data are open to the public.</p>
      </prefixDef>
      <prefixDef ident="part"
                 matchPattern="([a-z]+)"
                 replacementPattern="https://raw.githubusercontent.com/erc-dharma/project-documentation/master/DHARMA_IdListMembers_v01.xml#$1">
         <p>Internal URIs using the part prefix to point to person elements in the
                      <ref>DHARMA_IdListMembers_v01.xml</ref> file.</p>
      </prefixDef>
   </listPrefixDef>
</encodingDesc>

ou en utilisant un XInclude pour éviter de répéter le code pour les préfixes dans chaque fichier.

<encodingDesc>
   <projectDesc>
      <p>This project DHARMA has received funding from the European Research Council (ERC)
                  under the European Union's Horizon 2020 research and innovation programme (grant
                  agreement no 809994).</p>
   </projectDesc>
   <schemaRef type="guide"
              key="EGDv01"
              url="https://halshs.archives-ouvertes.fr/halshs-02888186"/>
<xi:include xmlns:xi="http://www.w3.org/2001/XInclude" href="(chemin_vers_le_fichier)prefixDef.xml">
            <xi:fallback>
               <p>Definitions of prefixes used.</p>
            </xi:fallback>
         </xi:include>
</encodingDesc>

ce qui suppose un autre fichier, que nous avons appelé prefixDef.xml, pour contenir l'information qui sera importée par le processeur XML lors du traitement du fichier.

<?xml version="1.0" encoding="UTF-8"?>
<listPrefixDef xmlns="http://www.tei-c.org/ns/1.0">
<prefixDef ident="bib"
           matchPattern="([a-zA-Z0-9\-\_]+)"
           replacementPattern="https://www.zotero.org/groups/1633743/erc-dharma/items/tag/$1">
   <p>Public URIs with the prefix bib to point to a Zotero Group Library named
                ERC-DHARMA whose data are open to the public.</p>
</prefixDef>
<prefixDef ident="part"
           matchPattern="([a-z]+)"
           replacementPattern="https://raw.githubusercontent.com/erc-dharma/project-documentation/master/DHARMA_IdListMembers_v01.xml#$1">
   <p>Internal URIs using the part prefix to point to person elements in the
                <ref>DHARMA_IdListMembers_v01.xml</ref> file.</p>
</prefixDef>
</listPrefixDef>

profilDesc

Il contient des éléments non bibliographiques sur le texte. Il peut contenir un résumé du texte, des informations sur les circonstances de création du fichier, la langue et ses variantes, une liste de mots-clés, etc. Il offre quelques possibilités, mais la plus courante est la déclaration des langues avec les éléments <langUsage> et <language>.

<profileDesc>
    <langUsage>
      <language ident="san-Latn">Sanskrit, romanized</language>
      <language ident="kaw-Latn">Old Javanese, romanized</language>
    </langUsage>
  </profileDesc>

revisionDesc

Présente une succession d'éléments <change>, par ordre antéchronologique, qui documentent les différentes interventions faites dans les fichiers, et qui peuvent être groupés par <list> ou par <listChange>. Il est souvent mobilisé avec les attributs @who et @when, ou les éléments <name> et <date>.

<revisionDesc>
   <change who="part:axja" when="2021-06-30">Beta version 4: adding facsimile for Chloe's encoding</change>
   <change who="part:axja" when="2021-06-02">Beta version 4 : starting adding elements to handle the resolution for ids linked to thesaurus concepts</change>
   <change who="part:axja" when="2020-10-12">Version 3.2 : movinng the xml:lang to the root</change>
   <change who="part:axja" when="2020-07-02">Version 3.1: adding the encodingDesc and linking the template with the DHARMA Schema</change>
   <change who="part:axja" when="2020-03-18">Version 2: addition of handDesc and summary</change>
   <change who="part:axja" when="2019-12-18">Creation of the
      template</change>
</revisionDesc>