Skip to the content.

Encoder un texte avec Manu

Éléments généraux

Éléments pour la poésie

Éléments pour le théâtre

Éléments pour la correspondance

Éléments que l'on peut utiliser en début d'une division

Éléments que l'on peut utiliser à la fin d'une division

Éléments que l'on peut utiliser en début et à la fin d'une division

Éléments pour une page de titre

Transcrire sa source

Structuration matérielle

Difficulté de lecture

<unclear> contient un mot, une expression ou bien un passage qui ne peut être transcrit avec certitude parce qu'il est illisible ou inaudible dans la source.

Passage impossible à transcrire

<gap> indique une omission dans une transcription, soit pour des raisons éditoriales décrites dans l'en-tête TEI au cours d’un échantillonnage, soit parce que le matériau est illisible ou inaudible.

Restituer un passage

<supplied> (texte restitué) permet d'encoder du texte restitué par l'auteur de la transcription ou par l'éditeur pour une raison quelconque, le plus souvent parce que le texte du document original ne peut être lu, par suite de dommages matériels ou de lacunes.

Indiquer qu'un segment de texte est superflu

<surplus> (Texte superflu) permet d'encoder une partie de texte présente dans la source lorsque l'éditeur la considère superflue ou redondante.

Interventions du scribe

Ajouts

<add> (ajout) contient des lettres, des mots ou des phrases insérés dans le texte par un auteur, un copiste, un annotateur ou un correcteur.

Suppressions

<del> (suppression) contient une lettre, un mot ou un passage supprimé, marqué comme supprimé, sinon indiqué comme superflu ou erroné dans le texte par un auteur, un copiste, un annotateur ou un correcteur.

Combiner un ajout et une suppression sur un même segment de texte

<subst> (substitution) regroupe une ou plusieurs parties de texte supprimées et une ou plusieurs parties de texte ajoutées, lorsque cette combinaison peut être considérée comme une intervention unique sur le texte.

<subst>
  <del>upon</del>
  <add>over</add>
 </subst>

Régularisation et correction

Distinguer :

Choice

L'élément <choice> permet de représenter des phénomènes qui se produisent en simultané d'un même segment de texte, le plus souvent des états du texte connus ou supposés. Si le plus commun est de représenter deux états, il n'y a pas de limites au nombre d'éléments enfants que peut avoir <choice>. On le retrouve ainsi avec des éléments de correction ou de régularisation des graphies, dans des cas d'incertitude ou d'abréviations.

Les couples orig et reg, et sic et corr

Avant de se lancer dans la correction ou la régularisation d'un texte, il vaut mieux que les membres d'un même projet se mettent d'accord sur les définitions de ces deux concepts et qu'ils décident aussi ce qu'ils corrigent et régularisent par l'encodage et ce qui est fait de manière silencieuse dans le texte. Les éléments de correction

orig, reg, sic et corr peuvent-ils être utilisés seuls?

Ces quatre éléments peuvent être utilisés de manière indépendante. Cela arrive souvent avec <sic>, plus rarement pour les trois autres.

Exprimer la certitude

Pour exprimer son degré de certitude sur une intervention, l'encodeur peut utiliser l'attribut @cert.

Responsabilité

A l'inverse, si vous voulez signaler l'éditeur, responsable de l'intervention, vous pouvez utiliser l'attribut @resp. Néanmoins, pour utiliser cet attribut, il faut que l'éditeur soit déclaré avec un @xml:id soit dans le <teiHeader>, soit dans un fichier externe. Lorsque le pointeur est interne, la convention est de le faire précéder par #.

<choice>
<sic>gruyère</sic>
<corr cert="high" resp="#aj">bruyère</corr>
</choice>

Abréviations

Les abréviations

17
 <choice>
 <abbr>oc<hi rend="sup">bre</hi></abbr>
 <expan>octobre</expan>
 </choice>
 1822

Caractères spéciaux

Traitement des allographes

Pour traiter les allographes présents dans la fable, plusieurs solutions sont possibles: 1- Utiliser <choice> puis déclarer systématiquement le caractère

<choice>
 <reg>s</reg>
 <orig>ſ</orig>
 </choice>
<choice>
<reg>s</reg>
<orig>&#383;</orig>
</choice>

2- On peut aussi déclarer le caractère spécial dans une DTD réduite. Pour associer un encodage à un nom que l'on utilisera comme un raccourci. Cette déclaration doit se faire après la déclaration XML et les instructions de traitement, mais avant l'élément racine <TEI>.

<?xml version="1.0" encoding="UTF-8"?>
<?xml-model href="http://www.tei-c.org/release/xml/tei/custom/schema/relaxng/tei_all.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<?xml-model href="http://www.tei-c.org/release/xml/tei/custom/schema/relaxng/tei_all.rng" type="application/xml"
	schematypens="http://purl.oclc.org/dsdl/schematron"?>
<!DOCTYPE TEI [
 <!ENTITY s-long
'<choice><reg>s</reg><orig>&#383;</orig></choice>' >
]>
<TEI xmlns="http://www.tei-c.org/ns/1.0">

On peut alors mobiliser <choice><reg>s</reg><orig>&#383;</orig></choice> en utilisant le nom donné, combiné avec la syntaxe des caractères XML spéciaux, soit &s-long;.

<l n="9"><lb n="12"/>A &s-long;e défendre hardi<supplied reason="illegible">ment</supplied>.</l>

3- Enfin, il y a la solution avec <g>. Dans ce cas, la déclaration du caractère s'effectue dans le <teiHeader> sous la section <encodingDesc>.

<encodingDesc>
 <charDecl>
 <glyph xml:id="s-long">
 <glyphName>LATIN SMALL LETTER LONG S EXTENDING BELOW THE
LINE</glyphName> <!-- Nom donné au glyphe -->
 <charProp> <!-- Description de ses propriétés -->
 <localName>entity</localName>
 <value>s-long</value>
 </charProp>
 <mapping type="modern">s</mapping>
 <mapping type="simplified">&#383;</mapping>
 </glyph>
 </charDecl>
 </encodingDesc>

Pour l'utiliser, l'encodage combine l'élément avec un attribut de référence dont le pointeur vise la déclaration faite dans le <teiHeader>.

<g ref="#s-long">s</g>

NB: Nous pouvons combiner les propositions faites si dessus, soit une DDT avec l'élément <g>.

<!ENTITY s-long '<g ref="#s-long">s</g>' >

Si la TEI recommande de déclarer et préciser de nombreux choix d'encodage à l'aide d'éléments du <teiHeader>, force est de reconnaître que de nombreux projets et utilisateurs en font l'impasse. C'est pourquoi, vous retrouverez souvent l'attribut <g> sans aucune déclaration sous <charDecl> dans le <teiHeader>.


Formater un caractère ou une chaîne de caractères

<head rend="italic"><lb n="2"/>Le loup &amp; le chien.</head>

Lorsqu'une indication typographique est nécessaire, mais que vous ne disposez pas d'élément pour l'indiquer, vous pouvez faire appel à l'élément générique <hi>. C'est cet élément que nous avons utilisé dans l'exemple de l'abréviation.

<head>
  <lb n="1"/>Fable cinquiesme.
  <lb n="2"/><hi rend="italic">Le loup & le chien.</hi>
</head>

Encoder des éléments en langue étrangère

Encoder une image

Décrire les facsimilés

Les facsimilés d'une édition peuvent se déclarer dans le <teiHeader> dans l'une des sous-sections de <sourceDesc>, ou peuvent aussi se déclarer entre le <teiHeader> et le <text> à l'aide de l'élément <facsimile>.

<facsimile>
 <graphic url="LaFontaine_001.jpg"/>
 <graphic url="LaFontaine_002.jpg"/>
 <graphic url="LaFontaine_003.jpg"/>
 <graphic url="LaFontaine_004.jpg"/>
</facsimile>

Lier une partie du texte avec un facsimilé

Il est possible de lier une division et une section de texte avec le facsimilé. Pour ce faire, il suffit d'utiliser l'attribut @facs auquel on donne comme valeur soit le chemin vers l'image, soit le nom de l'image, selon les conventions établies par le projet. Dans les pratiques TEI, on retrouve souvent l'utilisation de cet attribut avec l'élément <pb/>.

<pb n="10" facs="../facsimiles/LaFontaine_002.jpg"/>

Encoder une image

Encoder une image peut se faire de plusieurs manières et avec plusieurs degrés d'information, notamment il est possible de renseigner les coordonnées de l'image sur le facsimilé, à l'aide des éléments <surface> et <zone>. Nous ne considérerons que des solutions simples dans le cadre de cette présentation.

<facsimile>
<surface ulx="50" uly="20" lrx="400"
lry="280">
<zone ulx="0" uly="0" lrx="500" lry="321">
 <graphic url="graphic.png "/>
</zone>
</surface>
</facsimile>

source: TEI Guidelines

Entités nommées

Noms et personnes

<persName> en spécifiant

Lieux

<placeName> en spécifiant

<geogName> parfois pour des noms associés à une dimension géographique, comme une rivière ou une montagne par exemple.