Subsections

Baseline elements of TEI P5

The baseline encoding comprises elements of the modules core and dictionaries. The elements of the module header and textstructure, which are necessary for a valid TEI document are desciribed in a separate documentation.


XML elements

Table [*] shows the XML elements the module core, which are included in the baseline encoding. The marker optional refers to elements, which are used only if demanded by the structures of the dictionary entry. If an entry contains an example, for instance, the appropriate tags <cit> and <q> have to be used. If not, they are omitted.

Table: elements of the baseline encoding (modul core)

               
Element Function Status            
                 
<cit> examples or citations, containinig the headword optional            
<quote> quotation optional            
<bibl> bibliographic citation optional            
<author> author(s) optional            
<title> source optional            
<q> example optional            
<note> note optional            
<ref> reference optional            


Table [*] shows those XML elements of the module dictionaries, which are included in the baseline encoding. Again, the marker optional refers to elements, which are used only if demanded by the structures of the dictionary entry. If an entry contains a definition, for example, the appropriate tag <def> has to be used. If not, it is omitted.

Table: elements of the baseline encoding (modul dictionaries)

               
Element Function Status            
                 
<entry> contains a well-structured dictionary entry required            
<form> groups all the information on the written and spoken forms of one headword required            
<sense> groups together all information relating to one word sense in a dictionary entry, for example definitions, examples, translation equivalents, etymology ... required            
<gramGrp> groups morpho-syntactic information about a lexical item, groups the elements <pos>, <gen> and <subc> required            
<pos> indicates the part of speech required            
<subc> contains subcategorization information (``transitiv'' / ``intransitiv'') optional            
<gen> identifies the morphological gender optional            
<def> contains definition text in a dictionary entry optional            
<etym> encloses etymological information optional            
<usg> contains usage information optional            
<re> contains a dictionary entry for a lexical item related to the headword, such as a compound phrase or derived form, embedded inside a larger entry optional            
<superEntry> groups successive entries for a set of homographs optional            
<xr> cross-reference phrase: contains a phrase, sentence, or icon referring the reader to some other location in this or another text optional            

The elements <entry>, <form> and <sense> are necessary prerequisites for search enquiries and thus represent the obligatory components of the baseline encoding. The element <form> groups all the information on the lemma, the element <sense> all information relating to the word sense. This applies also to entries, which consist of headword and reference. The reference is encoded by the tag <xr> within <sense>.2

The element <usg> may appear within the element <entry>, on the same level as and followed by <form> and <sense>, in order to encode certain usage aspects of the lemma, which refer to the entire entry (see the encoded examples to ``Der Aar'', figure [*]).

Within <form> the headword is encoded by <form> and grammatical information by <gramGrp>. Within <gramGrp> the elements <pos>, <gen> and <subc> specify the type of grammatical information.
Within <sense>, larger units of sense information are encoded in <sense>. If there is additional grammatical information, this can be encoded by <form> within <sense>. More differentiated units are encoded by the tags <def>, <usg>, <etym>, <xr>, <re> and <cit>. Within <xr>, the reference is encoded by <ref>. The tags <q>, <quote> and <bibl> represent the subelements of <cit>, whereat <q> tags examples, <quote> quotations. The element <bibl> contains bibliographic citation of which <author> tags the author and <title> the source.


XML-Attribute

Table [*] lists mandatory attributes for elements. The elements <entry> and <superEntry> have to be identified by an xml:id. The value of this attribute has to be unique within a global context, for example in an XML file or an EXIST database. The attribute xml:id ensures that the electronic text can be cited.

Table: XML-Attributes of elements in the baseline encoding

               
Attribute Function Element            
                 
xml:id identification of elements <entry>            
xml:id identification of elements <superEntry>            
type identification of the lemma or headword <form>            
type usage type <usg>            
n numbering or grouping <sense>            
n referencing of the author (if possible) <author>            
n referencing of the source (if possible) <title>            

Within <form>-elements, the type attribute defines the complete lemma (including all forms of the headword) by the use of the value lemma and the headword by the use of the value headword.

Diasystematic information of the headword is encoded with the tag <usg>, its type attribute specifies the type of restriction, e.g. regional, temporal or stylistic use.

Within <sense> elements the attribute n differentiates the single meanings of a headword, within <author> n references an xml:id.

Examples

Figure: Dictionary entry ``Der Aar''
Image aar

Dictionary entry ``Der Aar'' in project encoding


<?xml version="1.0" encoding="UTF-8"?>
<?oxygen RNGSchema="../dictionary_schemas/campe_dictionary.rnc" type="compact"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xml:lang="de">
   <teiHeader>
      <fileDesc>
         <titleStmt>
            <title>Joachim Heinrich Campe, Wörterbuch der Deutschen Sprache, Band 1 mit TEI-Auszeichnung</title>
            <author>Kompetenzzentrum für EDV-Philologie, Universität Würzburg</author>
         </titleStmt>
         <publicationStmt>
            <availability>
               <p>für die Kodierungs- und Korrekturphase</p>
               <!-- die Festlegung der Nutzungslizenz erfolgt später -->
            </availability>
            <authority>Kompetenzzentrum für EDV-Philologie, Universität Würzburg</authority>
         </publicationStmt>
         <sourceDesc>
            <biblStruct xml:lang="de" type="dictionary">
               <monogr>
                  <author>Joachim Heinrich Campe</author>
                  <title>Wörterbuch der Deutschen Sprache</title>
                  <title type="sub">Veranstaltet und herausgegeben von Joachim Heinrich Campe. Erster Theil. A - bis - E. </title>
                  <imprint>
                     <pubPlace>Braunschweig</pubPlace>
                     <publisher>In der Schulbuchhandlung.</publisher>
                     <date when="1807">1807</date>
                  </imprint>
               </monogr>
            </biblStruct>
         </sourceDesc>
      </fileDesc>
      <encodingDesc>
         <editorialDecl>
            <normalization>
               <p>Formaterfassung der Lemmazeile: die Lemmazeile (Stichwort ggf. mit Artikel und grammatischen Angaben) ist ausnahmslos in einem ca. 0,5 Punkt größeren Schriftfont gesetzt; dies wird nur hier notiert. Der negative Einzug (Linksausrückung) wird nicht kodiert. </p>
               <p>Typographische Besonderheiten: Alle übrigen typographischen Veränderungen sind mit dem Element "hi" kodiert.</p>
            </normalization>
         </editorialDecl>
      </encodingDesc>
      <revisionDesc>
         <change who="#CG">20081007 automatisch generiert</change>
      </revisionDesc>
   </teiHeader>
    <text>
        <body>
            <div>                
                <entry xml:id="cwds1_00045_aar">
				<lb n="0002.035"/>
                    <usg type="time">
                        <g>*</g>
                    </usg>
                    <form>
                        <form type="lemma">
                            <gramGrp>
                                <pos value="noun"/>
                                <gen value="m"/>
                            </gramGrp>
                            <form type="determiner">
                                <orth>Der</orth>
                            </form>
                            <form type="headword" norm="aar">
                                <orth>Aar</orth>
                            </form>
                        </form>
                        <c>,</c>
                        <form type="inflected">
                            <gramGrp>
                                <case value="genitive"/>
                                <number value="singular"/>
                            </gramGrp>
                            <form type="determiner">
                                <orth>des</orth>
                            </form>
                            <form type="headword">
                                <orth>
                                    <oVar>
                                        <oRef/> - es </oVar>
                                </orth>
                            </form>
                            <c>,</c> oder <form type="headword">
                                <orth>
                                    <oVar>
                                        <oRef/> - en </oVar>
                                </orth>
                            </form>
                        </form>
                        <c>,</c>
                        <form type="inflected">
                            <gramGrp>
                                <case value="nominative"/>
                                <number value="plural">
                                    <abbr>Mz.</abbr>
                                </number>
                            </gramGrp>
                            <form type="determiner">
                                <orth>die</orth>
                            </form>
                            <form type="headword">
                                <orth>
                                    <oVar>
                                        <oRef/> - e </oVar>
                                </orth>
                            </form>
                            <c>,</c> oder <form type="headword">
                                <orth>
                                    <oVar>
                                        <oRef/> - en </oVar>
                                </orth>
                            </form>
                        </form>
                        <c>,</c>
                    </form>
                    <sense>
                        <def> die alte <lb n="0002.036"/> Benennung aller großer Raubvögel <c>,</c>
                            besonders aber des Adlers <c>,</c></def> die <lb n="0002.037"/> noch
                            <usg type="geo"> in <abbr>N. D.</abbr>
                        </usg> üblich ist und <usg type="style">bei Dichtern</usg> vorkömmt <c>.</c>
                        <lb n="0002.038"/>
                        <cit rend="indented">
                            <cit type="quote">
                                <quote> Ein kühner <hi rend="large">Aar</hi> theilt mit gewalt'gen
                                    Schwingen <lb n="0002.039"/> Die Lüfte <c>,</c>
                                    <c>-</c>
                                    <c>-</c>
                                    <c>-</c>
                                    <c>-</c>
                                    <c>-</c></quote>
                                <bibl>
                                    <author n="#Schreiber">
                                        <hi rend="spaced">Schreiber</hi>
                                    </author>
                                    <c>.</c>
                                </bibl>
                            </cit>
                            <lb n="0002.040"/>
                            <cit type="quote">
                                <quote>Bald werdet ihr im Meer der Haien <c>,</c> am Gestade <lb
                                        n="0002.041"/> Der <hi rend="large">Aaren</hi> Beute sein
                                        <c>.</c>
                                    <c>-</c></quote>
                                <bibl>
                                    <author n="#Ramler">
                                        <hi rend="spaced">Ramler</hi>
                                    </author>
                                    <c>.</c>
                                </bibl>
                            </cit>
                        </cit>
                    </sense>
                </entry>
            </div>
        </body>
    </text>
</TEI>

Dictionary entry ``Der Aar'' in baseline encoding


<?xml version="1.0" encoding="UTF-8"?>
<?oxygen RNGSchema="../coreencoding_dictionaries.rnc" type="compact"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xml:lang="de">
   <teiHeader>
      <fileDesc>
         <titleStmt>
            <title>Joachim Heinrich Campe, Wörterbuch der Deutschen Sprache, Band 1 mit
               TEI-Auszeichnung</title>
            <author>Kompetenzzentrum für EDV-Philologie, Universität Würzburg</author>
         </titleStmt>
         <publicationStmt>
            <availability>
               <p>für die Kodierungs- und Korrekturphase</p>
               <!-- die Festlegung der Nutzungslizenz erfolgt später -->
            </availability>
            <authority>Kompetenzzentrum für EDV-Philologie, Universität Würzburg</authority>
         </publicationStmt>
         <sourceDesc>
            <biblStruct xml:lang="de" type="dictionary">
               <monogr>
                  <author>Joachim Heinrich Campe</author>
                  <title>Wörterbuch der Deutschen Sprache</title>
                  <title type="sub">Veranstaltet und herausgegeben von Joachim Heinrich Campe.
                     Erster Theil. A - bis - E. </title>
                  <imprint>
                     <pubPlace>Braunschweig</pubPlace>
                     <publisher>In der Schulbuchhandlung.</publisher>
                     <date when="1807">1807</date>
                  </imprint>
               </monogr>
            </biblStruct>
         </sourceDesc>
      </fileDesc>
      <encodingDesc>
         <editorialDecl>
            <normalization>
               <p>Formaterfassung der Lemmazeile: die Lemmazeile (Stichwort ggf. mit Artikel und
                  grammatischen Angaben) ist ausnahmslos in einem ca. 0,5 Punkt größeren Schriftfont
                  gesetzt; dies wird nur hier notiert. Der negative Einzug (Linksausrückung) wird
                  nicht kodiert. </p> 
            </normalization>
         </editorialDecl>
      </encodingDesc>
      <revisionDesc>
         <change who="#MB">20080430 Textkontrolle</change>
      </revisionDesc>
   </teiHeader>
   <text>
      <body>
         <div>            
            <entry xml:id="cwds1_000045_Aar">
			<lb/>
               <usg type="time">*</usg>
               <form type="lemma">
                  <gramGrp>
                     <pos value="noun"/>
                     <gen value="m"/>
                  </gramGrp> Der <form type="headword">Aar</form>, des -es, oder -en, Mz. die -e,
                  oder -en,</form>
               <sense>
                  <def>die alte<lb/>Benennung aller großer Raubvögel, besonders aber des
                  Adlers,</def> die<lb/>noch <usg type="geo">in N. D.</usg> üblich ist und <usg
                     type="style">bei Dichtern</usg> vorkömmt.<lb/>
                  <cit type="example">
                     <cit type="verse">
                        <quote>Ein kühner Aar theilt mit gewalt'gen Schwingen<lb/>Die Lüfte, - - - -
                           -</quote>
                        <bibl>
                           <author n="#Schreiber">Schreiber.</author>
                        </bibl>
                     </cit>
                     <lb/>
                     <cit type="verse">
                        <quote>Bald werdet ihr im Meer der Haien, am Gestade<lb/>Der Aaren Beute
                           sein. -</quote>
                        <bibl>
                           <author n="#Ramler">Ramler.</author>
                        </bibl>
                     </cit>
                  </cit>
               </sense>
            </entry>
         </div>
      </body>
   </text>
</TEI>

Figure: Dictionary entry ``Abändern''
Image abaendern

Dictionary entry ``Abändern'' in project encoding


<?xml version="1.0" encoding="UTF-8"?>
<?oxygen RNGSchema="../dictionary_schemas/campe_dictionary.rnc" type="compact"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xml:lang="de">
    <teiHeader>
        <fileDesc>
            <titleStmt>
                <title>Joachim Heinrich Campe, Wörterbuch der Deutschen Sprache, Band 1 mit TEI-Auszeichnung</title>
                <author>Kompetenzzentrum für EDV-Philologie, Universität Würzburg</author>
            </titleStmt>
            <publicationStmt>
                <availability>
                    <p>für die Kodierungs- und Korrekturphase</p>
                    <!-- die Festlegung der Nutzungslizenz erfolgt später -->
                </availability>
                <authority>Kompetenzzentrum für EDV-Philologie, Universität Würzburg</authority>
            </publicationStmt>
            <sourceDesc>
                <biblStruct xml:lang="de" type="dictionary">
                    <monogr>
                        <author>Joachim Heinrich Campe</author>
                        <title>Wörterbuch der Deutschen Sprache</title>
                        <title type="sub">Veranstaltet und herausgegeben von Joachim Heinrich Campe. Erster Theil. A - bis - E. </title>
                        <imprint>
                            <pubPlace>Braunschweig</pubPlace>
                            <publisher>In der Schulbuchhandlung.</publisher>
                            <date when="1807">1807</date>
                        </imprint>
                    </monogr>
                </biblStruct>
            </sourceDesc>
        </fileDesc>
        <encodingDesc>
            <editorialDecl>
                <normalization>
                    <p>Formaterfassung der Lemmazeile: die Lemmazeile (Stichwort ggf. mit Artikel und grammatischen Angaben) ist ausnahmslos in einem ca. 0,5 Punkt größeren Schriftfont gesetzt; dies wird nur hier notiert. Der negative Einzug (Linksausrückung) wird nicht kodiert. </p>
                    <p>Typographische Besonderheiten: Alle Übrigen typographischen Veränderungen sind mit dem Element "hi" kodiert.</p>
                </normalization>
            </editorialDecl>
        </encodingDesc>
        <revisionDesc>
            <change who="#CG">20081007 automatisch generiert</change>
        </revisionDesc>
    </teiHeader>
    <text>
        <body>
            <div>
                <entry xml:id="cwds1_00081_abaendern">
				 <lb n="0003.066"/>
                    <form>
                        <form type="lemma">
                            <form type="headword" norm="abändern">
                                <orth>Abändern</orth>
                            </form>
                            <c>,</c>
                            <gramGrp>
                                <pos value="verb">
                                    <hi rend="roman">
                                        <abbr>v.</abbr>
                                    </hi>
                                </pos>
                            </gramGrp>
                        </form>
                    </form>
                    <sense>
                        <sense n="1">
                            <lbl type="ordering">I)</lbl>
                            <gramGrp>
                                <pos value="verb"/>
                                <subc value="transitive">
                                    <hi rend="roman">
                                        <abbr>trs.</abbr>
                                    </hi>
                                </subc>
                            </gramGrp>
                            <sense n="1.1">
                                <lbl type="ordering">1)</lbl>
                                <def>Ein wenig ändern <c>,</c> anders einrichten <c>.</c></def>
                                <cit>
                                    <q>Eine <lb n="0003.067"/> Haube <hi rend="large">abändern</hi>
                                        <c>.</c></q>
                                    <q>In diesem Aufsatze muß noch manches <hi rend="large">
                                            <w rend="abgeän-dert"> abgeän <lb n="0003.068"/> dert
                                            </w>
                                        </hi> werden <c>.</c></q>
                                </cit>
                                <note>Wenn in der Kanzleisprache <hi rend="large">abändern</hi> für
                                    aufheben <lb n="0003.069"/> oder widerrufen gebraucht wird
                                    <c>,</c> so ist dies ein Mißbrauch <c>.</c></note>
                            </sense>
                            <sense n="1.2">
                                <lbl type="ordering">2)</lbl>
                                <usg type="time">Seit <lb n="0003.070"/>
                                    <name n="#Gottsched">
                                        <hi rend="spaced">Gottscheds</hi>
                                    </name> Zeiten</usg>
                                <usg type="dom">bei vielen Sprachlehrern</usg> so viel wie <def>
                                    <hi rend="large">umenden</hi>
                                    <lb n="0003.071"/>
                                    <c>(</c>
                                    <hi rend="roman">decliniren</hi>
                                    <c>)</c>
                                </def>
                                <c>,</c>
                                <note>wofür es aber zu unbestimmt ist <c>.</c></note>
                                <xr>
                                    <lbl type="reference">
                                        <hi rend="large">
                                            <abbr>S.</abbr>
                                        </hi>
                                    </lbl>
                                    <ref target="#cwds5_Umenden">
                                        <hi rend="large">Umenden </hi>
                                    </ref>
                                </xr>
                                <c>.</c>
                            </sense>
                        </sense>
                        <sense n="2">
                            <lbl type="ordering">II)</lbl>
                            <lb n="0003.072"/>
                            <gramGrp>
                                <pos value="verb"/>
                                <subc value="neuter">
                                    <hi rend="roman">
                                        <abbr>ntr.</abbr>
                                    </hi>
                                </subc>
                                <gram> mit <hi rend="large">haben</hi>
                                </gram>
                            </gramGrp>
                            <c>,</c>
                            <def>so viel als abwechseln <c>,</c> sich verändern <c>.</c></def>
                            <cit type="quote">
                                <quote>
                                    <c>"</c> Die Farbe <lb n="0003.073"/> des Gefieders scheint bei
                                    dem Kampfhahn eben so <hi rend="large">abzuändern</hi>
                                    <c>,</c> wie bei <lb n="0003.074"/> dem Hausgeflügel <c>.</c>
                                    <c>"</c></quote>
                                <bibl>
                                    <author n="#Funke">
                                        <hi rend="spaced">Funke</hi>
                                    </author>
                                    <c>.</c>
                                </bibl>
                            </cit>
                        </sense>
                        <re type="derived">
                            <c>-</c>
                            <hi rend="large"> Das Abändern <c>.</c> Die Abänderung </hi>
                            <c>.</c>
                        </re>
                    </sense>
                </entry>
            </div>
        </body>
    </text>
</TEI>

Dictionary entry ``Abändern'' in baseline encoding


<?xml version="1.0" encoding="UTF-8"?>
<?oxygen RNGSchema="../coreencoding_dictionaries.rnc" type="compact"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xml:lang="de">
    <teiHeader>
        <fileDesc>
            <titleStmt>
                <title>Joachim Heinrich Campe, Wörterbuch der Deutschen Sprache, Band 1 mit TEI-Auszeichnung</title>
                <author>Kompetenzzentrum für EDV-Philologie, Universität Würzburg</author>
            </titleStmt>
            <publicationStmt>
                <availability>
                    <p>für die Kodierungs- und Korrekturphase</p>
                    <!-- die Festlegung der Nutzungslizenz erfolgt später -->
                </availability>
                <authority>Kompetenzzentrum für EDV-Philologie, Universität Würzburg</authority>
            </publicationStmt>
            <sourceDesc>
                <biblStruct xml:lang="de" type="dictionary">
                    <monogr>
                        <author>Joachim Heinrich Campe</author>
                        <title>Wörterbuch der Deutschen Sprache</title>
                        <title type="sub">Veranstaltet und herausgegeben von Joachim Heinrich Campe. Erster Theil. A - bis - E. </title>
                        <imprint>
                            <pubPlace>Braunschweig</pubPlace>
                            <publisher>In der Schulbuchhandlung.</publisher>
                            <date when="1807">1807</date>
                        </imprint>
                    </monogr>
                </biblStruct>
            </sourceDesc>
        </fileDesc>
        <encodingDesc>
            <editorialDecl>
                <normalization>
                    <p>Formaterfassung der Lemmazeile: die Lemmazeile (Stichwort ggf. mit Artikel und grammatischen Angaben) ist ausnahmslos in einem ca. 0,5 Punkt größeren Schriftfont gesetzt; dies wird nur hier notiert. Der negative Einzug (Linksausrückung) wird nicht kodiert. </p>                  
                </normalization>
            </editorialDecl>
        </encodingDesc>
        <revisionDesc>
            <change who="#MB">20080430 Textkontrolle</change>
        </revisionDesc>
    </teiHeader>
    <text>
        <body>
            <div>                
                <entry xml:id="cwds1_000081_Abaendern">
				<lb/>
                    <form type="lemma">
                        <form type="headword">Abändern</form>, <gramGrp>
                            <pos value="verb">
                                <choice>
                                    <abbr>v.</abbr>
                                </choice>
                            </pos>
                        </gramGrp>
                    </form>
                    <sense>
                        <sense n="1">I) <gramGrp>
                                <pos value="verb"/>
                                <subc value="transitive">
                                    <choice>
                                        <abbr>trs.</abbr>
                                    </choice>
                                </subc>
                            </gramGrp>
                            <sense n="1.1">1) <def>Ein wenig ändern, anders einrichten.</def>
                                <cit type="example">
                                    <q>Eine<lb/>Haube abändern.</q>
                                    <q>In diesem Aufsatze muß noch manches abgeän-<lb/>dert
                                    werden.</q>
                                </cit>
                                <note>Wenn in der Kanzleisprache abändern für aufheben<lb/>oder
                                    widerrufen gebraucht wird, so ist dies ein Mißbrauch.</note>
                            </sense>
                            <sense n="1.2">2) <usg type="time">Seit<lb/>Gottscheds Zeiten</usg>
                                <usg type="dom">bei vielen Sprachlehrern</usg> so viel wie
                                    <def>umenden<lb/>(declinieren),</def>
                                <note> wofür es aber zu unbestimmt ist.</note>
                                <xr>
                                    <choice>
                                        <abbr>S.</abbr>
                                    </choice>
                                    <ref target="#cwds5_umenden">Umenden.</ref>
                                </xr>
                            </sense>
                        </sense>
                        <sense n="2">II)<lb/>
                            <gramGrp>
                                <pos value="verb"/>
                                <subc value="neuter">
                                    <choice>
                                        <abbr>ntr.</abbr>
                                    </choice>
                                </subc> mit haben, </gramGrp> so viel als <def>abwechseln, sich
                                verändern.</def>
                            <cit type="example">
                                <cit type="verse">
                                    <quote>»Die Farbe<lb/>des Gefieders scheint bei dem Kampfhahn
                                        eben so abzuändern, wie bei<lb/>dem Hausgeflügel.«</quote>
                                    <bibl>
                                        <author n="#Funke">Funke.</author>
                                    </bibl>
                                </cit>
                            </cit>
                        </sense>
                        <re> - Das Abändern. Die Abänderung.</re>
                    </sense>
                </entry>
            </div>
        </body>
    </text>
</TEI>

TextGrid