Dictionnaire Étymologique de l'Ancien Français

Die digitale Version

Eine neue Konzeption des DEAF – warum?

Von 1974 bis 2009 wurden die Buchstaben G bis K des DEAF als klassisches, gedrucktes Wörterbuch veröffentlicht. Der Index und die Bibliographie wurden dabei regelmäßig erweitert.
Bei einer Sitzung am 5. Mai 2001 stimmte die philosophisch-historische Klasse der Akademie dem Vorschlag der wissenschaftlichen Kommission des DEAF zu, das Auslaufsdatum des Projekts auf 2025 festzusetzen. 2010 wurde das Datum von der wissenschaftlichen Kommission der Vereinigung der Akademien auf 2017 vorgezogen.

Im Hinblick auf diese Frist sah sich die Redaktion gezwungen, einen neuen Plan zu entwickeln, der es bis 2017 ermöglichte, das gesamte Alphabet zu bearbeiten. Der Plan für die Zukunft des Wörterbuches beinhaltet eine zum Teil veränderte redaktionelle Konzeption sowie zusätzliche Unterstützung im elektronischen Bereich der Redaktionsarbeit.

Der neue Plan: DEAFpré + DEAFplus =DEAFél

DEAFplus

Dieser Plan besteht aus zwei Teilen: Zum einen verfolgt die Redaktion weiterhin das Ziel, den Wortschatz in gewohnter Weise zu bearbeiten, insbesondere den Teil, der aufgrund der Geschichte der Lexikographie des Französischen und vor allem aufgrund des FEW ein „schwarzes Loch“ darstellt, nämlich die Buchstaben D, E und F, wobei der Schwerpunkt auf dem Buchstaben F liegt. Die abgefassten Artikel werden gedruckt, was die Fortsetzung des altbekannten DEAF ist. Anschließend werden die Artikel, mit zeitlichem Abstand, den das Verlagshaus festlegt, das die Veröffentlichung der Artikel in Form von Faszikeln verfolgt, online veröffentlicht. Die Online-Version wird durch technische Funktionen und Zusatzmaterial ergänzt, welches nicht in der gedruckten Version aufgeführt wird. Dies bringt ihm den Namen „DEAFplus“ ein.

DEAFpré

Zum anderen werden unter dem Namen „DEAFpré“ die Artikel, die die anderen Buchstaben betreffen, das sind die Buchstaben L – Z und A – C, zusammengestellt. Die Buchstaben G – K wurden bereits in gedruckter Form veröffentlicht. Der DEAFpré ermöglicht den Zugriff auf das Material dieser Teile des Alphabets, das durch einleitende Artikel vorstrukturiert wird. (Lesen Sie hierzu das Avertissement am Anfang des DEAFél). DEAFplus und DEAFpré bilden zusammen den „DEAF électronique“: DEAFél.

Die Digitalisierung des Wörterbuchs

Um aus unserem Wörterbuch den „DEAF électronique“ zu machen, musste eine enge Zusammenarbeit zwischen Lexikographie und Informatik ins Leben gerufen werden.
Das digitalisierte Wörterbuch ist ein Wörterbuch, dessen wissenschaftliche Konzeption seit Jahrzehnten besteht, an dem regelmäßig gefeilt wird und dessen wissenschaftlicher Wert unbestreitbar ist.
Die Umwandlung beinhaltete die Erstellung eines neuen, computer-adaptierten Aufbaus des Wörterbuches, der die traditionellen Aspekte der Redaktion und die technischen Neuerungen vereinte. Die Vielschichtigkeit der Artikel und die mannigfaltigen Möglichkeiten Informationen zu arrangieren, zu straffen, zu löschen oder abzukürzen machten die Umformung zu einer heiklen Angelegenheit. Die Vielzahl an Möglichkeiten beizubehalten – für den Informatiker zunächst eine wenig strikte Einstellung – erwies sich als konstitutiver Bestandteil der wachsenden Struktur, um die erforderliche Freiheit und Flexibilität bei den wissenschaftlichen Vorgängen zu gewährleisten. Der Umwandlungsprozess des DEAF zeigte sehr deutlich, wie wichtig eine Leitung der Zusammenarbeit zwischen Lexikographie und Informatik war, die einen Gesamtüberblick über das Projekt behält und den Inhalt des Wörterbuchs erhält.

Auf Initiative Prof. Dr. Gerhard Krügers, Mitglied der EDV-Kommission der Heidelberger Akademie der Wissenschaften, spendete die Gunther Schroff Stiftung 10.000 Euro, die den Beginn einer fruchtbaren Zusammenarbeit mit dem Institut für Programmstrukturen und Datenorganisation IPD, mit dem Karlsruher Institut für Technologie KIT in Karlsruhe unter Leitung von Prof. Dr. Peter C. Lockemann ermöglichten. Von der Akademie zusätzlich zur Verfügung gestellte Gelder gewährleisteten die Fortführung des Projekts. Somit konnten nacheinander Dr. René Witte, Thomas Kappler, Philip Stöver und Conny Kühne als Informatiker des Karlsruher Instituts eingestellt werden. Dr. Hagen Höpfner (zuletzt Universität Weimar, davor Bruchsal) und Marcus Husar, wissenschaftliche Hilfskraft beim DEAF vervollständigten das Team, das seitens der Redaktion von Dr. Sabine Tittel unterwiesen und geleitet wird.

Eine entscheidende Frage, die sich bei der Erstellung des Redaktionssystems stellte, bestand darin einen Konsens zwischen informatischen Anforderungen, von Natur aus eher unnachgiebig, und der nötigen Freiheit, derer der Lexikograph bedarf, zu finden. Um dieser conditio sine qua non gerecht zu werden, entwickelte das Team Trümpfe zweier Elemente, die nur bei oberflächlicher Betrachtung widersprüchlich waren: Erstens sind die Vorteile der elektronischen Unterstützung bei den Verfahren der Redaktion durch feste Strukturen gekennzeichnet und durch die Datenverwaltung automatisiert und zweitens werden die Vorteile einer freien Texterfassung ohne feste Strukturen gleichwohl durch ein Tool der semantischen Markierung gestützt (s. u. Abb. 3-7).

Das elektronische Redaktionssystem

Das neue Redaktionssystem wurde ausschließlich für die Redakteure des DEAF entwickelt. Es erlaubt eine schnellere Redaktion durch die technischen Hilfsmittel. Das System benutzt lediglich „open source“ Tools und könnte somit an die Anforderungen vergleichbarer Projekte angepasst werden

Zwei Vorbedingungen mussten für die Einrichtung eines solchen Systems erfüllt werden:

Dieser „Lemming“ basiert auf 120 phonetischen Regeln, die die Entwicklung des Altfranzösischen vom Latein sowie die diatopischen und graphischen Variationen der altfranzösischen Lexik berücksichtigen. Die Ergebnisse der Computerlemmatisierung werden dann mit der Liste der Lemmata des Tobler-Lommatzsch abgeglichen (s. u. Abb. 1).

Das Redaktionssystem wurde in Zusammenarbeit mit den genannten Informatikern und vor allem von Conny Kühne vom Institut für Programmstrukturen und Datenorganisation konzipiert und entwickelt, s. u.
Die technische Lösung enthält

Das System verbindet

Das System automatisiert mehrere Redaktionsschritte. Es erweitert beispielsweise – über den Umweg über die Sigel des DEAF – die Daten, die von den Zetteln kommen, die die Informationen der Bibliographie des DEAF erfassen, was die Datierung, die Lokalisierung und die Textart (Primär-, Sekundär-, Tertiärquelle; s. Abb. 3) anbelangt. Von den Textdatierungen ausgehend sortiert das System die Belege chronologisch und akzeptiert manuelle Änderungen. Et cetera.

Der Prozentsatz der Aktionen, die das System selbständig ausführt, liegt in den Artikeln des DEAFpré bei ungefähr 70%, in den Artikeln des DEAFplus, die eine höhere intellektuelle Arbeit erfordern, liegt er bei circa 15%.

Die Online-Veröffentlichung: Der DEAFél

Im Jahre 2010 wurde die neue Online-Version des DEAFél eingesetzt. Der DEAFél beinhaltet die veröffentlichten Artikel des DEAFpré und des DEAFplus. Zurzeit sind die Artikel der bereits veröffentlichten Bände (G, H, I, J und K) in Form von Bilddateien Teil des DEAFél. Der Verlag De Gruyter prüft momentan die Kosten für eine digitale Veröffentlichung der Buchstaben G bis K, die hoffentlich bald die aktuelle Veröffentlichungsform als Bilddateien ersetzen wird. Auch die Online-Veröffentlichung des Buchstaben F sowie die erweiterte Suche (s. u.) sind Teil dieser Überprüfung.

Die Suchmaschine

Der DEAFél beinhaltet eine Suchmaschine, die aus zwei Teilen besteht:

  1. 1. Die einfache Suche macht die Lemmata, die Ableitungen und die verschiedenen Schreibweisen der behandelten Wörter zugänglich. Diese einfache Suche macht auch die Lemmata und die Ableitungen der Artikel zu G bis K zugänglich und verbindet mit den Bilddateien, solange noch keine digitale Version der Buchstaben G bis K erschienen ist.
  2. 2. Die erweiterte Suche mit ca. 20 kombinierbaren Suchanfragen stellt manch zusätzliche Information bereit. Sie erlaubt beispielsweise die Suche nach einem Wort in Redewendungen, in Kollokationen, in Sprichwörtern oder in Stilfiguren. Die onomasiologische Suche, die auf den Definitionen beruht, ermöglicht die Suche nach Bedeutungen im Allgemeinen oder wird durch den Gebrauch des entsprechenden Wortes als terminus technicus oder in einer Stilfigur präzisiert.
Diese erweiterte Suche wurde vom Team des DEAF konzipiert, für einen kurzen Überblick s. u. Abb. 9. Die Kosten der Entwicklung dieser Suche werden zurzeit genauso durch den Verlag De Gruyter geprüft wie die Digitalisierung der Buchstaben G bis K.

Es ist der Tatsache geschuldet, dass die Artikel des DEAFplus eine elaboriertere semantische Struktur und eine andere Qualität als die Artikel des DEAFpré haben, dass die erweiterte Suche zu mehr Ergebnissen aus dem DEAFplus als aus dem DEAFpré führen wird, sobald die Artikel des DEAFplus im Netz sein werden.

Zahlreiche Hyperlinks stellen die Fäden eines ständig wachsenden Netzes dar: Die Bibliographie des DEAF mit seinen 20 Suchanfragen ist durch diese Hyperlinks, die die in den Artikeln des DEAFpré und des DEAFplus zitierten Sigel mit den entsprechenden bibliographischen Einträgen verbinden, in den DEAFél einbezogen. Die Verweise zwischen den Artikeln sind ebenfalls als Hyperlinks konzipiert. Die Hyperlinks zum Anglo-Norman Dictionary (ANDEl), zum Dictionnaire du Moyen Français (DMF) und zu anderen Online-Wörterbüchern verengen nach und nach die Maschen eines lexikographischen Netzwerks.

DEAF als Linked Data

Seit 2018 sind die Daten der Artikel des DEAFplus in das Format Resource Description Framework – RDF konvertiert und liegen somit als Linked (Open) Data vor. Zur Anwendung für die formalisierte inhaltsbezogene (semantische, im Sinne der Informatik) Auszeichnung der Daten kamen die folgenden, in der Wissenschaft etablierten Vokabulare und Ontologien: OntoLex-lemon, LexInfo, DublinCore, OLiA, RDF, RDFS, SKOS und FOAF. Für eine detaillierte Beschreibung des Konvertierungsprozesses, s. Sabine Tittel und Christian Chiarcos, Historical Lexicography of Old French and Linked Open Data: Transforming the resources of the Dictionnaire étymologique de l'ancien français with OntoLex-Lemon, in: Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). GLOBALEX Workshop (GLOBALEX-2018), 7-12 May 2018, Miyazaki, Japan, Paris (European Language Resources Association (ELRA)) 2018, S. 58-66.

Auch die Daten des elektronischen Altgaskognischen Wörterbuchs DAGél sind in Linked (Open) Data transformiert. Auf die Konvertierung in RDF trifft dasselbe zu wie auf die Daten des DEAFplus.


Abbildungen

Lemmatiseur « Lemming »

Abb. 1 – Der „Lemming“.


Masque de saisie « Zettelüberprüfung »

Abb. 2 – Die Eingabemaske „Zettelüberprüfung“ ermöglicht es die Ergebnisse einer Arbeit ad fontes für jeden Beleg zu vermerken.


Masque de saisie « Bearbeitung Beleg »

Abb. 3 – Die Eingabemaske „Bearbeitung Beleg“ ordnet alle Informationen, die einen Beleg betreffen: Sigel, Wort, Textdatierung, (das Datum in der umschreibenden Originalversion und als Zahl), Quellenart, Verweise, fakultative Kommentare zur Bedeutung des Belegs, fakultative Kommentare zur Schreibweise des Belegs, fakultative Kommentare für den internen Gebrauch, fakultativer Kontext und fakultativer Hyperlink.


Masque de saisie des « variantes graphiques »

Abb. 4 – Die Eingabemaske „Grafievarianten“ erlaubt es, die Schreibweisen (die Liste rechts oben), jedwede Anmerkung und jedweder Kommentar, die die Schreibweise betreffen, aufzuführen, die Belege nach entsprechenden Schreibweisen zu ordnen (die linke Tabelle zeigt die Belege, die noch geordnet werden müssen, die rechte zeigt die Belege, die bereits sortiert sind. Die Funktion, die das Ordnen ermöglicht, findet man unter „glisser-déposer“. Die rechte Tabelle bietet mehrere Möglichkeiten, die Belege zu sortieren) und sie gestattet es die Datierung der Schreibweise aus dem ältesten Text beizubehalten.


Masque de saisie de la partie sémantique

Abb. 5 – Die Eingabemaske des semantischen Teils ermöglicht es zu registrieren, zu kommentieren, nach Bedeutung und Unterbedeutung zu sortieren, die Datierung zu erfassen (s. Abb. 6) und die Belege nach den entsprechenden Bedeutungen zu sortieren (s. Abb. 4).


L’outil « Zeiträume »

Abb. 6 – Das Tool „Zeiträume“ bietet die Möglichkeit die Datierungen einer Bedeutung festzuhalten, selbst wenn sie sehr komplex sind. Hier die Daten, die folgendes ergeben „1eq.12es.; 1190-13es.; dep. 1611“. Zudem kann man mit diesem Tool Anmerkungen hinzufügen.


Discussion étymologique

Abb. 7 – Um die etymologische Diskussion zu erfassen, stellt das System den Redakteuren ein großes Eingabefeld zur Verfügung, dass von einem Tool zur semantischen Markierung gestützt wird; rechts werden die anerkannten Daten in einen Text, der durch die Markierung korrigiert wurde, umgewandelt.


Fiche digitalisée

Abb. 8 – Digitalisierter Zettel, der im Artikel fesse vorkommt.


Recherche avancée

Abb. 9 – Die erweiterte Suche, wie sie vom DEAF konzipiert wurde.


Code RDF

Abb. 10 – Ausschnitt aus dem RDF-Code des DEAF-Artikels afr. fiel: Modellierung der Graphievarianten fieil und fius und der ersten Hauptbedeutung "liquide verdâtre et amer qui est contenu dans la vésicule biliaire, bile".


version française
version française