eBooks

Wortbildung im elektronischen Wörterbuch

2013
978-3-8233-7737-5
Gunter Narr Verlag 
Annette Klosa

Der vorliegende Band enthält die Beiträge eines von der Deutschen Forschungsgemeinschaft geförderten internationalen Kolloquiums am Institut für deutsche Sprache, Mannheim, die sich mit Wortbildung im elektronischen Wörterbuch aus unterschiedlicher Perspektive beschäftigen. Die Beiträgerinnen und Beiträger beleuchten theoretische Aspekte von Wortbildung im Wörterbuch, die Praxis von Wortbildungsangaben im elektronischen Wörterbuch und die computergestützte Gewinnung von Wortbildungsangaben und ihre Präsentation. Hiermit wird die Diskussion zum Thema »Wortbildung im elektronischen Wörterbuch« angestoßen, welche die Beschäftigung mit den Möglichkeiten und Grenzen der Darstellung von Wortbildungsphänomenen im gedruckten Wörterbuch fortsetzt. Auch im elektronischen Medium gilt, dass durch die Analyse der Gebildetheit von Stichwörtern, durch die Aufnahme von Wortbildungsprodukten zu einem Stichwort und schließlich durch die Lemmatisierung von Wortbildungsmitteln die Vernetztheit des Wortschatzes aufgezeigt werden kann.Benutzbarkeit und Effektivität von Wörterbüchern lassen sich hierdurch erhöhen.

Annette Klosa (Hrsg.) Wortbildung im elektronischen Wörterbuch Studien zur Deutschen Sprache F O R S C H U N G E N D E S I N S T I T U T S F Ü R D E U T S C H E S P R A C H E S T U D I E N Z U R D E U T S C H E N S P R A C H E 6 3 Studien zur Deutschen Sprache F O R S C H U N G E N D E S I N S T I T U T S F Ü R D E U T S C H E S P R A C H E Herausgegeben von Arnulf Deppermann, Stefan Engelberg und Ulrich Hermann Waßner Band 63 Annette Klosa (Hrsg.) Wortbildung im elektronischen Wörterbuch Redaktion: Dr. Elke Donalies Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. © 2013 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Gedruckt auf säurefreiem und alterungsbeständigem Werkdruckpapier. Internet: http: / / www.narr.de E-Mail: info@narr.de Layout: Sonja Tröster, Mannheim Druck und Bindung: Hubert & Co., Göttingen Printed in Germany ISSN 0949-409X ISBN 978-3-8233-6737-6 Inhalt Annette Klosa Einleitung......................................................................................................... 7 Sabina Ulsamer Wortbildung.in.Wörterbüchern.-.Zwischen.Anspruch.und.. Wirklichkeit................................................................................................... 13 A) Theoretische Aspekte von Wortbildung im Wörterbuch Ludwig M. Eichinger Wortbildung.im.Wörterbuch..Aus.der.Sicht.eines.Grammatikers................. 63 Hilke Elsen Problemzonen.der.Wortbildung.und.der.Eintrag.im.Wörterbuch.................. 87 Johan De Caluwe Dictionary.entries.as.windows.on.the.onomasiological.aspects.. of.word.formation........................................................................................ 105 Jochen Splett Grundlegende.Bemerkungen.zu.einem.auf.einer.pragmatischen.. Sprachtheorie.fußenden.Wortfamilienwörterbuch.als.legitimem.. Ort.einer.integrierten.Wortbildung............................................................... 117 B) Zur Praxis von Wortbildungsangaben im elektronischen Wörterbuch Henning Bergenholtz Wortbildungsangaben.als.Hilfe.für.den.Zugriff.auf.andere.. Datentypen.und.als.Hilfe.bei.kommunikativen.und.kognitiven.. Informationsbedürfnissen............................................................................ 133 Pius ten Hacken Wortbildung.in.elektronischen.Lernerwörterbüchern.................................. 157 Annette Klosa Wortbildung.in.elexiko: .Gegenwart.und.Zukunft........................................ 175. Antje Töpel Die.Wortbildungsangaben.im.Online-Wörterbuch.und.wie.Nutzer.. sie.beurteilen.-.eine.Umfrage.zu.elexiko..................................................... 197 Inhalt 6 C) Computergestützte Gewinnung von Wortbildungsangaben und ihre Präsentation Christian Simon Finite-State-basierte.Morphologie-Tools.und.ihre.Stärken.und.. Schwächen.bei.der.maschinellen.Wortbildungsanalyse............................... 217 Sabina Ulsamer Chancen.und.Probleme.bei.der.automatischen.Ermittlung.von.. Wortbildungsprodukten.für.elexiko und.bei.ihrer.Präsentation................... 235 Peter Meyer / .Carolin Müller-Spitzer Überlegungen.zur.Visualisierung.von.Wortbildung.in.. elektronischen.Wörterbüchern..................................................................... 255 Annette.Klosa Einleitung Die. Darstellung. von. Wortbildung. im. Wörterbuch. wird. vor. allem. damit. begründet,.dass.dadurch.Beziehungen.und.Vernetzungen.der.Wörter.untereinander. wiedergegeben. werden. können.. So. gelingt. es,. durch. die.Aufnahme. von. Komposita.und.Derivaten,.durch.die.Lemmatisierung.von.Affixen.und.durch. die. Beschreibung. von. Wortbildungsregeln. in. der. Wörterbuchgrammatik. die. Vernetztheit.des.Wortschatzes.aufzuzeigen,.obwohl.die.alpha.betische.Anordnung.der.Stichwörter.im.Wörterbuch.diese.Zusammenhänge.nur.unzureichend. wiedergeben.kann..Allgemein.soll.sich.durch.die.Aufnahme.von.Wortbildung. in.Wörterbüchern.deren.Benutzbarkeit.und.Effektivität.erhöhen,.die.Rezeption. von.Wortbil.dungsangaben.kann.z.B..zu.einer.Bereicherung.des.Wortschatzes. gerade. bei. Lernern. führen.. Vor. diesem. Hintergrund. sind. in. die. Mikro-. wie. Makrostruktur. zahlreicher. allgemeiner. ein.sprachiger. Printwörterbücher. des. Deutschen.(wie.auch.anderer.Sprachen).Angaben.zur.Wortbildung.aufgenommen.worden..Besonders.in.den.80er.und.90er.Jahren.des.20..Jahrhunderts.hat. die. Metalexikographie. diese. Praxis. der.Wörterbücher. untersucht. und. daraus. Verbesserungsvorschläge. abgeleitet,. aber. auch. generelle. Vorschläge. zur. Behand.lung.von.Wortbildung.im.gedruckten.Wörter.buch.vorgelegt..Seit.Ende. des. 20.. Jahrhunderts. sind. solche.Überlegungen. vereinzelt. auf. das. elektronische.Wörterbuch.ausgeweitet.worden,.wobei.eine.umfassende.Diskussion.bislang. aussteht..Einen.Überblick.über. den.Forschungsstand.gibt. Sabina Ulsamer.in.ihrem.Beitrag.„Wortbildung.in.Wörterbüchern.-.Zwischen.Anspruch. und.Wirklichkeit“,.der.auch.eine.umfängliche.Bibliografie.zum.Thema.bietet.. Mit.den.Beiträgen.im.vorliegenden.Band.soll.versucht.werden,.die.Diskussion. zum. Thema. „Wortbildung. im. elektronischen. Wörterbuch“. anzustoßen.. Die. hier.gesammelten.Aufsätze.stellen.die.Schriftfassungen.zu.Vorträgen.dar,.die. im. Rahmen. eines. von. der. Deutschen. Forschungsgemeinschaft. dankenswerterweise.geförderten.internationalen.Kolloquiums.„Wortbildung.im.elektronischen.Wörterbuch“.gehalten.wurden,.das.am.26..und.27..Mai.2011.in.Mannheim. stattgefunden. hat.. Sie. sind. hier. in. drei. Abschnitte. gruppiert: . A). Theoretische.Aspekte. von. Wortbildung. im. Wörterbuch,. B). Zur. Praxis. von. Wortbildungsangaben.im.Wörterbuch.und.C).Computergestützte.Gewinnung. von.Wortbildungsangaben.und.ihre.Präsentation.. Annette Klosa 8 In.Abschnitt.A.stellen.Ludwig M. Eichinger.in.seinem.Beitrag.„Wortbildung. im.Wörterbuch..Aus.der.Sicht.eines.Grammatikers“.und.Hilke Elsen.in.ihrem. Beitrag.„Problemzonen.der.Wortbildung.und.der.Eintrag.im.Wörterbuch“.aus. grammatischer. und. wortbildungstheoretischer. Sicht. Überlegungen. dazu. an,. wie.insbesondere.nicht.prototypische.Wortbildungstypen.und.-mittel.im.elektronischen.Wörterbuch.erfasst.und.beschrieben.werden.könnten..Auf.der.Basis.des.Reichtums.produktiver.Wortbildungsmuster.und.ihrer.Produkte.in.Korpustexten. kommt. Ludwig. M.. Eichinger. zu. dem. Schluss,. Wortbildung. im. Wörterbuch.könne.ganz.Verschiedenes.heißen,.und.schlägt.vor,.die.multimodalen.Möglichkeiten.im. elektronischen.Medium. entsprechend. zu. nutzen..In. ähnlicher.Weise.argumentiert.Hilke.Elsen.dafür,.bisher.vernachlässigte.Randzonen.und.Übergangsbereiche.der.Wortbildung.im.Internetwörterbuch.in.angemessener. Ausführlichkeit,. aber. auch. der. nötigen. Strukturiertheit. zu. beschreiben..Johan de Caluwe.schlägt.in.seinem.Beitrag.„Dictionary.entries.as. windows.on.the.onomasiological.aspects.of.word.formation“.vor,.reiche.Angaben.von.Wortbildungsprodukten.(also.Derivate. zu. und.Komposita. mit. einem.Basiswort).im.elektronischen.Wörterbuch.in.einen.weiteren.onomasiologischen. Kontext. einzubetten,. sodass. Wörterbuchbenutzer. mithilfe. solcher. Angaben. einen.vollständigen.Überblick.über. ein.Wortfeld. erlangen.können.. So.könnten.muttersprachliche.Wörterbuchbenutzer.zugleich.einen.Einblick.in. die.Struktur.des.Lexikons.gewinnen..Jochen Splett.stellt.schließlich.„Grundlegende.Bemerkungen.zu.einem.auf.einer.pragmatischen.Sprachtheorie.fußenden. Wortfamilienwörterbuch. als. legitimem. Ort. einer. integrierten. Wortbildung“. an.. Unter. einem. elektronischen. Wörterbuch. versteht. er. generell. ein. elektronisches. Wortfamilienwörterbuch,. das. allerdings. noch. zu. realisieren. wäre..Jedenfalls.kann.in.einem.solchen.Wörterbuch.die.Vernetzung.zwischen. Simplizia.und.strukturierten.Wörtern.in.einer.Form.(nämlich.als.Wortfamilie). beschrieben.werden,.wie.dies.sonst.nicht.möglich.ist. Zu.Wortbildungsangaben.in.Wörterbüchern.zählen.also,.wie.schon.angeklungen,.Angaben.zur.Gebildetheit.eines.Stichwortes,.Angaben.zu.Wortbildungsprodukten. zu. einem. Stichwort. sowie. Angaben. zu. Wortbildungsmitteln. in. Form.eigener.Stichworteinträge..Alle.drei.werden.in.diesem.Band.in.Abschnitt. B. bei. der. Untersuchung. von. Wortbildung. in. verschiedenen. elektronischen. Wörterbüchern. erwähnt.. So. geht. Henning Bergenholtz. in. seinem. Beitrag. „Wortbildungsangaben. als. Hilfe.für. den. Zugriff. auf. andere. Datentypen. und. als.Hilfe.bei.kommunikativen.und.kognitiven.Informationsbedürfnissen“.ausgehend.von.seiner.weniger.linguistischen.als.vielmehr.informationstechnologischen. Sicht. auf. verschiedene. dänische. (Fach-)Wörterbücher. ein.. Er. argu- Einleitung 9 mentiert dafür,.Wortbildungsangaben.im.elektronischen.Wörterbuch.generell. an. den. Informationsbedürfnissen. der. Wörterbuchbenutzer. auszurichten. und. sich.bereits.bei.der.Konzeption.dieser.Angaben.über.ihre.möglichen.Funktionen.klar.zu.werden..Im.Sinne.der.Benutzerfreundlichkeit.plädiert.er.auch.für. eine.großzügige.Aufnahme.von.gebildeten.Stichwörtern.(Komposita.und.Derivaten).im.elektronischen.Wörterbuch..Pius ten Hacken.untersucht.in.seinem. Beitrag. „Wortbildung. in. elektronischen. Lernerwörterbüchern“. insbesondere. ein.englisches.Lernerwörterbuch.im.Internet..Er.verweist.auf.die.unterstützende.Bedeutung.von.Wortbildungsangaben.im.Wörterbuch.für.die.Lexikonbildung. bei. Lernern.. Deshalb. sollten.Wortbildungsangaben. im.Wörterbuch. im. besten. Fall. die.Analyse. einzelner. Bildungen. bieten,. Klassen. von. ähnlichen. Bildungen. benennen. und. schließich. explizite.Wortbildungsregeln. präsentieren..Dies.alles.ist.nur.im.elektronischen.Wörterbuch.wegen.des.dort.zur.Verfügung. stehenden. Raumes. möglich.. Die. Beiträge. von. Antje Töpel. („Die. Wortbildungsangaben.im.Online-Wörterbuch.und.wie.Nutzer.sie.beurteilen.-. eine.Umfrage.zu.elexiko“).und.Annette Klosa.(„Wortbildung.in.elexiko: .Gegenwart. und.Zukunft“). beschäftigen. sich.(unter. anderem).mit. dem. deutschsprachigen.Online-Wörterbuch.elexiko,.das.am.Institut.für.Deutsche.Sprache. in.Mannheim.entsteht,.vergleichen.dieses.aber.auch.mit.anderen.Online-Wörterbüchern.zum.Deutschen.und.anderen.Sprachen..In.elexiko.umfassen.Angaben. zur.Wortbildung. derzeit. nur. die.Analyse. gebildeter. Stichwörter. und. die. Angabe.von.Wortbildungsprodukten.zu.simplizischen.Lemmata..Offen.ist.dagegen.noch.die.Behandlung.von.Wortbildungsmitteln..Gerade.vor.dem.Hintergrund. des. möglichen.Ausbaus. der.Wortbildungsangaben. in. elexiko. ist. zu. fragen,.an.welche.Benutzer.in.welchen.Benutzungssituationen.man.sich.mit. solchen. Angaben. wendet.. Zu. hinterfragen. ist. beispielsweise. auch: . Dienen. Wortbildungsangaben.in.Wörterbüchern.wirklich.der.Wortschatzerweiterung. und. befähigen. sie. tatsächlich. dazu,. dass. Sprecher. neue,. korrekte. Bildungen. z.B..in.einer.Situation.der.Textproduktion.generieren.können? .Dass.Wörterbuchbenutzungsforschung.zum.Thema.der.Wortbildung.bei.der.Beantwortung. solcher,. aber. auch. weiterer. Fragen. helfen. kann,. wird. im. Beitrag. von.Antje. Töpel.deutlich.. Bei.den.Methoden.zur.Gewinnung.von.Wortbildungsangaben,.mit.der.sich.die. Beiträge.in.Abschnitt.C.beschäftigen,.ist.grundsätzlich.die.redakti.onelle.Erarbeitung.von.einer.automatischen,.korpus-.und.computerlinguistischen.Gewinnung.der.Angaben.zu.unterscheiden..Bei.den.automatischen.Vorgehensweisen. kann.man.differenzieren.zwischen.korpusgestützter.Ermittlung.von.produktiven. Wortbildungsmitteln,. korpusgestützter. Ermittlung. von. Wortbildungspro- Annette Klosa 10 dukten. zu. einem. Stichwort,. automatischer. Ermittlung. von. Wortbildungsprodukten.zu.einem.Stichwort.aus.einer.Stichwortliste.mithilfe.morphologischer. Tools. und. schließlich. automatischer. Analyse. der. Gebildetheit. eines. Stichwortes.mithilfe.morphologischer.Tools..Christian Simon.erläutert.in.seinem. Beitrag.„Finite-State-basierte.Morphologie-Tools.und.ihre.Stärken.und.Schwächen.bei.der.maschinellen.Wortbildungsanalyse“,.wie.die.automatische.Analyse.der.Gebildetheit.von.Wörtern.mithilfe.einer.automatischen.morphologischen. Zerlegung.funktioniert.und.warum.diese.nicht.immer.zu.fehlerfreien.Ergebnissen.führen.kann..Er.bezieht.sich.dabei.insbesondere.auf.das.Tool.Morphisto,. das.für.die.Erarbeitung.der.Wortbildungsprodukte.in.elexiko.eingesetzt.wurde.. Sabina Ulsamer.zeigt.in.ihrem.Aufsatz.zu.„Chancen.und.Problemen.bei.der. automatischen.Ermittlung.von.Wortbildungsprodukten.für.elexiko.und.bei.ihrer. Präsentation“,. mit. welchen. Schwierigkeiten,. aber. auch. mit. welchen. Datenmengen. man. bei. dieser. automatisch. unterstützten. Ermittlung. von. Wortbildungsprodukten. zu. einzelnen. Stichwörtern. zu. rechnen. hat.. In. diesem. Band. leider.nicht.enthalten.sind.Beiträge,.die.sich.mit.der.korpusgestützten.Ermittlung.von.Wortbildungsprodukten.oder.Wortbildungsmitteln.befassen..Im.Rahmen. des. Kolloquiums. „Wortbildung. im. elektronischen. Wörterbuch“. hatten. sich. Anke. Lüdeling. (Berlin). mit. dem. Thema. „Die. Ermittlung. produktiver. Wortbildungsmuster.aus.Lernerkorpora“.und.Marie-Aude.Lefer.(Louvain).mit. dem. Thema. „Word-formation. coverage. in. electronic. bilingual. dictionaries: . Addressing.the.challenge.with.cross-linguistic.corpora“.an.der.Diskussion.beteiligt..Da.beide.Untersuchungen.noch.nicht.abgeschlossen.sind,.muss.hier.auf. eine.Publikation.der.Ergebnisse.verzichtet.werden.. Die.Behandlung.von.Wortbildung.im.elektronischen.Wörterbuch.kann.schließlich.nicht.ohne.ein.Nachdenken.dazu.auskommen,.in.welcher.Form.Angaben. zur.Wortbildung.im.elektronischen.Wörterbuch.präsentiert.werden.sollen..Da. ein.Wörterbuch.im.Internet.theoretisch.kaum.Platzbeschränkungen.unterliegt. und.die.Präsentation.der.Wortartikel.generell.nicht.mehr.an.das.in.Printwörterbüchern.tradierte,.stark.kondensierte.Spaltenformat.gebunden.ist,.können.Angaben.zur.Wortbildung.an.verschiedenen.Positionen.auf.dem.Bildschirm.und. in.unter.schiedlichen.Formen.erfolgen..Hierbei.spielen.etwa.folgende.Fragen. eine.Rolle: .Sollen.Wortbildungsprodukte.in.Form.von.alphabetisch.sortierten. Listen. angeboten. werden? . Oder. können. sie. als. ganze. Wortfamilie. in. grafischer.Form.präsentiert.werden? .Sollen.bei.der.Angabe.der.Bildungsbestandteile.eines.Stichwortes.diese.als.Link.ge.s.taltet.werden? .Wie.können.Stichworteinträge. zu. Wortbildungsmitteln. sinnvoll. mit. den. zugehörigen. Bildungen. innerhalb. der. Stichwortliste. verlinkt. werden? . Wie. kann. man. Angaben. zur. Einleitung 11 Wortbildung. sinnvoll.für. neue. Zugriffsmöglichkeiten. nut.zen? . Solche. Fragen. werden. in. den. Beiträgen. von. Sabina. Ulsamer. sowie. von. Peter Meyer und Carolin Müller-Spitzer.(„Überlegungen.zur.Visualisierung.von.Wortbildung. in. elektronischen. Wörterbüchern“). angesprochen.. Sabina. Ulsamer. stellt. die. Überlegungen.für.die.Präsentation.der.Wortbildungsprodukte.zu.simplizischen. Lemmata.in.elexiko.vor..Carolin.Müller-Spitzer.und.Peter.Meyer.denken.unabhängig. von. einem. speziellen. Wörterbuch. darüber. nach,. wie. eine. interaktive. Erkundung. von. Wortbildungsbeziehungen. in. einem. elektronischen. Wörterbuch. aussehen. könnte.. Dies. geschieht. vor. dem. Hintergrund. der. Beurteilung. von.multimedialen.und.benutzeradaptiven.Elementen.in.elektronischen.Wörterbüchern.durch.Wörterbuchbenutzer,.wie.sie.im.Rahmen.von.Benutzungsstudien.erhoben.wurde.. Eine.weiterführende.Diskussion.der.vielfältigen.Fragen.zum.Thema.„Wortbildung. im. elektronischen. Wörterbuch“. wäre. wünschenswert.. Sie. sollte. in. Zusammenarbeit. zwischen. Wortbildungstheoretikern. und. Grammatikern,. zwischen. Lexikographen. und. Metalexikographen,. zwischen. Computer-. und. Korpuslinguisten. und. schließlich. Spezialisten. für. das. Design. elektronischer. Nachschlagewerke. geführt. werden,. damit. es. insgesamt. zu. einem. Qualitätssprung.bei.Wortbildungsangaben.im.elektronischen.Wörterbuch.kommen.kann. Sabina Ulsamer Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 1. Wortbildung in Wörterbüchern Unter der Thematik „Wortbildung in Wörterbüchern“ wird sowohl diskutiert, wie im Wörterbuch Beziehungen und Vernetzungen der Wörter untereinander - wie sie im Wortschatz vorliegen - verdeutlicht werden können, als auch, wie Regelmäßigkeiten in der Wortbildung abgebildet werden können. In diesem Beitrag werden zunächst die Gründe für Wortbildungsangaben aus der Forschungsliteratur der letzten 20 bis 30 Jahre skizziert. Anschließend werden die daraus resultierenden Empfehlungen zur Darstellung und Gestaltung von Wortbildungsbeziehungen vorgestellt, wobei sich die Vorschläge hauptsächlich auf gedruckte Wörterbücher beziehen (Kap. 2). Selbst die Literatur des vergangenen Jahrzehnts blendet die elektronischen Wörterbücher noch weitgehend aus. Inwieweit die Forderungen aus der Metalexikographie umgesetzt wurden, soll an aktuellen deutschen Print- und elektronischen Wörterbüchern - sowohl allgemeinsprachlichen als auch Lernerwörterbüchern - überprüft werden (Kap. 3). Der Überblick wird von einer umfangreichen Literaturliste zur Thematik abgeschlossen (Kap. 5). Warum sollte ein Wörterbuch Wortbildungsangaben enthalten? Was haben die Nutzerinnen und Nutzer davon? Durch Zusammensetzungen und Ableitungen entstehen Beziehungen zwischen Stämmen, Stammteilen und Morphemen, und bilden ein „komplexes Geflecht von Verbindungen zwischen [den] Lexemen“ (Mugdan 1984, S. 274). Dieses Beziehungsgeflecht tritt in gedruckten Wörterbüchern durch die lineare Anordnung der Stichwörter jedoch oft nicht hervor. Dass zu dem Verb springen auch der Sprung gehört, dass das Adjektiv häuslich mit dem Nomen Haus assoziiert ist, dass mit dem Suffix -lich weitere Nomen zu Adjektiven abgeleitet werden können, die bedeuten, dass eine Sache wie X ist, oder dass das Nomen Zug auch in den Zusammensetzungen Zugzwang und Nachtzug enthalten ist, erschließt sich in strikt glattalphabetischen Anordnungen nicht. Holly (1986, S. 203) beklagt deshalb nicht ohne Grund eine „Atomisierung“ des Wortschatzes in den Wörterbüchern und oft auch „in den Köpfen der Benutzer“. Sabina Ulsamer 14 Dabei können Wortbildungsangaben in Textproduktionssituationen orthographische Unsicherheiten klären, beispielsweise ob eine Zusammensetzung mit oder ohne Fuge gebildet wird (Bergenholtz 2000, S. 25). Außerdem, so wird häufig argumentiert, geben Wortbildungsangaben Anregungen zur stilistischen Variation zwischen Wortverbindung und Wortbildung sowie Textformulierungshilfen durch Wortbildungsangaben mit Lexemen, die mit demselben Kernmorphem Handlungen (kaufen, sammeln), Ergebnisse der Handlung (Kauf, Sammlung) und Ausführende der Handlung (Käufer, Sammler) bezeichnen. Gerade Lerner müssen sich das Wissen um die Vernetzungen zwischen diesen Wortbildungen als Teil ihrer Fremdsprachenkompetenz erst erschließen, wie Barz (2001, S. 87) herausstellt. Dazu müssen Motivationsbeziehungen bewusst gemacht werden, was mit der Darstellung von Wortfamilien und der Lemmatisierung von Wortbildungselementen wie Affixen, Affixoiden und Konfixen erreicht werden kann. Poethe (1996, S. 190) sieht in der Lemmatisierung von Wortbildungselementen eine Anleitung, um von den Morphemen bzw. Konstituenten aus Wortbaumuster zu realisieren. Nicht nur bei der Produktion eines Textes - sowohl in der Muttersprache als auch in der Fremdsprache -, sondern auch bei der Textrezeption können Wortbildungsangaben helfen, auch unbekannte und nicht lemmatisierte Wörter sowie Ad-hoc-Bildungen semantisch zu erschließen. So wird man beispielsweise ein Wort wie sousaphonesk aus dem folgenden Korpusbeleg kaum in einem Wörterbuch finden: Es folgte das straffe, fast schneidende, hochkorrekte Deutsch von Kulturminister Bernd Neumann, bevor Michael Glos den Bass anstimmte und fast schon sousaphonesk im leicht synkopierten bayrischen Sound die „Bopkomm“ eröffnete. (Berliner Zeitung, 20.09.2007; Die Politik beschwört den Klinsmann- Effekt [S. 30]). DUW (2001, S. 1472, Sp. 1) bietet die Information, dass ein Sousaphon ein Musikinstrument ist. Der Leser kann damit das Wort zumindest segmentieren. Tatsächlich findet sich auch ein Eintrag -esk (DUW 2001, S. 495, Sp. 2), der Licht in die Sache bringt (auch wenn er den besonderen stilistischen Effekt des Suffixes nicht erfasst): -esk: [...] drückt in Bildungen mit Substantiven (meist Namen) aus, dass die beschriebene Person oder Sache vergleichbar mit jmdm., etw. oder dem ähnlich ist/ in der Art von jmdm., etw. Das Bewusstsein von Wortbildungszusammenhängen trägt also zum Erschließen der Bedeutung bei (Poethe 2005, S. 301). Ferner leisten Wortbildungspro- Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 15 dukte einen Beitrag zur Differenzierung des Bedeutungsspektrums eines Stichwortes, sie können Bedeutungsvarianten der Ausgangslexeme deutlich machen. Mit dem Erlernen von Wortbildungsbeziehungen und -regeln wird außerdem die Vernetzung im mentalen Lexikon unterstützt, was der Erweiterung des Wortschatzes in der Fremdsprache dient. 1 Das Wissen um Wortbildungsregeln leistet einen Beitrag zur Struktur des mentalen Lexikons. Denn, so argumentieren ten Hacken/ Abel/ Knapp (2006, S. 245), ein organisiertes mentales Lexikon sei die Basis für den effizienten Erwerb neuer Wörter. Sind die Wörter im mentalen Lexikon durch viele strukturelle Links verknüpft, können die neuen Wörter wiederum mit diesen verbunden werden. Wortbildungsregeln können solche Links zur Verstärkung des mentalen L2-Lexikons 2 bereitstellen. Wortbildung verlangt das Wissen um und die Anwendung neuer Regeln, so ten Hacken/ Abel/ Knapp (ebd., S. 244). Die Regelmäßigkeit bestimmter Wortbildungsprozesse befähige den Lerner, neue Wörter zu bilden, sofern die Bedingungen zur Produktivität der Regel beachtet werden. Angaben zur Wortbildung können also die allgemeine Benutzbarkeit und Effektivität der Wörterbücher erhöhen (Müller 1982, S. 154), sie bleiben offen und auskunftsfähig für kommende Neuwörter und Ad-hoc-Bildungen (Müller 1989, S. 879). 2. Gestaltung von Wortbildungsbeziehungen im gedruckten Wörterbuch Die im Folgenden vorgebrachten Empfehlungen zur Gestaltung von Wortbildungsbeziehungen beziehen sich auf gedruckte Wörterbücher. Obwohl die alphabetische Anordnung der Stichwörter Wortbildungszusammenhänge nur unzureichend wiedergeben kann, wird sie aufgrund ihrer raschen Nachschlagemöglichkeit, Übersichtlichkeit und der Tatsache, dass sie kein Wortbildungswissen voraussetzt, bevorzugt. Grundlegend kristallisieren sich zwei Ideen heraus, wie Wortbildungszusammenhänge trotz alphabetischer Ordnung im Wörterbuch präsentiert werden können. Die eine ist die Anordnung in Wortbildungsnestern oder -nischen, die andere umfasst standardisierte und formelhafte Bedeutungsparaphrasen, über die sowohl Strukturzusammenhän- 1 Bei der Konzeption des Internet-Lernerwörterbuchs ELDIT wurde versucht, diese Erkenntnis umzusetzen (vgl. ten Hacken/ Abel/ Knapp 2006). 2 L2-Lexikon: mentales Lexikon der Zweitsprache im Unterschied zum L1-Lexikon, dem Lexikon der Erstbzw. Muttersprache. Sabina Ulsamer 16 ge als auch Wortbildungsmuster verdeutlicht werden sollen. Zusätzlich sollte das Verweissystem ausgebaut werden, um Wortbildungsbeziehungen sichtbar zu machen. 2.1 Makrostrukturelle Empfehlungen Bevor über die Anordnung der Stichwörter diskutiert werden kann, muss die Frage geklärt werden, nach welchen Kriterien die Lemmaauswahl erfolgen sollte. Die Lemmaauswahl ist abhängig vom jeweiligen Konzept des Wörterbuchs, aber für allgemeinsprachliche Bedeutungswörterbücher sowie Lernerwörterbücher gilt die Frequenz der Bildungen im zugrunde gelegten Wörterbuchkorpus als entscheidend. Bei Wortelementlemmata sollten diejenigen aufgenommen werden, die im Korpus durch eine hinreichende Anzahl an Wortbildungen belegt sind und deren Semantik so eindeutig ist, dass sich mit ihnen auch die Bedeutung nicht verzeichneter Bildungen erschließen lässt. Für Klosa (2008, S. 214) führt die Korpusgestütztheit bei der Auswahl der Lemmata zu einem Qualitätsgewinn nicht nur in allgemeinsprachlichen Bedeutungswörterbüchern, sondern besonders auch in Lernerwörterbüchern. Für De Caluwe/ Taeldeman (2003, S. 122) sollte ein Wörterbuch, d.h. ein allgemeinsprachliches Bedeutungswörterbuch, alle Simplizia als Einträge enthalten sowie alle Derivate, die opak sind. Für elektronische Wörterbücher gibt es - abgesehen vom zeitlichen Aufwand bei der Bearbeitung und vom zugrunde liegenden Konzept - wenig bis gar keine strukturellen Begrenzungen. Hier können alle Komposita und Derivate - auch transparente - aufgeführt werden. Für Lernerwörterbücher spielen der didaktische Wert und die Bedeutung des Stichworts für die Alltagskommunikation eine wichtige Rolle (Seelig 2001, S. 66). Die Lemmaauswahl sollte repräsentativ in Bezug auf die Produktivität der Wortbildungstypen sein und die gegenwartssprachlich produktiven Lemmata berücksichtigen. Die Empfehlungen für die Gestaltung der Makrostruktur lassen sich noch weiter präzisieren: - Überblick zur Wortbildung in den Außentexten; - Liste der lemmatisierten Wortbildungselemente in den Außentexten; - Nennung von Komposita und Derivaten als Sublemmata im Wortartikel. Mugdan (1984, S. 303) und Holly (1986, S. 205) empfehlen für Wörterbücher im Allgemeinen, einen leicht verständlichen Überblick zum Thema Wortbildung sowie eine Anleitung zur Analyse zusammengesetzter und abgeleiteter Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 17 Wörter in die Außentexte zu integrieren. Speziell für Lernerwörterbücher fordert van der Colff (1998, S. 203) eine gründliche Erläuterung der grammatischen Regeln der Wortbildung in der Wörterbuchgrammatik. Hier sollte auf morphologische und semantische Restriktionen aufmerksam gemacht werden. In die Außentexte sollte auch eine Liste aller lemmatisierten Wortelementlemmata aufgenommen werden (Barz 2003, S. 384). Für die Dokumentation von Wortbildungsbeziehungen stellt Barz (2001, S. 88) zwei mögliche Zugänge heraus: Einerseits kann von primären Wörtern ausgehend die Analyse ihrer Wortbildungsaktivität stattfinden, „durch die man die Entfaltung der Wörter in der Wortbildung erfassen und in Wortnester gruppieren kann“ (ebd.). Andererseits kann von sekundären, d.h. gebildeten Wörtern ausgehend der jeweils letzte Wortbildungsschritt rekonstruiert werden, wodurch man die unmittelbaren Motivationsbeziehungen ermittelt und zu Wortbildungstypen kommt (ebd., S. 89). Barz' erster Zugang wird durchweg in der Forschungsliteratur gefordert: Komposita und Derivate sollten als Sublemmata im Wortartikel des Kernwortes genannt werden. Diese sollten jedoch nicht einfach alphabetisch und kommentarlos am Ende des Eintrages aufgelistet werden. Stattdessen wird die Gruppierung in Wortbildungsnestern oder -nischen empfohlen, um die Vernetzungen des Kernwortes mit den Ableitungen und Zusammensetzungen aufzuzeigen (Kempcke 1992). Komposita sollten auch etwas zum „onomasiologischen Teil der Interpretamente“ (Holly 1986, S. 205) beitragen. Dazu müssten sie nach Bedeutungsvarianten der jeweiligen Kompositateile geordnet sein, da auf diese Weise die Beziehungsbedürfnisse im Wortfeld, zu dem das Basislemma gehört, hervortreten (ebd.). Grundsätzlich sollte auch auf Bedeutungserläuterungen nicht verzichtet werden, um dem Sprachlerner keine Interpretationsmöglichkeit zu lassen, so van der Colff (1998, S. 202). Ebenso wenig dürften die Angaben zur Flexion (‘Genitiv Singular, Nominativ Plural’) fehlen. Gerade die Nennung weiterer Wortbildungsprodukte im Stichwortartikel sei für Lerner hilfreich, da sie signalisieren, dass die eingetragenen Produkte geläufig sind (Klosa 2005, S. 153). Solche Informationen zur Wortbildungsproduktivität ermöglichten, Wortbildungsmuster zu erlernen, die zu eigenen korrekten Bildungen und Verwendungen sowie regelhaften Ad-hoc-Bildungen befähigen. Klosa (2008, S. 208) zeigt auf, dass größere Mengen regelhafter Bildungen die Aufmerksamkeit auf die sprachlichen Regularien lenken und damit bewusstes Lernen ermöglichen und den Spracherwerb unterstützen. Angaben zur Produktivität geben Aufschluss über die Wahrscheinlichkeit weiterer Verbindungen, in denen die als Stichwort aufgenommenen Wortbildungselemente vorkommen können (Poethe 1996, S. 202). Sabina Ulsamer 18 Immer wieder wird betont, dass nur durchsichtige Komposita (und Derivate) aufgeführt oder in den Nestern angegeben werden dürfen, d.h. solche, bei denen alle Glieder in der synchronischen Bedeutungsparaphrase auftreten (van der Colff 1998, S. 202). Synchron nicht mehr zu erschließende und idiomatisierte Komposita dürfen nicht in der Wortfamilie des Kernwortes aufgelistet werden, da sie, so Vachková (2002, S. 124), keinen bzw. einen fehlerhaften Einblick in das synchrone Sprachbewusstsein des muttersprachlichen Sprechers gewähren. Derivate, die in ihrer Form-Inhalt-Beziehung oder in ihrer Verwendung nicht vorhersagbar sind, sollten als eigene Einträge in der Stichwortliste aufgeführt werden, so De Caluwe/ Taeldeman (2003, S. 122). 2.2 Mikrostrukturelle Empfehlungen 2.2.1 Komposita und Derivate Wortbildungsmuster können bei Komposita und Derivaten durch feste Formeln in der Bedeutungsbeschreibung verdeutlicht werden (Motsch 1982, S. 69). Bei nicht-isolierten Bildungen sollte in der Bedeutungsbeschreibung das Basislexem wiederkehren. Barz (2001, S. 89) fordert standardisierte und „motivierende“ Bedeutungsparaphrasen, da sie Informationen über die Einzelbedeutung des Lemmas, aber auch über Strukturzusammenhänge liefern. Unter „motivierenden Bedeutungsparaphrasen“ für Komposita versteht Barz (2001, S. 91), dass 1) beide Konstituenten des Wortbildungsprodukts selbst in der Paraphrase vorkommen, z.B. „Vase für Blumen“ als Paraphrase zu Blumenvase, wie es im DDaF (2003, S. 180, Sp. 2) expliziert wird; 2) beide Konstituenten verwendet und mit Ergänzungen versehen werden, wobei auch andere Wortbildungsprodukte desselben Wortbildungsnestes zur Erklärung dienen können, wie dies z.B. der Eintrag Süßspeise aus dem LGWDaF (2008, S. 1048, Sp. 1) zeigt: „süße Speise, die man besonders als Dessert isst“; 3) nur eine unmittelbare Konstituente verwendet wird, die andere wird durch ein Hyperonym, Synonym oder Kohyponym ersetzt. Als Beispiel sei hier der Eintrag zu Leberknödel aus Wahrig (2006) genannt: „Kloß aus feingeschnittener Leber u.a. Zutaten“ (ebd., S. 930, Sp. 1). Problematisch ist natürlich, dass unter Umständen das verwendete Synonym nicht bekannt ist; Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 19 4) anstelle einer Paraphrase oder zusätzlich zu dieser ein Wortbildungssynonym genannt wird, dessen Bedeutungsexplikation an anderer alphabetischer Stelle erfolgt, wie Barz (2001, S. 91) mit dem Eintrag Tannenbaum „Weihnachtsbaum“ im DGWDaF (2000, S. 1011, Sp. 2) zeigt. Eine motivierende Bedeutungsparaphrase ist natürlich nur bei durchsichtigen Komposita möglich, für demotivierte Bildungen müssen andere Paraphrasen gefunden werden. Aber nicht nur für Komposita eignen sich motivierende Paraphrasen, auch substantivische Derivate können auf diese Weise beschrieben werden, wie Barz (2001, S. 91 ) deutlich macht. Dabei kann entweder 5) die Derivationsbasis oder ein anderes Glied des Wortbildungsnestes in der Paraphrase auftreten: Beurteilung „Schriftstück, mit dem etw., jmd. beurteilt wird“ (DGWDaF 2000, S. 155, Sp. 2) oder 6) statt der Paraphrase ein Wortbildungssynonym genannt werden: Lieferung „1. das Liefern“ (DUW 2001, S. 1019, Sp. 3). Barz (2001, S. 90) weist aber auch darauf hin, dass motivierende Paraphrasen gerade für Affixe als Konstituenten schwierig sind, da sie nicht frei vorkommen, sondern ersetzt werden müssen. Die standardisierte Bedeutungsparaphrase empfiehlt sie dagegen für Wortbildungsprodukte einer Wortbildungsreihe, sodass die Paraphrasen eines Derivationstyps auf die gleiche Weise formuliert werden. Der unter 6) genannte substantivierte Infinitiv für Nomina Actionis auf -ung ist demnach auch eine standardisierte Bedeutungsparaphrase, z.B. Überflügelung „das Überflügeln“ (DUW 2001, S. 1622, Sp. 1). Standardisierte Bedeutungsparaphrasen in der Mikrostruktur sind laut Barz (2001, S. 92) besonders hilfreich für die Erfassung von Wortbildungsbeziehungen. Eine solche Paraphrase ermögliche die Unterscheidung von motivierten und unmotivierten Wortbildungsprodukten, gebe Anleitungen zum bedeutungsgerechten Segmentieren komplexer Lemmata und damit implizit zu analogischen Neubildungen, stelle morphosemantische Beziehungen zwischen Ausgangs- und Zielwort her und vermittle in standardisierten Formen Wissen über Bildungstypen. Bei der „Verwendung von Wortbildungssynonymen zur Bedeutungsexplikation“ ergeben sich „Einsichten in die Wortbildungsaktivität des Kernwortes eines Wortbildungsnestes“ (ebd.). Fraglich bleibt allerdings, inwiefern eine Paraphrase wie „das Überflügeln“ die Bedeutung von Lexemen wie Überflügelung tatsächlich paraphrasiert. Sabina Ulsamer 20 De Caluwe/ Taeldeman (2003, S. 121) empfehlen, dass bei Derivaten „the most recent step taken in the morphological history of that word be made clear to the dictionary user“. Hier sprechen sie ganz im Sinne von Barz' zweitem Zugang zu Wortbildungsbeziehungen in Wörterbüchern, nämlich von sekundären Wörtern ausgehend den letzten Wortbildungsschritt zu rekonstruieren, sodass Motivationsbeziehungen ermittelt werden (Barz 2001, S. 89). Diese Darstellungsweise bettet das Wort und seine Bedeutungen in einen größeren Zusammenhang und gibt so einen Einblick in die Entwicklung eines Wortes (De Caluwe/ Taeldeman 2003, S. 122). Die beiden Autoren befürworten außerdem, den Nutzern Informationen zur Frequenz und Verwendung eines Stichwortes sowie zu seinem Vorkommen im Korpus anzubieten. 2.2.2 Wortelementlemmata Artikel zu Wortelementlemmata sollten nach Lesarten differenziert werden und neben der Bedeutungserläuterung die folgenden Angaben enthalten: − Angabe der Basiswortart(en), - Angabe zur Wortart der Ausgabewörter, - Angabe zu orthographischen Veränderungen an der Basis, - Angabe zu Betonungsverschiebungen, - Angaben zur Flexion und - Angabe von Allomorphen. Nach Barz (2001, S. 91) dienen Affixe dann der Vernetzungsrepräsentation, wenn sie separat lemmatisiert sind und in ihren Artikeln die Bedeutungen in Varianten differenziert werden, „so dass dann die jeweils in Frage kommende Variante im Stichwortartikel des motivierten Wortbildungsprodukts genannt werden kann“. Durch die Angaben zur Wortart der möglichen Basen und zur Wortart der Bildungen werde die aktive Benutzung von Wortneubildungen unterstützt (Barz 2003, S. 388). Im LGWDaF (2008) wird beispielsweise bei Affixen mit der Formulierung „im Subst.“ bzw. „im Adj.“ ausgedrückt, in welchen Wortarten das betreffende Affix verwendet wird. Zusätzlich wird dann erläutert, mit welchen Wortarten das Affix ein neues Wort von der anfänglich genannten Wortart bildet. So lautet der Eintrag zu -sam: im Adj., wenig produktiv; wird verwendet, um aus Verben u. Substantiven Adjektive zu machen (LGWDaF 2008, S. 906, Sp. 2). Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 21 Im Unterschied zu LGWDaF (2008) bringt das LDOCE (1995) den Ableitungsprozess durch eine Pfeilnotation zum Ausdruck. Nach Stein (1985, S. 40), die sich auf die Auflage von 1978 bezieht, werde auf diese Weise die wortgenerierende, dynamische Eigenschaft von Affixen am besten umgesetzt. Für jede Lesart wird der Ableitungsprozess durch Pfeile symbolisiert, beispielsweise „[n → adj]“ bei dem Suffixartikel -ate (LDOCE 1995, S. 68) in der Lesart ‘full of’ mit dem illustrierenden Beispiel affectionate. Das Nomen affection wird also durch das Suffix -ate zum Adjektiv. Dass Angaben zu orthographischen Veränderungen an der Basis nötig sind, wird im Deutschen bei dem Diminutivsuffix -chen deutlich. Hier müsste darauf hingewiesen werden, dass hintere Vokale im Stamm durch Anhängen des Suffixes umgelautet werden (Baum → Bäumchen, Stuhl→ Stühlchen), was nicht nur eine orthographische, sondern auch eine lautliche Änderung ist. Betonungsverschiebungen treten im Deutschen eher nicht auf, ähnlich gelagert sind im Deutschen jedoch die Akzentunterschiede bei Affixoiden. Bei Formengleichheit von Affixoiden und freien Elementen müssen Akzentunterschiede angegeben werden, die nämlich gerade das „normale“ von dem affixoiden Kompositum unterscheiden, wie Barz (2002, S. 117) an dem Beispiel 'Bombenanschlag vs. Bomben'stimmung zeigt. Unverzichtbar sind grammatische Angaben zur Flexion und zum syntaktischen Gebrauch auch bei Artikeln zu Wortbildungsmitteln. Das DGWDaF (2000) verweist bei substantiv- und adjektivbildenden Suffixen auf die entsprechenden Wortbildungsprodukte, weil dort bereits Flexion und syntaktischer Gebrauch angegeben werden. Diese einerseits ökonomische Lösung mache es andererseits aber schwierig, so Barz (2002, S. 117), nicht lemmatisierte Wortbildungsprodukte semantisch und grammatisch zu erschließen. Gerade die Lemmatisierung von Wortbildungsmitteln sollte ja den Zugang zu Wörtern, die nicht im Wörterbuch stehen, erleichtern. Durch das Weglassen der grammatischen Angaben bei Wortelementlemmata wird aber dieses Ziel nicht erreicht. So lautet beispielsweise der Artikel zu dem Affixoid -würdig: / bildet mit einem Subst. als erstem Bestandteil Adjektive; drückt aus, dass man das im ersten Bestandteil Genannte tun sollte/ : z.B. erbarmungswürdig (DGW- DaF 2000, S. 1241, Sp. 2). Erst wenn man dem angegebenen Beispiel erbarmungswürdig folgt, das auch noch in der Artikelnische zu erbarmungslos versteckt ist, erfährt man dann: -würdig <Adj.; Steig. reg., ungebr.> (DGWDaF 2000, S. 288, Sp. 1). Sabina Ulsamer 22 Barz (2003, S. 386) empfiehlt ferner, beim Haupteintrag eines Affixes auch alle Allomorphe unmittelbar nach dem Lemma aufzuführen, auch wenn dadurch die alphabetische Ordnung durchbrochen wird. Die Nennung der Allomorphe erspare dem Nutzer weitere Nachschlagehandlungen. So sollten beispielsweise bei dem Präfix indie Allomorphe il-, im- und iraufgelistet werden. 2.3 Mediostrukturelle Empfehlungen Um die Beziehungen zwischen lexikalischen Einheiten stärker zu verdeutlichen, empfiehlt Kempcke (1992, S. 177), Artikel zu Wortbildungsmitteln nicht im „luftleeren Raum“ zu lassen, sondern mit Wörterbuchartikeln dieses Bildungstyps zu vernetzen. Von dem Affixartikel sollte auf Wortbildungen mit diesem Affix verwiesen werden und analog von der Wortbildung auf den Affixartikel. Barz (2003, S. 391) und Prćić (1999, S. 274) plädieren dafür, auch synonyme Affixe anzugeben und durch Verweisangaben sichtbar zu machen, z.B. Verweise zwischen -bar und -abel oder zwischen -lich und -isch oder -sam. Barz (2003, S. 391) schlägt nicht ohne Grund vor, Verweise großzügiger zu nutzen, da sie „Einsichten in verschiedenartige systemhafte Relationen zwischen lexikalischen Elementen oder Wortbildungstypen“ ermöglichen, die eine glattalphabetische Ordnung der Lemmata oft verdeckt. Hierzu gehören auch Verweise in die Wörterbuchgrammatik, wo die Grundzüge der Wortbildung erläutert werden sollten. Mit Barz (2001, S. 89) kann folgendes Fazit gezogen werden: Makro-, Mikro- und Verweisstruktur bieten genügend Raum für Wortbildungsdaten. Auch eine alphabetische Ordnung und die Darstellung der „morphologisch-motivationellen Vernetzung“ (ebd., S. 97) schließen sich nicht aus: Bei glattalphabetischer Ordnung kann die Vernetzung über motivierende und standardisierte Bedeutungsparaphrasen, über Wortbildungssynonyme im Stichwortartikel sowie über Verweiseinträge auf Haupteinträge an anderen alphabetischen Orten und über die Lemmatisierung von Wortbildungsmitteln hergestellt werden (ebd.). 3. Umsetzung in Wörterbüchern: Wörterbuchvergleich Nachdem die Vorschläge zu Wortbildungsangaben aus der Metalexikographie dargelegt wurden, soll an aktuellen Print- und elektronischen Wörterbüchern untersucht werden, inwieweit die Forderungen aus der Forschung umgesetzt werden. Es wurden insgesamt sieben gedruckte und sieben elektronische Wörterbücher ausgewählt. Bei den Printwörterbüchern liegt mit fünf Produk- Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 23 ten der Schwerpunkt auf solchen für Lerner, unter den im Internet oder auf elektronischen Datenträgern verfügbaren Wörterbüchern ist das Verhältnis umgekehrt: fünf allgemeinsprachliche Wörterbücher und zwei Lernerwörterbücher. Für den Vergleich wurden zunächst allgemeine Charakteristika wie die Integration von Übersichten zu Wortbildung, Wortfamilien und lemmatisierten Wortelementlemmata in den Außentexten untersucht. Im Anschluss daran wurden die Wortartikel selbst betrachtet. Mit einer Auswahl an Testwörtern wurden die Kriterien in den Stichworteinträgen der einzelnen Wörterbücher überprüft. Zunächst wurden die Einträge zu nominalen Simplizia untersucht. Hier wurde evaluiert, ob und wie in den Wortartikeln Komposita und Ableitungen genannt und als Verweise bzw. Hyperlinks realisiert werden. Anschließend wurden die Wortartikel zu Komposita im Hinblick auf motivierende Bedeutungsparaphrasen, Rekonstruktion des letzten Wortbildungsschrittes und Kennzeichnung der Bedeutungsvarianten der Ausgangslexeme genauer betrachtet. Für Derivate wurden die gleichen Kriterien überprüft, wobei im Falle von Derivaten nicht motivierende, sondern standardisierte Bedeutungsparaphrasen gemeint sind. Zusätzlich wurden die Artikel daraufhin durchgesehen, ob die Wortbildungsregel dargestellt und auf das entsprechende Wortelementlemma verwiesen wird. An ausgewählten Wortelementlemmata wurden die Kriterien Bedeutungserläuterung, Lesartenunterscheidung, Angabe der Basiswortart und der resultierenden Wortart, Angabe von Allomorphen, Betonungsvariationen und Beispielen sowie Verweise auf Ableitungen, die mit diesen Wortelementlemmata gebildet werden, geklärt. 3.1 Printwörterbücher 3.1.1 Allgemeinsprachliche Wörterbücher Exemplarisch wird hier die Evaluation der beiden untersuchten allgemeinsprachlichen Wörterbücher Wahrig Deutsches Wörterbuch (Wahrig 2006) und Duden Deutsches Universalwörterbuch (DUW 2001) ausführlich und im Detail beschrieben. Die Beschreibung der übrigen Wörterbücher wird dann knapper ausfallen. Wahrig (2006) und DUW (2001) führen beide keine Übersichten zu Wortfeldern, Sachgruppen oder Wortfamilien auf. Im DUW (2001, S. 29-71) gibt es eine umfangreiche Übersicht zur deutschen Grammatik, wobei zu Substantiven (S. 51), Adjektiven (S. 58) sowie Adverbien (S. 60) die jeweils spezifi- Sabina Ulsamer 24 sche Wortbildung kurz erläutert wird. Über die Kriterien zur Lemmaauswahl gibt nur Wahrig (2006) Auskunft: korpus- und frequenzbasiert. Die Einträge zu den nominalen Simplizia werden in Wahrig (2006) - nach Lesarten getrennt - vorrangig um Komposita ergänzt, in denen das Stichwort Grundwort ist. Allerdings sind die Komposita selbst nicht als eigene Stichwörter lemmatisiert. DUW (2001) führt in den Einträgen zu Simplizia weder Komposita noch Derivate auf, in die das Simplexstichwort eingeht. Beide Wörterbücher geben bei Komposita keinen Hinweis auf den letzten Wortbildungsschritt, wie mit Wörtern wie Eiskunstlauf, Bushaltestelle und Hausaufgabenbetreuung getestet wurde. Transparente Komposita wie Blumenvase oder Schiffsarzt sind lemmatisiert. Die Verwendung motivierender Bedeutungsparaphrasen für Komposita, wie sie unter Kapitel 2.2.1 dargelegt wurden, konnte mit den Wörtern Blumenvase, Tagesmutter, Süßspeise und Weihnachtsbaum überprüft und für Wahrig (2006) und DUW (2001) bestätigt werden. Auf die jeweilige Lesart der Ausgangslexeme eines Kompositums weist DUW (2001) in den Bedeutungsparaphrasen hin, wie man an Kiefernwald „Wald aus hochstämmigen 2 Kiefern“ (ebd., S. 896, Sp. 2) und im Vergleich dazu Kieferanomalie „Anomalie des 1 Kiefers“ (ebd., S. 896, Sp. 1) sieht. Diese beiden Bedeutungserläuterungen sind auch gute Beispiele für motivierende Paraphrasen. Anhand der Lemmata Häuslichkeit, Misshandlung und Nutzbarkeit wurde festgestellt, dass Wahrig (2006) und DUW (2001) auch bei Derivaten den letzten Wortbildungsschritt nicht kennzeichnen. Die mikrostrukturellen Empfehlungen zu standardisierten Bedeutungsparaphrasen (vgl. Kap. 2.2.1) werden in DUW (2001) und Wahrig (2006) gut umgesetzt, wie mit den Nomina Actionis auf -ung Abberufung, Bewertung, Lieferung sowie Überflügelung überprüft wurde: 3 Abberufung [...] das Abberufen, Abberufenwerden (DUW 2001, S. 74, Sp. 3; Wahrig 2006, S. 94, Sp. 1); Bewertung [...] das Bewerten (DUW 2001, S. 283, Sp. 1; Wahrig 2006, S. 268, Sp. 3); Lieferung [...] das Liefern (DUW 2001, S. 1019, Sp. 3; Wahrig 2006, S. 946, Sp. 3); Überflügelung [...] das Überflügeln (DUW 2001, S. 1622, Sp. 1). Die Adjektivbildungen mit -ig wie seidig und seifig sind in beiden Wörterbüchern nicht so einheitlich dargestellt: 3 Die Fragwürdigkeit solcher Paraphrasen im Hinblick auf ihren semantischen Informationsgehalt wurde in Kapitel 2.2.1 bereits angesprochen. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 25 seidig [...] weich und glänzend wie Seide (DUW 2001, S. 1433, Sp. 1; Wahrig 2006, S. 1340, Sp. 3); seifig [...] a) voller Seife; Seife enthaltend b) wie Seife (DUW 2001, S. 1433, Sp. 2); 1. Seife enthaltend 2. schmierig wie Seife (Wahrig 2006, S. 1341, Sp. 1). Die Wortbildungsregel wird in beiden Wörterbüchern nicht angegeben. Obwohl Wortbildungselemente lemmatisiert sind, wird in Wortartikeln zu Ableitungen nicht auf die Wortelementlemmata hingewiesen, wie der Eintrag zu Disharmonie deutlich macht: Disharmonie [...] 2 <fig.> Unstimmigkeit, Uneinigkeit [<lat. dis- „ent-“ + Harmonie] (Wahrig 2006, S. 375, Sp. 3). So finden sich in Wahrig (2006, S. 375, Sp. 2) zwar zwei Wortelementlemmata zu dem Präfix dis-: dis...1, Dis...1 [...] auseinander..., weg... [lat.], dis...2, Dis...2 [...] zweimal, doppelt [grch.], im oben genannten Artikel zu Disharmonie wird aber nicht erwähnt, dass sich das Nomen aus Harmonie und der Vorsilbe ‘Dis...1’ zusammensetzt. Erstaunlich ist auch, dass bei beiden Lesarten nicht die Variante di-/ Diangegeben wird. Das verwundert umso mehr, als der darauffolgende Artikel nämlich Disacharid ist: Di|sa|cha|rid [...] aus zwei Monosachariden entstandenes Kohlenhydrat [...] [<grch. di- „zwei“ + Sacharid] (Wahrig 2006, S. 375, Sp. 2). Die Bedeutungserläuterung gebraucht das Zahladjektiv zwei, was der Wörterbuchnutzer vermutlich implizit mit ‘dis...2’, ‘Dis...2’ in Verbindung bringt, aber aus den Angaben im Artikel nicht explizit hervorgeht. Die Angabe ‘di- „zwei“’ kann man als potenziellen Verweis auffassen, und tatsächlich ist in Wahrig (2006, S. 365, Sp. 2) dilemmatisiert und verweist auf die beiden Lesarten: di... <Vorsilbe> → dis...1, dis...2. Wenigstens wird im Artikel Disacharid kein Verweis auf digesetzt, sonst hätte man eine Art Zirkelverweis. Das DUW (2001, S. 383, Sp. 1) lemmatisiert dagegen nur die in Wahrig (2006) als erste Lesart von disgenannte lateinische Form: dis-, Dis- [lat. diseigtl. = entzwei]: drückt in Bildungen mit Verben, Substantiven oder Adjektiven eine Verneinung, das Gegenteil von etw. aus: disharmonieren, disqualifizieren [...]. Sabina Ulsamer 26 Im Artikel zu Disacharid heißt es „aus griech. dís (di) = zweimal [...]“ (DUW 2001, S. 381, Sp. 1). Ein Eintrag zu diist nicht vorhanden. Auch bei Wortbildungen mit den nativen Suffixen -sam und -heit wie in duldsam und Sicherheit wird weder in Wahrig (2006) noch in DUW (2001) auf die lemmatisierten Suffixe verwiesen. Um produktive Wortbildungsregeln zu erlernen und selbst anwenden zu können (vgl. Kap. 2.3) wäre aber gerade das notwendig. Sowohl in Wahrig (2006) als auch in DUW (2001) werden zwar in den Einträgen zu den Affixen Beispiele von Wörtern genannt, die mit diesen Elementen gebildet werden, aber leider erfolgt von den entsprechenden Derivaten in der Stichwortliste kein Verweis auf die Artikel zu den Wortelementlemmata. Sie bleiben somit zwar nicht im „luftleeren Raum“ (Kempcke 1992, S. 177), aber für eine „Korrespondenz“ von Wortelementlemma und Ableitung im Sinne Kempckes (1992) müssten die Wortartikel der Derivate wieder auf die Artikel der Affixe und anderer Wortbildungselemente zurückverweisen. Bedauerlich ist auch, dass die Forderung von Barz (2001, S. 91), im Artikel des Derivats die jeweils infrage kommende Lesart des Affixes zu nennen, nicht umgesetzt wird. Wahrig (2006, S. 447, Sp. 3) nennt für das Präfix ent-/ Entzwar drei verschiedene Lesarten und gibt neben der Bedeutungserläuterung auch jeweils ein bis zwei Beispiele an: ent..., Ent... <Vorsilbe; in Zus.> 1 von etwas weg, aus ... heraus, zum Gegenteil hin, z. B. entfließen, entschuldigen 2 wegnehmen (von), z. B. entölen 3 beginnen, z. B. entbrennen, entfachen [...] (Wahrig 2006, S. 447, Sp. 3; Fett- und Kursivdruck i.Orig.). Bei den entsprechenden Verben (vgl. Abb. 1 und 2) wird jedoch nicht kenntlich gemacht, auf welche Bedeutungsvariante des Präfixes sich die Bildung bezieht. Das Verb entfließen als Beispiel der ersten Bedeutung ist außerdem im Wörterbuch gar nicht gebucht. Abb. 1: Wahrig (2006, S. 454, Sp. 3 und 452, Sp. 3): Ausschnitte aus den Artikeln entschuldigen (erste Lesart von ent-) und entölen (zweite Lesart von ent-) Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 27 Abb. 2: Wahrig (2006, S. 448, Sp. 2 und 449, Sp. 1): die Wortartikel entbrennen und entfachen (jeweils dritte Lesart von ent-) Nachdem keine Übersichten zu Wortfamilien oder Wortfeldern in die Makrostruktur der beiden Wörterbücher integriert sind, kann auch nicht auf solche aus den Artikeln der Komposita und Derivate heraus verwiesen werden. In den Artikeln selbst werden im Unterschied zum Lernerwörterbuch DGWDaF (2000) keine Wortfamiliengruppen angegeben. In beiden Wörterbüchern sind sowohl native als auch nichtnative Affixe und Affixoide sowie Konfixe lemmatisiert. Wahrig (2006) und DUW (2001) lemmatisieren unterschiedlich viele Wortbildungselemente, aber zu allen gebuchten werden auch Bedeutungserläuterungen gegeben. Die Basiswortart, die ein Affix zur Wortbildung benötigt, wird in Wahrig (2006) nicht erwähnt, wie der Eintrag zu -sam veranschaulicht: ...sam <in Zus.; zur Bildung von Adj.> von bestimmter Beschaffenheit, eine Tätigkeit ausübend, z.B. strebsam, unbeugsam [urspr. selbstständiges Wort mit der Bedeutung „von gleicher Beschaffenheit“, [...] (Wahrig 2006, S. 1263, Sp. 1). Wie man sieht, lässt sich nur aus den angegebenen Beispielen schließen, dass sich -sam mit Verben verbindet. Immerhin erfährt der Nutzer, dass das Affix zur Bildung von Adjektiven gebraucht wird. Der Eintrag zu -sam im DUW (2001, S. 1344, Sp. 2) dagegen differenziert in drei Lesarten und formuliert für jede Lesart, mit welcher Ausgangswortart die jeweilige resultierende Wortart gebildet wird: -sam [...] 1. drückt in adj. Bildungen mit Verben (Verbstämmen) aus, dass mit der beschriebenen Person oder Sache etw. gemacht werden kann; -bar (1): einfügsam, lenksam, biegsam. 2. drückt in adj. Bildungen mit Verben (Verbstämmen) aus, dass die beschriebene Person oder Sache etw. tut; -lich (3): bedrohsam, nachdenksam. 3. drückt in adj. Bildungen mit Substantiven aus, dass die beschriebene Person oder Sache von etw. erfüllt ist oder etw. bereitet: tugendsam, vergnügsam. (DUW 2001 S. 1344, Sp. 2-3). Sabina Ulsamer 28 Außerdem werden für jede Lesart Beispiele angegeben. Leider sind diese nicht immer in der Lemmaliste enthaltene Stichwörter. Von den Beispielen in der ersten Lesart ist beispielsweise nur biegsam lemmatisiert. Allerdings gehören lenksam und einfügsam auch nicht gerade zu häufigen Wörtern des Deutschen, wie eine Korpusrecherche in DeReKo, dem deutschen Referenzkorpus des IDS zur geschriebenen Sprache, mit 13 bzw. drei Treffern belegt. Wie von Barz (2003, S. 391) und Prćić (1999, S. 274) gefordert, werden aber sogar synonymische Wortbildungselemente angegeben (vgl. Kap. 2.3), jedoch nicht in Form von Verweisen. Der Wörterbuchbenutzer weiß somit nicht, ob er im Wörterbuch auch Näheres über -bar und -lich erfährt. In der Behandlung des Präfixes in- und seiner Allomorphe il-/ im-/ irsind sowohl Wahrig (2006) als auch DUW (2001) zu loben. Die Allomorphe sind alle lemmatisiert, verweisen in Wahrig (2006) aber immer auf in-. Dort wird dann die phonologische Verteilung der Varianten beschrieben. Beispiele wären hier noch wünschenswert gewesen. DUW (2001) hat ebenfalls alle Allomorphe gebucht und gibt bei jedem neben dem Verweis auf indie Bedeutungserläuterung an sowie den spezifischen Anlaut des Adjektivs, an das das jeweilige Allomorph affigiert: im- [ ↑ in-]: verneint in Bildungen mit Adjektiven, die mit m und p anlauten, deren Bedeutung: nicht: immateriell, immobil, implausibel (DUW 2001, S. 820, Sp. 1). Der Nutzer hat zwar bei jeder Variante die passende Information; vorteilhafter wäre aber gewesen, wie in Wahrig (2006) im Eintrag zu indie Verteilung der Allomorphe zu erläutern. In DUW (2001, S. 823, Sp. 3) heißt es dann lediglich „vor Konsonanten angeglichen zu il-, im-, ir-“. Auf den Betonungsunterschied zwischen Affixoid und freiem Lexem weisen sowohl Wahrig (2006) als auch DUW (2001) hin, wie mit den Präfixoiden B/ bomben- und R/ riesenüberprüft werden konnte. 3.1.2 Lernerwörterbücher Für den Vergleich wurden fünf Lernerwörterbücher ausgewählt: Langenscheidts Großwörterbuch Deutsch als Fremdsprache (LGWDaF) in der aktuellen Auflage von 2008, das Wörterbuch Deutsch als Fremdsprache unter der Leitung von Günter Kempcke von de Gruyter (DGWDaF 2000), das Duden Wörterbuch Deutsch als Fremdsprache von Hueber/ Duden (DDaF 2003), die zweite Auflage aus dem Jahr 2007 (HueberDaF 2007) und das Großwörterbuch Deutsch als Fremdsprache aus dem Hause Wahrig (WahrigDaF 2008). Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 29 Obwohl Barz (2001, S. 87) Wortbildungsnester als „außerordentlich förderliche Struktur für den Wortschatzerwerb bei Fremdsprachenlernern“ befürwortet, zeichnen sich bis auf das DGWDaF (2000) alle Lernerwörterbücher durch eine glattalphabetische Anordnung der Stichwörter aus. Das DGWDaF (2000) wählt eine nischenalphabetische Struktur, genauer eine so genannte komprimiertnischenalphabetische Makrostruktur mit lemmaexternen Nischeneingängen. 4 Lediglich im DGWDaF (2000) gibt es jedoch in den Artikeln Verweise zu Wortfeldern und Wortfamilien sowie eine Übersicht zu Wortfeldern in den Außentexten. In HueberDaF (2007, S. 22f.) werden im Rahmen der „Hinweise zur Benutzung des Wörterbuchs“ einige Begriffe aus der Wortbildung erläutert. Im WahrigDaF (2008, S. 22f.) wird im Rahmen der Einleitung unter „4. Das Wort, seine Zusammensetzungen und seine Ableitungen“ eine Einführung in die deutsche Wortbildung gegeben. Das DGWDaF (2000, S. 1320f.) listet in Tafel XV die im Wörterbuch lemmatisierten Wortbildungsmittel auf, wie von Barz (2003) gefordert (vgl. Kap. 2.1). Zur Lemmaauswahl macht nur WahrigDaF (2008) Angaben. Im Vorwort erfährt man, dass die Auswahl der Wörter anhand des „WAHRIG Textkorpus digital “ erfolgte, wobei „neben inhaltlichen Kriterien insbesondere die Häufigkeit ihres Vorkommens im Deutschen“ ausschlaggebend war (WahrigDaF 2008, S. 5). Eine Aussage zur Transparenz der ausgewählten Stichwörter findet sich in DGWDaF (2000, S. IX) in den „Erläuterungen zur Konzeption des Wörterbuches“: Komposita wurden „nur insoweit [ausgewählt], als sie in ihrer Bedeutung nicht transparent sind und zugleich im Alltag häufig vorkommen.“ Betrachtet man die Lemmatisierung und die Artikelgestaltung von Simplizia, so fällt auf, dass nur LGWDaF (2008) und WahrigDaF (2008) Komposita aufführen, die das entsprechende Simplex sowohl als Bestimmungswort als auch als Grundwort aufweisen. Im LGWDaF (2008) wird hierzu mit den Symbolen ‘K-: ’ und ‘-K: ’ eine Notation gewählt, die jeweils die Komposita einleitet, die die nominale Basis als erste Konstituente (K-: ) bzw. als zweite Konstituente (-K: ) enthalten. DDaF (2003) und HueberDaF (2007) nennen in den untersuchten Wortartikeln nur linkserweiterte Komposita, also Komposita, in denen das Simplex Grundwort (und um links davon stehende Komplemente erweitert) ist. Das DGWDaF (2000) listet am Ende der Simplexeinträge Begriffe aus der Wortfamilie zu dem Simplex auf. Die Komposita und Derivate werden innerhalb dieser Wortfamilie genannt. Obwohl reine Auflistungen von Wortbildungsprodukten am Ende eines Artikels kritisiert werden - so gehören für van der Colff (1998, S. 202) unbearbeitete Sublemmata sowie die 4 Zur Kritik an dieser Anordnung sei auf Wiegand (2002, S. 424) verwiesen, der sie als den zugriffsunfreundlichsten Untertyp der nischenalphabetischen Makrostrukturen bezeichnet. Sabina Ulsamer 30 Kompositionsreihen, wie sie im LGWDaF erscheinen, nicht in ein Lernerwörterbuch - verfahren alle untersuchten Wörterbücher auf diese Weise. Bedeutungserläuterungen oder grammatische Angaben werden nicht geboten. Der Ausschnitt aus LGWDaF (2008, S. 668, Sp. 2) zu dem Artikel Land 2 zeigt die von van der Colff (1998, S. 202) kritisierte Kompositionsreihe. Besonders die unkommentierte Nennung der Bestimmungswörter Länder und Landes ist fragwürdig. Land 2 das; -(e)s, Länder 1. ein Gebiet, das e-e Regierung hat u. politisch selbstständig ist [...] || K-: Länder-, -name; Landes-; grenze, -hauptstadt, -regierung, -sprache, -währung, -wappen || -K: Mittelmeer-, Urlaubs- (LGWDaF 2008, S. 668, Sp. 2; Fettdruck i.Orig.). Zur Lemmatisierung der in den Artikeln genannten Komposita kann für die untersuchten Wörterbücher anhand der Testwörter keine allgemeine Aussage getroffen werden. Einige sind als eigene Stichwörter angesetzt, einige nicht. Beispielsweise werden im Artikel Haus in HueberDaF (2007, S. 315, Sp. 1) die Zusammensetzungen Bauernhaus, Einfamilienhaus, Geschäftshaus, Hochhaus, Mietshaus, Reihenhaus und Wohnhaus genannt. Die ersten drei und Wohnhaus haben keinen eigenen Artikel, die anderen dagegen schon (Hochhaus, ebd., S. 329, Sp. 1; Mietshaus, ebd., S. 425, Sp. 1; Reihenhaus, ebd., S. 495, Sp. 2). Welches Kriterium dieser Lemmatisierungsentscheidung zugrunde liegt, erfährt man nicht. Derivate werden in WahrigDaF (2008) bei substantivischen Simplizia nicht genannt, sondern als eigene Lemmata in der Stichwortliste verzeichnet. So ist beispielsweise häuslich nicht unter Haus aufgeführt, sondern besitzt den Status eines selbstständigen Lemmas. Bei Verben und Adjektiven werden dagegen Ableitungen genannt. Häuslichkeit ist deshalb im Artikel häuslich (WahrigDaF 2008, S. 482, Sp. 1) zu finden. Ähnlich verfährt LGWDaF (2008). In den beiden Wörterbüchern aus der Kooperation von Duden und Hueber werden Ableitungen immer als eigene Lemmata behandelt. Auch in Adjektiv- oder Verbeinträgen werden keine Derivate genannt. Wo Komposita und/ oder Derivate in den Artikeln der nominalen Basen aufgeführt werden, sind diese auch nach Lesarten getrennt. Eine Rekonstruktion des letzten Wortbildungsschrittes bei Zusammensetzungen und Ableitungen nimmt keines der untersuchten Lernerwörterbücher vor. In DGWDaF (2000) wird bei Komposita allerdings auf die Ausgangslexeme verwiesen, sodass der Nutzer daraus schließen kann, wie ein Kompositum gebildet ist. Bei Derivaten wird - wenn sie einen eigenen Lemmaeingang haben - auf die Basis, z.B. das Verb, von dem es abgeleitet ist, verwiesen. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 31 Motivierende Bedeutungsparaphrasen werden von allen untersuchten Lernerwörterbüchern zur Erläuterung von Komposita verwendet. Die oben genannte (vgl. Kap. 2.2.1) Variante, hierfür eine unmittelbare Konstituente zu verwenden und die andere durch ein Hyperonym, Synonym oder Kohyponym zu ersetzen, wird in WahrigDaF (2008, S. 988, Sp. 1) beispielsweise für Tagesmutter verwendet: „Frau, die Kinder von berufstätigen Eltern tagsüber betreut“. Im Eintrag Weihnachtsbaum werden in WahrigDaF (ebd., S. 1139, Sp. 2) beide Konstituenten in der Paraphrase verwendet, mit Ergänzungen versehen, und zusätzlich wird ein Synonym genannt, bei dem auf die entsprechende Lesart verwiesen wird: Weihnachtsbaum [...] Nadelbaum, der zu Weihnachten ins Zimmer gestellt u. geschmückt wird; Syn Tannenbaum (2) (WahrigDaF 2008, S. 1139, Sp. 2). Die Bedeutungserläuterung in HueberDaF (2007, S. 688, Sp. 1) wiederholt nur die Konstituente Weihnachten und ersetzt Baum durch „(kleine) Tanne, Fichte, Kiefer“ und fährt dann fort: „die man zu Weihnachten bes. im Zimmer aufstellt und mit Kerzen und anderem schmückt“. Dass es sich bei Tanne, Fichte und Kiefer um Bäume handelt, muss der Lerner also erst nachschlagen. Vorteilhaft wäre bei Kiefer auch die Angabe der Lesart gewesen, gibt es doch einen Artikel 2 Kiefer [...] Nadelbaum mit langen, in Bündeln wachsenden Nadeln und kleinen Zapfen (ebd., S. 360, Sp. 2). Zur Bewertung der Derivate ist festzustellen, dass in allen Lernerwörterbüchern standardisierte Bedeutungsparaphrasen für Derivate einer Wortbildungsregel mehr oder weniger konsequent eingesetzt werden. In LGWDaF (2008) werden vor allem Derivate auf -ung systematisch durch den substantivierten Infinitiv beschrieben. Da das Suffix selbst aber nicht lemmatisiert ist, kann auch nicht auf dieses verwiesen werden. Andere Wortbildungen, z. B. mit dem Suffix -lich, werden nicht so einheitlich erläutert. Auch in WahrigDaF (2008) sind vorrangig ung-Derivate standardisiert beschrieben. Adjektivbildungen mit -lich wie beispielsweise dicklich, gelblich und rundlich werden mit „etwas dick“ (WahrigDaF 2008, S. 247, Sp. 2), „fast gelb, leicht gelb“ (ebd., S. 413, Sp. 2) und „annähernd rund, dicklich“ (ebd., S. 852, Sp. 2) erläutert. In Hueber- DaF (2007) ist lediglich gelblich lemmatisiert, sodass sich die Systematik hier nicht überprüfen lässt. Allerdings zeigt sich die Standardisierung von Substantivierungen mit -heit bzw. -keit wie in Betroffenheit und Feigheit, die mit Syntagmen aus Adjektiv und sein wiedergegeben werden: „das Betroffensein, Berührtsein“ (HueberDaF 2007, S. 169, Sp. 2) bzw. „das Feigesein“ (ebd., S. 254, Sabina Ulsamer 32 Sp. 2). Im Unterschied dazu jedoch Klugheit „1. scharfer Verstand“ und „2. kluges, besonnenes Verhalten“ (HueberDaF 2007, S. 368, Sp. 2). Bei Derivaten wird in den untersuchten Lernerwörterbüchern weder die Wortbildungsregel angegeben noch wird auf das jeweilige Wortelementlemma verwiesen, obwohl in allen bis auf DGWDaF (2000) Affixe verzeichnet sind. Auch auf Bedeutungsvarianten der Ausgangslexeme wird in keinem der Wörterbücher bei Derivaten aufmerksam gemacht. Auf Wortfamilien und die im Wörterbuch angesetzten Wortfelder kann nur DGWDaF (2000) verweisen, die anderen Wörterbücher geben keine Wortfamilien oder -felder an. Die Praxis bei den Wortelementlemmata ist weniger einheitlich als bei den Derivaten. Das DGWDaF (2000) hat bis auf das Konfix B/ bionur Affixoide lemmatisiert, in DDaF (2003) und HueberDaF (2007) finden sich keine Konfixe in der Stichwortliste. Zu den von ihnen lemmatisierten Wortelementlemmata wird in allen Wörterbüchern die Bedeutung paraphrasiert. Die Wortart der Basis, an die das entsprechende Affix oder Affixoid affigiert, wird nur bei LGWDaF (2008) und DGWDaF (2000) durchgängig angegeben. Die resultierende Wortart wird dagegen in allen Wörterbüchern genannt. Ob es sich um ein Präfix oder ein Suffix handelt, erfährt der Nutzer in DDaF (2003), Hueber- DaF (2007) und WahrigDaF (2008), wobei in Letzterem die Begriffe ‘Vorsilbe‘ und ‘Nachsilbe’ verwendet werden. Unterschiedliche Lesarten der Wortelementlemmata werden - sofern vorhanden - in den Wörterbüchern bis auf DGWDaF (2000) angesetzt. Aussagen zur Produktivität der Affixe macht lediglich LGWDaF (2008) mit Formulierungen wie „nicht (mehr) produktiv, wenig/ begrenzt/ sehr produktiv“ (LGWDaF 2008, S. 11, Sp. 1). Allerdings geben die so genannten „Hinweise für die Benutzer“ (ebd., S. 9-26) keine Auskunft darüber, auf welchen Kriterien diese Produktivitätsskala beruht. Der Forderung nach der Angabe von Allomorphen bei Affixen (vgl. Kap. 2.2.2) kommen nur LGWDaF (2008) und WahrigDaF (2008) nach, wie mit dem fremdsprachlichen Präfix in- und seinen phonologisch bedingten Varianten im-/ il-/ irüberprüft wurde. Bei diesen wird jeweils auf das Lemma inverwiesen, und dort wird dann die Verteilung der Allomorphe erläutert, wobei in WahrigDaF (2008) nur die Variante imals eigenständiges Stichwort angesetzt ist. In DDaF (2003) und HueberDaF (2007) scheint mit dem Fehlen der Variante imeine Lemmalücke vorzuliegen. Die lemmatisierten Allomorphe verweisen nicht aufeinander. Wie dadurch redundante Einträge entstehen, zeigen die folgenden Ausschnitte aus den Artikeln zu in-, il- und ir-: il- [...] <adjektivisches Präfix; vor Adjektiven, die mit „l“ anlauten>: un-, nicht-: illegal, illegitim. (DDaF 2003, S. 336, Sp. 1), Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 33 in- [...] <adjektivisches Präfix; meist bei fremdsprachlichem Basiswort>: un-, nicht-: inakzeptabel, indiskret [...]. (DDaF 2003, S. 337, Sp. 2) und ir- [...] <adjektivisches Präfix; vor Adjektiven, die mit „r“ beginnen>: un-, nicht-: irrational, irreal [...]. (ebd., S. 344, Sp. 2) Es erstaunt daher umso mehr, dass imnicht auf die gleiche Weise lemmatisiert ist als ‘<adjektivisches Präfix; vor Adjektiven, die mit „m“ oder „p“ beginnen>: un-, nicht-: immateriell, impotent.’ In der Auflage von 2007 wurde an dieser Vorgehensweise nichts geändert. Auf eine etwaige Betonungsvariation, die die präfixoide Verwendung eines bestimmten Lexems von der Komposition (vgl. Bomben'stimmung vs. 'Bombenanschlag) unterscheidet, wird in keinem der Lernerwörterbücher hingewiesen. Untersucht wurde dies wieder anhand der Präfixoide B/ bomben- und R/ riesen-, die immerhin in LGWDaF (2008), DGWDaF (2000) und Wahrig- DaF (2008) lemmatisiert sind. Alle fünf Lernerwörterbücher geben Beispiele zu den Wortelementlemmata an; in DGWDaF (2000) handelt es sich dabei auch gleich um Verweise. Die anderen Wörterbücher verweisen nicht auf Derivate, die mit diesen Wortelementlemmata gebildet sind. Von den angeführten Beispielen sind in LGWDaF (2008) und WahrigDaF (2008) auch nicht alle lemmatisiert, in DDaF (2003) und HueberDaF (2007) sind sie gar nicht als Stichwörter angesetzt. Die im DGWDaF (2000) gemachten Verweise sind allerdings nicht nach Lesarten unterschieden. Als einziges der untersuchten Lernerwörterbücher nennt LGW- DaF (2008) zumindest bei einigen Affixen (fast) synonymische Wortelementlemmata. Im Artikel zu -abel (ebd., S. 32, Sp. 1) wird das Suffix -bar genannt, im Artikel des Diminutivsuffixes -chen (ebd., S. 240, Sp. 2) seine Variante -lein und dort wiederum -chen (ebd., S. 684, Sp. 1). 3.1.3 Zwischenfazit Bevor die elektronischen Wörterbücher betrachtet werden, soll an dieser Stelle ein kurzes Resümee gezogen werden. Ob allgemeinsprachliche Bedeutungswörterbücher oder Lernerwörterbücher die Forderungen aus der Metalexikographie besser umsetzen, kann nicht pauschal beantwortet werden. Bis auf das DGWDaF (2000) wählen sowohl die allgemeinsprachlichen als auch die Lernerwörterbücher aufgrund der Benutzerfreundlichkeit eine strikt initialalphabetische Anordnung ohne Nester oder Nischen. Obwohl van der Colff (1998, S. 203) gerade für Lernerwörterbücher eine ausführliche Erläuterung der Wortbildungsregeln in den Außentexten fordert, bie- Sabina Ulsamer 34 ten nur zwei der fünf untersuchten Lernerwörterbücher diese Information, ebenso aber das allgemeinsprachliche DUW (2001). Eine Liste aller lemmatisierten Wortbildungselemente, wie Barz (2003, S. 384) für beide Wörterbuchtypen empfiehlt, findet sich nur in dem Lernerwörterbuch DGWDaF (2000), obwohl auch die anderen Wörterbücher Wortbildungselemente verzeichnen. Komposita und Derivate, die mit dem simplizischen Nomen gebildet werden, werden bis auf DUW (2001) von allen Wörterbüchern genannt, jedoch in unterschiedlichem Maße. Vorrangig werden Komposita angeführt, die das Stichwort als Grundwort enthalten. LGWDaF (2008) listet explizit beide Kompositamöglichkeiten auf, kenntlich gemacht durch unterschiedliche Strukturanzeiger. Ableitungen werden nur in DGWDaF (2000) innerhalb der Wortfamilie am Ende der Artikel genannt. Gemäß Holly (1986, S. 205) werden die Komposita und Derivate in den Simplexartikeln in allen untersuchten Wörterbüchern nach Lesarten getrennt angegeben. Bedeutungserläuterungen und grammatische Angaben finden sich allerdings weder in den allgemeinsprachlichen noch in den Lernerwörterbüchern, obwohl van der Colff (1998, S. 202) das besonders für diesen Wörterbuchtyp forderte. Komposita und Derivate werden auch nicht als Verweise signalisiert, sodass der Nutzer nicht weiß, ob er das betreffende Wort nachschlagen kann und dort weitere Informationen finden wird. Die von Barz (2001, S. 89) geforderte Rekonstruktion des letzten Wortbildungsschrittes wird von keinem der Wörterbücher, weder bei Komposita noch bei Derivaten, angedeutet. Alle kommen jedoch der Forderung nach motivierenden Bedeutungsparaphrasen für durchsichtige Komposita nach. Im Grad der Standardisierung von Paraphrasen für gleiche Ableitungstypen unterscheiden sich die Wörterbücher nur geringfügig. Um welche Bedeutungsvariante der Ausgangslexeme (in Zusammensetzungen und Ableitungen) es sich handelt, kennzeichnet nur DUW (2001). Bei Derivaten verweist keines der untersuchten Wörterbücher auf den Eintrag des jeweiligen Wortbildungselementes. In den Artikeln der Wortbildungselemente werden zwar sowohl in den beiden allgemeinsprachlichen als auch in den vier Lernerwörterbüchern Beispiele mit dem betreffenden Affix genannt, jedoch sind sie in den seltensten Fällen auch tatsächlich als eigene Stichwörter gebucht. Am vollständigsten ist hier noch DGWDaF (2000), das dementsprechend die angegebenen Beispiele gleich als Verweise kennzeichnet. Verweise zu synonymischen Wortelementlemmata bietet nur LGWDaF (2008). In der Angabe der Basiswortart und der aus der Wortbildung resultierenden Wortart, wie sie von Barz (2003, S. 388) gefordert wird (vgl. Kap. 2.2.2), unterscheiden sich die untersuchten Printwörterbücher stark. Wahrig (2006) gibt Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 35 nur die Wortart der Ausgabewörter an, das Pendant für Lerner, WahrigDaF (2008), gibt zumindest bei einigen Suffixen nicht nur die resultierende Wortart, sondern auch die Ausgangswortart an. Das DUW (2001) nennt dagegen nur die Wortart(en) der möglichen Basen. LGWDaF (2008) und DGWDaF (2000) geben wiederum beides an, die beiden Lernerwörterbücher von Hueber und Duden verzeichnen konsequent die Wortart der entstehenden Ableitungen, aber wie WahrigDaF (2008) nicht immer die Wortart der infrage kommenden Basiswörter. Die Überprüfung der Forderung nach der Angabe der Allomorphe von Affixen wie inmachte einige Mängel deutlich. Entweder wird in den oft redundant formulierten Artikeln gar nicht auf die Allomorphe aufmerksam gemacht, werden keine Verweise auf die anderen Formen gesetzt, wird die phonologische Verteilung nicht beschrieben oder einige der Varianten fehlen völlig. Positiv fallen die beiden Wahrig-Wörterbücher und LGWDaF (2008) auf, in denen die Allomorphe lemmatisiert sind, aber alle auf inverweisen. Dort wird dann die phonologische Verteilung der Varianten beschrieben. Außer diesen drei hat noch DUW (2001) die Allomorphe zu ingebucht. Wie nach diesem Fazit noch einmal deutlich geworden sein dürfte, unterscheiden sich Lernerwörterbücher und allgemeinsprachliche Bedeutungswörterbücher kaum in der Umsetzung der metalexikographischen Vorschläge zur Darstellung von Wortbildungsbeziehungen im (gedruckten) Wörterbuch. 3.2 Elektronische Wörterbücher Bei der vorliegenden Evaluation der elektronischen Wörterbücher wird nicht nach Lerner- und allgemeinsprachlichen Wörterbüchern getrennt, sondern nach solchen, die auf gedruckten Wörterbüchern basieren, und solchen, die genuin für das elektronische Medium konzipiert wurden. Die Kriterien, wie sie an den Printwörterbüchern angewendet wurden, können hier nicht unverändert übernommen werden. Die Anordnung der Lemmata erübrigt sich beispielsweise, wenn keine Stichwortliste angezeigt wird. Dagegen stellt sich die Frage, inwieweit die untersuchten elektronischen Wörterbücher ihre Möglichkeiten, die ihnen das Medium bietet, ausschöpfen. Der Fokus liegt besonders auf dem Verweissystem, da sich mit Hyperlinks vielfältige Optionen zur Darstellung von Wortbildungsbeziehungen ergeben. Von der Evaluation der Printwörterbücher können für Simplexartikel die Kriterien ‘Nennung von Komposita und Ableitungen’ und ‘Unterscheidung dieser nach Lesarten’ übernommen werden. Für Einträge von Komposita und Derivaten können die Kriterien ‘Rekonstruktion der Wortbildungsschritte’ Sabina Ulsamer 36 und ‘Darstellung der Wortbildungsregel’ sowie die ‘Verwendung motivierender bzw. standardisierter Bedeutungsparaphrasen’ aufgegriffen werden. Ebenso kann überprüft werden, ob Grammatikinformationen gegeben und Grundlagen der Wortbildung im Rahmen des elektronischen Wörterbuchs erläutert werden. Eine Neuerung bei elektronischen Wörterbüchern ist die Verwendung von Hyperlinks statt der Angabe von Verweisen. Deshalb gilt es zu untersuchen, ob die in den Simplexartikeln genannten Wortbildungen nicht nur aufgelistet werden, sondern über Links direkt zu ihren Einträgen führen. Ähnliches gilt für Komposita und Derivate: Werden sie mit ihren jeweiligen Ausgangslexemen - und auch gegebenenfalls mit der richtigen Lesart - vernetzt? Werden bei Wortelementlemmata die entsprechenden Wortbildungen verlinkt? Hier ließen sich mit einem einzigen Mausklick Vernetzungen der Wörter innerhalb der Stichwortliste aufzeigen. Mit Hyperlinks können außerdem Grammatik- und Wortbildungsinformationen mit den Wortartikeln verknüpft werden. Statt in printwörterbuchähnlichen Außentexten können sie aufgrund des größeren Platzangebotes auch direkt in den Wortartikeln gezeigt werden. Neue Möglichkeiten ergeben sich auch bei den Suchmöglichkeiten und in der Darstellung der angezeigten Wortbildungsprodukte. Aufgrund des großen Platzangebotes können sehr viel mehr Wortbildungsprodukte präsentiert und diese auf unterschiedliche Weise gruppiert und sortiert werden. Nutzen die elektronischen Wörterbücher diese Möglichkeiten? Wie viele Wortbildungsprodukte werden pro Simplex, wie viele Derivate pro Wortelementlemma angezeigt? Werden sie alphabetisch oder nach Frequenz sortiert oder nach Wortarten gruppiert? Gibt es vielleicht sogar eine grafische Darstellung der Wortbildungsbeziehungen eines Stichwortes? In einem elektronischen Wörterbuch können auch andere Medien integriert werden, wie beispielsweise Tondateien. Gerade der Betonungsunterschied bei Affixoidkomposita könnte mit einem Hörbeispiel verdeutlicht werden. Anhand von sieben elektronischen Wörterbüchern, wovon vier auf gedruckten basieren und drei von Grund auf für das Internet konzipiert wurden, sollen diese Kriterien und Fragestellungen untersucht werden. 3.2.1 Printbasierte Wörterbücher Für diesen Überblick wurden vier Wörterbücher ausgewählt, die auf ihren gedruckten Pendants basieren und für die elektronischen Medien Internet oder CD-ROM aufbereitet wurden. Die Wörterbücher Duden - Das große Wörter- Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 37 buch der deutschen Sprache in der Duden PC-Bibliothek 3.0 (DudenPC-Bib) 5 und die CD-ROM-Ausgabe des Wahrig Deutsches Wörterbuch (WahrigDigital) sind auf einem festen elektronischen Datenträger gespeichert und müssen lokal installiert werden. Das Internetwörterbuch Das Digitale Wörterbuch der deutschen Sprache (DWDS) der BBAW baut auf dem sechsbändigen Wörterbuch der deutschen Gegenwartssprache (WDG) auf und verknüpft dieses mit Text- und Wörterbuchressourcen ( http: / / retro.dwds.de/ woerterbuch ; Stand 09/ 2011). Die vorliegende Evaluation wurde an der alten Version 1.2.1 - im Folgenden DWDSretro genannt und unter http: / / retro.dwds.de/ (Stand: 09/ 2011) erreichbar - durchgeführt. Die unter Lizenz verfügbare Online-Version des LGWDaF LGWDaFonline ist das einzige Lernerwörterbuch unter den printbasierten Wörterbüchern. Die elektronischen Wörterbücher, die auf gedruckten Wörterbüchern basieren, wurden besonders daraufhin untersucht, wie sie ihre Daten an das neue Medium adaptiert haben und ob sie die medienspezifischen Möglichkeiten nutzen. Wo sie sich mit ihren gedruckten Pendants decken, wird dies nicht weiter ausgeführt. Über die Anordnung der Lemmata in einem elektronischen Wörterbuch kann nur dann eine Aussage getroffen werden, wenn eine sichtbare Stichwortliste wie in WahrigDigital und DudenPC-Bib präsentiert wird. In WahrigDigital werden nach Eingabe des gesuchten Wortes Haus in einer Liste alle Wörter präsentiert, die Haus oder -hausenthalten. Auf diese Weise zeigt WahrigDigital auch alle Komposita, in denen das nominale Simplex Bestimmungswort oder Grundwort ist. Allerdings werden auch Wörter aufgelistet, die mit Haus gar nichts zu tun haben, wie Haussa. Stichwörter, die die umgelautete Form Häus-/ häusenthalten, werden jedoch nicht genannt. Die Ableitung häuslich findet der Nutzer folglich nicht, wenn er Haus eingibt. Zu häuslich werden allerdings nicht nur weitere Stichwörter aufgelistet, die mit Häus-/ häusbeginnen, sondern auch einige, die auf die Zeichenkette -lich enden, wie hässlich und scheußlich. Es findet zwar lediglich eine zeichenbasierte Suche statt, doch durch das ‘beidseitige’ Vorgehen erhält der Nutzer zumindest eine Ahnung von morphologischen Strukturen. In DudenPC-Bib werden nach Eingabe von Haus alle Stichwörter aufgelistet, die mit Haus-/ haus- oder Häus-/ häusbeginnen. In LGWDaFonline und DWDSretro gibt es keine sichtbare 5 Das seit Mai 2011 verfügbare Online-Angebot Duden online ( www.duden.de ) wurde in dieser Untersuchung noch nicht berücksichtigt, da sie in den Jahren 2009 und 2010 im Rahmen des IDS-Forschungsprojekts BZVelexiko ( http: / / www.ids-mannheim.de/ lexik/ BZVelexiko/ ) entstand. Eine erste Analyse wird in dem Beitrag „Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen - eine Umfrage zu elexiko“ von Antje Töpel in diesem Band vorgenommen; für die Darstellung eines Präfixartikels vgl. dort Abbildung 1. Sabina Ulsamer 38 Stichwortliste. In Letzterem wird unterhalb des Suchformulars nach Eingabe der ersten Buchstaben eine Liste mit Lemmata gezeigt, die mit diesen Buchstaben beginnen. Dass im DWDSretro dennoch eine Art morphologische Suche möglich ist, wird im Rahmen der im Folgenden zu besprechenden Verlinkungspraxis deutlich. In LGWDaFonline werden dem Nutzer drei Suchoptionen geboten: ‘genaues Stichwort’, ‘Anfang des Stichworts’ und ‘Teil des Stichworts’. Je nach Wahl einer dieser Suchoptionen erhält man nur das gesuchte Wort, z.B. Haus, oder alle Stichwörter, die mit dem gesuchten Wort beginnen oder in denen es enthalten ist. Allerdings handelt es sich hierbei auch nur um eine zeichenbasierte und nicht um eine morphologische Suche, wie das Stichwort Chaussee unter der dritten Option belegt. Betrachtet man die Artikel zu Simplizia, Komposita und Derivaten, so fällt auf, dass sich die digitalen Varianten kaum von ihren Printversionen unterscheiden. In Wahrig (2006) werden in den Simplexartikeln Komposita angeführt, in WahrigDigital werden sie in der Ergebnisliste präsentiert. Bei der Lemmatisierung von Wortelementlemmata unterscheiden sich die beiden Wahrig-Wörterbücher dahingehend, dass WahrigDigital manche Wortbildungselemente nicht gebucht hat, die aber in der Printversion angesetzt sind, wie z.B. -zeug. Auch DudenPC-Bib unterscheidet sich nicht von DUW (2001), ebenso LGWDaFonline nicht von LGWDaF (2008). Das DWDSretro ähnelt in der Artikelgestaltung dem unter Kapitel 3.1.2 besprochenen DGWDaF (2000). Die von Wiegand (2002, S. 424) vorgebrachte Kritik an der nischenalphabetischen Struktur gilt auch für das DWDSretro. Inwieweit bieten nun aber die elektronischen Wörterbücher mehr als ihre gedruckten Pendants? Werden Wortbildungsprodukte, die in Simplexartikeln genannt werden, als Hyperlinks zu ihren eigenen Einträgen realisiert? In Duden- PC-Bib werden wie in DUW (2001) gar keine Komposita oder Derivate im Artikel genannt. In WahrigDigital werden keine Zusammensetzungen oder Ableitungen genannt, weil sie in der Ergebnisliste aufgeführt werden. Werden im Simplexartikel beispielhaft Komposita genannt, so sind sie wie in der Printversion mit Tilde versehen: Handels~ unter Haus. In LGWDaFonline werden die Komposita wie in LGWDaF (2008) nach den Symbolen ‘-K’ bzw. ‘K-’ aufgeführt, aber nicht verlinkt zu ihren Einträgen. Im DWDSretro wird am Ende des Simplexartikels eine Reihe von Erstgliedern aufgelistet, die mit dem Simplex als Grundwort Komposita bilden. Sie sind nach Lesarten sortiert. Dann folgen die Nischeneingänge mit dem Simplex als Erstglied, beispielsweise Haus-, haus-. In alphabetischer Reihenfolge werden die Zweitglieder genannt, mit denen das Simplex als Bestimmungswort Komposita bildet. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 39 Werden Komposita und Derivate mit ihren Ausgangslexemen und der richtigen Lesart verlinkt? Diese Frage wurde anhand der Wörter Kiefernzapfen, Kiefernholz und Kieferknochen überprüft. In DudenPC-Bib scheint das der Fall zu sein. Bei Kiefernzapfen kann man in der Bedeutungserläuterung „verholzter Fruchtstand der 2 Kiefer [...]“ auf 2 Kiefer klicken und gelangt zur richtigen Lesart. Dies ist aber nur möglich, wenn solche polysemen Lemmata als zwei getrennte Stichwörter angesetzt sind, wie DudenPC-Bib das für Homonyme, die sich im Genus unterscheiden, praktiziert (siehe auch die Einträge 1 Mangel, der und 2 Mangel, die). Wenn ‘nur’ verschiedene Lesarten ohne grammatische Unterschiede vorliegen, wird in DudenPC-Bib nicht auf die richtige Lesart verlinkt, wie mit Herzanfall getestet wurde. Auch WahrigDigital nimmt bei Kiefer diese Unterscheidung vor, und man kann ebenfalls in der Bedeutungserläuterung „Holz der Kiefer“ auf Kiefer klicken. Jedoch gelangt man nicht auf den korrekten Eintrag Kiefer 2 , sondern auf den anatomischen Kiefer 1 . In LGWDaFonline sind wie in LGWDaF (2008) transparente Komposita nicht eigens lemmatisiert, sondern werden unter ihrem Erstund/ oder Zweitglied nach ‘K-’ bzw. ‘-K’ aufgelistet. Das Wort Kiefernzapfen hat keinen eigenen Artikel. Als Ergebnis der Suche erhält man aber die beiden Artikel Kiefer 2 (d.h. die Lesart ‘Baum’) und Zapfen. In diesen beiden Simplexartikeln wird jeweils das Kompositum Kiefernzapfen genannt. Sucht man nach Kieferorthopäde, das die erste Lesart von Kiefer enthält, erhält man nur Orthopäde als Ergebnis, da nur hier das Kompositum als Sublemma aufgeführt wird. Eine Inkonsistenz fällt allerdings bei Kieferknochen auf. Obwohl unter Knochen die Zusammensetzung Kieferknochen aufgeführt wird und also als Sublemma vorhanden ist, wird dieser Artikel - im Gegensatz zu der Praxis bei Kiefernzapfen und Kieferorthopäde - nicht angeboten. Stattdessen werden sieben Stichwörter präsentiert: Die beiden Lesarten von Kiefer ‘Kiefer 1 ’ und ‘Kiefer 2 ’, aber auch die Stichwörter Harz, Nadel, Zapfen, Operation und Orthopäde. Bei diesen werden unter ‘-K’ die entsprechenden Zusammensetzungen mit Kiefer als Erstglied genannt: Kiefernharz, Kiefernnadel, Kiefernzapfen, Kieferoperation und Kieferorthopäde. Im Printwörterbuch kann man diese verschiedenen Artikel natürlich nicht direkt hintereinander rezipieren, da sie im Alphabet weit aus-einanderstehen. Jedoch ist es fraglich, ob dem Nutzer mit dieser Ergebnispräsentation geholfen ist. LGWDaFonline nimmt also keine Zerlegung in die Bestandteile vor, wie es bei Kiefernzapfen anfänglich noch der Fall zu sein schien. Stattdessen wird nach denjenigen Artikeln gesucht, die das Kompositum als Sublemma enthalten oder die als Sublemmata Komposita auflisten, die das Erstglied des Suchwortes enthalten. In DWDSretro dagegen werden Komposita wie Kiefernzapfen und Kieferknochen tatsächlich mit ihren Ausgangslexemen und den richtigen Lesarten verknüpft: Sabina Ulsamer 40 Abb. 3: DWDSretro: Ergebnis der Suche zu Kiefernzapfen. Im Wörterbuchpanel werden der Eintrag zu ‘Zapfen’ und die Komposita mit ‘Kiefer 2 ’ präsentiert; Stand: 09/ 2011 Werden in den Artikeln zu Wortelementlemmata die entsprechenden Wortbildungsprodukte verlinkt? Sofern in DudenPC-Bib die angegebenen Beispiele auch Stichwörter sind, wird auf diese verlinkt. Geißlein als Beispiel zu -lein ist als Stichwort vorhanden und deshalb auch verknüpft. Das Beispiel Figürlein ist zwar nicht als eigenes Stichwort vorhanden, aber der Link führt den Nutzer zu Figur. Ebenso gelangt man von dem Beispiel Narrheit unter -heit zu dem betreffenden Eintrag. DudenPC-Bib nutzt mit diesen Verlinkungen die sich mit dem elektronischen Medium bietende Möglichkeit, Wortbildungszusammenhänge aufzuzeigen. Ein Manko ist jedoch, dass die als Hyperlinks realisierten Beispiele nicht als solche erkennbar sind, da beispielsweise eine farbliche Hervorhebung fehlt. Nutzer müssen also überhaupt erst einmal herausfinden, dass es möglich ist, von dem Beispiel zum Eintrag zu kommen. Dann muss man auf alle Beispiele klicken, um festzustellen, welche tatsächlich Links sind und zu anderen Artikeln führen. Für WahrigDigital gilt das Gleiche wie für DudenPC-Bib. Die im Artikel zu einem Wortbildungselement angegebenen Beispiele werden zu ihren Einträgen verlinkt. Aber auch hier ist nicht erkennbar, wann es sich um Links handelt. In LGWDaFonline werden keine Links zu den entsprechenden Wortbildungen gesetzt. Möglichkeit wird als Beispiel unter -keit genannt und ist selbst auch Stichwort. Aber von dem Wortelementlemma-Artikel wird nicht zu Möglichkeit verlinkt. Im Internetwörterbuch DWDSretro sind keine Wortbildungselemente lemmatisiert. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 41 Auch die vierte Fragestellung betrifft das Verweissystem. Gibt es Grammatik- oder Wortbildungsinformationen in den Wörterbuchaußentexten und wenn ja, werden die Wortartikel von Wortbildungsprodukten mit diesen verknüpft? DudenPC-Bib und LGWDaFonline bieten wie die gedruckten Pendants keinerlei Grammatikinformationen. Auch DWDSretro offeriert keine Erläuterung der deutschen Wortbildung und Wortbildungsregeln. Hier hätte die Möglichkeit bestanden, durch die Integration zusätzlicher Ressourcen Wortbildungsinformationen zur Verfügung zu stellen, ähnlich der Verknüpfung mit dem DWDS- Korpus oder automatisch ermittelten Kollokationen und Relationspartnern. Die neue Version DWDS2.0 bietet bereits in einem Panel einen Link zu dem deutschen Internetthesaurus OpenThesaurus. Es bleibt abzuwarten, ob weitere externe Ressourcen, z.B. auch Grammatikinformationen, aufgenommen werden. In WahrigDigital gibt es zwar keine eigene Grammatik, in der die Grundlagen der Wortbildung oder Wortbildungsregeln erläutert werden. Aber wie in der gedruckten Version werden im Formkommentar eines Substantivartikels das Genus und seine Flexionsklasse genannt: Abb. 4: WahrigDigital: Ausschnitt aus dem Artikel Haus. Im Formkommentar <n. 12u> gibt 12u die Deklinationsklasse an, zu der Haus gehört. Diese Angabe ist ein Hyperlink. Die Angabe der Deklinationsklasse bei Nomen, wie 12u im Beispiel Haus, ist als Hyperlink realisiert und öffnet ein neues Fenster mit der Tabelle der verschiedenen Deklinationen. Die in diesem Fenster oberste Klasse ist immer diejenige des Stichwortes: Abb. 5: WahrigDigital: Ausschnitt aus dem Fenster „Tabelle der Deklinationen“, das sich nach Klick auf die Klasse 12u im Artikel Haus öffnet. Die passende Deklinationsklasse 12u ist die erste sichtbare Klasse in diesem Fenster. Sabina Ulsamer 42 Die Deklinations- und Konjugationstabellen sind aus Wahrig (2006, S. 18-25) übernommen. Auch in diesem Fall ist nicht erkenntlich, dass es sich überhaupt um einen Link handelt. Die Angabe ist nicht in einer anderen Farbe oder in einem besonderen Schrifttyp gehalten oder auf andere Weise als Hyperlink gekennzeichnet. Der Nutzer gelangt also, wenn überhaupt, mehr durch Zufall zur Tabelle mit den Flexionsklassen. Nun stellt sich noch die Frage, ob die untersuchten Wörterbücher auch andere Medien, wie beispielsweise Tondateien integrieren. Gerade für die Affixoidkomposita wäre das ein Mehrwert gegenüber den Printversionen. Doch auch diese Frage muss für die vier printbasierten Wörterbücher verneint werden. Sie sind in ihrer Darstellung noch sehr dem Papier verhaftet. Das zeigt sich auch an der eigentlich unnötigen Verwendung von Abkürzungen und der Textverdichtung. Diese vier Wörterbücher könnten die Möglichkeiten des elektronischen Mediums in noch stärkerem Maße nutzen. 3.2.2 Für das Internet konzipierte elektronische Wörterbücher Die Überschrift dieses Kapitels weist schon auf die Problematik bei der Bezeichnung elektronischer Wörterbücher hin. Müller-Spitzer (2003) führt als Alternative zu dem Begriff ‘elektronisches Wörterbuch’ den Terminus ‘Wortschatzinformationssystem’ ein und definiert diesen als ein Informationssystem, 6 „dessen genuiner Zweck darin besteht, daß ein potentieller menschlicher Benutzer aus den zugreifbaren Daten Informationen zu sprachlichen Gegenständen gewinnen kann“ (ebd., S. 148). 7 Sie unterscheidet zwischen drei Wortschatzinformationssystemen: solchen, die ausschließlich aus automatisch erstellten Daten bestehen, solchen, die sowohl aus automatisch erstellten als auch aus lexikographisch bearbeiteten Daten bestehen und daher semiautomatisch genannt werden, und solchen, die nur aus lexikographisch bearbeiteten Daten bestehen (ebd., S. 152f.). Die drei hier untersuchten elektronischen Wörterbücher, die explizit für das Medium Internet konzipiert wurden, sind das Wortschatzprojekt der Universität Leipzig (WortschatzUniLeipzig) 8 und 6 „Informationssystem“ definiert sie als „eine elektronisch verfügbare Datensammlung mit wenigstens einer definierten äußeren Zugriffsstruktur“, deren „genuiner Zweck darin besteht, daß ein potentieller menschlicher Benutzer aus den zugreifbaren Daten Informationen zum Gegenstand des Informationssystems gewinnen kann“ (Müller-Spitzer 2003, S. 148). 7 Müller-Spitzer (2003) weist darauf hin, dass nach diesen Definitionen der Terminus ‘Wortschatzinformationssystem’ synonym mit dem Begriff ‘elektronisches Wörterbuch’ verwendet werden kann. 8 http: / / wortschatz.informatik.uni-leipzig.de (Stand: 09/ 2011). Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 43 Canoo.net 9 ( www.canoo.net ) sowie das Lernerwörterbuch ELDIT. 10 Das Leipziger Wortschatzprojekt, das nach den Definitionen als automatisch erstelltes Wortschatzinformationssystem gilt, ist ein Projekt der Abteilung Sprachverarbeitung des Instituts für Informatik an der Universität Leipzig. Der Schwerpunkt liegt weniger auf der Beschreibung der Stichwörter - es werden kaum Bedeutungserläuterungen gegeben -, sondern auf den Möglichkeiten des Information-Retrieval und Text-Mining. 11 Canoo.net ist ein Online-Sprachservice, der die sprachtechnologischen Werkzeuge der Canoo Engineering AG nutzt und mit redaktioneller lexikographischer Arbeit kombiniert, 12 d.h. ein semi-automatisch erstelltes Wortschatzinformationssystem. ELDIT ist ein speziell auf die Bedürfnisse der Sprecher in Südtirol zugeschnittenes Wörterbuch bzw. ein lexikographisch bearbeitetes Wortschatzinformationssystem. Man kann es als Sonderform eines zweisprachigen Lernerwörterbuches sehen, nämlich für Italienischlerner mit Deutsch als Muttersprache und für Deutschlerner mit Italienisch als Erstsprache. Die Lemmaauswahl in ELDIT basiert auf den Texten für die Zweisprachigkeitsprüfung, wie sie in Südtirol für den Öffentlichen Dienst abgelegt werden muss. 13 Die Evaluation der Wörterbücher folgt zunächst den Fragen, wie sie an die printbasierten Wörterbücher gestellt wurden. Die Suchmöglichkeiten beschränken sich in WortschatzUniLeipzig auf die einfache Eingabe des Suchwortes. In Canoo.net kann man auswählen, ob man in allen Bereichen des Online-Angebots suchen möchte oder in einem bestimmten, z.B. im ‘Wörterbuch Wortformen’, im ‘Wörterbuch Wortbildung’, in der Grammatik, in den Wortbildungsregeln oder im Glossar der Fachbegriffe. In ELDIT ist es möglich, sich neben der Suche via Eingabefeld auch die gesamte Stichwortliste anzeigen zu lassen und hier Wörter auszuwählen. Man kann auch diejenigen Einträge auswählen, die Grafiken zu Wortbeziehungen oder Abbildungen integriert haben. Auch an die drei expliziten Internetwörterbücher soll die Frage gestellt werden, ob Wortbildungsprodukte, die in Simplexartikeln genannt werden, als Hyperlinks zu ihren eigenen Einträgen realisiert sind. WortschatzUniLeipzig 9 http: / / www.canoo.net ( Stand: 09/ 2011). 10 ELDIT ist erreichbar unter http: / / dev.eurac.edu: 8081/ MakeEldit1/ Eldit.html ( Stand: 09/ 2011). Die Nutzung von ELDIT ist erst nach Login möglich. 11 Für Informationen zu den in WortschatzUniLeipzig angewandten Methoden und Verfahren vgl. http: / / asv.informatik.uni-leipzig.de/ about ( Stand: 09/ 2011) . 12 http: / / www.canoo.net/ services/ ueberblick/ verantwortung.html (Stand: 09/ 2011). 13 Nähere Informationen zu den verwendeten Texten erhält man nach dem Login auf http: / / dev. eurac.edu: 8081/ MakeEldit1/ Eldit.html unter „Was ist das ELDIT-Programm? “ (Stand: 09/ 2011). Sabina Ulsamer 44 listet in den Artikeln zu nominalen Simplizia keine weiteren Wortbildungsprodukte dazu auf, weil die Konzeption dieses Wörterbuches das nicht vorsieht. Statt Wortbildungszusammenhängen stehen semantische Relationen und Kollokationen im Vordergrund, die automatisch ermittelt wurden. Außerdem wird automatisch eine Zuordnung zu Sachgebieten und den Bedeutungsgruppen nach Dornseiff vorgenommen. WortschatzUniLeipzig nimmt mit den eigenen Sachgebieten und den Dornseiff-Bedeutungsgruppen als einziges der untersuchten elektronischen Wörterbücher eine Strukturierung des Wortschatzes nach Sachgruppen vor. Allerdings kann weder über diese Sachgebiete noch über die Dornseiff 'schen Gruppen das Wörterverzeichnis durchsucht werden. Zu jedem Stichwort werden knappe Angaben zur Morphologie und Grammatik gemacht. Auch diese sind automatisch ermittelt. In der Angabe ‘Morphologie’ wird durch senkrechte Striche deutlich gemacht, aus welchen Morphemen oder Morphemteilen das Stichwort besteht. Die Grammatikangaben nennen Wortart, Genus und die Flexionsformen des Stichwortes. Abb. 6: WortschatzUniLeipzig: Ausschnitt aus dem Artikel Sicherheit; Stand: 09/ 2011 WortschatzUniLeipzig macht sonst keine weiteren Angaben zur Wortbildung, sodass dieses Wörterbuch hier nicht weiter betrachtet wird. In Canoo.net werden zu allen Wortartikeln - nicht nur bei den Einträgen nominaler Simplizia - Komposita und Derivate aufgelistet. Alphabetisch sortiert werden sie unter ‘Ableitungen’ in Form eines von links nach rechts wachsenden Baumes angeboten, wobei das gewählte Wort die Wurzel ist. Unter den Komposita sind sowohl solche, welche die betreffende nominale Basis als Bestimmungswort enthalten, als auch solche, in denen das gesuchte Nomen Grundwort ist. Hier wird das Wortbildungspotenzial des Basisnomens deutlich. Fragwürdig ist allerdings der Terminus ‘Ableitungen’. Ein allgemeineres ‘Wortbildungsprodukte’ wäre weniger missverständlich. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 45 Abb. 7: Canoo.net: Ausschnitt aus den unter ‘Ableitungen’ genannten Komposita zu Apfel; Stand: 09/ 2011 In Canoo.net werden Hyperlinks konsequent durch die blaue Schriftfarbe gekennzeichnet. Das gilt für die angegebenen Wortbildungsprodukte wie für metasprachliche Begriffe und grammatische Fachausdrücke, die eigens erklärt werden. Für die Evaluierung von ELDIT wurde nur die Nutzersicht für italienische Deutschlerner betrachtet. ELDIT legt großen Wert auf die Wortbildung, um den Wortschatz der Lerner zu erweitern (vgl. ten Hacken/ Abel/ Knapp 2006). In Artikeln zu Simplizia werden deshalb - nach Lesarten getrennt - sowohl rechtsals auch linkserweiterte Komposita und Ableitungen im Reiter ‘famiglia lessicale’ genannt, die selbst auch Stichwörter sind. Außerdem sind diese als Verweise bzw. Links realisiert, bei deren Klick ein neues kleines Fenster geöffnet und über den eigentlichen Stichworteintrag gelegt wird. Hierin wird eine Übersetzung für den Begriff geboten, und man hat die Möglichkeit, drei kurze Beispieltexte mit diesem Wort zu lesen. Lobenswert ist die Nennung und Verlinkung von ausschließlich durchsichtigen Wortbildungen. Das Lemma Hausmeister wird beispielsweise aus diesem Grund nicht als Kompositum zu Haus genannt, sondern ist als eigenständiges Lemma angesetzt. Sabina Ulsamer 46 Abb. 8: ELDIT: Ausschnitt aus dem Artikel Haus mit geöffneter Registerkarte ‘famiglia lessicale’; Stand: 09/ 2011 Werden Komposita und Derivate mit ihren Ausgangslexemen und der richtigen Lesart verlinkt? In Canoo.net werden bei Komposita und Derivaten die einzelnen Wortbildungsschritte rekonstruiert. Hierüber gelangt man zu den einzelnen Lexemen, wie die blaue Schriftfarbe anzeigt. Im Falle der Suffixe führt der Link zu ihren Einträgen in der Grammatik. Abb. 9: Canoo.net: Ausschnitt aus der ‘Wortbildungsanalyse’ zu Trinkbarkeit; Stand: 09/ 2011 14 Die Komposita Kiefernzapfen und Kieferknochen wurden auch in Canoo.net überprüft und es wurde festgestellt, dass die einzelnen Bestandteile mit der richtigen Lesart verlinkt sind. Aber das gilt nur dann, wenn die Wörter als ei- 14 Jedes Wort und Wortbildungselement sowie die metasprachlichen Begriffe zur Beschreibung der Wortbildungsprozesse rechts sind in blauer Schriftfarbe gehalten und signalisieren so, dass es sich um Hyperlinks handelt. Die Links auf trinken und trinkbar führen zu ihren jeweiligen Einträgen, die Wortelementlemmata -bar und -keit führen jeweils zu ihren eigenen Einträgen in der Grammatik. Die Hyperlinks der Wortbildungsprozesse führen ebenfalls in die Grammatik. Dass die Strukturanalysen von Canoo.net nicht immer fehlerfrei sind, zeigt das Wort Kalender, das als gebildet aus dem Nomen Kalenden und dem Suffix -er analysiert wird. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 47 gene Stichwörter gebucht sind und nicht nur als Lesart eines Haupteintrages, wie anhand von Eiskaffee verifiziert werden konnte. Eine Wortbildungsanalyse und Zerlegung wird auch von dem so genannten ‘Unknown Word Analyzer’ durchgeführt, wenn nach einem Wort gesucht wird, das nicht in Canoo.net enthalten ist. Dieses Werkzeug versucht das eingegebene Wort in seine Bestandteile zu zerlegen. Das Wort Teefilterhalter beispielsweise ist nicht in Canoo.net enthalten. Mithilfe des ‘Unknown Word Analyzer’ wird das komplexe Wort in Teefilter und Halter zerlegt, und wie bei Trinkbarkeit wird die Art der Wortbildung angegeben. Abb. 10: Canoo.net: Ausschnitt aus der vorgeschlagenen Analyse für das nicht gebuchte Wort Teefilterhalter; Stand: 09/ 2011 15 Klickt der Nutzer nun auf die Bestandteile Teefilter und Halter, gelangt er zu den jeweiligen Einträgen und erhält dort weitere Informationen. In ELDIT wird in den meisten Fällen ein Wort, das nicht als eigenes Stichwort lemmatisiert ist, über Wortbildungsregeln mit den entsprechenden Einträgen im Wörterbuch verknüpft. Bei der Auflösung eines nicht selbstständig lemmatisierten (oft transparenten) Kompositums wird der Nutzer sofort auf die entsprechende Lesart der Ausgangslexeme verwiesen, wie man an dem Eintrag zu Eiskaffee sieht. Diese Zusammensetzung ist nicht in der ELDIT-Stichwortliste enthalten, weshalb die Meldung erscheint: Per Eiskaffee in ELDIT sono stati trovati i seguenti risultati: Eiskaffee trovato nella entrata „Eis“ (tedesco, sostantivo) in „ parola composta“ Eiskaffee trovato nella entrata „Kaffee“ (tedesco, sostantivo) in „ parola composta“. ( http: / / dev.eurac.edu: 8081/ MakeEldit1/ Eldit.html ; Stand: 09/ 2011; Kursivdruck i. Orig.) Für Eiskaffee wurden in ELDIT also die folgenden Resultate gefunden: Eiskaffee im Wortartikel Eis (deutsch, Substantiv) und im Wortartikel zu Kaffee 15 Die beiden Wörter Teefilter und Halter sind in blauer Schriftfarbe und damit als Links zu ihren jeweiligen Artikeln erkennbar. Auch die metasprachlichen Begriffe zur Erläuterung der Wortbildungsprozesse rechts sind in blauer Schriftfarbe gehalten und führen als Hyperlinks in die entsprechenden Grammatikabschnitte. Sabina Ulsamer 48 (deutsch, Substantiv) jeweils unter den zusammengesetzten Wörtern. Der erste Hyperlink führt zu dem Artikel Eis, und zwar gleich zur passenden zweiten Lesart: 2.) Eis ist ein süßes Nahrungsmittel, das gefroren ist. Es wird aus Milch oder Wasser, Zucker und häufig Früchten hergestellt, die ihm Farbe und Geschmack geben. Gelato. ( http: / / dev.eurac.edu: 8081/ MakeEldit1/ Eldit.html; Stand: 09/ 2011; Kursivdruck i. Orig.) Die Zusammensetzung Eiskaffee ist bei dieser Lesart von Eis - in roter Schriftfarbe hervorgehoben - unter ‘Composti’ in der Registerkarte ‘famiglia lessicale’ aufgeführt. Auch Ableitungen werden auf diese Weise zu ihrer Basis in Beziehung gesetzt und unter ‘Derivati’ genannt. Gemäß der Forderung von De Caluwe/ Taeldeman (2003) werden in ELDIT aus der Rezeptionssichtweise heraus alle gebildeten Wörter mit den jeweiligen Simplizia verlinkt, sofern die Wortbildungen dort aufgelistet sind. Derivate haben in ELDIT oft keine eigenen Artikel, sondern werden im Reiter ‘famiglia lessicale’ des Basiswortes unter ‘Derivati’ genannt. Gibt man eine Ableitung ein - beispielsweise häuslich - wird man zu dem Grundwort, hier Haus, geführt. Da in ELDIT keine Wortelementlemmata gebucht sind, erübrigt sich dafür die Frage, ob in den Artikeln zu Wortelementlemmata die entsprechenden Wortbildungsprodukte verlinkt sind. In Canoo.net jedoch werden heimische wie fremde Affixe im Rahmen der Wortbildung in der Grammatik erläutert. Abb. 11: Canoo.net: Ausschnitt aus dem Grammatikeintrag zu dem Präfix in-; Stand: 09/ 2011 Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 49 Zu dem Link ‘Alle Ableitungen’ öffnet sich ein weiterer Tab im Browser, der in diesem Fall „128 Einträge der Wortbildungsklasse Adjektiv-zu-Adjektiv- Ableitungen mit dem Präfix invon insgesamt 55 410 Adjektiven im Canoo Wörterbuch“ ( www.canoo.net ; Suchbegriff in, ausgewählt ‘Derivation: Adjektivpräfix in’) anzeigt. Unter ‘Besonderheiten’ wird hier für das Präfix indie phonologische Verteilung der Allomorphe beschrieben. Die Frage nach Grammatik- oder Wortbildungsinformationen hat sich für Canoo.net, wie bereits mehrfach gesehen, schon beantwortet. In einer umfangreichen Grammatik werden die Wortbildungsprozesse des Deutschen und heimische sowie fremde Affixe erläutert. Über die zu den Stichwörtern angegebenen Wortbildungsanalysen gelangt man zu den entsprechenden Abschnitten der Grammatik. ELDIT bietet in der integrierten Grammatik eine Übersicht zu Wortbildung und Wortbildungsregeln. Leider gibt es keinen Verweis aus den Artikeln heraus dorthin. Abschließend sei noch die Frage beantwortet, ob die untersuchten Wörterbücher auch andere Medien, wie beispielsweise Tondateien, integrieren. In Canoo.net werden keine Multimedia-Elemente angeboten. In ELDIT jedoch wird die Aussprache der Wörter durch Audiodateien hörbar gemacht, wie es sich gerade für ein Lernerwörterbuch empfiehlt. 3.2.3 Zwischenfazit Wie für die gedruckten Wörterbücher soll auch für die elektronischen ein kurzes Resümee gezogen werden. Die Evaluation der vier printbasierten elektronischen Wörterbücher hat gezeigt, dass sie noch sehr dem Druckmedium verhaftet sind und sich kaum von ihren gedruckten Vorgängern unterscheiden. Häufig werden noch die drucktypischen textverdichtenden Abkürzungen verwendet. Die Möglichkeiten, Wortschatzbeziehungen durch Verlinkungen zwischen den Wortbildungsprodukten deutlich zu machen und Wortbildungsregeln durch Links in integrierte Grammatiken herauszustellen, werden nur unzureichend genutzt. In WahrigDigital und DudenPC-Bib sind Hyperlinks zwischen Wortbildungsprodukten zwar oft vorhanden, aber für den Nutzer nicht als Links erkennbar. Abgesehen vom DWDSretro erweitert keines der printbasierten Wörterbücher sein Angebot mit zusätzlichen medienspezifischen Elementen. Die digitale Version des LGWDaF hätte beispielsweise durch integrierte Audiodateien für die Aussprache der Stichwörter bereichert werden können. Ein Hauptvorteil der digitalen Varianten gegenüber ihren gedruckten Versionen scheint die Schnelligkeit der Suche zu sein. Die Nachschlagefähigkeiten - Sabina Ulsamer 50 Beherrschung des Alphabets, Abschätzung der Länge der Lemmastrecke, Kenntnis der Anordnungsprinzipien (Engelberg/ Lemnitzer 2009, S. 97-99) - sind für die Suche im elektronischen Wörterbuch weniger oder nicht relevant. In einem deutlichen Gegensatz zu den printbasierten Wörterbüchern stehen die drei untersuchten elektronischen Wörterbücher, die von Grund auf für das Internet konzipiert wurden. Abgesehen von dem eher unter texttechnologischen Gesichtspunkten zu betrachtenden WortschatzUniLeipzig machen sich das Internetlernerwörterbuch ELDIT und das allgemeinsprachliche Internetwörterbuch Canoo.net die Möglichkeiten dieses Mediums weit mehr zunutze als die printbasierten Internet- oder CD-ROM-Wörterbücher. Durch eine elaborierte Verlinkungspraxis zwischen simplizischen Nomen und ihren Komposita und Derivaten werden Wortschatz- und Wortbildungsbeziehungen sichtbar gemacht. Von dem großen Platzangebot in einem elektronischen Wörterbuch macht vor allem Canoo.net Gebrauch und listet zu einem Basiswort alle Wortbildungsprodukte auf, die in der Stichwortliste enthalten sind. Für nicht lemmatisierte Komposita und Derivate erhält der Nutzer sowohl in Canoo.net als auch in ELDIT Vorschläge, aus welchen Teilen das Wort besteht. Die Bestandteile sind als Hyperlinks realisiert, sodass der Nutzer diesen lediglich folgen muss, um Bedeutung und Grammatik der Bestandteile zu erhalten. Canoo.net bietet außerdem eine Zerlegung komplexer Stichwörter an, bei der sich die Wortbildungsschritte rekonstruieren lassen. Umfangreiche Informationen zur Wortbildung und Grammatik runden das Bild ab. Im Unterschied zu den printbasierten elektronischen Wörterbüchern liegt der Vorteil der für das Internet konzipierten nicht nur in der Schnelligkeit der Suche, sondern auch in der Vielzahl an Informationen, die durch wenige Mausklicks erreichbar sind. Bei der Digitalisierung von gedruckten Wörterbüchern sollten deshalb die Möglichkeiten, die das neue Medium bietet, viel stärker genutzt werden. 4. Schlussbetrachtung und Ausblick In diesem Beitrag sollten Forschungsmeinungen zu Wortbildung in Wörterbüchern der letzten 20 bis 30 Jahre dargestellt und mit der aktuellen Praxis in Print- und elektronischen Wörterbüchern verglichen werden. Wie deutlich geworden sein dürfte, liegt der Schwerpunkt in der Literatur auch in jüngerer Zeit noch immer auf Printwörterbüchern. Elektronische, auf CD- ROM oder online verfügbare Wörterbücher rücken erst allmählich ins Zentrum des Interesses. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 51 Die Gründe für Wortbildungsangaben im Wörterbuch sind vielfältig. Wortbildungen dienen der Wortschatzbereicherung, machen Beziehungen zwischen Wörtern und Bedeutungsvarianten der Ausgangslexeme deutlich. Sie helfen bei der semantischen Erschließung nicht lemmatisierter Wörter und von Adhoc-Bildungen. Wortelementlemmata zeigen ihr Potenzial für Wortbildungen auf und befähigen zu eigenen Neubildungen. Für Muttersprachler, aber gerade auch für Lerner bieten Wortbildungsangaben damit Hilfestellungen in Textrezeptionswie Textproduktionssituationen. Mit dem Erlernen von Wortbildungsbeziehungen und -regeln wird außerdem die Vernetzung im mentalen Lexikon unterstützt, was der Erweiterung des Wortschatzes in der Fremdsprache dient. Zur Gestaltung von Wortbildungsbeziehungen im (gedruckten) Wörterbuch werden neben makrostrukturellen Aspekten zur Artikelanordnung auch Empfehlungen für die Artikelgestaltung und das Verweissystem genannt. Vorgeschlagen werden die Erläuterung der Wortbildungsgrundlagen in den Umtexten, Wortbildungsprodukte als Sublemmata, Verweise auf Wortfamilien in einer Übersicht sowie motivierende und standardisierte Bedeutungsparaphrasen für gleiche Wortbildungstypen. Bei Wortelementlemmata werden die Lesartenunterscheidung und die Angabe von Beschränkungen als obligatorische Informationen gefordert. Ferner sollte das Verweissystem stärker ausgeschöpft werden, sodass von Ableitungen auf die jeweiligen Wortbildungselemente verwiesen wird und umgekehrt von Wortbildungselementen auf entsprechende Wortbildungsprodukte. Wichtig ist der Verweis auf die jeweilige Lesart der einzelnen Bestandteile. Die verschiedenen in der Forschung genannten Möglichkeiten zur Darstellung von Wortbildungsbeziehungen werden in den Wörterbüchern in unterschiedlichem Maße genutzt, wie im Zwischenfazit zu den gedruckten Wörterbüchern (vgl. Kap. 3.1.3) und dem zu elektronischen Wörterbüchern (vgl. Kap. 3.2.3) zusammengefasst wurde. Schwerpunkte der Evaluation waren die Betrachtung der Bedeutungserläuterung im Hinblick auf die Verwendung formelhafter Paraphrasen, die Nennung weiterer Wortbildungsprodukte und damit verbunden die Überprüfung der Verweisungspraxis sowie die Frage nach der Darstellung von Wortbildungsprozessen. Bei den elektronischen Wörterbüchern stand die medienspezifische Angemessenheit zur Diskussion. Während sich die Druckwörterbücher vor allem standardisierter Paraphrasen von motivierten Wortbildungsprodukten bedienen, um Wortbildungsregularitäten herauszustellen, versuchen die „echten“ elektronischen Wörterbücher dies eher über Verlinkungen zwischen den Wortbildungsprodukten und Verweise Sabina Ulsamer 52 in die Wörterbuchgrammatik zu erreichen. In Printwie in elektronischen Wörterbüchern sollen Wortbildungsprodukte bei (den hier untersuchten) simplizischen Nomen das Wortbildungspotenzial verdeutlichen. Die gedruckten Wörterbücher nennen dabei sowohl Lemmata, die selbst auch im Wörterverzeichnis des Wörterbuches sind, als auch andere. Wegen fehlender Verweisanzeiger ist allerdings oft nicht ersichtlich, welche dieser Wörter lemmatisiert sind. Die beiden elektronischen Wörterbücher Canoo.net und ELDIT listen nur diejenigen Lemmata auf, die der Nutzer ebenfalls im Wörterbuch finden kann. Über Hyperlinks gelangt er sofort zu dem entsprechenden Wortartikel. Nun wurde von vielen Metalexikographen begründet, warum sie Wortbildungsangaben für sinnvoll halten: Zum Teil stand die linguistische und grammatische Motivierung im Vordergrund, besonders aber wurden die Nutzerinteressen hervorgehoben. Wörterbuchmacher haben diese Forderungen und Ideen mal mehr, mal weniger konsequent umgesetzt. Was jedoch noch völlig aussteht, ist die Klärung der Frage, was den Wörterbuchbenutzern tatsächlich nutzt. Alle in der Forschung angeführten Nutzerinteressen basieren auf der Introspektion der Autoren, nicht jedoch auf Studien mit einer ausreichenden Zahl an Wörterbuchbenutzern, welche die vorgetragenen (angeblichen) Interessen untermauern könnten. Kann ein Lerner mit Komposita und Derivaten, die bei einem Stichwort genannt werden, tatsächlich selbst produktiv werden und eigene Bildungen realisieren? Besteht darin nicht vielleicht die Gefahr, dass Lerner auch „unmögliche“ Komposita bilden? Erkennt die Nutzerin mit dieser Praxis tatsächlich Bedeutungsvarianten des Ausgangslexems oder verwirrt dies nur? Werden dem Nutzer tatsächlich Strukturzusammenhänge durch formelhafte Bedeutungsparaphrasen deutlich? Beim Nachschlagen einer einzigen Wortbildung scheint das eher unwahrscheinlich. Neben den hier vorgenommenen Vergleich zwischen Theorie und Praxis muss deshalb die Überprüfung der Nutzerbedürfnisse im Rahmen von Wörterbuchbenutzungsstudien treten. Besonders elektronische Wörterbücher müssen stärker in den Blick genommen werden. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 53 5. Literaturverzeichnis 5.1 Wörterbücher 5.1.1 Printwörterbücher DDaF (2003) = Duden Wörterbuch Deutsch als Fremdsprache. Hrsg. von der Dudenredaktion in Zusammenarbeit mit dem Max Hueber Verlag. Mannheim u.a. DGWDaF (2000) = Wörterbuch Deutsch als Fremdsprache. Von Günter Kempcke unter Mitarbeit von Barbara Seelig, Birgit Wolf, Elke Tellenbach et al. Berlin/ New York. DUW (2001) = Duden Deutsches Universalwörterbuch. 4., neu bearb. und erw. Aufl. Herausgegeben von der Dudenredaktion. Mannheim u.a. HueberDaF (2007) = Hueber Wörterbuch Deutsch als Fremdsprache. 2. Aufl. Ismaning/ Mannheim. LDOCE (1995) = Longman Dictionary of Contemporary English. Völl. Neuentw. 1995. 3. Ausg. München. LGWDaF (2008) = Langenscheidt Großwörterbuch Deutsch als Fremdsprache. Neubearbeitung. Hrsg. von Dieter Götz, Günther Haensch, Hans Wellmann und der Langenscheidt-Redaktion. München. Wahrig (2006) = Wahrig Deutsches Wörterbuch. 8., vollst. neu bearb. und akt. Aufl. Gütersloh/ München. WahrigDaF (2008) = Wahrig Großwörterbuch Deutsch als Fremdsprache. Hrsg. von Renate Wahrig-Burfeind. Gütersloh/ München/ Berlin. 5.1.2 Elektronische Wörterbücher Canoo.net = Deutsche Wörterbücher und Grammatik. Internet: http: / / www.canoo.net. Stand: 09/ 2011. DudenPC-Bib = Duden - Das große Wörterbuch der deutschen Sprache (2000). In: Die PC-Bibliothek 3.0. 1993-2001. Mannheim. [CD-ROM]. DWDSretro = Das Digitale Wörterbuch der deutschen Sprache des 20. Jahrhunderts. Internet: http: / / retro.dwds.de/ (Stand: 09/ 2011). ELDIT = Elektronisches Lernerwörterbuch Deutsch-Italienisch. Dizionario elettronico per apprendenti Italiano-Tedesco (EURAC Research Bozen). Internet: http: / / dev.eurac.edu: 8081/ MakeEldit1/ Eldit.html (Stand: 09/ 2011). LGWDaFonline = Langenscheidt Online Wörterbücher. Internet: http: / / services. langenscheidt.de/ hebis/ (Stand: 09/ 2011). WahrigDigital = Wahrig Deutsches Wörterbuch (2003). Gütersloh/ München. [CD- ROM]. WortschatzUniLeipzig = Wortschatz Universität Leipzig. Internet: http: / / wortschatz. uni-leipzig.de/ (Stand: 09/ 2011). Sabina Ulsamer 54 5.2 Forschungsliteratur Barz, Irmhild (2001): Wortbildungsbeziehungen im einsprachigen Bedeutungswörterbuch. In: Korhonen (Hg.), S. 85-100. Barz, Irmhild (2002): Die Wortbildungsmittel im „de Gruyter Wörterbuch Deutsch als Fremdsprache“. In: Wiegand (Hg.), S. 105-121. Barz, Irmhild (2003): Affixe im GWDS. Die Entwicklung der Lemmaselektion. In: Wiegand, Herbert Ernst (Hg.): Untersuchungen zur kommerziellen Lexikographie der deutschen Gegenwartssprache I. „Duden. Das große Wörterbuch der deutschen Sprache in zehn Bänden“. Tübingen, S. 383-393. Bergenholtz, Henning (2000): Lexikographie und Wortbildungsforschung. In: Barz, Irmhild/ Schröder, Marianne/ Fix, Ulla (Hg.): Praxis- und Integrationsfelder der Wortbildungsforschung. Heidelberg, S. 19-30. De Caluwe, Johan/ Taeldemann, Johan (2003): Morphology in dictionaries. In: van Sterkenburg, Piet (Hg.): A practical guide to lexicography. Amsterdam/ Philadelphia, S. 114-125. Engelberg, Stefan/ Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4., überarb. u. erw. Aufl. Tübingen. Holly, Werner (1986): Wortbildung und Wörterbuch. In: Lexicographica 2, S. 195-213. Kempcke, Günter (1992): Organisationsprinzipien und Informationsangebote in einem Lernerwörterbuch. In: Brauße, Ursula/ Viehweger, Dieter (Hg.): Lexikontheorie und Wörterbuch. Wege der Verbindung von lexikologischer Forschung und lexikographischer Praxis. Tübingen, S. 165-243. Klosa, Annette (2005): Wortbildung. In: Haß, Ulrike (Hg.) (2005): Grundfragen der elektronischen Lexikographie. elexiko - das Online-Informationssystem zum deutschen Wortschatz. Berlin/ New York, S. 141-161. Klosa, Annette (2008): Zur Optimierung von Wortbildungsangaben in DaF-Wörterbüchern auf der Basis systematischer Korpusuntersuchungen. In: Deutsch als Fremdsprache 4/ 2008, S. 208-215. Korhonen, Jarmo (Hg.) (2001): Von der monozur bilingualen Lexikografie für das Deutsche. Frankfurt a.M. Motsch, Wolfgang (1982): Wortbildungen im einsprachigen Wörterbuch. In: Agricola, Erhard/ Schildt, Joachim/ Viehweger, Dieter (Hg.): Wortschatzforschung heute. Aktuelle Probleme der Lexikologie und Lexikographie. Leipzig, S. 62-71. Müller, Wolfgang (1982). Wortbildung und Lexikographie. In: Wiegand, Herbert Ernst (Hg.): Studien zur neuhochdeutschen Lexikographie II. (= Germanistische Linguistik 3-6/ 80). Hildesheim/ New York, S. 153-188. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 55 Müller, Wolfgang (1989): Die Beschreibung von Affixen und Affixoiden im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef/ Reichmann, Oskar/ Wiegand, Herbert Ernst/ Zgusta, Ladislav (Hg.): Wörterbücher. Ein internationales Handbuch zur Lexikographie / Dictionaries. An international encyclopedia of lexicography. 1. Teilbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science 5.1). Berlin/ New York, S. 869-882. Müller-Spitzer, Carolin (2003): Ordnende Betrachtungen zu elektronischen Wörterbüchern und lexikographischen Prozessen. In: Lexicographica 19, S. 140-168. Mugdan, Joachim (1984). Grammatik im Wörterbuch: Wortbildung. In: Wiegand, Herbert Ernst (Hg.): Studien zur neuhochdeutschen Lexikographie IV. (= Germanistische Linguistik 1-3/ 83). Hildesheim/ New York, S. 237-308. Poethe, Hannelore (1996): Wortbildung im Großwörterbuch Deutsch als Fremdsprache. In: Barz, Irmhild/ Schröder, Marianne (Hg.): Das Lernerwörterbuch Deutsch als Fremdsprache in der Diskussion. (= Sprache - Literatur und Geschichte. Studien zur Linguistik − Germanistik 12). Heidelberg, S. 189-207. Poethe, Hannelore (2005): Zur Konversion im Wörterbuch. In: Barz, Irmhild/ Bergenholtz, Henning/ Korhonen, Jarmo (Hg): Schreiben, Verstehen, Übersetzen, Lernen. (= Finnische Beiträge zur Germanistik 14). Frankfurt a.M., S. 299-313. Prćić, Tvrtko (1999): The treatment of affixes in the ‘big four’ EFL dictionaries. In: International Journal of Lexicography 12, 4, S. 263-279. Seelig, Barbara (2001): Neue lexikographische Wege der Darstellung in de Gruyters Wörterbuch ‘Deutsch als Fremdsprache’. In: Korhonen (Hg.), S. 65-84. Stein, Gabriele (1985): Word-Formation in modern English Dictionaries. In: Ilson, Robert (Hg.): Dictionaries, Lexicography and Language Learning (= ELT Documents Series 120). Oxford, S. 35-44. ten Hacken, Pius/ Abel, Andrea/ Knapp, Judith (2006): Word formation in an electronic learners' dictionary: ELDIT. In: International Journal of Lexicography 19, 3, S. 243-256. Vachková, Marie (2002): Wortbildung und zweisprachiges Wörterbuch. In: Barz, Irmhild/ Fix, Ulla/ Lerchner, Gotthard (Hg.): Das Wort in Text und Wörterbuch. (= Abhandlungen der Sächsischen Akademie der Wissenschaften zu Leipzig, Philologisch-historische Klasse 76, 4). Stuttgart/ Leipzig, S. 119-126. van der Colff, Adri (1998): Die Komposita in „Langenscheidts Großwörterbuch Deutsch als Fremdspprache“. In: Wiegand, Herbert Ernst (Hg.): Perspektiven der pädagogischen Lexikographie des Deutschen. (= Lexicographica. Series Maior 86). Tübingen, S. 193-207. Wiegand, Herbert Ernst (2002): Zur Makrostruktur und zu den äußeren Zugriffsstrukturen im DGWDaF. In: Wiegand (Hg.), S. 413-442. Sabina Ulsamer 56 Wiegand, Herbert Ernst (Hg.) (2002): Perspektiven der pädagogischen Lexikographie des Deutschen II. Untersuchungen anhand des „de Gruyter Wörterbuchs Deutsch als Fremdsprache“. (= Lexicographica. Series Maior 110). Tübingen. 5.3 Weiterführende Literatur 5.3.1 Wortbildung in Wörterbüchern Barz, Irmhild (1995): Komposita im Großwörterbuch Deutsch als Fremdsprache. In: Pohl, Inge/ Ehrhardt, Horst (Hg.): Wort und Wortschatz. Beiträge zur Lexikologie. Tübingen, S. 13-24. Bergenholtz, Henning (2005): Wortbildungen im Text und im Wörterbuch. In: Fix, Ulla/ Lerchner, Gotthard/ Schröder, Marianne/ Wellmann, Hans (Hg.): Zwischen Lexikon und Text. Lexikalische, stilistische und textlinguistische Aspekte. (= Abhandlungen der Sächsischen Akademie der Wissenschaften zu Leipzig, Philologisch-historische Klasse 78, 4). Stuttgart/ Leipzig, S. 125-143. Burgschmidt, Ernst (2004): Theorie der Wortbildung und ihr Reflex im Wörterbuch. In: Herbst, Thomas/ Lorenz, Gunter/ Mittmann, Brigitta/ Schnell, Martin (Hg.): Lexikografie, ihre Basis- und Nachbarwissenschaften. (Englische) Wörterbücher zwischen „common sense“ und angewandter Theorie. (= Lexicographica. Series Maior 118). Tübingen, S. 175-184. Dardano, Maurizio/ Frenguelli, Gianluca/ Colella, Gianluca (2006): What lexicographers do with word formation. In: Corino, Elisa/ Marello, Carla/ Onesti, Cristina (Hg.): Proceedings XII Euralex International Congress, Turin, 6.-9. September 2006. Alessandria, S. 1115-1127. Elsen, Hilke/ Michel, Sascha (2007): Wortbildung im Sprachgebrauch. Desiderate und Perspektiven einer etablierten Forschungsrichtung. In: Muttersprache 1, S. 1-16. Hausmann, Franz Josef (1989): Die Markierung im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef/ Reichmann, Oskar/ Wiegand, Herbert Ernst/ Zgusta, Ladislav (Hg.): Wörterbücher. Ein internationales Handbuch zur Lexikographie. 1. Teilbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft 5.1). Berlin/ New York, S. 649-657. Hyvärinen, Irma (2005): Finnische und deutsche adjektivische Zusammenbildungen in der Wortbildungslehre und in ein- und zweisprachigen Wörterbüchern. In: Barz, Irmhild/ Bergenholtz, Henning/ Korhonen, Jarmo (Hg.): Schreiben, Verstehen, Übersetzen, Lernen. (= Finnische Beiträge zur Germanistik 14). Frankfurt a.M., S. 251-267. Jackson, Howard (2004): Lexicography. In: Booij, Geert/ Lehmann, Christian/ Mugdan, Joachim (Hg.): Morphologie: ein internationales Handbuch zur Flexion und Wortbildung (= Handbücher zur Sprach- und Kommunikationswissenschaft 2). Berlin/ New York, S. 1882-1892. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 57 Kempcke, Günter (1996): Zur Makro- und Mikrostruktur in Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In: Barz, Irmhild/ Schröder, Marianne (Hg.): Das Lernerwörterbuch Deutsch als Fremdsprache in der Diskussion. (= Sprache - Literatur und Geschichte. Studien zur Linguistik − Germanistik 12). Heidelberg, S. 115-128. Kettemann, Bernhard/ König, Martina/ Marko, Georg (2003): The BNC and the OED. Examining the usefulness of two different types of data in an analysis of the morpheme eco. In: Granger, Sylviane/ Petch-Tyson, Stephanie (Hg.): Extending the scope of corpus-based research. New applications, new challenges. Amsterdam/ New York, S. 135-148. Møller, Elisabeth (1988): Komposita - Ihre Behandlung in einbzw. zweisprachigen Wörterbüchern. In: Hyldgaard-Jensen, Karl/ Zettersten, Arne (Hg.): Symposium on Lexicography III. Proceedings of the Third International Symposium on Lexicography May 14-16, 1986 at the University of Copenhagen. (= Lexicographica. Series Maior 19). Tübingen, S. 88-103. Schierholz, Stefan J. (1998): Die Grammatik der Substantive in „Langenscheidts Großwörterbuch Deutsch als Fremdsprache“. In: Wiegand, Herbert Ernst (Hg.): Perspektiven der pädagogischen Lexikographie des Deutschen I. Untersuchungen anhand von „Langenscheidts Großwörterbuch Deutsch als Fremdsprache“ (= Lexicographica. Series Maior 86). Tübingen, S. 88-103. Schierholz, Stefan J. (2002): Die Grammatik der Substantive im „de Gruyter Wörterbuch Deutsch als Fremdsprache“. In: Wiegand, Herbert Ernst (Hg.): Perspektiven der pädagogischen Lexikographie des Deutschen II. Untersuchungen anhand des „de Gruyter Wörterbuchs Deutsch als Fremdsprache“ (= Lexicographica. Series Maior 110). Tübingen, S. 75-90. ten Hacken, Pius (1998): Word formation in electronic dictionaries. In: Dictionaries. Journal of the Dictionary Society of North America 19, S. 158-187. 5.3.2 Wortelementlemmata in Wörterbüchern Allhoff, Jürgen (1992): Die Berücksichtigung von Affixen in Wörterbüchern. In: Meder, Gregor/ Dörner, Andreas (Hg.): Worte, Wörter, Wörterbücher. Lexikographische Beiträge zum Essener linguistischen Kolloquium. (= Lexicographica. Series Maior 42). Tübingen, S. 62-86. Augst, Gerhard (1992): Das lexikologische Phänomen der Wortfamilie in alphabetisch-semasiologischen Wörterbüchern. In: Zeitschrift für germanistische Linguistik 20, S. 24-36. Augst, Gerhard (2005): Die Wortfamilie als Ordnungskriterium in elementaren Lernerwörterbüchern. In: Fix, Ulla/ Lerchner, Gotthard/ Schröder, Marianne/ Wellmann, Hans (Hg.): Zwischen Lexikon und Text. Lexikalische, stilistische und textlinguistische Aspekte. (= Abhandlungen der Sächsischen Akademie der Wissenschaften zu Leipzig, Philologisch-historische Klasse 78, 4.). Stuttgart/ Leipzig, S. 111-124. Sabina Ulsamer 58 Bergenholtz, Henning (1989): Probleme der Selektion im allgemeinen einsprachigen Wörterbuch. In: Hausmann et al. (Hg.), S. 772-779. Frisch, Regina (1994): Lexikographische Beschreibung von Wortbildungselementen in zweisprachigen Wörterbüchern. In: Hyvärinen, Irma/ Klemmt, Rolf (Hg.): Von Frames und Slots bis Krambambuli: Beiträge zur zweisprachigen Lexikographie. Referate der zweiten internationalen Lexikographiekonferenz Jyväskylä, Finnland 24.-26.3.1994. (= Studia Philologica Jyväskyläensia 34). Jyväskylä, S. 113-130. Hausmann, Franz Josef/ Reichmann, Oskar/ Wiegand, Herbert Ernst/ Zgusta, Ladislav (Hg.) (1989): Wörterbücher. Ein internationales Handbuch zur Lexikographie / Dictionaries. An international encyclopedia of lexicography. 1. Teilbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science 5.1). Berlin/ New York Hyvärinen, Irma (2000): Zur Wortbildung in einem deutsch-finnischen Großwörterbuch im Werden - Probleme der Lemmatisierung von Wortbildungselementen. In: Barz, Irmhild/ Schröder, Marianne/ Fix, Ulla (Hg.): Praxis- und Integrationsfelder der Wortbildungsforschung. Heidelberg, S. 31-54. Kastovsky, Dieter (2009): Astronaut, astrology, astrophysics: About combining forms, classical compounds and affixoids. In: McConchie, Roderick W. (Hg.): Selected proceedings of the 2008 Symposium on New Approaches in English Historical Lexis (HEL-LEX 2). Sommerville, MA, S. 1-13. Link, Elisabeth (1990): Das Wörterbuch der Wortbildungsmittel. In: Hausmann, Franz Josef/ Reichmann, Oskar/ Wiegand, Herbert Ernst/ Zgusta, Ladislav (Hg.): Wörterbücher. Ein internationales Handbuch zur Lexikographie / Dictionaries. An international encyclopedia of lexicography. 2. Teilbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science 5.2). Berlin/ New York, S. 1223-1230. Müller, Peter O. (2000): Deutsche Fremdwortbildung. Probleme der Analyse und der Kategorisierung. In: Habermann, Mechthild/ Müller, Peter O./ Naumann, Bernd (Hg.): Wortschatz und Orthographie in Geschichte und Gegenwart. Tübingen, S. 115-134. Prćić, Tvrtko (2005): Prefixes vs. initial combining forms in English: A lexicographic perspective. In: International Journal of Lexicography 18, 3, S. 313-334. Prćić, Tvrtko (2008): Suffixes vs. final combining forms in English: A lexicographic perspective. In: International Journal of Lexicography 21, 1, S. 1-22. Rettig, Wolfgang (1989): Die Wortbildungszusammenhänge im allgemeinen einsprachigen Wörterbuch. In: Hausmann et al. (Hg.), S. 642 - 649. Schmidt, Rosemarie (2000): Grammatik und Lexikographie. Wortbildungsmittel im zweisprachigen Wörterbuch anhand deutscher, schwedischer und russischer Beispiele. In: Bayer, Josef/ Römer, Christine (Hg.): Von der Philologie zur Grammatiktheorie. Peter Suchland zum 65. Geburtstag. Tübingen, S. 303-313. Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit 59 Seiffert, Anja (2005): Das Konfix im einsprachigen Lernerwörterbuch. Eine Untersuchung anhand des „Duden. Deutsch als Fremdsprache“. In: Barz, Irmhild/ Bergenholtz, Henning/ Korhonen, Jarmo (Hg): Schreiben, Verstehen, Übersetzen, Lernen. (= Finnische Beiträge zur Germanistik 14). Frankfurt a.M., S. 285-297. Starke, Günter (1992): Der Übergang von Kompositionsgliedern zu Suffixen im Spiegel des einsprachigen Wörterbuchs. In: Große, Rudolf/ Lerchner, Gotthard/ Schröder, Marianne (Hg.): Beiträge zur Phraseologie, Wortbildung, Lexikologie. Festschrift für Wolfgang Fleischer zum 70. Geburtstag. Frankfurt a.M. u.a., S. 115-124. Tellenbach, Elke (1985): Wortbildungsmittel im Wörterbuch. Zum Status der Affixoide. In: Linguistische Studien A 122, S. 266-315. 5.4 Internetressourcen Automatische Sprachverarbeitung am Institut für Informatik der Universität Leipzig. Internet: http: / / asv.informatik.uni-leipzig.de/ about (Stand: 09/ 2011). Canoo.net − Deutsche Wörterbücher und Grammatik. Internet: http: / / www.canoo.net/ services/ ueberblick/ verantwortung.html (Stand: 09/ 2011). DeReKo. Das Deutsche Referenzkorpus. Internet: http: / / www.ids-mannheim.de/ kl/ projekte/ korpora/ (Stand: 09/ 2011). DWDS-Projekt. Internet: http: / / retro.dwds.de/ woerterbuch (Stand: 09/ 2011). ELDIT-Programm. Internet: http: / / dev.eurac.edu: 8081/ MakeEldit1/ Eldit.html unter „Was ist das ELDIT-Programm? “. (Stand: 09/ 2011). A) Theoretische Aspekte von Wortbildung im Wörterbuch Ludwig M. Eichinger Wortbildung im Wörterbuch Aus der Sicht eines Grammatikers 1. Wörter ins Wörterbuch! Wenn das Ergebnis von Wortbildung komplexe Wörter sind, sind die Ergebnisse von Prozessen der Wortbildung zumindest auf den ersten Blick geborene Kandidaten dafür, in ein Wörterbuch aufgenommen zu werden. 1 Dass die Prozesse der Wortbildung zudem im Wesentlichen nur die drei sogenannten Hauptwortarten Substantiv, Adjektiv und Verb betreffen, macht die Antwort auf die Frage, ob komplexe Wörter in ein Wörterbuch aufzunehmen wären, eigentlich noch leichter. Nur nebenher sei angemerkt, dass das Reden von „Wörtern“ in diesem Sinn natürlich das Reden von potenziellen Wörtern meint, also - im Fall der komplexen Wörter zumindest - von lexematischen Einheiten erkennbarer Strukturiertheit, deren Realisierung eine flexivische Einbettung bedingt, die in Wörterbucheinträgen die Gebrauchsbeispiele belegen. So weit scheint die Sache einfach zu sein: Wörter gehören ins Wörterbuch. Die andere Seite ist allerdings, dass die Wortbildung einen produktiven Apparat diffusen Charakters darstellt. Die Abbildung produktiver Prozesse, die nicht ein endliches Paradigma andeuten, ist eher nicht die typische Aufgabe des Wörterbuchs: So enthalten Wörterbücher in der Regel keine explizite und gar vollständige Satzgrammatik, vielmehr einerseits Signale für die Einbettung in eine flexionsmorphologische Paradigmatik, andererseits Grundregeln (zumindest auch) lexikalischer Steuerung. Das betrifft einerseits rektionale Informationen (z.B. Valenzmuster), 2 andererseits die Angabe von Kollokationen oder Konstruktionstypen. Ähnliche Beschränkungen kann man bei den Phänomenen der Wortbildung erwarten. Auch hier gibt es Phänomene einer spezifischen Morphologie - bei den Affixen der Derivation -, es gibt Beziehungen, die mutatis mutandis der Rektion vergleichbar sind - vor allem bei Fällen, die in Wortbildungslehren gerne als Übergangsfälle erscheinen, z.B. 1 In dem vorliegenden Beitrag dient eine Übersicht über die in elektronischen Wörterbüchern gängige Praxis, wie ihn Klosa (2005) darstellt, als eine Art Hintergrundinformation. Es werden im Folgenden nicht die dort ausgeführten Positionen diskutiert. 2 Dazu systematischer Eichinger (2006b). Ludwig M. Eichinger 64 Rektionskomposita, 3 Affixoidbildungen u.Ä. - und es gibt den vielleicht allem anderen formal unverwandtesten Fall, die Komposition, die verschiedenste Arten von Relation durch simple Univerbierungsprozesse zu integrieren vermag. 2. Wissen über Struktur und Gebrauch 2.1 Informationstypen und Aufnahmekriterien Welchen systematischen Platz haben unter diesen Voraussetzungen Informationen zur Wortbildung im Wörterbuch? Wie in den gerade gemachten Bemerkungen schon angedeutet, hängt das von den verschiedenen Arten ab, in denen sich Wortbildung realisieren kann. Sie repräsentieren unterschiedliche Schnittpunkte im Hinblick auf das Variablenbündel, das Wortbildung insgesamt charakterisiert. Wortbildungseinheiten sind im Hinblick auf drei Kategorisierungen gekennzeichnet, die schon bei der Aufnahme oder Nichtaufnahme in das Wörterbuch eine Rolle spielen und sich als Kategorien von entsprechenden Einträgen in Wörterbüchern niederschlagen. Zum ersten handelt es sich um den genannten Ausschnitt aus dem Paradigma der Wortarten und dann ein in nicht banaler Weise zugeordnetes Set an Wortbildungsarten, die die funktionale Spannweite zwischen Modifikation und Transposition abdecken. Die dritte Kategorisierung misst den Grad an Lexikalisierung. Sie ist textpragmatisch fundiert und weniger klar paradigmatisch differenziert. Die Bemessung der „Lexikalität“ eines potenziellen Eintrags stellt sich dar als das Produkt von Werten auf drei graduierenden Skalen. Am engsten an die anderen beiden Kategorisierungen schließt jene Skala an, die sich zwischen den Polen (relativer) Motiviertheit und Idiomatisierung bewegt. Eine zweite Ebene ist die der Üblichkeit, eine Kategorie, die sicher nicht so leicht zu fassen ist. Sie ist wohl einerseits über die Häufigkeit des Auftretens zu messen, andererseits über die Notwendigkeit der kontextuellen Unterstützung des Verständnisses. Davon zu trennen ist vermutlich die Produktivität der Bildungsmuster und gegebenenfalls ihre analogische Ausweitung. Es ist offenkundig, dass es die Variabilität auf den Ebenen der dritten Kategorisierung ist, mittels der die unterschiedlichen Verhältnisse zwischen Wortbildung und lexikographischer Verzeichnung beschrieben und so über die Frage entschieden wird, was davon einen Raum im Wörterbuch hat. 3 Ein typischer Fall wären die sogenannten Partizipialkomposita; vgl. Eichinger (2006a, S. 187ff.). Wortbildung im Wörterbuch 65 Es ist ein Vorteil einer elektronischen Lexikographie, die konsequent die Möglichkeiten des Mediums nutzt, dass die Entscheidungen über die Aufnahme bestimmter sprachlicher Einheiten, aber auch bestimmter Informationen zu ihrer Kombinierbarkeit, keine reine Ja-Nein-Entscheidung sein muss, sondern an passender Stelle die Frage danach ist, was im Vordergrund des „Wörterbuchtextes“ erscheint und was aus verschiedenen Hintergründen beigebracht wird. 2.2 Lexikalisierung Wenn man in einem ersten Schritt eine Bewertung nach den oben genannten drei linguistischen Kriterien vornimmt, sieht man, dass nicht alle Ergebnisse von Wortbildungsprozessen verzeichnungswürdig sind. Das gilt zumindest für das hier als Folie angenommene allgemeinsprachliche einsprachige Wörterbuch, in dem das potenzielle geteilte oder doch teilenswürdige „Lexikon“ einer Sprechergemeinschaft dokumentiert werden soll. So gibt es zumindest im kompositionellen Teil der Wortbildung tatsächlich Textwörter, die über ihre textstrukturierende Funktion hinaus keinen weiteren sprachlichen Platz beanspruchen. Wir finden sie in ganz vielen Texten, und hier hilft, wie im Beispiel (1), oft schon eine geringfügige Stützung durch den Kontext, um die Hinweise durch die interne Syntagmatik des Kompositums aufzulösen. Auch wenn wir nur den einen Satz haben und die intertextuellen Erfahrungen eines Lesers solcher Texte - einer geschichtswissenschaftlichen Monographie - wissen wir genug. Und es ist ebenso wenig nötig, die Bildung Fußgängerstadt mit einer Bedeutungserläuterung vom Typ ‘Stadt, für die Fußgänger typisch sind’ in ein Wörterbuch aufzunehmen wie überhaupt eine solche Paraphrase zu bilden, erklärt sie ja gerade nicht, was die funktionale Eigenheit von Komposita ist: (1) Die Fußgängerstadt des frühen 19. Jahrhunderts hingegen war das schiere Mittelalter. (Osterhammel 2009, S. 450) 4 Nun scheint die Fußgängerstadt eher ein Wort für diesen textuellen Ort zu sein, 5 eine Ad-hoc-Bildung, die allerdings wenig Auffälligkeit in sich trägt. Es gibt Ad-hoc-Bildungen, die eine mehr oder minder große Zeit lang im sprach- 4 Hervorhebungen hier und im Folgenden durch mich [L.M.E.]. 5 Sie wird im zitierten Kontext der „modernen“ Stadt der mechanisierten Verkehrsmittel, der Straßenbeleuchtung usw. gegenübergestellt, die ihren wortbildungsmäßigen Niederschlag z.B. in Robert Musils „Mann ohne Eigenschaften“ (1978, Bd. 1, S. 31) findet, wo es die Vorstellung einer Zukunftsstadt mit vielfach geschichteten Verkehrsstraßen gibt, in Ludwig M. Eichinger 66 lichen Leben eine Rolle spielen und vielleicht als echte Neologismen an die Tür des „Lexikons“ einer repräsentativen Anzahl von Sprechern klopfen. So sieht man in dem folgenden Text, dass der öffentliche Diskurs über bestimmte Phänomene des Sexuallebens eine Reihe von Komposita hervorgebracht hat, die Neuerungen sind, aber zweifellos nicht mehr von den Bedingungen des Einzeltextes abhängen. 6 (2) Swingerclubs, Pornoindustrie, Vermarktung von Potenzmitteln, Telefonsex, Internetsex, Rückzug der Eltern als Verhinderungsinstanzen, Absinken des Durchschnittsalters beim ersten sexuellen Kontakt, Seitensprungagenturen, Entstigmatisierung der Homosexualität bis zur Homoehe [...]. (Schulze 2006, S. 39) Wenn man das Deutsche Referenzkorpus des IDS (DeReKo) mit COSMAS II dazu befragt, ergeben sich zumindest zur Häufigkeit unterschiedliche Verhältnisse. Am breitesten und kontinuierlichsten belegt ist das Wort Potenzmittel mit immerhin 993 Belegen, die - bis auf 2 7 - seit 1990 auftauchen und 1998 mit 232 Belegen einen deutlichen Höhepunkt haben, während die Belegzahlen in den letzten Jahren so um die 50 schwanken. Es wird gefolgt von Telefonsex, das sich im Jahr 1991 zum ersten Mal (mit 2 Belegen) findet, in den Jahren 1998 und 1999 mit jeweils knapp 100 Belegen am häufigsten vorkommt, um seit 2001 bei einer Belegzahl zwischen 10 und 20 zu schwanken (mit insgesamt 521 Belegen). Am Ende der Belegung liegt die Seitensprungagentur mit 13 Belegen seit 1997, wobei sich zwischen 2000 und 2010 nur in vier Jahren jeweils ein Beleg findet. 8 der Luftzüge, Erdzüge, Unterdzüge, Rohrpostmenschensendungen und Kraftwagenketten die horizontale Bewegung ausmachen. Dieser Text ist als Beispiel für Komposition auch in Eichinger (2000, S. 115) aufgeführt. Vgl. auch, was Wendelin Schmidt-Dengler in diesem Kontext zum Bild Wiens in den literarischen Texten zu Beginn des 20. Jahrhunderts schreibt: „Die Stadt wird ergangen, die modernen Verkehrsmittel sind kaum existent, vor allem: es wird aus dem Stadtverkehr das Tempo herausgenommen.“ (Schmidt-Dengler 2004, S. 106). 6 Für die Üblichkeit des Wortes Swingerclub spricht der Tatbestand, dass von den im Deutschen Referenzkorpus des IDS für das Jahr 2010 verzeichneten 37 Belegen 30 auf die Installation eines echten solchen Clubs im Rahmen einer Kunstausstellung in der Wiener Secession entfallen. 7 Das ist der Grund, dass dieses Wort im Unterschied zur Potenzpille nicht als Neologismus der 1990er Jahre geführt wird; es hat seinen Schwerpunkt noch eindeutiger (707 von insgesamt 1 113 Belegen) im Jahr 1998, im Jahr der Markteinführung des Medikaments Viagra. 8 Häufiger ist übrigens die Entstigmatisierung, die seit 1993 regelmäßig in kleinen Zahlen und insgesamt 42-mal belegt ist. In den allermeisten Fällen ist der Kontext „psychische Auffälligkeit“, einzelne Belege haben einen allgemeineren Kontext von „zu Unrecht Verdrängtem“. Wortbildung im Wörterbuch 67 Es ist schon aus diesen Beispielen ersichtlich, dass es bei der Üblichkeit nicht nur um die Häufigkeit geht, dass Üblichkeit im Hinblick auf eine lexikographische Verzeichnung eine Kategorie ist, die mindestens von zwei weiteren Faktoren gesteuert ist: von der Zugänglichkeit der Sprachebene und von einem erkennbaren allgemeinen gesellschaftlichen Interesse an dem Diskursausschnitt, dem ein Wort zuzurechnen ist. So gesehen hat auch die Fußgängerstadt im Sinne neuerer ökologischer Stadtplanung an sich das Zeug zum Neologismus, allerdings hat sich, soweit man das an den Korpora sehen kann, trotz entsprechender Ansätze in diesem Kontext eher die fußgängergerechte analog zur autogerechten Stadt durchgesetzt. Das eine ist wie gesagt die Häufigkeit und Üblichkeit, das andere ist die Frage der Allgemeinsprachlichkeit und ihrer Ränder. Manches Mal scheinen Bildungen so weit von einer sprachlichen Neutralebene - z.B. in einer Domäne fachlicher Kommunikation - zu liegen, dass man über ihren Status im Wörterbuch nachdenkt. (3) Das Drehen von Ringen mit grossen Durchmessern und die Bearbeitung schwerst zerspanbarer und hochwarmfester Materialien für die Produktion von Turbinenrotor-Einbauteilen. (St. Galler Tagblatt, 24.10.2009) Wenn man auf die Korpusbelege sieht, sind diese oder verwandte Bildungen gar nicht so selten, 9 auf den ersten Blick aber auf jeden Fall sehr durchsichtig und nachvollziehbar. Sie sind allerdings in alltäglicheren Texten stark kontextuell unterstützt und hochgradig terminologisiert, und Terminologisierung kann man als einen Sonderfall von Idiomatisierung betrachten. 10 Häufigkeit, Üblichkeit, Verwendungsspezifik waren die bisher genannten Punkte. Dazu kommt noch die Frage der Produktivität von Regeln und mehr noch von Konstruktionsmustern. Produktivität ist eine Kategorie, die, wenn man so will, in die mögliche Zukunft von Wortschatzbereichen weist. Sie erschöpft sich nicht im Aufweis der Regel, der gefolgt wird. Vielmehr zeigt sie Wege in bedarfsbedingte Ausbaustrecken hinein auf. Dabei sind neue Bildungen in Analogiemustern häufig zu Beginn so stark von stilistischem Willen geprägt, dass man sie nicht für wörterbuchwürdig halten würde, man wüsste allerdings gerne etwas über die Entstehung von Verschiebung in neugebildeten Wortschatzclus- 9 Zerspanbar hat 15 Belege, die Basis zerspan insgesamt 65; hochwarmfest (und Flexionsformen) findet sich immerhin auch 23-mal. 10 Vgl. die Einordnung der Säge als zerspanend im entsprechenden Wikipedia-Artikel (2005): „Die Säge ist ein zerspanendes Werkzeug. [...] Beim Sägen heben die Sägezähne durch eine diskontinuierliche oder auch kontinuierliche Bewegung kleine Späne vom Werkstoff ab und erzeugen auf diese Weise eine Rinne, in die sich das Sägeblatt immer tiefer eingräbt.“ Ludwig M. Eichinger 68 tern. Nicht ganz einfach ist hier eine sinnvolle Differenzierung bei einander verwandten, zum Teil analog ausgebauten Bildungen mit ähnlichen oder gleichen lexematischen Kernen. Das betrifft z.B. Wörter, die in einem Differenzierungszusammenhang stehen, der sich an das Muster einer gängigen Bildung anschließt, wie sie etwa in einem Adjektiv wie humorvoll vorliegt: (4) Zu den humorvollen Rednern gehörten [...] (Braunschweiger Zeitung, 30.09. 2009); wenn er einen humorlosen Richter erwischt (Rhein-Zeitung, 11.02.2009); Vergeistigt, pedantisch, prüde, ein humorfreier Sittenwächter (St. Galler Tagblatt, 25.03.2009); ein netter Abend, der allerdings weitgehend höhepunktfrei und überraschend humorarm verläuft (Rhein-Zeitung, 23.10. 2009); Die Fans des [...] Karnevals hatten wieder alle Mühe, noch einen Platz für die beiden humorträchtigen Sitzungen zu ergattern. (Rhein-Zeitung, 04.03.2003) Ganz offenkundig ist es ein Geflecht von Beurteilungskriterien, die bei der Frage der Aufnahme in ein Wörterbuch ins Auge zu fassen sind. Eine angemessene Wertung dieser verschiedenen Faktoren muss die Grundlage für die Entscheidung über die Aufnahme in ein Wörterbuch sein. Das ist in Anbetracht der Tatsache, dass neuere Neologismenwörterbücher die Frage, was hier zu verzeichnen wäre, durchaus verschieden betrachten, durchaus bedenkenswert. 11 2.3 Wortbildungsarten und Wortarten Den Kern struktureller Information zur Wortbildung bildet zweifellos die Klassifikation nach Wortbildungsarten. Es gibt drei Typen, die dabei im Zentrum stehen, einerseits die Komposition, die in ihrem merkmallosen Minimalismus Lexemkontextualisierung als Kerntechnik von Wortbildung darstellt und in der gegenseitigen Beeinflussung der Bestandteile der Subklassenbildung dient, andererseits die Derivation, die ein Set an Affixen bereitstellt, mittels derer Stämme nach Wortart und semantischer Klasse kategorisiert werden, und zum dritten eine Reihe von Techniken, bei denen die Relationalität eines der beteiligten Elemente zum Aufruf typischer Zusammenhänge genutzt wird. Ich nenne diesen Typ Inkorporation. Diese Typen sind auch dadurch als „Wortbildung“ zusammengehalten, dass sie klare Kerne kennen, aber durch funktional und formal schwer zu unterteilende Übergangsbereiche miteinander verbunden sind. 12 Wenn man zusätzlich die Funktionen betrachtet, sieht man die folgenden Korrelationen (vgl. Abb. 1); zudem gibt es Präferenzen bei den verschiedenen Wortarten. 13 11 Vgl. dazu die entsprechende Praxis in Herberg/ Kinne/ Steffens (2004) und Quasthoff (2007). 12 Vgl. ausführlicher Eichinger (2011). 13 Ausführlicher sind diese Beziehungen dargestellt in Eichinger (2006a). Wortbildung im Wörterbuch 69 Abb. 1: Wortbildungsarten und Wortarten Beim Substantiv ist die Komposition in vielfältiger Weise nutzbar und so wird diese Option auch ausgiebig genutzt. Selbst einigermaßen tabubehaftete Lexeme führen hier ein rege subkategorisiertes Eigenleben: (5) der [...] dem Mann entquellende Fluchtschweiß (Handke 2004, S. 24) Das Deutsche Referenzkorpus verzeichnet immerhin über einhundert Bildungen (mit 752 Belegen) mit dem Element {schweiß}, von denen die meisten allerdings nur einmal belegt sind, und die passenderweise alphabetisch von Abstiegsschweiß bis Zuschauerschweiß reichen, die ihrerseits jeweils einmal belegt sind; die häufigsten Bildungen sind: (6) Angstschweiß (376 Belege), Nachtschweiß (48 Belege), Achselschweiß (45 Belege), Trainingsschweiß (38), Männerschweiß (32), Fußschweiß (30), Handschweiß (13), Menschenschweiß (12), Arbeitsschweiß (11), Körperschweiß (10) Pferdeschweiß (10) Man mag überrascht sein, dass eine in der Reihe dieser N+N-Komposita eher untypische Bildung wie Angstschweiß - zudem zumeist konstruktionell gebunden (er steht jemandem auf der Stirn) - das häufigste Exemplar darstellt. Wie auch immer: Es geht erkennbar um Subkategorisierung einer Entität, die als Zweitglied dieser Bildungen genannt ist. Was man davon in einem Wörter- Ludwig M. Eichinger 70 buch finden möchte, ist über reine Häufigkeiten hinaus wohl schwer zu sagen. Eigentlich erhellender sind Fügungen mit geteilten Erstgliedern. Da Komposita ja in mehr oder minder klarem Ausmaß signalisieren, das Erstelement repräsentiere im Hinblick auf das Zweitelement eine relevante, nicht kontingente Kategorie, gibt es von hier aus durchaus Einblicke in Lebens- und Diskurswelten, deren Repräsentation im Wörterbuch einem nicht absurd vorkäme. So findet sich im Deutschen Referenzkorpus (DeReKo) eine ganze Feuer-Welt entfaltet: (7) Diese „Feuer-Welt“ ist voller Feuerwehren, Feuerwehrleute, d.h. Feuerwehrmänner und -frauen, ja Feuerwehrkommandanten, die mit Feuerwehrfahrzeugen, Feuerleitern, womöglich Feuerwehr-Tanklöschfahrzeugen mit Feuerwehrschläuchen, die aus dem Feuerwehrdepot geholt werden, dem Feuer, oder gar poetisch, der Feuersbrunst Herr zu werden versuchen, wenn die Feuertemperaturen unzuträglich hoch geworden sind. Eine Feuerschutzabgabe ermöglicht diese Tätigkeiten, in harmloseren Fällen tut es auch ein Feuerlöscher, Feueralarm muss gegeben werden, dabei heult die Feuer-Sirene, es gibt allerdings Feuerschutzbeauftragte, die den ganzen Ereignissen schon einen Riegel vorschieben wollen, zumindest in der Schweiz gibt es für nicht freiwillige Feuerwehrdienst Leistende eine Feuerwehrdienstersatzabgabe. Was vom Zweitglied aus gesehen eine Subkategorisierung darstellt, geradezu eine Formalisierung von Hyperonymie, Hyponymie und Kohyponymierelationen, erscheint vom Erstglied aus gesehen als Entfaltung diskurspragmatisch relevanter Bestandteile einer Szene, jener des Feuers als einer der Bedrohungen unseres Lebens. Anders ist das bei der zweiten großen Wortbildungsart, der Derivation. Sie dient der Kategorisierung (ggf. Umkategorisierung) von Basislexemen, mit der größtenteils ein Wortartwechsel verbunden ist: (8) Zwar scheint die Moderne nichts anderes zu sein als ein gigantisches Projekt der Ernüchterung, Versachlichung, Verhässlichung und Gefühlsunterdrückung. (Schulze 2006, S. 159) Wörter wie Ernüchterung, Versachlichung oder Verhässlichung zeigen die mehrfache Anwendung dieser Wortbildungsart. Wortbildung im Wörterbuch 71 Abb. 2: Wortbildungsanalyse von Ernüchterung Zwei Dinge sind dabei vielleicht bemerkenswert. Zum einen sind auf dieser Basis die Zusammenhänge von Wortfamilien - mit der Einbindung verschiedener Rollen durch die Suffixe vor allem im deverbalen Bereich - ableitbar. Das gilt aber auch für andere systematische Zusammenhänge, nicht zuletzt im Feld der sogenannten Fremdwortbildung; dass solche Optionen einen wichtigen Platz in der Informationsstrukturierung von Texten haben, zeigt das folgende Beispiel: (9) Nur privilegierte Minderheiten denken und agieren „global“. [...] entdecken nicht erst heutige Historiker, auf der Suche nach Spuren von „Globalisierung“ Handlungszusammenhänge der Überschreitung [...] Das 19. Jahrhundert reflektierte seine eigene werdende Globalität. (Osterhammel 2009, S. 13f.) (10) In den letzten Jahrzehnten wurde das schon immer zur Moderne gehörende nomadische Element zur demonstrativen Nomadomanie. (Schulze 2006, S. 47) (11) Die „neue Nomadologie“, gegen die sich Jaroschka als Liebhaber von „Orten“ wendet, praktizieren seine Publikation schwungvoll und kompetent. (Kleine Zeitung, 24.08.2000) (12) Es ist ein tolles Gefühl, wenn sich die Künstler als Teil einer eigentlichen Gemeinde verstehen, die sich für zwei Wochen trifft. Eigentlich etwas Anti- Nomadisches in unserem nomadischen Musikerleben. (Die Südostschweiz, 26.06.2009) 14 14 Dabei finden sich zunächst die üblichen paradigmatischen Erweiterungen im Bereich der Wortbildung des nicht autochthonen Bildungswortschatzes wie etwa in den folgenden Fällen: Das Wissen nomadisiert durch die globale Wirtschaftswelt. (Braunschweiger Zeitung, Ludwig M. Eichinger 72 Zum anderen lassen sich deutliche wortartspezifische Präferenzen erkennen. So sind verschiedene Typen von Präfixbzw. Partikelbildung nicht nur kennzeichnend für die verbale Wortbildung, sie haben in diesem Bereich auch erhebliche morphosyntaktische Konsequenzen, die sich in spezifischen Valenzmustern und Valenzverschiebungen niederschlagen. In den üblichen Behandlungen sind das die beiden großen Wortbildungsarten, die im Fokus der Darstellung stehen. Nun gibt es aber eine Reihe von Bildungen, die in verschiedener Weise von der inhärenten Relationalität der Zweitelemente geprägt sind, und auf der Basis dieser Beziehungen sprachliche Szenen andeuten. Dazu gehören einerseits schon die sogenannten Rektionskomposita und verwandte Bildungen („Zusammenbildungen“) beim Substantiv, wie bei Erlösungshoffnung, die auch eher die Nominalisierung der Fügung auf Erlösung hoffen darstellt als einen Spezialfall von Hoffnung: (13) Wachstumsfixierte Erlösungshoffnung und elegante Desillusioniertheit wirken wie zwei abgetragene Uniformen. (Schulze 2006, S. 18) 3. Relevante Wortschatzstrukturen: Inkorporationskonstruktionen Wesentlich bedeutsamer sind diese Typen von Bildungen beim Adjektiv: Hier dienen verschiedene Typen relationaler Elemente zur paradigmatischen Ausdifferenzierung regelhafter Beziehungsverhältnisse zwischen der adjektivischen Basis und dem Bezugselement. Sie sind in gewissem Umfang „wörterbuchwürdig“ und müssen in relevantem Ausmaß dokumentiert werden. Noch dazu, wo sie in jener modern gewordenen Sprechweise als Konstruktionen betrachtet werden können, die eine syntagmatische wie paradigmatische Bin- 05.07.2007); Die Epoche der Bandkeramik vor mehr als 7 000 Jahren markiert einen bedeutenden Einschnitt in der Menschheitsgeschichte, den Wechsel von den nomad-isierenden Jägern und Sammlern hin zu den sesshaften Bauern. (Nürnberger Zeitung, 26.08.2010). Daneben auch Einbindungen in die zentralen Muster der deutschen Wortbildung, wie der üblichen Suffixderivationen, und das sowohl im substantivischen Bereich: Das Nomadentum der Moderne (Mannheimer Morgen, 08.07.2009) wie bei den Adjektiven: Assanges nomadenhafter Lebensstil wurde zitiert [...] (Mannheimer Morgen, 08.12.2010), auch in die „modernen“ Ausbaumuster dieses Bereichs, nicht nur, wie in (10) und (11) beim Substantiv, sondern auch bei den entsprechenden adjektivischen Mustern, die eine gegenüber den Suffixen höhere Differenzierung präsentieren: [...] die Kollektivierung ein Jahrzehnt später machte die Kirgisische SSR offiziell nomadenfrei (Die Presse, 13.05.2000); „Das nomadenähnliche Leben ist für viele Kinder eine interessante Erfahrung “, weiß die Sozialpädagogin, die das von der BUND-Jugend Saar getragene Zeltlager organisiert. (Rhein-Zeitung, 20.10.2005). Wortbildung im Wörterbuch 73 dung aneinander zeigen, und die zudem kommunikativ offenbar besonders nachgefragte Differenzierungen zu tragen erlauben. Man kann zwei Stufen inkorporierender Bildungen unterscheiden, die sich als Stufen entlang einer semantischen Kategorie verstehen lassen. An folgendem Beleg sind diese Abstufungen ablesbar: (14) Inzwischen sinkt jedoch altersbedingt der Hormonspiegel der Generation der sexuellen Revolution, und bildüberfütterte, gelegenheitssatte Generationen jenseits der Sünde wachsen nach. (Schulze 2006, S. 39) Die erste Stufe repräsentieren Elemente wie {satt}, häufig auch selbstständig realisierbare Lexeme, die in diesem gebundenen Kontext automatisch in einer relationalen Variante gelesen werden - die sich, wie in diesem, nicht in jedem Fall eindeutig einer entsprechenden selbstständigen Verwendung zuordnen lassen. In diesem Fall wird auf der Kategorie des ‘Habens’ differenziert. Dieselbe Kategorie betrifft die Bildung mit der Partizipialform {übersättigt}, die eine noch spezifischere Junktion signalisiert. Wie auch die formal entsprechenden Belege altersbedingt - mit kausaler Kategorisierung - oder wachstumsfixiert zeigen, handelt es sich nicht um die Univerbierung beliebiger syntaktischer Fügungen, sondern um Muster, deren Besetzung auch stark durch lexikalische Kookkurenzen charakterisiert ist. Es ist zweifellos eine lexikalische Aufgabe, die Produktivität dieser Muster und ihre funktionale Distribution zu dokumentieren. Sie ergänzen ja zweifellos die etwa im Suffixbereich fast grammatikalisiert eingebetteten funktionalen Nischen. Ein Element wie {fähig} und entsprechende Bildungen erlauben eine Spezifizierung im Bereich des ‘Könnens’, die im Hinblick auf Genus-Verbi-Unterscheidungen neutralisiert bzw. unterdifferenziert ist. Gleichzeitig können mit solchen Bildungen Indizierungen im Hinblick auf Texttypen verbunden sein. So verstärkt das entsprechende Adjektiv in dem folgenden Beleg die Instruktion von Fachlichkeit, die diesem Text eignet: (15) Der Fachmann rät, Winterdiesel zu tanken, der bis minus 16 Grad fließfähig sei und somit ein Einfrieren des Motors verhindern könne. (Nürnberger Nachrichten, 13.01.2009, S. 2) Offenbar besteht ein hohes Bedürfnis nach der lexikalischen „Verpackung“ einer solchen Art von Information; so finden sich im Deutschen Referenzkorpus des IDS eines einzigen Jahres (für 2009) die folgenden komplexen Lexeme dieses Typs: Ludwig M. Eichinger 74 (16) abzugsfähig, anpassungsfähig, arbeitsunfähig, ausbaufähig, DSL-fähig, einsatzfähig, erstattungsfähig, fließfähig, geschäftsfähig, haftfähig, handlungsfähig, konkurrenzfähig, lebensfähig, leistungsfähig, lernfähig, marktfähig, regierungsfähig, salonfähig, schuldfähig, teamfähig, tragfähig, transportfähig, überlebensfähig, verhandlungsfähig, vernehmungsfähig, wandlungsfähig, wettbewerbsfähig, widerstandsfähig, zahlungsunfähig Schon auf den ersten Blick fallen Subdifferenzierungen des Musters auf, die spezifischere Konstruktionstypen kennzeichnen. Erkennbar gibt es einige Bildungen, bei denen die Idiomatisierung schon weit fortgeschritten ist, wie etwa bei tragfähig (was etwa ein Kompromiss sein kann), das jedenfalls nicht alle Kontexte in gleicher Weise bedient, die im Zusammenhang mit der formal zugehörigen Derivation Tragfähigkeit auftreten. Man sieht auch, dass diese Bildungen mit dem eindeutigen Verbstamm als Basis nunmehr nicht den unmarkiertesten Typ darstellen - ihn repräsentieren die Bildungen mit deverbalen Vorgangsnomina als Basis - so erlaubt diese Markiertheit des Typs die Nutzung als merkmalhaft im Sinn von ‘fachlich’. Das betrifft Bildungen wie fließfähig oder lernfähig. Ähnlich merkmalhaft sind die - eigentlich gar nicht paraphrasierbaren - Bildungen mit anderen Substantiva als Basen: DSL-fähig, geschäftsfähig, haftfähig, marktfähig, schuldfähig, teamfähig. Es ist nicht verwunderlich, dass sich auch hier stark idiomatisierte Bildungen vom Typ salonfähig finden. Eine andere semantische Gruppe, die bei der Adjektivderivation ebenfalls eine Rolle spielt (‘veränderlich’), sind Dispositionsadjektive. Mit dem Element {lastig} gibt es eine Option, die Modifikation auszudrücken, dass die Disposition in zu hohem Ausmaß vorhanden sei. (17) eine gute Adresse für bodenständige Küche. Die ist ein bisschen sahnelastig. (Nürnberger Nachrichten, 01.09.2009, S. 9) Man kann allerdings nicht nur an diesem Beispiel sehen, dass diese Bildungen insgesamt zu stilistischer Überneutralität neigen, die in unterschiedlicher Weise genutzt wird. (18) balladenlastig, blechlastig, fleischlastig, gitarrenlastig, importlastig, kommunal-lastig, kopflastig, „modellbahn-lastig“, sahnelastig, streicherlastig, textlastig, theorielastig, USA-lastig, wortlastig Bei den partizipialen Fügungen gibt es ebenfalls Züge der Lexikalisierung zu erfassen und zu dokumentieren. Ein ganz dominantes Muster - in unterschiedlicher lexikalischer Fixierung - ist durch die Relation des ‘Versehen- Wortbildung im Wörterbuch 75 seins-mit’ gekennzeichnet. Das sei mit einer Reihe von Belegen zu {übersät} belegt. Diese Bildung ist in unserem Kontext besonders geeignet, da hier der Bezug auf eine verbale Basis schon sehr prekär ist: (19) Dieser nötigte seine Frau, „bakterienübersäte Taschentücher“ zu waschen. (St. Galler Tagblatt, 30.01.2009); [...] der Mann, dessen narbenübersäte Arme sich [...] nur erahnen lassen (Hamburger Morgenpost, 09.05.2009); auf einem pfützenübersäten Kunstrasen nebenan (St. Galler Tagblatt, 05.08.2009); Erst klettert man über einen scherbenübersäten Deich, dann rutscht man einen müllübersäten Abhang hinunter. (Braunschweiger Zeitung, 22.01.2009); Sie stehen links und rechts der Ausfahrt aus dem steinübersäten Gelände. (Braunschweiger Zeitung, 10.01.2009) (20) [...] neben den sternenübersäten Füssen wohl das spektakulärste Kulissenstück (St. Galler Tagblatt, 25.05.2009); Doch bei allem Schmetterlingsgeflatter auf blütenübersäten Wiesen (Hannoversche Allgemeine, 16.05.2009) Offenbar ist der Kern der Verwendung dieses Elements mit Bedeutungsmerkmalen verbunden, die sich als ‘flächendeckend, punktuell an der Oberfläche mit etwas versehen, meist mit Elementen negativer Bewertung’ beschreiben lassen. Die - seltener zu findenden - positiven Fälle sind stilistisch als überneutral anzusehen. Wie die Belege zeigen, handelt es sich um ein reihenbildendes wie produktives Muster in einem semantischen Feld, das auch durch weitere Mittel im morphologisch-syntaktisch geprägten Übergangsbereich der Wortbildung ausdifferenziert wird. Die folgenden Beispiele belegen die Möglichkeit, mit solchen Techniken den paradigmatischen Bereich zwischen ‘nicht-Haben’ und ‘im-Überfluss-Haben’ auszudifferenzieren. Die verschiedenen Optionen im Bereich ‘nicht/ kaum-Haben’ zeigen zudem, wie sich hier Untermuster mit positiver oder negativer Bewertung herausbilden. (21) [...] präsentiert Waldgebiete wie den Viehtrieb [...] und die heute fast wasserlose Johannestraubentränke (Mannheimer Morgen, 16.10.2009); Baumwolle aus der wasserarmen Türkei (Hannoversche Allgemeine, 18.07.2009); Vor dem Spaziergang sollten Eltern das Gesicht ihres Kindes mit einer wasserfreien Creme schützen. (Mannheimer Morgen, 13.01.2009); Weil der Fluss generell zu wenig wasserreich ist (St. Galler Tagblatt, 05.09.2009); Zwischen Österreich und Spanien liegen derart viele wasserträchtige Gebirgsmassive (Salzburger Nachrichten, 10.06.1994) Es ist erkennbar, dass durch die inhärente Relationalität der Zweitelemente hier Konstruktionen aufgespannt werden, die zudem durch Paradigmen typischer Erstelemente geschlossen werden - ohne dass hier explizit syntaktische Mittel in Einsatz kämen. Es sind das Dinge, die zweifellos in ihrer Existenz und ihrer spezifischen Regelhaftigkeit eher ins Lexikon gehören. Ludwig M. Eichinger 76 4. Ein mehrstufiges Modell der Beschreibung 4.1 Vorbemerkung Wenn man sich nach dieser kurzen Diskussion fragt, was denn eigentlich ein elektronisches Wörterbuch davon verzeichnen sollte - und in welcher Weise das dann geschehen sollte - kommt man zu unterschiedlichen Schlüssen, wenn man die verschiedenen Arten von Wortbildung unter diesem Aspekt ins Auge fasst. Der Einfachheit halber sollen dabei die Bedingungen der verbalen Wortbildung außer Acht bleiben und zentral soll im Bereich des Substantivs argumentiert werden. In allen Fällen ist aber klar, dass auf jeden Fall gängige und lexikalisierte, vielleicht auch für bestimmte Diskurse typische Bildungen in einem Wörterbuch zu verzeichnen sind. Wir haben das oben mit den Feuer-Beispielen in (7) anzudeuten versucht. Was kann man darüber hinaus sagen? Zumindest das: Die Offenheit des elektronischen Raums, die zunächst wenn schon nicht alles, so doch vieles von dem, was man sich wünschen kann, zu ermöglichen scheint, ist auch eine Verführung. Mehr noch als im gedruckten Wörterbuch mit seinen offenkundigen praktischen Grenzen bedarf es der Überlegung, welche Information in der vernetzten Welt elektronischer Information wo präsentiert wird. Und so gilt denn auch für das elektronische Wörterbuch, dass man vom Nutzer vor Ort nicht zu viel verlangen, beziehungsweise ihm geben soll, was er an dieser Stelle erwarten kann. 4.2 Komposition Was heißt das zum Beispiel für die Behandlung von Komposita, die ja im deutschen Wortschatz, seinem Bestand und seiner Dynamik, eine typische und als solche zu dokumentierende Rolle spielen? Es heißt zuvorderst, eine dieser Ebene angemessene Komplexität des beschreibenden Werkzeugs zu finden. Die vorderste Ebene der Information über Komposita ist doch die, auf der die syntagmatischen und paradigmatischen Einbindungen der komplexen Lexeme vorgeführt werden, geht es doch darum, ihre relative Lesbarkeit als Optionen ihrer Verwendung zu nutzen. Man kann das als Verwirklichung der Anforderung verstehen, dass Sprache für sich selbst sprechen müsse. 15 Was man Motiviertheit und ihre Grade nennt, kann und 15 Die Formulierung spielt auf den entsprechenden Satz in Wittgensteins „Philosophischer Grammatik“ an. Wortbildung im Wörterbuch 77 sollte als syntagmatischer Kontext genutzt werden; die Elemente der Komposita werden dann logischerweise in abgestufter Weise als Elemente eines Verwendungsmusters auftauchen. Das kann selbst strukturell verwandte Bildungen betreffen und zu einer differenzierenden Beschreibung der Verwendung führen: So kann man sich fragen, wie die den Vorgaben dieses Wörterbuchs entsprechende Angabe zur Bedeutung des Wortes Antragsberatungskommission in elexiko 16 zu der knappen Wortbildungsangabe passt, es handle sich um ein endozentrisches Determinativkompositum aus den Bestandteilen Antrag, Beratungskommission und der Fuge -s-. (22) Mit Antragsberatungskommission bezieht man sich auf ein Gremium, eine Gruppe von Personen, die zu speziellen Forderungen Entscheidungen trifft oder Empfehlungen ausspricht. (elexiko s.v. Antragsberatungskommission) Im Hinblick auf eine differenzierte Erfassung des Verhältnisses von Wortbedeutung und Wortbildungsbedeutung wäre auf die relative Motiviertheit dieser Bildung hinzuweisen - übrigens auch im Hinblick auf die unter dem Unterpunkt „Besonderheiten des Gebrauchs“ gegebenen Hinweise zur themengebundenen Verwendung, die ja 17 auf den prototypischen Charakter des Gebrauchs im organisierten politischen, gesellschaftlichen und NGG-Umfeld verweisen: Tatsächlich handelt es sich bei solchen Gremien um ‘Kommissionen zur Beratung von Anträgen’ bzw. - um die relevante Relationalität noch deutlicher zu machen - ‘Kommissionen, in denen Anträge beraten werden’. 18 Zum spezifischen Gebrauch gehört, dass es sich nicht um die Entscheidungsgremien, sondern Gremien der institutionellen Entscheidungsvorbereitung handelt. 19 Wie auch die in (22) zitierte Verwendungs-Paraphrase zeigt, handelt es sich daher eher um ‘Kommissionen zur Antragsberatung’ als um ‘Beratungskommissionen für Anträge’. 20 Denn Beratungskommissionen sind offen- 16 http: / / www.owid.de/ artikel/ 164505? module=elex_b&pos=16 (Stand: 01/ 2012). 17 Wie übrigens beide [! ] in dem Lemmaeintrag gegebenen Belege. Ggf. auch ‘Kommission, die eine Institution im Hinblick auf Anträge berät’; es geht ja nicht darum, eine Basis-Formulierung zu finden, sondern die Hierarchie der eingehenden Relationen zu ermitteln. 18 Vermutlich demgegenüber eher abgeleitete Personifizierungsverwendungen: ‘Kommission, die Anträge berät’. 19 Vgl. z.B. die parallel gebildeten Komposita in dem folgenden Beleg: Die Konstituierung einer Mandatsprüfungskommission und einer Antragsberatungskommission stehen auf der Tagesordnung der 9. ordentlichen Vertreterversammlung der IG-Metall-Verwaltungsstelle. (Rhein-Zeitung, 24.02.1998). 20 Vgl. etwa auch die Erläuterung zur Jugendkonferenz der IG Metall ( http: / / www.mission-gerechtigkeit.de/ die-konferenz/ von-a-z/ , Stand: 01/ 2012), wo sich sogar ein entsprechendes Akronym findet: „Die Abkürzung ‘ABK’ steht für ‘Antragsberatungskommission’. Die ABK sichtet, Ludwig M. Eichinger 78 bar etwas anderes: Sie sind Gremien, die jemanden/ eine Institution o.Ä. in einem bestimmten Sachbereich beraten. Das zeigen auch die zu diesem Stichwort automatisch erzeugten Belege in elexiko. 21 Es geht dort um folgende Kontexte: (23) die von der Regierung eingesetzte Beratungskommission für Menschenrechte (24) Mitglied der Beratungskommission des Kommunalen Arbeitgeber Verbandes (25) eine Beratungskommission für die Ernennung neuer Richter So kann man aus einer differenzierten Darstellung der Motivationsgrade und der strukturellen Gegebenheiten durchaus zu einer genaueren Schichtung sprachlicher Schematisierung kommen. 22 Diese Hilfen zum Verstehen der Wortverwendung ergänzen anderweitige („syntagmaexterne“) Kookkurrenzangaben in sinnvoller Weise. Wir haben das bei dem ausführlicher diskutierten Beispiel der Antragsberatungskommission und ihrem Verhältnis zur Beratungskommission einerseits strukturell in der unterschiedlichen Nutzung von Relationen und der Art ihrer Anbindung gesehen: Als erstes Kompositionsglied ist das Objekt planender Beratung über etwas in diese Bildung integriert, während in der syntaktischen Anbindung, wie das die Beispiele (23) bis (25) andeutungsweise zeigen, Zugehörigkeit, Auftraggeber, Adressat und Bereich des „Rat Gebens“ angebunden werden. Ganz klar geworden ist zudem, dass es ein Wort aus institutionellen Kontexten ist, was z.T. in der Schilderung der Besonderheiten des Gebrauchs im Eintrag von elexiko abgebildet wird. Ergänzend ließe sich noch andeuten, dass sich zudem eine „Kurzform“ Antragskommission in zumindest sehr ähnlicher Verwendung findet. 23 sortiert, nummeriert und bespricht die eingegangen Anträge für die Jugendkonferenz im Vorfeld. Sie gibt eine Empfehlung, wie der jeweilige Antrag entschieden werden könnte - auch während der Konferenz. Die Konferenz entscheidet immer erst über die Empfehlung der ABK. Wird dieser Empfehlung gefolgt, dann ist der Antrag so entschieden, wie von der ABK vorgeschlagen. Dieses Vorgehen spart Zeit - vor allem bei Anträgen, die von einer großen Mehrheit der Konferenzdelegierten geteilt werden.“ 21 http: / / www.owid.de/ artikel/ 171125? module=elex_b (Stand: 01/ 2012); das Lemma selbst ist noch nicht lexikographisch bearbeitet. 22 Beim behandelten Beispiel Antragsberatungskommission könnte man zudem den Link auf Antrag noch dahingehend differenzieren, dass er unmittelbar zu der einschlägigen zweiten Lesart dieses Lemmaeintrags führte. 23 Siehe: Die Ergebnisse der Antragsberatungskommission werden von folgenden Mitgliedern der diesjährigen Antragskommission vorgetragen ( www.lsv-nrw.de/ .../ lsv... / Proto-koll_der_-MV_2009_mit_Anlagen.pdf , Stand: 01/ 2012) . Wortbildung im Wörterbuch 79 Insofern die lexematischen Einheiten, die in Komposita auftauchen, in einer Verwendung gezeigt werden sollen, die ein gutes Muster eines gegenwärtigen Gebrauchs - bzw. auch des Gebrauchs zu einer bestimmten Zeit - darstellt, kann die Auswahl zu dokumentierender komplexer Lexeme dieser Art nicht so sehr von wortbildungsmäßigen Regularitäten geleitet sein, und vielleicht nicht einmal von Fragen der schieren Häufigkeit, vielmehr muss die Auswahl einer anderen Eigenheit der Komposition Rechnung tragen. Komposita sind keine Beschreibungen, wie das vielfach analogische syntaktische Konstruktionen sind, vielmehr zeigt ihre formale Unverbundenheit, die sich andersherum als Korrelat einer „unauflöslichen“ Inselbildung verstehen lässt, dass sie den Anspruch erheben, als ein so zu nehmender Name wahrgenommen zu werden. Ein Name allerdings, der mit seinen Bestandteilen mit unterschiedlicher Klarheit indiziert, wie er zu lesen sei. Verzeichnet in elexiko ist etwa das Stichwort Bauchmensch, dessen Erstelement hier die Bedeutung beiträgt, die es in der Fügung hat, man tue etwas ‘aus dem Bauch heraus impulsiv, ohne großes Nachdenken’. 24 Der Bauchmensch steht nicht allein, Körperteilbzw. Sinnesorgan-Metonymien sind offenbar ein durchaus produktives Klassifizierungsmuster: (26) Ein Bauchmensch ist der 52-jährige Politiker indes nicht. Er plant jeden seiner Schritte bis ins Detail. (Rhein-Zeitung, 21.02.2011) (27) Sie sei allgemein ein „Kopfmensch“. In der wenigen Freizeit, die neben dem Fechten bleibt, spielt sie Schach oder Detektivspiele am Computer. (Mannheimer Morgen, 27.01.2011) (28) Alberto Giacometti war ein Augenmensch. (Südostschweiz, 11.03.2011) (29) Vor zwei Jahren fand Chall Bork. Nasenmensch traf Nasenmensch. „Wir haben einen Assoziationstest gemacht“, berichtet Chall. Er konnte Bork von seinen olfaktorischen Fähigkeiten überzeugen. (Braunschweiger Zeitung, 28.04.2011) Für die Aufnahme in ein Wörterbuch hat das zur Folge, dass Komposita einerseits erkennbar an unterschiedlichen Stellen lemmatisiert oder sublemmatisiert werden sollten. So stehen sie je nach der funktionalen Dominanz der einen der beiden konstituierenden Elemente in einer lexikalischen Paradigmatik des Ausbaus der Wortfamilien, die sich um diese Lexeme angesiedelt haben. Zum anderen haben sich sehr übliche lexikalisierte und in höherem Ausmaß idiomatisierte Bildungen so weit von ihrer morphologischen Basis entfernt, 24 Heute kaum noch: ‘der Völlerei ergeben’; soviel zu Motivationsverschiebungen, vgl. aber: Bauch- oder Kopfmensch: Wenn es um Essen geht sicher Bauchmensch. Ansonsten etwas zu oft ein Kopfmensch. (Braunschweiger Zeitung, 02.03.2011). Ludwig M. Eichinger 80 dass sie eigene Einträge - praktisch ohne Bezug auf die erkennbare Lexemkombinatorik - verdienen. Für alle drei möglichen Positionen gilt aber, dass auf der Ebene der lexikalischen Information die Auswahl nicht primär von Überlegungen zur Exemplifikation von Wortbildungsmustern und -regularitäten geleitet ist, sondern von der Intention, Namen für komplexe Konzepte zu verzeichnen, die in relevanten (öffentlichen) Diskurswelten einen - mehr oder minder festen - Platz haben. 25 Dass das bei kompositionellen Bildungen der zentrale Punkt ist, kommt genau daher, dass mit ihnen textuell bestimmte Deutungen indiziert und damit mitbehauptet werden. 26 4.3 Derivation Die strukturelle Betrachtung der Wortbildung hat einen unifizierenden Blick, der nahelegen würde, Derivate - also Kombinationen lexematischer Einheiten mit Affixen - in gänzlich analoger Weise zu behandeln, d.h. neben weithin selbstständig zu verzeichnenden Bildungen jeweils die Basislexeme und die Affixe und dazu dann jeweils zugehörige und gängige Bildungen aufzuführen. So einfach ist es aber nicht. 27 Am klarsten wird das, wenn man sich fragt, welche Bildungen man hier auswählen würde, um die lexikalische Prägungskraft der Affixe bei deren Einträgen zu belegen: Es zeigt sich, dass das Unterfangen in dieser Art in vielen Fällen keinen rechten Sinn ergibt. Natürlich hat das damit zu tun, dass Lexikoneinträge im besten Fall Form und Funktion lexikalischer Einheiten in ihren Verwendungsregularitäten aufzeigen. Hier ist es die Funktion der Affixe, die eine solche Beschreibung für diese Einheiten schwierig macht. Sie stellen ja im Kern eine wortgrammatische Technik semantischer Grobkategorisierung und syntaktisch-textueller Adaptation dar. Natürlich kann man entsprechende Elemente auch im Wörterbuch verzeichnen, aber eigentlich begibt man sich damit doch auf eine andere Informationsebe- 25 Nicht umsonst verzeichnen Neologismen-Wörterbücher den Prozess, der zu solch einem Status führt - auch ggf. im Rückblick die weniger erfolgreichen Versuche. 26 Besonders klar zeigt sich das an der Nutzung der Komposition in der Geschichte der Verdeutschung, die durchaus neben der Verdeutlichung der ideologischen „Einnordung“ dient. Vgl. etwa, dass das „Entsprechungs“-Glossar der Schweizerischen Bundeskanzlei für englischsprachige Ausdrücke für global public good die folgenden deutschsprachigen Alternativen vorschlägt „Global Public Good, Globales Öffentliches Gut, Globales Gemeinschaftsgut, Gut der Weltgemeinschaft“ ( http: / / www.bk.admin.ch/ dienstleistungen/ db/ anglizismen/ index.htm l? lang=de&letter=G&action=translate&id=1957 , Stand: 01/ 2012). Gut zeigt sich hier die - unterschiedliche - Akzentuierung durch gängige Komposita. 27 Es soll hier nicht um eine weitere Differenzierung gehen; diskutiert werden die Fälle nominaler Suffigierung vom Typ {-er}, {-heit}, {-ion}, {-ität}, {-itis},{-nis}, {-ung} bzw. {-al}, {-iell}, {-ig}, {-isch}, {-lich}, {-ös} usw. Wortbildung im Wörterbuch 81 ne; die Beschreibung wortförmiger Lexeme, die letztlich auch bei den Komposita geleistet wird, wobei gerade bei elektronischen Wörterbüchern geradezu noch ein Mehr in der problemlosen Verknüpfung auf die Bestandteile wie auf Reihen von Bildungen mit diesen Elementen wie auf das semantische Feld, in dem sie stehen, geleistet werden kann. Fragen muss man sich bei den Suffixderivationen, wie ein Eintrag dort aussehen kann, ob nicht hier doch eine so andere Art von Information gegeben wird, dass sie bei den Möglichkeiten elektronischer Lexikographie ihre eigene Ebene der Präsentation finden könnte oder vielleicht sollte. Eine mit den neuen lexikographischen Mitteln leicht lösbare Aufgabe wäre ja die Option, alle verzeichneten Bildungen mit den jeweiligen Suffixen aufrufen zu können, und das auch noch verbunden mit einer semantischen Klassifikation, wie sie ja etwa in den Einträgen von elexiko geliefert wird. Solcherart kämen auch in den Wortbildungsmustern der Suffixe angelegte Zusammenhänge in der Darstellung zu Geltung, etwa die systematische Beziehung zwischen Vorgangs- und Zustands-Lesart bei einer Gruppe deverbaler Substantive mit dem Suffix {-ung}. Ein Beispiel dafür wäre etwa das in elexiko redaktionell schon bearbeitete Lemma Ballung, 28 bei dem ein Verweis zum Basisverb ballen geht, 29 das Suffix {-ung} ohne weitere Verweise eingetragen ist, und dann eine Zustands- (‘Ansammlung’) und eine Vorgangslesart (‘Anwachsen’) verzeichnet wird. Dazu wird kommentiert: (30) Die Lesarten ‘Ansammlung’ und ‘Anwachsen’ liegen semantisch dicht beieinander und werden oft gleichzeitig realisiert. Die Lesart ‘Ansammlung’ ist eine Metonymisierung der Lesart ‘Anwachsen’. Durch entsprechende Hinweise zur Wortbildung wären solche Erscheinungen in einen weiteren Kontext gestellt. 30 Ein klassischer Fall sind in dieser Hinsicht zweifellos die deverbalen Bildungen mit verschiedenen Suffixen, die es erlauben, verschiedene Rollen in dem verbal angedeuteten Schema in das komplexe Lexem zu integrieren, was die syntaktisch-textuelle Verwendbarkeit der entsprechenden Inhalte erheblich erhöht. Da es sich um allgemeine Klassifizierungsprozesse handelt, sind es größere Lexemklassen, die mit solchen Affixen verbunden werden können, zudem sind die Suffixe (in systematischer Weise) polysem bzw. multifunktional. Das alles zu durchleuchten, bedarf einer anderen Art der Darstellung, als das bei 28 http: / / www.owid.de/ artikel/ 168674? module=elex_b (Stand: 01/ 2012). 29 Vermutlich besser auf reflexives sich ballen. 30 Vgl. z.B. die Einträge zu Lemmata wie Anmeldung, Ausbildung, Befriedigung (mit variierenden motivationalen Verhältnissen). Ludwig M. Eichinger 82 Lexemen der Fall ist. Da wir uns mit diesen Phänomenen und Prozessen zweifellos irgendwo im Übergangsprozess zwischen Morphologie und Lexikon befinden, ist es sicherlich berechtigt, zu fragen, wie man diese lexikalisch relevante Information in einem Wörterbuch unterbringen kann. Bei einem gedruckten Wörterbuch hat man dabei keine besonders große Wahl. Im Fall der elektronischen Präsentation sind die Möglichkeiten vielfältiger, und sie lassen sich zu einer konzeptuell begründeten Schichtung der Information nutzen. So wäre es die Aufgabe des „Wörterbuchs“ auf der ersten Stufe, von dem wir bisher gesprochen haben, eigentlich in einer zu den Komposita analogen Weise gängige Bildungen bei den jeweiligen Basislexemen bzw. bei entsprechender Selbstständigkeit auch als eigene Lemmata darzustellen, deren Dokumentation die textuelle Funktion beleuchten sollte. Insofern auch hier die interne Syntagmatik zu betrachten wäre - auch diese Bildungen sind ja zumindest im Hinblick auf die Basen durchsichtig -, ist auf jeden Fall die lokale Funktion des Affixes zu erläutern. Bei allen einschlägigen Lemmata sollte aber die Möglichkeit bestehen, Prototypisches zur Funktion aufzurufen (etwa den oben schon genutzten Zusammenhang von Nomina actionis und acti bei {-ung} o.Ä.). Über solche Links sollte man in ein lexikalisches „Morphologikon“ geraten können, das dann die entsprechenden wortbildungsmäßigen Zusammenhänge erläutern könnte. Diese Informationen kann man im Hintergrund des Lexikons bereithalten, da ja an diesem morphologisch charakterisierten Ende der Wortbildung ein endliches Inventar an Mitteln zu behandeln ist. Das ist auch der Unterschied zum eigentlichen („lexikalischen“) Kern in der Komposition. Bei der Derivation kommt etwas anderes dazu, was man auf der Wörterbuchebene repräsentieren sollte - und auch mit systematischem Hintergrund versehen. Es gibt hier systematisch ausgebaute Wortfamilien, deren Besetzungen bzw. Besetzungslücken nicht einfach über eine Regel zu beschreiben sind. Auch hier bietet die elektronische Form die Möglichkeit, diese Netzwerke morphologisch-lexikalischer Verwandtschaft von allen beteiligten Lemmata her aufzugreifen. 4.4 Inkorporation Wie wir oben schon im Beispielteil angedeutet haben, findet sich in Sonderheit bei den Adjektiven jener Bildungstyp, der die syntaxnahe Seite der Wortbildung repräsentiert und den wir Inkorporation nennen. Er steht in dieser Position an einer Grenze zwischen grammatisch-regelhaften und lexikalisch-analogischen Verhältnissen, die in der neueren grammatischen Diskussion zu ganz grundsätzlichen Überlegungen geführt hat. 31 Der syntaxnahe und 31 Siehe etwa Engelberg/ Holler/ Proost (Hg.) (2011). Wortbildung im Wörterbuch 83 gleichzeitig konstruktionelle Charakter dieser Bildungen bedingt eine regelhafte wie eine analogisch-lexikalische Anbindung. Bei den Zweitelementen dieser Bildungen handelt es sich um paradigmatische Optionen in bestimmten wichtigen inhaltlichen Kategorien, z.B. verschiedenen Arten von Modalität, die durchaus lexikalisch differenziert werden, auch wenn der Grad potenzieller Selbstständigkeit variiert. In elexiko sind entsprechende Bildungen derzeit noch wenig bearbeitet und auch wortbildungsmäßig nicht näher kategorisiert, sie laufen als endozentrische Determinativkomposita. Ein bearbeitetes Beispiel wäre das Adjektiv waschmaschinenfest. 32 Dass hier einerseits auf das selbstständig vorkommende adjektivische Lexem {fest} verwiesen wird, leuchtet ein, allerdings wäre dort dann irgendwo der Platz dafür gewesen, darauf hinzuweisen, dass das Zweitelement {-fest} in einer Verwendung ‘widerständig gegen’ als gebundenes Lexem reihenbildend geworden ist, in Bildungen wie bissfest, krisenfest, wasserfest, wetterfest. Neben das Muster mit substantivischer Basis treten zudem entsprechende Bildungen mit verbaler Basis (Typ: kochfest, kratzfest, trinkfest). Das sind zweifellos lexematische Informationen, die im Lemmaeintrag von {fest} einen Platz finden sollten, auch um gegenüber „normalen“ Determinativkomposita des Adjektivs (Typ: bissfest, auch mit Graduierungselementen: bombenfest) differenzieren zu können. 33 Hierher gehören auch Bildungen mit partizipialer Struktur: Zumindest die stark kookkurenziell gebundenen Exemplare sollten ihren Platz im Wörterbuch finden. In elexiko findet sich als entsprechendes Lemma das Adjektiv grenzüberschreitend, 34 das als explizite Derivation mittels des Suffixes {-end} zu einer Verbalphrase eine Grenze überschreiten betrachtet wird, wozu man zumindest bildungstechnisch einiges anmerken könnte. Kennzeichnend ist der relationenstiftende Charakter dieser Zweitelemente, die eine Verschiebung der Bedeutungskerne gegenüber den Komposita bedingt. Das macht es in ähnlicher Weise wie bei den Suffixen schwierig, ihnen allein eine lexematische Beschreibung zukommen zu lassen. Allerdings lassen sich bei diesen Bildungen - mehr als bei den stärker grammatikalisierten Suffixen - durchaus relevante Ausbaurichtungen einer analogischen Weiterentwicklung der Muster anzeigen. 32 http: / / www.owid.de/ artikel/ 136704? module=elex_b&pos=12 (Stand: 01/ 2012). 33 Die Wünschbarkeit einer genaueren Differenzierung zeigt sich z.B. auch daran, dass beim Eintrag bandförmig ( http: / / www.owid.de/ artikel/ 121219? module=elex_b&pos=9 ,- Stand: 01/ 2012) das Zweitelement ohne weitere Erläuterung als Suffix und die Gesamtbildung als explizite Derivation bezeichnet wird; Analoges gilt für das Stichwort grenzenlos. 34 http: / / www.owid.de/ artikel/ 305337? module=elex_b&pos=11 (Stand: 01/ 2012). Ludwig M. Eichinger 84 5. Ein kurzer Schluss Wortbildung im elektronischen Wörterbuch, das kann offenbar ganz Verschiedenes heißen, gerade auch, weil die Möglichkeiten einer multidimensionalen Präsentationsweise genutzt werden können. Auch grundsätzlich gilt es eigentlich drei mögliche Intentionen der Verzeichnung im Auge zu behalten. Zum einen gilt es häufige und übliche Bildungen einfach als komplexe Lexeme zu verzeichnen und den Grad ihrer morphologischen Lesbarkeit im Hinblick auf die Verwendungsbedeutung zu akzentuieren. Im Hinblick darauf, dass Komposita im Deutschen in vielen Fällen die normale Zugriffsebene auf relevante und prägende Elemente im öffentlichen Bewusstsein wirkender Diskurswelten darstellen, werden Komposita in größeren Mengen als normale Lexeme zu verzeichnen sein. Wenn auch in verschiedener Weise - die nötigen Differenzierungen sind oben schon angedeutet. In entsprechender Weise gilt das auch für die anderen Wortbildungsarten, bei denen aber die inhärente Relationalität und - bei den Derivationen - die Endlichkeit und der generelle Charakter der Affixe eher von der Üblichkeit bestimmter Thematisierungen sprechen - und so im Schnitt weniger „interessant“ erscheinen. Zum anderen kann es darum gehen, die Produktivität und analogische Ausbaufähigkeit von Mustern bzw. von Bildungstypen mit bestimmten Elementen zumindest anzudeuten. Auch hier kann man am ehesten bei den Komposita durch die Angabe bestimmter Reihen von Bildungen indizieren, worum es geht. Schwieriger ist das bei den Derivationen, wo man kaum einfach eine Liste entsprechender Bildungen aufführen wird, sondern lieber auf die generellen Bedingungen der Bildung neuer Formen hinweisen möchte. Das ist dann etwas, was man zweifellos eher nicht als normalen Lemmaeintrag sondern als anklickbare Zusatzinformation bei entsprechenden Bildungen betrachten würde. Interessant und auch in gewissem Umfang herausfordernd ist es, der inkorporativen Reihenbildung („Affixoid“) nachzugehen, die in unterschiedlichem Maße beider Bezüge bedarf, des kompositionell analogischen und des derivationell-strukturellen. Zum dritten kann es auch noch darum gehen, einige spezifischere Orte von Wortbildung lexikalisch auszuleuchten. Ein solcher Fall wären Neologismen, d.h. Bildungen, die akute Ausbauwege aufweisen, ein anderer etwa fachsprachliche Nischen oder dergleichen. Hier wären Wege zu finden, die den Anschluss an den systematischen Kern der Wortbildung ebenso erlauben, wie die Besonderheit - etwa der Ad-hoc-Charakter - deutlich gemacht würde. Hier bietet der direkte Bezug auf relevante Korpora zweifellos neue Wege an. Wortbildung im Wörterbuch 85 Diese kurzen Schlussbemerkungen haben im Wesentlichen das Ziel, dazu aufzufordern, Phantasie zu entwickeln, um die mögliche Differenziertheit der Darstellungsoptionen in der elektronischen Welt zu einer sinnvollen Repräsentation sachlicher Komplexität und Diversifikation zu nutzen. 6. Literatur 6.1 Quellentexte COSMAS II. Internet: http: / / www.ids-mannheim.de/ cosmas2/ (Stand: 01/ 2012). DeReKo - Deutsches Referenzkorpus des IDS. Internet: http: / / www.ids-mannheim.de/ kl/ projekte/ korpora/ (Stand: 01/ 2012). Musil, Robert (1978): Der Mann ohne Eigenschaften. 2 Bde. Reinbek. Osterhammel, Jürgen (2009): Die Verwandlung der Welt. Eine Geschichte des 19. Jahrhunderts. München. Schmidt-Dengler, Wendelin (2004): Die Stadt wird ergangen: Wien bei Schnitzler, Musil, Doderer. In: Sommer, Gerald (Hg.): Gassen und Landschaften. Heimito von Doderers „Dämonen“ vom Zentrum und vom Rande aus betrachtet. Würzburg, S. 105-122. Schulze, Gerhard (2006): Die Sünde. Vom guten Leben und seinen Feinden. München/ Wien. 6.2 Wörterbücher elexiko (2003ff.). In: Institut für Deutsche Sprache (Hg.): OWID - Online-Wortschatz- Informationssystem Deutsch. Mannheim. Internet: http: / / www.owid.de ( Stand: 01/ 2012). Herberg, Dieter/ Kinne, Michael/ Steffens, Doris (2004): Neuer Wortschatz. Neologismen der 90er Jahre im Deutschen. (= Schriften des IDS 11). Berlin/ New York. Quasthoff, Uwe (2007): Deutsches Neologismenwörterbuch. Berlin/ New York: de Gruyter. 6.3 Forschungsliteratur Eichinger, Ludwig M. (2000): Deutsche Wortbildung. Eine Einführung. Tübingen. Eichinger, Ludwig M. (2006a): Wortbildung - ein Haus mit drei Nachbarn. In: Proost, Kristel/ Winkler, Edeltraud (Hg.): Von Intentionalität zur Bedeutung konventionalisierter Zeichen. ( = Studien zur Deutschen Sprache 35). Tübingen, S. 179-196. Ludwig M. Eichinger 86 Eichinger, Ludwig M. (2006b): Dependenz in der Wortbildung. In: Ágel, Vilmos/ Eichinger, Ludwig M./ Eroms, Hans-Werner et al. (Hg.): Dependenz und Valenz / Dependency and valency. Ein internationales Handbuch der zeitgenössischen Forschung / An international handbook of contemporary research. 2. Halbbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science 25.2). Berlin/ New York, S. 1065-1080. Eichinger, Ludwig M. (2011): Aktuelle Tendenzen in der Wortbildung des Deutschen. In: Moraldo, Sandro (Hg.): Deutsch aktuell. 2. Einführung in die Tendenzen der deutschen Gegenwartssprache. (= Lingue e letterature 129). Roma, S. 151-193. Engelberg, Stefan/ Holler, Anke/ Proost, Kristel (Hg.) (2011): Sprachliches Wissen zwischen Lexikon und Grammatik. Jahrbuch 2010 des Instituts für Deutsche Sprache. Berlin/ New York. Klosa, Annette (2005): Wortbildung. In: Haß, Ulrike (Hg.): Grundfragen der elektronischen Lexikographie. (= Schriften des Instituts für Deutsche Sprache 12). Berlin/ New York, S. 141-162. Hilke Elsen Problemzonen der Wortbildung und der Eintrag im Wörterbuch * 1. Eingangsbemerkungen Ein Sorgenkind der Wörterbuchmacher war lange Zeit die Wortbildung. Das lag teilweise ganz einfach nur am Platzmangel, da die Lemmata im Volumen starken Einschränkungen unterworfen und andere Angaben schlicht wichtiger waren, sodass Informationen zu Affixen oder ähnlichen Strukturelementen nicht integriert werden konnten. Wenn Wortbildungsinformationen überhaupt vorlagen, erwiesen sie sich fast immer als inkonsistent. Da für Lexikologen und Lexikographen unterschiedliche Untersuchungsziele gelten, dürften sich auch die Probleme, die sich mit dem Thema Wortbildung verbinden, jeweils anders darstellen. Dieser Beitrag will daher einige Aspekte aus Sicht der Lexikologie beleuchten, die erfahrungsgemäß Schwierigkeiten machen, für die aber nicht klar ist, inwiefern sie Berücksichtigung in Wörterbüchern finden sollten. 1.1 Polyexpektionalität - die Sicht der Benutzer Bekanntermaßen müssen Nachschlagewerke je nach Adressatenkreis unterschiedlichen Benutzerbedürfnissen gerecht werden. Oft mögen Unsicherheiten bei der Schreibung und Silbentrennung zu einem Blick in das Wörterbuch führen. Aber zu Aussprache, Bedeutung oder zur Verwendungsweise wird ebenfalls gern nachgeschlagen. Für Muttersprachler stehen dann auch andere Wörterbücher zur Verfügung als für Nichtmuttersprachler, für Lernende andere als für Fachleute. Es gibt Bedeutungswörterbücher, solche, die viel mit Wortfamilien arbeiten, und Rezeptions- und Produktionswörterbücher. Erscheinungsformen sind Buch, CD-ROM oder auch Onlinewerke. Dies alles ergibt für den Lexikographen andere Rahmenbedingungen für die Auswahl und Bearbeitung der Stichwörter und letztendlich andere Antworten auf die in diesem Beitrag zu stellenden Fragen. Da der gesamte Band aber auf neue Browsermöglichkeiten durch Online-Wörterbücher abzielt, kann ein polyfunktionales Nachschlagewerk möglicherweise gleich mehreren Nutzerbedürfnissen gerecht werden. Dann müssen die Informationen aber geschickt angeordnet sein. * Mein Dank gilt Henning Bergenholtz und Sascha Michel für konstruktive Kritik am Vortrag. Hilke Elsen 88 1.2 Wozu Wortbildungsinformationen? In der Literatur wurde zunächst angezweifelt, dass Wortbildung überhaupt in ein Wörterbuch gehört. 1 Mittlerweile sind aber genügend Stimmen laut geworden, die solche Angaben gern berücksichtigt finden möchten, denn sie sind der Schlüssel zu Wortstrukturen und zur Bedeutungsermittlung. Die Motive sind mehrschichtig. So wird einerseits eine leichtere Erschließbarkeit der Wörter für die Rezeption schwieriger Texte erwartet, andererseits der Ausbau produktiver Fähigkeiten gewünscht. Bei Lernenden einer Fremdsprache sollten Wortbildungsinformationen die Strukturierung des mentalen Lexikons verbessern und das Vokabellernen erleichtern (ten Hacken/ Abel/ Knapp 2006), hier zielen sprachdidaktische Erwägungen auf eine explizitere Behandlung von Wortbildungszusammenhängen ab. Und die Übersetzer erhoffen sich natürlich präzisere Übersetzungen. Schließlich soll noch auf die Dokumentationsfunktion von Wörterbüchern hingewiesen sein. So gesehen stellt sich die Frage nach dem Ob der Wortbildung im Wörterbuch gar nicht mehr, allerdings nach wie vor die nach dem Wie. Muttersprachler wie Nichtmuttersprachler treffen bei der Rezeption von Texten immer auch auf seltene bzw. okkasionelle Lexeme. Ihnen sollte ein Wörterbuch genauso helfen wie denjenigen, die selbst neue Wörter bilden wollen. Aus Sicht der Wörterbuchbenutzer wären also Wortbildungsinformationen willkommen. Für die Wörterbuchmacher stellt sich ein weiteres Problem, das der konsequenten und konsistenten Behandlung von Affixen & Co. Die Angaben zur Wortbildung müssen daher gut durchdacht sein und auf klaren und anwendbaren Definitionen fußen. Dies ist aber genau das Problem, zumindest in einigen Bereichen des Deutschen. Vielfach zielte die Kritik ab auf die uneinheitliche Verwendung und Terminologisierung der im Zusammenhang mit Wortbildung ermittelten Einheiten als Affixe, Vor- und Nachsilben, in Zusammensetzungen etc., auf fehlende Systematizität und Lemmalücken. Während die älteren Lexika die Affixe, vor allem die Präfixe, als Lemmata aufführten, ist das in modernen (Buch-)Ausgaben längst nicht überall der Fall und wenn, erscheinen sie höchst selektiv und unausgeglichen. Wolfgang Müller (1989) erstellte dazu vergleichende Tabellen, die die großen Lücken und den Mangel an System in den gängigen Nachschlagewerken aufzeigen, denen oft genug Unsicherheit aufseiten der Lexikographen zugrunde liegen. Er fordert daher eine konsequentere und systematischere Bearbeitung der Affixe. 1 Für einen Überblick vgl. den Beitrag „Wortbildung im Wörterbuch - zwischen Anspruch und Wirklichkeit“ von Sabina Ulsamer in diesem Band. Problemzonen der Wortbildung und der Eintrag im Wörterbuch 89 Die neuen Medien ermöglichen mehr Platz und mehr strukturiertes Suchen. Das bezieht sich auch auf die neue Form des Online-Wörterbuchs. Aber das Verhältnis zwischen Informationsfülle und Übersichtlichkeit muss trotzdem stimmen. Das heißt, alte Probleme stellen sich neu. Hieß es sonst, aus Platzgründen muss bei einem Wörterbuch (in Buchform) auf die Auflistung und Erklärung der Affixe verzichtet werden und fach- und sondersprachliche Einheiten seien notwendigerweise restriktiv, wenn überhaupt, zu behandeln, so könnte jetzt aufgrund der quasi unendlichen Kapazitäten eines Online-Wörterbuchs praktisch alles an Information, was möglich ist, integriert werden. Aber ein Wörterbuch darf nicht zur Sammelstelle diffusen Sprachwissens degenerieren. Die ordnende Hand der Lexikographen ist wichtig wie nie zuvor. Zwar interessieren sich viele Benutzer wahrscheinlich gar nicht für die Wortbildung (Augst 1992), sie bedeutet somit keine Information ersten Ranges. Aber ein Online-Instrument stellt ganz andere Möglichkeiten der Vernetzung und Gliederung der Angaben zur Verfügung. 2 Es kann verschiedene Ebenen, getrennt nach Relevanz, anbieten und die Informationen zu einem Schlagwort effektiver filtern und strukturiert veranschaulichen. Auch die visuelle Darstellung gestaltet sich flexibler und übersichtlicher. Auf Papier sind allzu oft möglichst viele Angaben auf engem Raum zusammengestellt, das erschwert das Auffinden der gesuchten Information. Untersuchungen haben dann auch gezeigt, dass elektronische Wörterbücher im Vergleich zu denen in Buchform das effektivere Werkzeug sind, zumindest für Nichtmuttersprachler (Dziemianko 2010). Wenn in den neuen Online-Nachschlagewerken mehr Wortbildung aufgenommen werden kann, ergibt sich eine Verschiebung der Grenze, bis wohin diese gehen darf. Hierzu folgen nun drei auch für die Lexikologie umstrittene Problemgruppen, erstens kontroverse Morphemtypen, zweitens der Übergang von simplizischen zu morphologisch komplexen Lexemen und drittens die Rolle einzelner Varietäten. Stets stellt sich die Frage, wie weit die Einheiten aufzulisten sind und wo die Verallgemeinerung durch Regeln beginnen soll. Diese Aspekte könnten für die Wörterbuchgestaltung relevant sein, auch wenn, so viel ist klar, dies dann zu Informationen für einen kleinen Nutzerkreis führen dürfte, der besonders interessiert ist am Bau der deutschen Wörter, also zu Wörterbuchangaben fern der ersten Ebene. 2 Vgl. hierzu die Beiträge von Annette Klosa, Antje Töpel, Sabina Ulsamer und Peter Meyer/ Carolin Müller-Spitzer in diesem Band. Hilke Elsen 90 2. Problembereiche 2.1 Kontroverse Morphemtypen Für die Morphemtypen, die in der Literatur einerseits umstritten sind, andererseits zu Analyseschwierigkeiten führen, sind klare Definitionen besonders wichtig, um zu einer konsequenten Bearbeitung der Wörterbucheinträge zu führen. Häufig schwanken die terminologischen Angaben zwischen den Werken oder gar innerhalb eines Wörterbuchs stark (Müller, W. 1989). 2.1.1 Konfix Bei den Konfixen beginnen die Schwierigkeiten bereits mit dem Begriff, der im Deutschen seit einigen Jahren besteht, in der englischsprachigen Literatur jedoch keine Entsprechung findet, und das wirkt sich besonders nachteilig auf die wissenschaftliche Diskussion aus, wenn Erkenntnisse aus der angelsächsischen Sprachwissenschaft zu ‘combining forms’ auf Konfixe übertragen werden. Beide Begriffe sind zu trennen. Die ‘combining form’ (demo-, bio-, -logy, -graphy) kommt dem Konfix sehr nahe, wird aber anders definiert. Beide, ‘combining form’ und Konfix, sind zunächst lexikalisch und produktiv. Aber schon bei der Gebundenheit hören die Gemeinsamkeiten auf. Hierzu äußern sich die Anglisten nämlich widersprüchlich, wenn sie ‘combining forms’ zwar als gebunden definieren, dann jedoch auch Beispiele wie speak oder insect dazu zählen (Warren 1990, S. 118, 122; Prćić 2005, S. 315, 317). Ein elementarer Unterschied besteht darin, dass sich die ‘combining form’ nicht allein mit einem Suffix verbinden darf (Warren 1990, S. 122; Prćić 2005, S. 320; 2008, S. 7), während dies für die Konfixe eine der Hauptaufgaben darstellt, vgl. politisch, rhythmisch, Ignoranz, Identität. Die ‘combining form’ bildet keine Basis für Verben (Prćić 2005, S. 322), das Konfix ist hier wieder sehr produktiv, vgl. solidarisieren, klassifizieren, elektrifizieren, kritisieren. Weiterhin zählen unter Umständen wie erwähnt auch freie Basen als ‘combining form’, etwa engl. graph, man (Barnhart/ Steinmetz/ Barnhart 1980 zit. n. Warren 1990, S. 114), insect in insecticide (Prćić 2005, S. 317), speedo-meter, jazzo-phile oder filmography mit den englischen Lexemen speed, jazz und film (Bauer 1983, S. 214; Prćić 2005, S. 317, 321; 2008, S. 9). Die ‘combining form’ muss, wenn sie am Wortanfang steht, einen Endvokal aufweisen (Warren 1990, Prćić 2005). Das führt dazu, dass speed und speedo und insect und insecti teils als Allomorphe bestimmt werden, teils als Lexeme, die in speedometer bzw. insecticide einen ‘linking vowel’ zu sich nehmen. Die englische Sprachwissen- Problemzonen der Wortbildung und der Eintrag im Wörterbuch 91 schaft behandelt diese i und o nicht durchgängig kohärent. Die deutsche Sprachwissenschaft hingegen setzt hier Fugen an und kann dann problemlos zwei Basen in einem Kompositum bestimmen wie bei Herb-i-zid, bibli-o-phil. Die ‘combining form’ ist keine Wurzel (Warren 1990), das Konfix allerdings schon. Und manche ‘combining forms’ bestehen dann auch aus mehreren Morphemen, z.B. -cracy, -logy, -metry, -centric (Prćić 2008, S. 3, 8). Dazu gibt es durchaus auch mehrmorphemige englische Wörter, etwa haired in shorthaired ‘kurzhaarig’ und long-haired ‘langhaarig’ (ebd., S. 7). Im Unterschied zum Konfix können ‘combining forms’ aus Kürzungsprozessen resultieren, vgl. Euro zu Europe (Prćić 2005, S. 317). Kurzwörter entstehen auch im Deutschen unabhängig von ihrer morphologischen Struktur, zählen aber nicht zu den Konfixen. Insgesamt scheinen ‘combining forms’ nur sehr selten ihren Weg in das englischsprachige Wörterbuch gefunden zu haben (ebd., S. 319), was sicherlich an der uneinheitlichen Behandlung mal als Morphem, mal als Wortrest liegt. Gerade aber dieses Loslösen von jeglicher Morphemstruktur führt die aktuelle Debatte zu ‘combining forms’ in eine gänzlich andere Richtung als die Entwicklung der Konfixe. Die Diskussion zum Stellenwert dieser Fälle soll den Anglisten überlassen sein. Hier sei betont, dass ‘combining form’ und Konfix auseinanderzuhalten sind, auch wenn sie über eine große Menge gemeinsamer Elemente verfügen. Bei den Konfixen handelt es sich um lexikalische Grundmorpheme, die im Deutschen nur gebunden auftreten (seit u.a. Fleischer/ Barz 1992, vgl. auch Elsen 2005b, 2011b). Damit fallen Fälle wie haired, speed oder -logy fort, die aus mehreren Morphemen bestehen (haired, -logy) und/ oder selbstständig auftreten können (speed). Konfixe werden nicht flektiert, können aber abgeleitet werden, vgl. politisch. Sie sind nicht positionsfest, vgl. graph in Photograph und Graphologie, und sie können auch nicht einer Wortart zugewiesen werden, da sie in Nomen, Adjektiven und Verben auftreten, im Gegensatz zu den ‘combining forms’, vgl. politisieren, graphologisch. Bei manchen Konfixen kommt es nun aber zu Abgrenzungsproblemen. So erscheint beispielsweise bio in Biogemüse, Biomüll, Bioethik, biogen, aber ab und zu auch isoliert, etwa Ab Mai gibt's hier Bio! , Hieß es nicht immer, bei teurem Wein sei es egal, ob er ‘bio’ sei oder nicht? (Scheller-Boltz 2008, S. 251). Dies sind seltene Fälle, zudem auch umgangssprachlich und nicht dem Standardlexikon zuzurechnen, aber möglicherweise ist für manche hier der Status des Konfixes als gebundenes Morphem nicht mehr gegeben. Hilke Elsen 92 Andere Fälle wie mini finden sich in der Fachliteratur mal als Konfix, mal als Präfix klassifiziert. Da mini aber nur an den Anfang eines Lexems tritt, nie abgeleitet wird und eine eher relative Bedeutung, und zwar diminutiv, aufweist, ist die Zuordnung zu den Präfixen hier vorzuziehen. Grundsätzlich jedoch bestehen für einige Konfixe Abgrenzungsprobleme. Und die Dynamik der Sprache kann bei verändertem Gebrauch auch neue Klassifizierungslösungen notwendig machen, wie es in der Vergangenheit bei super der Fall war. Hier steht heute einem Präfix ein homonymes freies Lexem zur Seite. 2.1.2 Affixoid Dieser Begriff hat eine langjährige Diskussionsgeschichte hinter sich und wird nach wie vor gern abgelehnt (vgl. ausführlich Tellenbach 1985, Elsen 2009b). Tellenbach (1985) bescheinigt den Affixoiden ein hohes Maß an inkonsequenter Behandlung in den Wörterbüchern. Es besteht also Bedarf erstens an einer anwendbaren Definition, die den Kreis der Kandidaten klarer umreißt als bisher geschehen, zweitens an einer Sensibilisierung für die Notwendigkeit dieser Kategorie nicht aus Analysierfreude der Sprachwissenschaftler heraus, sondern tatsächlich für das Verständnis und die Produktion komplexer Lexeme. Bei den Affixoiden handelt es sich um Einheiten, die positionsfest, gebunden, systematisch reihenbildend auftreten und ein freies lexikalisches Pendant aufweisen, verbunden mit Bedeutungsverallgemeinerung. Affixoide treten nur mit Stämmen auf, sie werden nicht abgeleitet. Bei den Präfixoiden können wir Besonderheiten bei der Betonung feststellen. Bei Ríesenhochzeit in einem Märchen haben wir ein Determinativkompositum mit der Bedeutung ‘Hochzeit zweier Riesen’ vorliegen. Sprechen wir es aber mit zwei Hauptakzenten aus oder sogar mit Betonung des zweiten Gliedes, also Ríesenhóchzeit oder Riesenhóchzeit, handelt es sich um eine Präfixoidbildung mit der Bedeutung ‘besonders große und schöne Hochzeit’. Diese Form ist mit dem zur Steigerung und Hervorhebung verwendeten Präfixoid riesen gebildet. Was schließlich den Begriff notwendig macht, ist, dass die Affixoide eine stetig wachsende Gruppe bilden, obwohl es natürlich auch hier zu Abgrenzungsschwierigkeiten zu den Komposita und teils auch zu den Ableitungen kommt. So treten jüngst immer wieder Beispiele wie Literaturpapst oder Kunstpapst mit dem „affixoidverdächtigen“ Zweitglied Papst auf, allerdings in übertragender Bedeutung ‘jemand bedeutet für die Literatur so außerordentlich viel Problemzonen der Wortbildung und der Eintrag im Wörterbuch 93 wie der Papst für die katholische Kirche’. Solange aber für alle Beispiele eine metaphorische Beziehung zu erkennen ist, hat sich die Bedeutung noch nicht ganz von der des Pendants entfernt. In anderen Fällen ist die inhaltliche Beziehung zwischen Affixoidkandidat und freiem Pendant gar nicht gegeben, etwa bei artig in adjektivartig, wolkenbruchartig. Allein für sich bedeutet artig ‘brav’, in den komplexen Fügungen jedoch ‘in der Art von, so wie’. Auch dieses Beispiel genügt nicht der Definition, daher wird es oft nicht als Affixoid, sondern als Kompositionsglied eingeordnet. Schließlich seien noch Fälle erwähnt wie mann in Taximann, Zeitungsmann. Hier tritt überhaupt keine Bedeutungsveränderung zu Mann ein, und deswegen handelt es sich nicht um ein Affixoid. Für eine bessere Zuordnung eines Affixoidkandidaten zur Gruppe der Affixoide sollten die Definitionskriterien verfeinert werden. Die Anzahl der Types muss erstens wachsen, dies trifft besonders in umgangssprachlichen Varietäten wie der Jugendsprache zu. Ein gehäuftes Auftreten allein ist jedoch kein zuverlässiger Grund für die Zuordnung eines komplexen Lexems zu den Affixoidbildungen, da viele Kompositionsglieder ebenfalls sehr aktiv verwendet werden, vgl. alkoholabhängig, basisabhängig, benutzerabhängig, corpusabhängig, empfängerabhängig, entscheidungsabhängig, erfahrungsabhängig, erlösabhängig, ertragsabhängig und viele mehr (Wilss 1986, S. 121), arbeitsmarktneutral, aromaneutral, aufkommensneutral, bankneutral, besitzneutral, duftneutral, effektivitätsneutral, gefühlsneutral und viele mehr (ebd., S. 124). Hier zeigen die Paraphrasen, dass keine Bedeutungsverselbstständigungen vorkommen, denn die Bildungen meinen immer ‘abhängig von’ bzw. ‘neutral gegenüber, in Bezug auf’. Denn - zweitens - sollte die metaphorische Verwendung unabhängig vom anderen Glied erfolgen. So heißt riesen mittlerweile allein schon ‘sehr groß’, das beschleunigt eine Verwendung sogar für Adjektive, vgl. riesendämlich, riesendoof. Wichtig ist, dass innerhalb der Gruppe Beispiele mit veränderter Bedeutung ohne metaphorischen Bezug auftreten. Bei saublöd etwa ist noch ein ‘blöd wie eine Sau’ möglich, bei saugut aber steht sau allein für die Steigerung. Genauso verhält es sich mit mords in Mordsgeschrei oder Mordsspektakel als ‘Geschrei wie bei einem Mord’ bzw. ‘Spektakel wie bei einem Mord’, aber für Mordsfete ist diese Beziehung nicht mehr gegeben, es handelt sich um eine ‘besonders schöne Fete’. Bei den Affixoiden haben wir es also mit Einheiten zu tun, die Paraphrasen haben, die nicht in allen Fällen aus den Einzellexemen des Gesamtausdrucks entstehen. Bei der Beachtung dieser Kriterien lässt sich die Gruppe der Affixoide etwas eingrenzen. Die Frage ist nun, ob die Affixoide Hilke Elsen 94 als Einträge im Wörterbuch infrage kommen, wie es Wolfgang Müller schon 1989 forderte. Wenn ja, muss eine konsequente, für die Nutzer nachvollziehbare Auswahl getroffen werden. 2.2 Übergang von Simplex zu komplexem Wort Der Wortschatz des Deutschen liefert immer wieder Texte mit Lexemen, für die eine klare Struktur nicht erkennbar ist. Der Übergang von Simplex zu komplexem Wort ist nicht unbedingt scharf, sondern besteht aus einer Zone von mehr oder weniger eindeutigen Fällen. Diese Übergangszone weist jedoch System auf. Die folgenden Kapitel illustrieren die Problematik anhand von Kunstwörtern und Fremdwörtern. 2.2.1 Kunstwort Ein Kunstwort (auch Urschöpfung) ist eine neue Wurzel, wie sie beispielsweise in der Werbesprache häufig anzutreffen ist, vgl. Fa als Name für ein Deo. Oft findet sich auch der Begriff der Wortschöpfung für solche Formen. Allerdings wird der an anderer Stelle wiederum gleichgesetzt mit Neuschöpfung und Neologismus, daher ziehen wir Kunstwort für Lexeme vor, die nicht über die reguläre Wortbildung des Deutschen entstanden, daher morphologisch nicht komplex sind und somit neue Wurzeln bilden. Eine ausführliche Auseinandersetzung mit dieser Art der sprachlichen Kreativität findet sich in Elsen (2005a, 2008). Kunstwörter treten nicht nur in der Werbesprache, der Medizin und in Kinderbüchern auf, sondern vermehrt auch in einigen Formen der Belletristik, wo sie durchaus zu Rezeptionsproblemen bei Nichtmuttersprachlern führen können. Science-Fiction- und Fantasy-Romane sind ergiebige Quellen für solche Wörter. Sie erheben zwar nicht den Anspruch, ins Standardlexikon des Deutschen eingehen zu wollen, lösen jedoch systematisch eine Vielfalt von Assoziationen aus und steuern dadurch das Verständnis der Leser (ausführlich Elsen 2008). Schauen wir uns einige dieser Beispiele genauer an und versuchen wir, sie morphologisch zu analysieren: Ertruser, Merkuria, Erosan. Für deutsche Muttersprachler stecken in solchen Beispielen einige morphologische Informationen, die sie wohl eher gefühlsmäßig erkennen. Nichtmuttersprachler sind dabei jedoch auf Lehrwerke angewiesen oder eben Wörterbücher, in denen sie diese Beispiele aber nie finden werden. Umso wertvoller wären dann Hinweise zu den Strukturelementen. Namen üben für das Textverständnis und für die Rezeptionssteuerung spezielle Funktionen aus, da sie oft Hinweise zu den Namensträgern geben. Die Verbindung von Form und Inhalt ist ganz und Problemzonen der Wortbildung und der Eintrag im Wörterbuch 95 gar nicht willkürlich (vgl. Elsen 2005a, 2008, 2011a; Luft 2007; Munat 2007). Um es gleich vorwegzunehmen, solche Wörter, alles Namen, befinden sich auf einer Skala von gut bis gar nicht morphologisch strukturiert (vgl. auch Elsen 2009a, 2010). Bezeichnungen wie Venusier oder Saturner sind regelhafte Derivationen, sie benennen die Bewohner von Venus bzw. Saturn. Beispiele wie Ertruser oder Thorwaler sind für die Leser, die aus ihrem Roman den Planeten Ertrus oder die Stadt Thorwal kennen, mindestens genauso durchsichtig. Allerdings sind weder Ertrus noch Thorwal Morpheme des Deutschen, sondern textgebundene Kunstwörter. Auch Merkuria und Terrania verursachen Science-Fiction- Kundigen wenig Probleme, da quer durch die Geschichten solche Namen die Hauptstädte der jeweiligen Planeten bezeichnen. Aber bei -(ni)a handelt es sich wieder nicht um ein deutsches Morphem. Trotz mehrfach stabiler Relation zwischen Basis (Merkur, Terra) und ergänzter Basis (Merkuria, Terrania) haben wir es nicht mit regulär abgeleiteten Bildungen zu tun. Beispiele wie Ertruser, Thorwaler, Merkuria und Terrania scheinen morphologisch strukturiert zu sein, bestehen aber nicht ausschließlich aus bedeutungstragenden Einheiten der deutschen Sprache. Noch etwas komplizierter liegt der Fall bei Erosan und Euphorit. Muttersprachler dürften leicht erkennen, dass diese Beispiele etwas mit eros, also mit Liebe, und euphor, bekannt aus euphorisch, zu tun haben. Die Endsilben wiederum sind in bestimmten Sprachvarietäten geläufig, und zwar in denen der Werbung, der Chemie und der Medizin. Dort verknüpfen wir mit ihnen die Vorstellung von Wissenschaftlichkeit, Seriosität, Wirksamkeit oder gleich den Gedanken an ein Medikament, eine Substanz. Verbinden wir diese Information mit dem Rest der Wörter, werden wir Erosan und Euphorit als Liebesbzw. Rauschmittel interpretieren. Und genauso ist es von den Autoren auch gemeint. Mit diesen Endungen haben wir einen systematischen Zusammenhang zwischen bestimmten Lautkomplexen, betonten Endsilben in der Form (C)VC mit Vollvokalen wie -in, -it, -on, -an, -ol, und Assoziationskomplexen vorliegen (zu Pseudomorphemen vgl. Elsen 2006). Darüber hinaus finden wir Namen wie Karisom und Terkonit. Hier treten solche Pseudomorpheme an nicht interpretierbare Wortfragmente. Hier liegt dann auch kein morphologisch komplexes Wort mehr vor, obwohl wir Pseudosuffixe identifizieren können und mit ihrer Hilfe wieder auf Substanzen schließen. Und gänzlich nichtkomplex sind reine Kunstwörter wie Draglop oder Gorx. Die Belletristik ist eine ergiebige Quelle für einen gleitenden Übergangsbereich von Wörtern mit mehr oder weniger Information, die über die morpho- Hilke Elsen 96 logische Struktur vermittelt wird. Häufig steuern solche Bildungen wichtige, für das Leseverständnis notwendige Assoziationen. Und sollten die Wörterbücher nicht gerade für Fremdsprachenlernende Assoziationshilfen bieten, die dem Muttersprachler selbstverständlich sind? Für solche Formen sind Wortbildungszusammenhänge, auch aus didaktischer Sicht, wünschenswert (Barz 2001). Neben den regulären Wortbildungen gibt es mögliche und individuelle. Die Frage ist, ob wir grundsätzlich auf solche Beispiele mit der ihnen eigenen Systematizität eingehen wollen, stammen sie doch aus nicht gerade hoch angesehenen Varietäten. Wie wichtig sind Bildungen wie Erosan und die von ihnen gesteuerten Assoziationskomplexe? 2.2.2 Fremdwort Ein weiteres Gebiet mit hohem Konfliktpotenzial bilden die Fremdwörter. Allerdings verteilen sich hier die Analyseschwierigkeiten auf mehrere Bereiche. Entlehnung und Wortbildung werden, so Rettich (1989) und Müller (1989), nicht klar genug getrennt. Und ständig begegnen wir dem Problem, dass eine vollständige Morphemanalyse nicht immer möglich ist. 2.2.2.1 Allomorphie Wenn wir uns Beispiele anschauen wie Sekretär/ Sekretariat, regulär/ Regularität, variabel/ Variabilität (Dittmer 2005), sehen wir, dass die Fremdwortmorpheme in Abhängigkeit von ihrer Position im Wort Veränderungen unterliegen. Für die Lexikographen stellt sich dann die Frage, ob solche Varianten einzeln aufgenommen werden sollten oder ob Regeln zur Verteilung zu erstellen sind. Mögen solche Alternanzen den Muttersprachlern vielleicht noch nicht einmal auffallen, so können sie bei Fremdsprachenlernenden doch zu Irritationen führen. 2.2.2.2 Fremdwortübernahme und Fremdwortbildung Der Unterschied zwischen einem Fremdwort, das als Ganzes aus einer anderen Sprache übernommen wurde und damit erst einmal als Simplex zu werten ist, und einem aus fremden Elementen im Deutschen gebildeten Wort ist oft ebenso schwer zu erkennen. Dies liegt einerseits an der Polygenese, wenn Fremdwörter aus mehreren Sprachen gleichzeitig kommen und wir es mit direkten und indirekten Übernahmen zu tun haben, denen darüber hinaus im Deutschen gebildete Beispiele zur Seite stehen, ohne dass diese Unterschiede ohne weitläufige Recherchen sichtbar wären. Beispielsweise stammt chap- Problemzonen der Wortbildung und der Eintrag im Wörterbuch 97 linesk aus dem Französischen, boccacciesk aus dem Italienischen, statuesk aus dem Englischen, während kafkaesk im Deutschen gebildet wurde (Wellmann 2005b). Archaismus haben wir dem Griechischen zu verdanken, Dualismus dem Englischen, Egoismus dem Französischen, und Pessimismus haben wir selbst gebildet (Wellmann 2005a). Karambolage kam aus dem Französischen, Takelage aus dem Niederländischen ins Deutsche, aber Blamage ist eine deutsche Bildung (Öhmann 2005). In all diesen Fällen ist eine eindeutige Trennung nach direkter und indirekter Übernahme und Fremdwortbildung schwierig oder gar unmöglich. Überhaupt stellt sich die Frage, inwiefern wir nach diachronen Gesichtspunkten Wortbildungsregularitäten zu beurteilen haben, für die Fremdwörter ganz besonders. Sehen wir uns dazu einige Nomen auf -ität an und betrachten wir sie historisch korrekt (vgl. Müller, P.O. 2005). Wir übernahmen als Fremdwörter beispielsweise Kapazität und Pietät, außerdem auch Naivität und Neutralität. Später dann bildeten wir analog dazu Aktivität und Relativität, da wir die Adjektive aktiv und relativ bereits kannten. Wenn wir aber die Durchsichtigkeit als Hauptkriterium der Analyse ansetzen, sind neben Aktivität und Relativität auch Naivität und Neutralität morphologisch transparent, denn das Deutsche verfügt über die Adjektive naiv und neutral. Das trifft auf Kapazität und Pietät nicht zu, da es *kapaz und *pie nicht gibt. Die Analysekriterien der diachron orientierten und der morphologisch durchsichtigen Wortbildung ergeben unterschiedliche Gruppen. Damit stellt sich für den Lexikographen die Frage, wie die Darstellung der Fremdwörter zu erfolgen hat - so, dass sie den historisch richtigen Weg wiedergibt, oder so, dass sie für den Sprachbenutzer zu nachvollziehbar zerlegbaren Beispielen führt? Insgesamt gibt es keine klaren Grenzen zwischen übernommenem und gebildetem Fremdwort. Wie stark ist also auf die morphologische Struktur einzugehen? Wie weit sind die beteiligten Morpheme als Wörterbucheinträge zu berücksichtigen? Heute wird vermehrt auf die synchron grundierte Anschaulichkeit Wert gelegt, die Zusammenhänge verdeutlicht, genaue etymologische Beziehungen treten in den Hintergrund (Link 1990; Augst 1992; Barz 2001, S. 88). 2.2.2.3 Zerlegbarkeit Und auch die Grenze zwischen den einzelnen Morphemen ist nicht immer leicht zu lokalisieren. Es gibt natürlich klare Fälle, beispielsweise inform-ieren, invest-ieren, interven-ieren, exekut-ieren (vgl. Dittmer 2005, Seiffert 2009). Die entsprechenden Nomen können auch zerlegt werden, bei einheitlicher Basis also Inform-ation, Invest-ition, Interven-tion und Exekut-ion. Jetzt Hilke Elsen 98 sehen wir aber Schwankungen der Derivationsaffixe. Wollen wir einheitliche Derivationsmorpheme erhalten, müsste die Zerlegung folgendermaßen aussehen: Informa-tion, Investi-tion, Interven-tion, Exeku-tion. Nur sehen nun die Basen anders aus als die der Verben. Die Grenzziehung zwischen Stamm und Affix ist also nicht immer eindeutig. Ja, es ist nicht einmal klar, ob die Veränderung der Fremdwortmorpheme überhaupt mit Regeln des Deutschen beschreibbar ist. Inwieweit sollen daher die Lexeme als Ganzes aufgenommen werden? Inwieweit ist auf die morphologische Struktur einzugehen? Dieser Fragenkomplex bedeutet für die Lexikographen insofern eine besondere Herausforderung, als er kaum systematisch und gleichzeitig für den Benutzer des Nachschlagewerks praktikabel beantwortet werden kann. 2.3 Produktive Wortbildungsmuster in einzelnen Varietäten Der dritte Problembereich betrifft die Wortbildungsproduktivität in verschiedenen Varietäten des Deutschen, die alle Lexeme für die Standardsprache liefern. Noch in frühen Standardwerken wie denen von Otto Behagel oder Friedrich Kluge war die Behandlung von Berufs- und Sondersprachen selbstverständlich, um die Vielschichtigkeit und die zahlreichen Einflüsse auf die Gemeinsprache zu demonstrieren und Bedeutungszusammenhänge zu ergründen (Kramer 2010, S. 18f.). Bedauerlicherweise erreichen aktuelle Wörterbücher die quantitativen und qualitativen Vorgaben dieser Vorbilder nicht (ebd., S. 227), sie sind unvollständig, wenig aktuell und ungenau (ebd., S. 292). 2.3.1 Fachsprachen: komplexe Lexeme mit Präfixen Fachsprachen weisen häufig für sie typische oder gar für sie eigene Morpheme auf, neben bestimmten Konfixen (vgl. auch Link 1990) auch Affixe. Die Fachsprache der Literaturwissenschaft ist bei den Bildungen auf -esk, das gern -haft vertritt, produktiv, vgl. hollywoodesk, godardesk, hoffmannesk, dantesk, balladesk etc. (Wellmann 2005b). Die Fachsprache der Linguistik hat eigene Morpheme, vgl. -em in Phonem, Morphem, Semem (vgl. auch Elsen 2004). Lexikographen wenden verschiedene Kriterien an, um über die Aufnahme einer Einheit ins Wörterbuch zu entscheiden, beispielsweise, ob sie häufig vorkommt, ob sie in die Alltagssprache übertritt, ob sie schwer verständlich ist (Kramer 2010), oder neuerdings auch, ob sie von den Benutzern verlangt wird (Bergenholtz, pers. Mitteil.). Vielleicht sind Bildungen mit -em zu speziell, um für das Wörterbuch infrage zu kommen, aber gilt das auch für -esk? Schließlich finden wir es in einigen journalistischen Texten, wie die Belegsammlung von Wellmann (2005b) zeigt, und auch in Belegkorpora wie DeReko. Problemzonen der Wortbildung und der Eintrag im Wörterbuch 99 2.3.2 Fachsprachen: Wortgruppenlexeme Dann treffen die Leser bei der Lektüre ihrer Texte auf Fügungen wie rechter Winkel, Kap der Guten Hoffnung, Bürgerliches Gesetzbuch, Rolle rückwärts (vgl. ausführlich Elsen 2007, 2011b). Sie stammen meist aus technisch-wissenschaftlichen Fachsprachen und gehen zum Teil in die Allgemeinsprache ein. Sie weisen eine große Nähe zu den Komposita auf. Dies sehen wir daran, dass sie in einer Reihe mit ihnen stehen, beispielsweise Acker-Kamille, Feld- Kamille, Echte Kamille, Römische Kamille. Es gibt auch oft Dubletten in Form von Komposita, vgl. Euler-Zahl/ Eulersche Zahl, Glykosidbindung/ glykosidische Bindung. Sie werden gern im Alltag durch Einzellexeme ersetzt, beispielsweise der Gewöhnliche Geißfuß durch Giersch, den Gartenfreunden als ungeliebtes Wildkraut ein Begriff. Die Wortgruppenlexeme nehmen außerdem an Kürzungsprozessen teil wie andere Wortbildungsprodukte auch: EU zu Europäische Union, Audimax zu Auditorium Maximum. Dies alles weist auf den Terminuscharakter der Wortgruppenlexeme hin. Und Termini sind ja gerade gute Kandidaten für ein Wörterbuch. Den Sprachbenutzern ist offenbar dieser Terminuscharakter unbewusst klar, denn sie schreiben die Teile eines Wortgruppenlexems gern groß. In Texten von Bauingenieuren finden wir daher beispielsweise Zusätzliche Leistungen. Die Ingenieure benutzen diesen Begriff für Leistungen, die zwar ursprünglich nicht verlangt waren und darum auch nicht in einem Leistungsverzeichnis festgehalten sind, trotzdem aber bezahlt werden müssen, da sie sich für das Gelingen einer Baumaßnahme als notwendig erweisen. Wird eine Leistung nicht als Zusätzliche Leistung bezeichnet, muss sie nicht bezahlt werden - es handelt sich also um einen juristisch und finanziell äußerst wichtigen Begriff, der für ein klar umrissenes Konzept steht. Die Großschreibung dient dem Wissenschaftler aber höchstens als Hinweis auf ein Wortgruppenlexem, nicht als Definitionskriterium. Bei den Wortgruppenlexemen haben wir es mit festen Fügungen aus mindestens zwei getrennt geschriebenen Einheiten zu tun, die auf eine begriffliche Einheit Bezug nehmen, also auf ein Konzept. Sie weisen kaum oder gar keine Idiomatizität auf - definitionsabhängig können sie zur Gruppe der Phraseologismen gerechnet werden. Die Tatsache, dass sie bei der Kurzwortbildung beteiligt und in manchen Varietäten produktiv, ja hochproduktiv sind (sie stellen bis zu 20% der Neubildungen, vgl. Elsen 2011a), spricht dafür, sie als Wortbildungen zu verstehen und damit als reguläre Kandidaten für Wörterbucheinträge. Für die mehrwortigen Lexeme konstatiert Rettich (1989, S. 647) besonders große Schwankungen in den Wörterbüchern, auch hier steht den Lexikographen noch einiges an Arbeit bevor. Hilke Elsen 100 2.3.3 Jugendsprache Andere Varietäten speisen das Standarddeutsche ebenfalls mit Lexemen, die über Wortbildungseigenheiten entstanden. Die Jugendsprache hält sich in vielerlei Hinsicht nicht an den Standard. Sie ist stark umgangssprachlich geprägt mit äußerst kurzlebiger Lexik, daher dürfte sie kaum als Quelle für Wörterbücher infrage kommen. Allerdings lieferte sie uns super in freier Verwendung. Affixe in Lexeme zu verwandeln geschieht in den jugendsprachlichen Ausprägungen immer wieder, nur gelangen solche Wörter, zu denen auch top gehört, nicht so oft in die Standardsprache. Eine weitere Wortbildungseigenheit der Jugendsprache ist es, Affixe zu verwenden, die keine Bedeutungsveränderung hervorrufen, sondern als stilistische Marker dienen, z.B. klar/ klaro oder chillen/ abchillen. Diese Muster sind produktiv, kommen aber nur in dieser Sprachausprägung vor. Es bleibt abzuwarten, ob es hierzu Reflexe im Standard geben wird. 2.3.4 Belletristik, Werbung Schließlich sind die Werbung, aber auch die Kinderliteratur und einige Formen der Belletristik kreativ, wenn es darum geht, neue Wörter zu bilden. Hier wird dann auch von der Möglichkeit der Kunstwortbildung Gebrauch gemacht. Hin und wieder wandern Beispiele in den Allgemeinwortschatz, so manche Produktnamen wie Kodak, Teflon (Baldi/ Dawar 2000) und Fa oder besondere Charaktere wie das Urmel. Es ist wieder fraglich, ob solche Formen des Deutschen als seriös genug erachtet werden, um für die Wörterbuchmacher infrage zu kommen. Das gesamte Varietätenspektrum muss in dieser Hinsicht noch einmal kritisch betrachtet werden. Die Lexikographen wollen mit einem Wörterbuch in der Regel den Standard des Deutschen wiedergeben und alle relevanten Aspekte des Allgemeinwortschatzes betrachten. Darum fordert nicht nur Bergenholtz (2005) mehr und umfassenderes Basismaterial, durchaus auch aus Belletristik und Fachliteratur. Die neuen Möglichkeiten, die das Instrument Internet bietet, wirken sich auch auf die Lexikographie aus. Nun können wir unsere Wörterbuchangaben ausführlicher, gleichzeitig aber auch strukturiert gestalten 3 und über zusätzliche Ebenen, die per Mausklick für jeweils Interessierte offenstehen, anbieten. Somit können bisher vernachlässigte Randzonen und Übergangsbereiche, gestaffelt nach Wichtigkeit, ihren Weg in das Wörterbuch finden. 3 Für Überlegungen zur grafischen Aufbereitung von Wortbildungsbeziehungen vgl. den Beitrag „Visualisierung von Wortbildungsbeziehungen im elektronischen Wörterbuch“ von Peter Meyer und Carolin Müller-Spitzer in diesem Band. Problemzonen der Wortbildung und der Eintrag im Wörterbuch 101 3. Literatur 3.1 Forschungsliteratur Augst, Gerhard (1992): Das lexikologische Phänomen der Wortfamilie in alphabetisch-semasiologischen Wörterbüchern. In: Zeitschrift für germanistische Linguistik 20, S. 24-36. Baldi, Philip/ Dawar, Chantal (2000): Creative processes. In: Booij, Geert/ Lehmann, Christian (Hg.): Morphology I. Berlin, S. 963-972. Barnhart, Clarence L./ Steinmetz, Sol/ Barnhart, Robert K. (1980): The second Barnhart dictionary of New English. Bronxville, NY. Barz, Irmhild (2001): Wortbildungsbeziehungen im einsprachigen Bedeutungswörterbuch. In: Korhonen, Jarmo (Hg.): Von der monozur bilingualen Lexikografie für das Deutsche. Frankfurt a.M., S. 85-100. Bauer, Laurie (1983): English word-formation. Cambridge. Bergenholtz, Henning (2005): Wortbildungen im Text und im Wörterbuch. In: Fix, Ulla/ Lerchner, Gotthard/ Schröder, Marianne/ Wellmann, Hans (Hg.): Zwischen Lexikon und Text. Lexikalische, stilistische und textlinguistische Aspekte. (= Abhandlungen der Sächsischen Akademie der Wissenschaften zu Leipzig, Philologisch-historische Klasse 78, 4). Stuttgart/ Leipzig, S. 125-143. Dittmer, Ernst (2005): Form und Distribution der Fremdwortsuffixe im Neuhochdeutschen. In: Müller (Hg.), S. 77-90. Dziemianko, Anna (2010): Paper or electronic? The role of dictionary form in language reception, production and the retention of meaning and collocations. In: International Journal of Lexicography 23, 3, S. 257-273. Elsen, Hilke (2004): Neologismen in der Fachsprache der Linguistik. In: Deutsche Sprache 31, 1, S. 63-75. Elsen, Hilke (2005a): Das Kunstwort. In: Muttersprache 115, 2, S. 142-149. Elsen, Hilke (2005b): Deutsche Konfixe. In: Deutsche Sprache 33, 2, S. 133-140. Elsen, Hilke (2006): Pseudomorpheme - Fiktive Namen im Übergangsbereich von Phonologie und Morphologie. In: Muttersprache 116, 3, S. 242-248. Elsen, Hilke (2007): Wortgruppenlexeme - Beispiele aus Enzyklopädie, Zeitung, Baurecht und Wasserbau. Fachsprache. In: International Journal of LSP 1-2, S. 44-55. Elsen, Hilke (2008): Phantastische Namen. Die Namen in Science Fiction und Fantasy zwischen Arbitrarität und Wortbildung. Tübingen. Elsen, Hilke (2009a): Prototypen im Grenzbereich von Phonologie und Morphologie. In: Linguistik Online 40, S. 63-75. Internet: www.linguistik-online.de/ 40_09/ elsen.html (Stand: 10/ 2012). Elsen, Hilke (2009b): Affixoide. Nur was benannt wird, kann auch verstanden werden. In: Deutsche Sprache 37, 4, S. 316-333. Hilke Elsen 102 Elsen, Hilke (2010): Between phonology and morphology. In: Onysko, Alexander/ Michel, Sascha (Hg.): Cognitive perspectives on word formation. Berlin/ New York, S. 127-146. Elsen, Hilke (2011a): Neologismen. Formen und Funktionen neuer Wörter in verschiedenen Varietäten des Deutschen. 2. Aufl. Tübingen. Elsen, Hilke (2011b): Grundzüge der Morphologie des Deutschen. (= De Gruyter Studium). Berlin/ New York. Fleischer, Wolfgang/ Barz, Irmhild (1992): Wortbildung der deutschen Gegenwartssprache. Tübingen. Hausmann, Franz Josef/ Reichmann, Oskar/ Wiegand, Herbert Ernst/ Zgusta, Ladislav (Hg.) (1989): Wörterbücher. Ein internationales Handbuch zur Lexikographie / Dictionaries: An international encyclopedia of lexicography. 1. Teilbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science 5.1). Berlin/ New York. Kramer, Undine (2010): Spezielle Wortschätze und ihre Kodifizierung in deutschen Wörterbüchern. Berlin/ New York. Link, Elisabeth (1990): Das Wörterbuch der Wortbildungsmittel. In: Hausmann, Franz Josef/ Reichmann, Oskar/ Wiegand, Herbert Ernst/ Zgusta, Ladislav (Hg.): Wörterbücher. Ein internationales Handbuch zur Lexikographie / Dictionaries: An international encyclopedia of lexicography. 2. Teilbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science 5.2). Berlin/ New York, S. 1223-1230. Luft, Yvonne (2007): Die Bedeutung von Namen in Kinderbüchern. Eine Studie zur literarischen Onomastik im Spannungsfeld zwischen Autor und Leser. Duisburg. Müller, Peter O. (2005): Einführung. In: Müller (Hg.), S. 11-45. Müller, Peter O. (Hg.) (2005): Fremdwortbildung. Theorie und Praxis in Geschichte und Gegenwart, Frankfurt a.M. u.a. Müller, Wolfgang (1989): Die Beschreibung von Affixen und Affixoiden im allgemeinen einsprachigen Wörterbuch. In: Hausmann et al. (Hg.), S. 869-882. Munat, Judith (2007): Lexical creativity as a marker of style in science fiction and children's literature. In: Munat, Judith (Hg.): Lexical creativity, texts and contexts. Amsterdam/ Philadelphia, S. 163-185. Öhmann, Emil (2005): Suffixstudien X. Das deutsche Suffix -age, -asch(e). In: Müller (Hg.), S. 305-317. Prćić, Tvrtko (2005): Prefixes vs. initial combining forms in English: A lexicographic perspective. In: International Journal of Lexicography 18, 3, S. 313-334. Prćić, Tvrtko (2008): Suffixes vs. final combining forms in English: A lexicographic perspective. In: International Journal of Lexicography 21, 1, S. 1-22. Problemzonen der Wortbildung und der Eintrag im Wörterbuch 103 Rettich, Wolfgang (1989): Die Wortbildungszusammenhänge im allgemeinen einsprachigen Wörterbuch. In: Hausmann et al. (Hg.), S. 642-649. Scheller-Boltz, Dennis (2008): „Bio, Burger oder Genfood - Streit ums Essen“, bio (-) jetzt als selbstständiges Wort? In: Muttersprache 118, 3, S. 243-258. Seiffert, Anja (2009): Inform-ieren, Inform-ation, Info-thek. Probleme der morphologischen Analyse fremder Wortbildungen im Deutschen. In: Müller, Peter O. (Hg.): Studien zur Fremdwortbildung. Hildesheim u.a., S. 19-40. Tellenbach, Elke (1985): Wortbildungsmittel im Wörterbuch. Zum Status der Affixoide. In: Bahner, Werner (Hg.): Beiträge zu theoretischen und praktischen Problemen in der Lexikographie der deutschen Gegenwartssprache. Berlin, S. 266-315. ten Hacken, Pius/ Abel, Andrea/ Knapp, Judith (2006): Word formation in an electronic learners' dictionary: ELDIT. In: International Journal of Lexicography 19, S. 243-256. Warren, Beatrice (1990): The importance of combining forms. In: Dressler, Wolfgang U./ Luschützky, Hans C./ Pfeiffer, Oskar E./ Rennison, John R. (Hg.): Contemporary morphology. New York, S. 111-132. Wellmann, Hans (2005a): Zur Problematik einer wissenschaftlichen Sprachpflege: Die „Ismen“. In: Müller (Hg.), S. 325-343. Wellmann, Hans (2005b): Fremdwörter des Lexikons oder systemgebundene Ableitungen? Über die Integration der Adjektive auf -esk (und -oid ). In: Müller (Hg.), S. 345-365. Wilss, Wolfram (1986): Wortbildungstendenzen in der deutschen Gegenwartssprache, Tübingen. 3.2 Internetressourcen DeReKo. Das Deutsche Referenzkorpus. Internet: http: / / www.ids-mannheim.de/ kl/ projekte/ korpora/ (Stand: 09/ 2011). Johan De Caluwe Dictionary entries as windows on the onomasiological aspects of word formation 1. Introduction The theme of this volume of papers is Word formation in electronic dictionaries and in fact this reflects the perspective of linguists/ lexicographers on the subject. The average user of the dictionary is likely to be more interested in words and meanings, not in word formation as such. If we try to combine the perspective of both linguist/ lexicographer on the one hand, and user of the dictionary on the other hand, I would reformulate the theme of this volume as: What, if any information on word formation should we build into the make-up of the dictionary (lexicographic perspective) in order for the user of that dictionary to find what he may be looking for (user perspective)? As a consequence we cannot but start from the needs of the user. We all know that users may have either semasiological or onomasiological needs, or - again, in the language of the user: a) What does word X mean? b) Which word could best express meaning/ concept ‘Y’? I will concentrate on word formation in monolingual dictionaries, since this context is most challenging to lexicographers, especially from the onomasiological perspective. 1 When for example a language learner is looking in a monolingual dictionary of that language for a particular lexical item that would best serve his/ her naming needs, there is no mediating term from his/ her mother tongue to start from, as would be the case in a bilingual dictionary. Throughout this paper I will use examples from Dutch from one particular paradigm. I will focus on 1) adjectives that can be used to characterise people, 2) nouns naming people with these characteristics, 3) the relation between these adjectives 1) and nouns 2), 1 Cf. Koefoed (1991, 1993) for his pioneering work on the relation between word formation and onomasiology. Johan De Caluwe 106 4) the question whether information of type 3) should be encoded in the e-dictionary, and if so, how? In Dutch we can distinguish between the following word formation patterns for naming people on the basis of a typical (adjectival) feature: (1) [A + eling] N woest ‘savage, wild’ > woest-eling creatief ‘creative’ > creatiev 2 -eling (2) [A] N (conversion) revolutionair ‘revolutionary’ > revolutionair conservatief ‘conservative’ > conservatief (3) [A + e] N bejaard ‘elderly’ > bejaard-e blank ‘white’ > blank-e (4) [A + erd/ aard] N eng ‘creepy, scary’ > eng-erd laf ‘cowardly’ > laf-aard (5) [A + erik] N lui ‘lazy’ > lui-erik onbeleefd ‘impolite, rude’ > onbeleefd-erik (6) [A + je] N (diminutive) blond ‘blonde’ > blond-je oud ‘old’ > oud-je (7) [A + o] N positief ‘positive’ > positiv-o lesbisch ‘lesbian’ > lesb 3 -o So Dutch has at least seven different patterns - be it with varying productivity - operating in one particular onomasiological domain, each with its own morphological, phonological, lexical, semantic restrictions on the base words. Consequently there are complex relations of competition and/ or complementarity between these word formation rules, and even between these morphological naming strategies and „phrasal names“ (De Caluwe 1990, 2010; Booij 2010, p. 169ff.) such as grote baas (‘big boss’). 2 The alternation between [ f ] and [v] is a phonological matter, but in this paper I will not go into the phonological changes involved in the word formation patterns under discussion. 3 The o-suffix is not added to the base adjective, but rather replaces the original adjectival suffix -isch. Dictionary entries as windows on the onomasiological aspects of word formation 107 The information on the hundreds of word formation rules in a language like Dutch or German is too complex for an exhaustive treatment in dictionaries. Therefore people with a primary interest in (Dutch) word formation as such should better consult a Dutch grammar like the ANS (1997) (Algemeene Nederlandse Spraakkunst - ‘General Dutch Grammar’), Booij's Morphology of Dutch (2002), or the Morfologisch Handboek van het Nederlands (‘Morphological Handbook of Dutch’) (De Haas/ Trommelen 1993). In the next sections I will try to answer the question: if it is impossible to give all relevant data on word formation in a dictionary, then how do we select the data that are lexicographically relevant, and how do we present them in an electronic dictionary? 2. Information on the morphological make-up of words 2.1 Specifying the latest morphological operation If we focus on the receptive use of the dictionary, i.e. on the semasiological needs of the user, we have in mind for example learners of Dutch as a second language, looking up woesteling, revolutionair, bejaarde, lafaard, luierik, oudje, etc. Should we give the users more than the meaning of these words? Should we offer them the morphological make-up of these words as specified in (1) - (7)? The answer in this case is: yes. It can be done at a relatively small cost, at least if word formation is a simple process of concatenation, as with bejaard-e or onbeleefd-erik. For each derived word that is listed as a separate entry in a (paper-based or electronic) dictionary, it would be useful to have its morphology explained in detail, to the extent that it is grammatically and practically possible. This does not mean that each derivation should be analysed to its deepest level, but that the most recent step taken in the morphological history of that word be made clear to the dictionary user. In the case of bejaarde ‘elderly’ the most recent morphological operation is suffixation of the adjective with -e: bejaard-e, and the same holds for many more words in Dutch: blank-e ‘white’, blind-e ‘blind’, volwassen-e ‘adult’, etc. In the case of the adjective bejaard the most recent operation is circumfixation with beand -d: be-jaar N -d, meaning: ‘with (many) N’. The same holds for Johan De Caluwe 108 - be-wolk-t ‘with (many) clouds’, - be-middel-d ‘with (many) means’, i.e. ‘rich’, - be-vooroordeel-d ‘with (many) prejudices’. The specification of the morphological make-up of complex words will help the users of the dictionary if they want more information on the systematic meaning of that word. With bejaard-e for example, they can click on the suffix -e to read more about that particular word formation pattern, and to find more words that have been formed in a similar way. This will help the reader to situate a word and its set of meanings - be they idiosyncratic or not - within a paradigm of morphologically related words, which can allow the reader to gain insight into how the consulted word developed its meaning. In the case of bejaard for example, readers will discover that its present meaning ‘elderly’ relates to the basic meaning of ‘having (many/ much) N’, which it shares with bewolkt, bemiddeld, bevooroordeeld. The added advantage of morphological marking in an electronic dictionary is that it allows us to easily identify all words of the same morphological type in the dictionary (De Caluwe/ Taeldeman 2003, p. 121f.). As we all know, it is of little use to search for *e in an electronic dictionary if we want to identify all nouns of the type bejaard-e, since the search engine would also generate ziekte ‘disease’, aardolie ‘petrol’, and thousands of other words ending in e, but not the suffix -e. 2.2 Technical problems Specifying the morphological make-up is sometimes easier said than done. We are aware of the technical problems that will arise if you want to enrich the dictionary with information on the derivational history of complex items. Lexicographers should devise technical solutions for problems that are typical for either concatenative or non-concatenative word formation. Under (8) we just mention a few different types of problems to overcome: (8a) domm-erik N ‘stupid person’ Orthographic: the user may think the base word is domm, but it is dom. In dommerik the consonant is doubled to indicate that the preceding vowel is short. (8b) creatiev-eling N ‘creative person’ Phonological: the user may think the base word is creatiev, but it is creatief, due to the process of devoicing of the final consonant in the adjective. Dictionary entries as windows on the onomasiological aspects of word formation 109 (8c) il-legaal A ‘illegal’ Phonological: in all cases the prefix inis involved, but that is obscured by the different types of regressive assimilation. (8d) revolutionair A/ N ‘revolutionary’ Morphological: how to specify that revolutionair N is derived from revolutionair A by conversion? (8e) social-ist N Morphological: how to specify that socialist N is not derived from the adjective social, but is the product of affix substitution on the base word socialisme N , as is the case with realist, naturalist, impressionist, etc. Mutatis mutandis the same question holds for cases of back-formation (Rückbildung): hongerstaker N ‘hunger striker’ is no simple deverbal noun; its base is another noun hongerstaking (‘hunger strike’). 2.3 Giving the users more than they were looking for Specifying the morphological make-up of a word in a strict sense does not correspond to the principles we started from at the beginning of this paper. The user of the dictionary, looking up dommerik, illegaal, etc. is most likely to be only/ primarily interested in the meaning of these words and perhaps also the way they can be used in an idiomatically correct way. And yet there is a good reason for lexicographers to specify the morphological make-up of lexical entries since it adds greatly to the practical value of the dictionary. As ten Hacken/ Abel/ Knapp (2006, p. 243) put it: In second language acquisition, word formation is important for the decoding of words the learner does not know, for the production of regular new words when the learner has not acquired the standard word, and for the creation of a tighter network structure in the mental lexicon, which facilitates vocabulary acquisition. The quotation reflects ten Hacken/ Abel/ Knapp's focus on (electronic) learners' dictionaries in the context of language acquisition, but mutatis mutandis the same argument holds for native speakers consulting a monolingual dictionary. Providing the user looking for the meaning of a word with information on the paradigmatic, in casu morphological relations, of that word with other items in the lexicon really constitutes an added value to the user, on the condition of course that it will not lead to information stress. 4 The way in 4 On information stress, see also Henning Bergenholtz in his article „Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen und als Hilfe bei kommunikativen und kognitiven Informationsbedürfnissen“ (this volume). Johan De Caluwe 110 which the morphological information is presented should reflect its secondary status, while semantic information should by all means keep its primary status on the screen. 5 Specifying the morphological make-up of a word also raises another question: where does information on word formation end and where does etymology start? Words may have been derived from a particular base many hundreds of years ago, and the relation to that base word may have long been lost in the mind of native speakers. For example: (9) Du. bepalen V ‘to determine’ verb stem: be-paal base word: paal ‘post, stake, pole’ word formation type: [be + N] V : ‘to provide with N’ semantic evolution: ‘to put stakes in the ground to stake out a piece of land’ > ‘to demarcate’ > ‘to determine’ This word formation type is still productive in Dutch, which may be a good argument to specify the morphological make-up of this type of words too. It will help the user of the dictionary to create a tighter network structure in the mental lexicon, facilitating vocabulary acquisition in the case of language learning. The unproductivity of the word formation type involved is, however, no sufficient ground for not specifying morphological make-up. In Dutch for example, the following pattern has become unproductive now: (10) [N + in] N : ‘female N’ vriend-in ‘girl friend’ koning-in ‘queen’ leeuw-in ‘lioness’ Yet, the morphological make-up of these complex words is still highly transparent to all native speakers of Dutch, which is a good reason to specify this make-up in the dictionary. On the other hand, there will be cases where unproductive word formation types are involved, resulting in complex items that are no longer transparent 5 This raises the general question of course which information can count as added value, and where it should be specified. For example, some dictionaries add data on the etymology of a word. In the Dutch dictionary series of Van Dale - the most comprehensive and the most popular dictionary in both Belgium and the Netherlands - etymological information used to be specified immediately after the details on the word form, so before the definition of the word sense. The editors have recently decided to move this secondary type of information to the end of the dictionary entry, i.e. after the description of the semantics (cf. Van Dale 2005). Dictionary entries as windows on the onomasiological aspects of word formation 111 even to native speakers. Specifying the morphological make-up of these words would perhaps be a step too far in a synchronic (learners') dictionary, but of course would be welcome in a historic dictionary. 3. Information on derivations and compounds with a particular base word 3.1 Motivation Until now we discussed information on the morphological make-up of a word, but how about the complementary question: should the e-dictionary specify for each lexical item the derivations and compounds that have been formed on the basis of that lexical item? For example, returning to the examples we discussed earlier, there are good reasons to specify the morphological make-up of Du. bejaarde as bejaard-e, or of bejaard as be-jaar-d. But should we specify in the dictionary entry for bejaard A that Dutch has a deadjectival noun bejaard-e ‘elderly person’? And is it interesting for the reader looking up jaar ‘year’ to learn that there is a derivation in Dutch be-jaar-d, meaning ‘elderly’? And shall we tell the reader in the entry for revolutionair A that the word form can also be used as a name for people who are revolutionary (by means of conversion)? One option is to list all derivations and compounds with any base word in the dictionary. This option is only worth considering if the format of the e-dictionary will enable the user to avoid information stress. So it would certainly be wise to present all compounds and derivations on secondary screens only if the user decides to use a particular link on the main screen. In chapter 2.3 we raised the question whether we should specify the morphological make-up of words, if that make-up is of no particular synchronic relevance any more. The same question holds in the opposite direction: should we specify in the entry for paal N , as in (9) above, that the verb bepalen has been derived from it? And how about the relation between the words in (11)? (11) Du. vliegen V ‘to fly’ > vlieg N ‘fly’ Du. boek N ‘book’ > boeken V ‘to book’ Du. hond N ‘dog’ > zeehond N lit. sea-dog/ ‘seal’ Du. haven N ‘port, harbour’ > luchthaven N ‘airport’ Shall we specify in the lexical entry for the Du. verb vliegen that the name for a fly (vlieg) has been derived from it by conversion of the verb stem? And is it relevant for the reader consulting the dictionary for Du. hond ‘dog’ to learn that the name for a seal (zeehond) is based on that word? Johan De Caluwe 112 We would suggest to list all these derivations and compounds in a secondary screen, but particular words should be brought under the attention of the user more prominently than others because they may be more relevant to the user. 3.2 Selection on onomasiological grounds Which word formations deserve to be highlighted? One option is to only list or to highlight those word formations that reach a particular level of frequency in the relevant corpora of a language. This option should be considered with due caution since the most frequent word formations may not always be the most relevant for a particular base word. For example: luchthaven ‘airport’ is very frequent in Dutch, but is that relevant when lexicographers have to decide which complex words to highlight in the lexical entry for haven ‘harbour’? We would propose to list and/ or highlight not the most current word formations with a particular base word, but rather those words that stand in a current onomasiological relation to that base word, even if these words are morphologically unrelated to that base word. To illustrate with an example under (12): (12) Du. vliegen V ‘to fly’ > vlieg N ‘fly’ vlieg-angst N ‘fear of flying’ vlieg-enier N ‘flier, airman’ vlieg-er N ‘flier / kite’ vlieg-ramp N ‘plane crash’ vlieg-tuig N ‘aeroplane’ ... PILOOT N ? Many words have been derived and compounded on the basis of the Dutch verb vliegen - see the right hand column under (12) - and there is nothing wrong with listing these formations in the dictionary in the lexical entry for that verb. However, a word like piloot ‘pilot’ is of much more onomasiological relevance to the user and should consequently be much more prominent in the window of related words than the name for the well-known flying insect. 3.3 Implementation With reference to the Algemeen Nederlands Woordenboek (ANW) 6 - ‘General Dutch Dictionary’, a combined semasiological and onomasiological dictionary being compiled at the Institute for Dutch Lexicology in Leiden, Van Sterkenburg (2003) states: 6 http: / / anw.inl.nl Dictionary entries as windows on the onomasiological aspects of word formation 113 By inproving existing dictionaries we will probably never succeed in making the electronic monolingual dictionary impeccably onomasiological. That can only be achieved if a new electronic dictionary is compiled [...] (Van Sterkenburg 2003, p. 138) In other words: we have to leave traditional ideas of dictionary making behind us, if necessary. If we apply the onomasiological principle outlined in 3.2 to the type of words I have been focussing on in (1) - (7), viz. adjectives naming human characteristics, the picture could look as follows: (13) be-jaar-d ‘elderly’ > [bejaarde man/ vrouw] ‘elderly man/ woman’: a. bejaard-e b. ouder-e c. oud-je d. senior e. ouden-van-dagen The dictionary entry for Du. bejaard would of course first specify its morphological make-up: be-jaar-d. In addition one could simply list bejaard-e as the only derivation from this adjective. But then the reader would miss the relevant information of the status of that derivation in its onomasiological paradigm. Listing all names in Dutch for elderly people, even if they are morphologically unrelated to the base word, as in b.-e. in (13), seems to be a better solution. By clicking on each of these words under a.-e. in the e-dictionary the user would then generate a comprehensive definition of the items listed, and of course information on usage of these items, compared to their (near) synonyms. The user would in this case learn from the dictionary 1) that Dutch has names for elderly people which are gender neutral: there are several words to be used for both elderly men and women; 2) that derivation with -e is possible, both with the base adjective bejaard (a.) and with the base adjective oud in its comparative form oud-er ‘older’ (b.); 3) that there is an alternative derivation with the suffix -je (c.), but clicking on the suffix would inform the user of the patronizing, belittling connotation of names on -je; 4) that senior (both with Dutch and English pronunciation) is the new euphemism about to replace all the other names, as is attested by many new compounds or expressions with senior, often replacing the older equiva- Johan De Caluwe 114 lents with bejaarden-: seniorenpas, seniorenwoning, seniorenraad, seniorenflat, etc. (‘pass/ house/ council/ flat for elderly people’). 7 5) that ouden-van-dagen (lit. ‘old-of-days’) really is corny now, and is absolutely ‘out’. By listing all these possible names for elderly people with the adjective bejaard ‘elderly’, the user will learn that bejaarde is part of a constellation of terms in which each has its own history, its own connotation, and that each term is subject to particular conditions of use. In (14) we give two more examples of a combined morphological/ onomasiological approach to word formation in electronic dictionaries: (14) optimist-isch ‘optimistic’ > [optimistische man/ vrouw] ‘optimistic man/ woman’: a. optimist b. positiv-o pessimist-isch ‘pessimistic’ > [pessimistische man/ vrouw] ‘pessimistic man/ woman’: a. pessimist b. zwartkijker (lit. black-watch-er) c. hypochonder This is a special case as the adjectives - optimistisch and pessimistisch - may have been derived from the name for the person with that particular characteristic feature - optimist/ pessimist, or it may be a matter of paradigmatic morphology whereby (also) the nouns optimism/ pessimism are involved. If a dictionary would only specify which derivations and compounds have been formed with either optimistisch or pessimistisch as a base word, nothing would have to be specified in this case, since there are no formations with these base words. From an onomasiological perspective on word formation on the other hand, there is every reason to list the words that are used to name the concept of ‘optimistic/ pessimistic man/ woman’ even if they are not directly derived from the adjectives under consideration, such as optimist, positivo, etc. Positivo illustrates a relatively new word formation pattern in Dutch; it is used to create informal, trendy words for people, sometimes a little derogatory, as in this case: ‘someone who will always look at the bright side of life, even if there is hardly anything bright to it ...’. 7 Senior is so popular now because it's the only word without (as yet) the connotation of ‘little, old people who can't help themselves any more, and who are just good enough for living a passive life in an old people's home’. Dictionary entries as windows on the onomasiological aspects of word formation 115 For the notion ‘pessimistic man/ woman’, apart from pessimist, there are two onomasiological alternatives, one synthetic compound 8 (zwartkijker), and one formed with classical ingredients (hypochonder). 4. Conclusion Of course it is an interesting aspect of electronic dictionaries that so much information on word formation can be specified with any lexical item. So of course it may be interesting to add derivations and compounds of a base word to the lexical entry of that base word. But it would be even more relevant if this information is embedded in a wider onomasiological context, providing the user with all naming alternatives even if - as is often the case - these alternatives are not morphologically related to that base word. By complementing the most obvious derivations (e.g. bejaard > bejaard-e) with relevant naming alternatives (e.g. senior) the dictionary helps the learners of a language to acquire a vocabulary in a particular domain, in all its denotational and connotational nuance. In addition, it enriches the insight of the native speaker into the structure and dynamics of the lexicon. Before we can implement this onomasiological principle in electronic dictionaries, decisions will have to be made on both (1) the selection of the onomasiological/ morphological material to be incorporated in the dictionary, and (2) the structure for the presentation of this material. Research on the naming needs of native speakers and language learners will inform dictionary makers on the optimal make-up of their dictionary format, or formats, for both types of user groups may have quite different needs and expectations with respect to onomasiological and morphological information in dictionaries. 5. References ANS 1997 = Haeseryn, Walter/ Romijn, Kirsten/ Geerts, Guido/ De Rooij, Jaap/ Van den Toorn, Maarten (eds.) (1997): Algemeene Nederlandse Spraakkunst. Second, completely revised edition. Groningen/ Deurne. Booij, Geert (2002): The morphology of Dutch. Oxford. Booij, Geert (2010): Construction morphology. Oxford. Booij, Geert/ Van Santen, Ariane (1998): Morfologie. De woordstructuur van het Nederlands. Second, completely revised edition. Amsterdam. De Caluwe, Johan (1990): Complementariteit tussen morfologische en in oorsprong syntactische benoemingsprocedés. In: De Caluwe, Johan: Betekenis en produktiviteit. Gent, p. 9-23. 8 Cf. Booij/ Van Santen (1998, p. 171ff.) on the notion of synthetic compound in Dutch. Johan De Caluwe 116 De Caluwe, Johan (2010): Woordvorming in onomasiologisch perspectief. Een case study uit het Nederlands. In: Voortgang, jaarboek voor de nederlandistiek 28, p. 71-91. De Caluwe, Johan/ Taeldeman, Johan (2003): Morphology in dictionaries. In: Van Sterkenburg (ed.), p. 114-126. De Haas, Wim/ Trommelen, Mieke (1993): Morfologisch handboek van het Nederlands: een overzicht van de woordvorming. ‘s-Gravenhage. Koefoed, Geert (1991): Morfologie en pragmatiek: produktiviteit en de act van benoeming. In: Forum der Letteren 32, p. 161-172. Koefoed, Geert (1993): Benoemen. Een beschouwing over de faculté du langage. Doctoral dissertation Utrecht University. Amsterdam. ten Hacken, Pius/ Abel, Andrea/ Knapp, Judith (2006): Word formation in an electronic learners' dictionary: ELDIT. In: International Journal of Lexicography 19, 3, p. 243-256. van Dale (2005) = Den Boon, Ton/ Geeraerts, Dirk (eds.) (2005): Van Dale Groot woordenboek van de Nederlandse taal. Fourteenth, completely revised edition. Utrecht/ Anterpen. van Sterkenburg, Piet (2003): Onomasiological specifications and a concise history of onomasiological dictionaries. In: Van Sterkenburg (ed.), p. 127-143. van Sterkenburg, Piet (ed.) (2003): A practical guide to lexicography. Amsterdam/ Philadelphia. Jochen Splett Grundlegende Bemerkungen zu einem auf einer pragmatischen Sprachtheorie fußenden Wortfamilienwörterbuch als legitimem Ort einer integrierten Wortbildung 1. Prämissen eines Wortfamilienwörterbuchs Unter einem elektronischen Wörterbuch verstehe ich ein elektronisches Wortfamilienwörterbuch. Das bedarf zunächst einer Erläuterung und Begründung. Denn spätestens seit Jacob Grimm versteht man unter einem Wörterbuch „die alphabetische verzeichnung der wörter einer sprache“ (Deutsches Wörterbuch, Bd. I, Vorwort, Sp. IX), und er fügt hinzu, „wer sie [= „die alphabetfolge“] heute nicht handhabt, sondern aufhebt und stört, hat sich an der philologie versündigt“ (Sp. XI). Ein solcher armer Sünder ist der Autor dieses Beitrags. Vorab muss allerdings angemerkt werden, dass religiöser Sprachgebrauch im Rahmen eines sprachwissenschaftlichen Diskurses zu besonders kritischem Verhalten anregen und eine Hinterfragung der Gründe herausfordern muss. Dies umso mehr, wenn Grimm als Grund „sicherheit und schnelle des gebrauchs“ (ebd.) anführt. Dies kann auch ein entsprechendes Register leisten, erst recht heutzutage im Zeitalter des elektronischen Wörterbuchs. Der Grund ist aber nicht ein äußerlicher, rein formaler. Im Rahmen des neuen Paradigmas eines historischen Wörterbuchs und im Blick auf Grimms organische Auffassung von Sprache ist für ihn das Wort einer Pflanze vergleichbar, die aufkeimt, sich entfaltet, blüht und verwelkt. Das geschichtliche Moment liegt für ihn im Einzelwort und entsprechend ist die Isolierung des Einzelwortes vermittels einer alphabetischen Auflistung von Einzelwortgeschichten für diesen Wörterbuchtyp zentral. Nun sind seit dem Tod der Gebrüder Grimm über 150 Jahre und seit der vorläufigen Vollendung ihres Deutschen Wörterbuchs 50 Jahre vergangen. Ihr historisches Paradigma ist - grob gesprochen - durch das strukturalistische Paradigma abgelöst worden. Die grundlegenden Prämissen sind nun: Die Deutung der Sprache als zweiseitiges Zeichensystem und damit die Vorrangstellung des Morphems vor dem Wort, dem als Sonderfall des Morphems nur eine untergeordnete Stellung zugesprochen wird, die Reduzierung der Bedeutung auf eine limitative Funktion und das Ausblenden der Geschichtlichkeit Jochen Splett 118 der Sprache. Die Hauptdomänen des Strukturalismus waren seit seiner Grundlegung durch Ferdinand de Saussure die Phonetik bzw. die Phonologie und die Grammatik mit dem Schwerpunkt Syntax, nicht aber die Lexikologie bzw. Lexikographie. Erst Eugenio Coseriu hat in den siebziger Jahren des vorigen Jahrhunderts mit seiner Lexematik dieses Gebiet systematisch miteinbezogen. Er hat die phonologischen Verfahrensweisen auf das Gebiet des Wortschatzes übertragen und so die konsequenteste strukturalistische Grundlegung für diesen Bereich vorgelegt. Ohne im Einzelnen auf seine allgemein bekannte Theorie einzugehen, sollen nur einige hier besonders relevante Aspekte hervorgehoben werden. Um die homogene Ebene zu erreichen, auf der die lexikalischen Einheiten einer Strukturanalyse unterzogen werden können, postuliert Coseriu sieben Abstraktionsschritte. Am Ende verbleiben nur noch „die Bedeutungsverhältnisse zwischen Zeichen, nicht Beziehungsverhältnisse zwischen Zeichen und Sachen“ (Coseriu 1973, S. 51). Die Wortebene ist damit ausgeschaltet und es bleiben nur noch Einheiten übrig, die mit den drei logischen Oppositionsarten erfasst werden können. Die Feststellung von de Saussure „So beruht denn bei einem Sprachzustand alles auf Beziehungen“ (de Saussure 1967, S. 147) gilt damit auch für die strukturalistisch fundierte lexikalische Ebene. Die Auflistung aller Morpheme einer Einzelsprache in Form von phonologischen Matrizes und der Nachweis ihrer Verflechtung durch die drei Oppositionsarten wären dann die Aufgaben gewesen. Ein solches Vorhaben ist meines Wissens bis heute noch nicht in Angriff genommen, geschweige denn durchgeführt worden. Um ein Wörterbuch im strikten Sinne kann es sich dabei auf keinen Fall handeln. So liegt der Schluss nahe, dass der Strukturalismus mit seinem strikten Strukturbegriff nicht die geeignete Sprachtheorie ist, um die Probleme des Wortschatzes einer Einzelsprache und seiner Strukturen zu bewältigen. Dementsprechend bedarf es eines grundsätzlichen Paradigmenwechsels, der sich in der Linguistik unter dem Stichwort Pragmatik bereits vollzogen und sich in der Ausfächerung in Dialoggrammatik und Konversationsanalyse weithin etabliert hat. Hier nun interessiert der Bereich Lexikologie bzw. Lexikographie, für den die pragmatische Sprachtheorie ebenso die notwendigen Ansatzpunkte für eine angemessene Wortschatzstrukturierung bietet. Denn der Strukturgedanken ist keineswegs obsolet, wohl aber seine strukturalistische Ausprägung. Mit dem wittgensteinschen Begriff der „Familienähnlichkeit“ (Wittgenstein 1967, S. 48f.) bietet sich ein Begriff an, in dem die scharfe Grenze zwischen Identität und Differenz und damit der auf diesem unvermittelten Gegensatz beruhende strikte Strukturbegriff durch das Moment des Wortfamilienwörterbuch als legitimer Ort einer integrierten Wortbildung 119 Genetisch-Geschichtlichen aufgehoben ist. Das betrifft z.B. die Dichotomie ‘synchron’/ ‘diachron’, an deren Stelle die aufeinander bezogenen Begriffe ‘sprachstufenbezogen’/ ‘genetisch’ treten. Dies ist keineswegs nur eine bloße Terminologieänderung. So gehören beispielsweise „veraltete“ Wörter zum Wortschatz einer bestimmten Sprachstufe, und damit zeigt sich, dass die darin involvierte Kategorie der Zeit auch eine Rolle in dem quasi „zeitlosen“ Querschnitt spielt. Coseriu (1973) hatte deswegen - von seinem Standpunkt aus konsequent und zu Recht - die Diachronie im Verlauf seiner fortschreitenden Abstraktion zur Gewinnung einer strukturfähigen Sprachebene ausgeschieden. Da sich die einzelnen Sprachstufen nicht exakt abgrenzen lassen, ist zudem auch der jeweils ‘sprachstufenbezogene’ Wortschatz nicht exakt einzugrenzen. Auch hier zeigt sich, dass die strukturalistischen Kategorien nicht hilfreich sind. Im Prager Strukturalismus hat man zwar das Problem mit den Begriffen ‘Zentrum’ und ‘Peripherie’ zu lösen versucht und so die de Saussure'schen Prämissen teilweise revidiert. Dies kann man als einen ersten Schritt auf die pragmatische Wende hin interpretieren, aber eine eigene, darauf aufbauende Lexikologie hat diese strukturalistische Richtung nicht entwickelt. Der Paradigmenwechsel zu einem handlungstheoretisch begründeten Sprachbegriff eröffnet zugleich die Möglichkeit, die den Wortbedeutungen zukommende Rolle schärfer in den Blick zu nehmen. Sie sind als unterscheidbare Gebrauchsweisen und mit der damit gegebenen unmittelbaren Rückbindung an das menschliche Handeln gleichsam Kristallisationspunkte der Welterfassung einer Sprachgemeinschaft. Damit wird zugleich deutlich, dass das Wort in einer Sprachwissenschaft, die Sprache nicht als Zeichensystem, sondern in Analogie zum menschlichen Handeln versteht, nicht einfach als grundlegende Einheit vorausgesetzt werden kann. Die Bedeutungen der Wörter sind nämlich im Zusammenspiel von Textsemantik, Satzsemantik und Wortsemantik zu ermitteln, wobei der Wortsemantik als quasi unterster Ebene der semantischen Beschreibung eine Schlüsselrolle zufällt. Jedenfalls lassen sich die textsemantischen und satzsemantischen Probleme nur lösen, wenn zuvor die Rolle und der spezifische Beitrag der Wörter zum Zustandekommen der Text- und Satzbedeutung geklärt werden. Dazu ist es erforderlich, die verschiedenen Gebrauchsweisen eines Wortes, also sein Bedeutungspotenzial, in den Blick zu nehmen. Die Menge der voneinander unterscheidbaren Gebrauchsweisen eines Wortes kann als Menge der minimalen konventionalisierten Bedeutungspositionen bestimmt werden. Im Gegensatz zu den Prämissen einer strukturalistischen Semantik, die die Wortbedeutungen als inhärente Eigenschaften der Wörter und als ein Bündel kategorialer Merkmale fasst, handelt Jochen Splett 120 es sich vom Standpunkt der Pragmatik um ein Geflecht von Verwendungsweisen. In diesem Sinne können auch die Bedeutungsangaben in den alphabetischen semasiologischen Wörterbüchern größtenteils interpretiert werden. Dabei liegt aber nicht die Ebene der Bedeutungspositionen zugrunde, sondern eine weniger strikte und explizite Analyseebene. Terminologisch haben Hundsnurscher/ Splett (1982, S. 12) diese Ebene der Bedeutungsangaben in den Wörterbüchern als ‘Lesarten’ gefasst. Die Ebene der Lesarten empfiehlt sich auch als empirische Grundlage für die Analyse der Wortfamilienstrukturen. Unter semantischen Gesichtspunkten ist also nicht das Wort, sondern die Bedeutungsposition bzw. aus Gründen der praktischen Durchführbarkeit die Lesart die maßgebende Einheit. 2. Der Typ des Wortfamilienwörterbuchs Damit dürften die wesentlichen Prämissen für ein Wortfamilienwörterbuch zumindest skizzenhaft erörtert worden sein. Daraus ergibt sich, dass es eines neuen Typs von Wortfamilienwörterbuch bedarf, um die Wortschatzstrukturen in angemessener Weise explizit darzulegen. Nur wenn das gelingt, dürfte der im Titel dieses Beitrags erhobene Anspruch zu Recht bestehen, dass das Wortfamilienwörterbuch an die Stelle des alphabetischen semasiologischen Wörterbuchs treten soll. Bezogen auf das Thema dieses Bandes hieße es, das dort genannte ‘elektronische Wörterbuch’ als Wortfamilienwörterbuch zu interpretieren. Mit der Veröffentlichung meines achtzehnbändigen Werks Deutsches Wortfamilienwörterbuch mit dem Untertitel „Analysen der Wortfamilienstrukturen der deutschen Gegenwartssprache, zugleich Grundlegung einer zukünftigen Strukturgeschichte des deutschen Wortschatzes“ liegt seit Oktober 2009 nunmehr ein entsprechendes Wortfamilienwörterbuch vor. Hinzuzurechnen ist das im Jahre 1993 - recte: Dezember 1992 - erschienene dreibändige Werk Althochdeutsches Wörterbuch mit dem Untertitel „Analyse der Wortfamilienstrukturen des Althochdeutschen, zugleich Grundlegung einer Strukturgeschichte des deutschen Wortschatzes“. Noch nicht erschienen bzw. noch nicht in Angriff genommen sind die entsprechenden Wortfamilienwörterbücher für die Sprachstufen des Mittelhochdeutschen, des Frühneuhochdeutschen und der Goethezeit. Wenn in den zu veranschlagenden knapp 50 Mannjahren lexikographischer Arbeit diese noch fehlenden Wortfamilienwörterbücher vorliegen sollten, könnte das im Untertitel genannte Vorhaben gestartet werden. Das dürfte selbst beim größten Optimismus nicht mehr in die mir gegebene Lebenszeit fallen. Dennoch - die hier anvisierte Strukturgeschichte des deutschen Wortschatzes betrifft das Gesamtziel und ist als der genetisch- Wortfamilienwörterbuch als legitimer Ort einer integrierten Wortbildung 121 historische Teil, der nur aus dem systematischen Vergleich der jeweils sprachstufenbezogenen Wortschatzstrukturen zu gewinnen ist, ein im Grunde unverzichtbarer Bestandteil der Wortfamilienforschung vom Standpunkt einer pragmatischen Sprachtheorie aus. Eigentlich hätten deswegen die einzelnen Wortfamilienwörterbücher in historischer Abfolge der Sprachstufen erarbeitet werden müssen, aber es fehlen bis heute die dazu notwendigen semasiologischen Wörterbücher. So blieb nichts anderes übrig, als wenigstens Anfang und Endpunkt zu markieren. Gegenstand einer synchronen bzw. sprachstufenbezogenen Wortbildungslehre sind bekanntlich die komplexen Wörter einer bestimmten Sprachstufe einer Einzelsprache. Dabei geht es in erster Linie um die Bedeutungsindizierung der Wörter, nicht um die lexikalische Bedeutung. Mit dem von Clemens-Peter Herbermann (vgl. Herbermann 1981, vor allem S. 72ff.) eingeführten Begriff der ‘Bedeutungsindizierung’ werden die Semantik der Konstituenten komplexer Wörter und die zwischen diesen Konstituenten bestehenden Relationen erfasst. Dieses Phänomen ist in der Sprachwissenschaft mindestens seit über hundert Jahren bekannt. Von Rozwadowski (1904) hat es klar und ausführlich beschrieben. Bei Schwarz (1971) findet man es in den sechziger Jahren des vorigen Jahrhunderts unter dem Terminus ‘Aufschlusswert’ wieder, allerdings im Rahmen wortmodelltheoretischer Überlegungen und nur insofern auch im Rahmen der Wortbildung (vgl. Herbermann 1981, S. 72, Anm. 56). Bezogen auf die Bildung eines Wortes ist mit der Bedeutungsindizierung der Benennungsgrund zu fassen. So ist z.B. in dem im Juni 1967 gebildeten Wort Sechstage-Krieg, um ein Beispiel Herbermanns aufzugreifen, mit der Bedeutungsindizierung ‘Krieg, der etwas mit sechs Tagen zu tun hat’ der Grund für die Benennung des vom 5. Juni bis 10. Juni 1967 dauernden Krieges zwischen Israel und seinen arabischen Nachbarn gemeint. Wichtig ist im vorliegenden Zusammenhang die Differenz zwischen Wortbedeutung und Bedeutungsindizierung. Die von Strukturalisten oft herangezogene Lexikalisierung oder Idiomatisierung kommt hier als Grund für diese Differenz allein schon aus Zeitgründen nicht infrage. In den Fällen, in denen ein Wort nicht im Lichte der Überlieferung gebildet worden ist und erst durch Sprachvergleich rekonstruiert werden muss, ist nach allgemeiner Auffassung die Etymologie zuständig. Alle anderen Fälle sind der historischen Wortbildung zuzuweisen. Sieht man vom genetischen Standpunkt ab, dann muss man die Ergebnisse dieser Vorgänge, also den Wortschatz einer Sprachstufe, in den Blick nehmen. Nicht die Frage der Wortentstehung, sondern die Frage, in welchem Verhältnis die zu verschiedenen Zeiten gebil- Jochen Splett 122 deten Wörter zueinander stehen, ist dann zu beantworten. Die Bedeutungsindizierungen erscheinen nun als Motivationsbeziehungen zwischen den strukturierten Wörtern und den Wörtern, auf die hin die entsprechenden Wortkonstituenten durchsichtig sind. Damit sind wir bei der Wortbildung im Sinne der ‘Wortgebildetheit’. Unter ‘Wortgebildetheit’ - ein von Dokulil (1968, S. 205) eingeführter Terminus - wird die Analyse der existierenden Wörter eines gegenwärtigen Zustandes verstanden. Auf der Ebene der Lexikologie bzw. der Lexikographie kommt dafür nur das Wortfamilienwörterbuch infrage. Allerdings hat die Wortbildungslehre weithin von der neuen Rolle der Wortfamilie noch keine Kenntnis genommen, obwohl z.B. in den entsprechenden Artikeln zur Wortfamilie in dem ersten Teilband der beiden Bände Lexikologie aus der renommierten Reihe Handbücher zur Sprach- und Kommunikationswissenschaft (Cruse et al. 2002) der Wortfamilie und ihrer lexikographischen Erfassung ein neuer und eigenständiger Status zuerkannt wird. In Fleischer/ Barz (2007) wird aber nur an einer Stelle (S. 72) kurz auf die Wortfamilie eingegangen. „Die Wortfamilie (Wortsippe)“ - so heißt es da - „ist als Gruppe von Wörtern, die sich auf dieselbe Wurzel zurückführen lassen, diachron definiert.“ Entsprechende Nachweise fehlen leider; so kann nur vermutet werden, dass sich die Verfasser auf Bußmann (2002) beziehen. Dort heißt es unter dem Stichwort Wortfamilie auf S. 756: „Menge von Wörtern innerhalb einer Sprache, deren gleiche oder ähnliche Stammmorpheme auf dieselbe etymologische Wurzel zurückgehen.“ Das auf die Sprachstufe des Althochdeutschen bezogene, auf eine pragmatische Sprachtheorie sich stützende Wortfamilienwörterbuch ist bereits 1992/ 93 erschienen und bis 2005 sind sechs Beiträge von mir zur Wortfamilienproblematik publiziert worden (vgl. die Nachweise im Literaturverzeichnis von Splett 2009, Bd. 1, S. XLI). Dort kann man u.a. auch über das Verhältnis der Etymologie und der Wortbildungslehre zum Wortfamilienkonzept nachlesen. Aber das strukturalistische Erbe ist offensichtlich so übermächtig, dass es selbst mit schlechtem Gewissen nicht aufgegeben wird. Im Vorwort von Fleischer/ Barz (2007, S. V) wird nämlich gesagt: Dieses Werk neueren Forschungstrends anzupassen hätte bedeutet, auch seine von uns mitgetragene Grundkonzeption zu verändern. Das erscheint uns im Sinne der Bewahrung der Leistung Fleischers nicht angebracht und angesichts der breiten Akzeptanz, die seine Wortbildungsdarstellung in der Forschung wie auch im Unterricht nach wie vor erfährt, auch nicht geboten. Wortfamilienwörterbuch als legitimer Ort einer integrierten Wortbildung 123 Ich kann dem - mit Ausnahme der anerkennenden Worte zum Werk von Fleischer - nicht folgen. Im Vorwort der ersten Auflage aus dem Jahre 1992, die auch Fleischer unterschrieben hat, heißt es: „Das vorliegende Buch ist keine Überarbeitung des 1969 erstmals erschienenen Werkes von W. Fleischer, sondern eine vollständige Neufassung.“ (Fleischer/ Barz 1992, S. V). Fleischer hätte also nichts gegen eine vollständige Neubearbeitung einzuwenden gehabt. Wie dem auch sei, wichtig erscheint mir, dass die Wortbildungsforschung auf eine neue Grundlage zu stellen ist. Nicht irgendwelche „neueren Forschungstrends“ sind zu berücksichtigen, sondern die pragmatische Wende ist ernst zu nehmen und ihr ist auch auf dem Gebiet der Lexikologie Geltung zu verschaffen. Schon Herbermann hatte wie vor ihm schon Dokulil (1964, S. 217f.) nachgewiesen, dass die strukturalistischen Wortbildungstheorien, die von einer tiefenstrukturellen Identität zwischen Satz und komplexem Wort ausgehen, inadäquat und widersprüchlich sind. Dies betrifft vor allem die Entwürfe von Hans Marchand, Peter von Polenz und Herbert Ernst Brekle. Ähnliches gilt für die Ableitung eines komplexen Wortes, vor allem eines komplexen Substantivs, aus einer Attributivkonstruktion, wie sie z.B. Robert B. Lees und Wolfgang Motsch favorisieren. In Herbermanns Kapitel „Zur Wortbildungslehre in der jüngsten Linguistik“ (1981, S. 18-70) sind die entsprechenden Argumente und die kritisch besprochene, umfangreiche Literatur der genannten Autoren zu finden. Hier wird das notwendige Fundament gelegt für eine Wortbildungslehre unter pragmatischem Aspekt. Zwar erscheint Herbermann (1981) im Literaturverzeichnis von Fleischer/ Barz (1992, S. 360; 2007, S. 360), aber eine Stellungnahme dazu sucht man vergebens. Überhaupt hat dieses Werk eines Vertreters der Allgemeinen Sprachwissenschaft vor allem im Bereich der germanistischen Sprachwissenschaft zu ihrem eigenen Schaden nicht die ihm zukommende Beachtung gefunden. Also nicht die Syntax ist zu bemühen, sondern die strukturierten Wörter sind im Rahmen des Gesamtwortschatzes zu analysieren und in ihrer Verflechtung aufzudecken. Der wesentliche Unterschied zwischen Simplex und strukturiertem Wort liegt ja darin, dass das strukturierte Wort nicht nur eine bzw. mehrere Bedeutungen aufweist, sondern durch seine Konstituenten und ihre Relation zueinander auf seine Bedeutung bzw. Bedeutungen hinweist. In dieser Weise sind in dem genannten Deutschen Wortfamilienwörterbuch schätzungsweise rund 145 000 strukturierte Wörter der deutschen Gegenwartssprache in 8 264 Wortfamilien vernetzt und ist jeweils ihre Bedeutungsindizierung direkt oder indirekt aufgewiesen. Anhand eines relativ einfachen Beispiels (vgl. Anhang I) soll das veranschaulicht werden. Jochen Splett 124 Für einen weiteren Bereich der Wortbildung ist das Wortfamilienwörterbuch der legitime Ort der Vernetzung. Gemeint ist der Bereich der Präfixe und Suffixe, der nicht einfach übergangen werden darf, weil die Präfixe und Suffixe Konstituenten der strukturierten Wörter sind. Die vier Bände 15-18 des Deutschen Wortfamilienwörterbuchs bieten deshalb eine strukturierte Auflistung der Präfix- und Suffixwörter analog dem Aufbau der Wortfamilien. Auch im Hinblick auf das Gesamtkonzept, das Ziel einer Strukturgeschichte des deutschen Wortschatzes, ist die Berücksichtigung dieses Bereiches erforderlich. Denn im Laufe der Sprachgeschichte haben sich Affixe vielfach aus Wörtern entwickelt. Wie der Präfixbzw. Suffixliste zu entnehmen ist, handelt es sich um 96 Präfixe und 319 Suffixe der deutschen Gegenwartssprache, die größtenteils in zahlreichen Varianten (vgl. als Beispiel das Suffix -ität im Anhang II) vorkommen. Es dürfte sich meines Wissens um die vollständigste Auflistung der Affixe der deutschen Gegenwartssprache und der entsprechenden Präfix- und Suffixwörter handeln. Um wenigstens einen ersten Eindruck von diesem Teil des Wortfamilienwörterbuchs zu vermitteln, ist im Anhang III ein Beispiel in verkürzter Form abgedruckt. Die ungekürzte Version dieser Strukturierten Auflistung, die 279 Suffixwörter mit dem Suffix -d erfasst, findet sich in Band 16 auf den Seiten 533-537. Zum Abschluss nur noch ein nicht unwesentlicher Hinweis. Das Deutsche Wortfamilienwörterbuch - wie schon das dreibändige Althochdeutsche Wörterbuch - ist so konzipiert, dass auch heute noch nicht überlieferte bzw. existierende strukturierte Wörter ihren genau angebbaren Platz finden. Das gilt z.B. für das Wort Frühpensionierungswahn, das durch das bekannte Buch von Thilo Sarrazin die Chance hat, den deutschen Gegenwartswortschatz zu bereichern. Wie diese Neubildung und in diesem Zusammenhang das im Duden (1999) nicht gebuchte Wort Frühpensionierung in das Deutsche Wortfamilienwörterbuch einzuordnen wären, zeigen die entsprechenden Hinweise im Anhang IV. Im extremsten Fall müsste eine neue Wortfamilie etabliert werden, falls es sich um strukturierte Wörter handelt, die nicht bzw. nicht vollständig in eine oder mehrere der 8 264 Wortfamilien einzuordnen sind. Das Wortfamilienwörterbuch ist also auch der legitime Ort für die Wortbildung im Gegensatz zur Wortgebildetheit, von der in erster Linie hier die Rede war. Wortfamilienwörterbuch als legitimer Ort einer integrierten Wortbildung 125 3. Literaturverzeichnis 3.1 Wörterbücher Bußmann, Hadumod (2002): Lexikon der Sprachwissenschaft. 3., aktual. u. erw. Aufl. unter Mithilfe und mit Beiträgen von Fachkolleginnen und -kollegen. (= Kröners Taschenausgabe 542). Stuttgart. Duden (1999): Duden - Das große Wörterbuch der deutschen Sprache in zehn Bänden. 3., völl. neu bearb. u. erw. Aufl. Herausgegeben vom Wissenschaftlichen Rat der Dudenredaktion. Mannheim. Grimm, Jacob und Wilhelm (1854-1960): Deutsches Wörterbuch. 32 Bände in XVI. Leipzig. Splett, Jochen (1993): Althochdeutsches Wörterbuch. Analyse der Wortfamilienstrukturen des Althochdeutschen, zugleich Grundlegung einer zukünftigen Strukturgeschichte des deutschen Wortschatzes. Bd. I, 1: Einleitung. Wortfamilien A-L. Bd. I, 2: Wortfamilien M-Z. Einzeleinträge. Bd. II: Präfixwörter. Suffixwörter. Alphabetischer Index. Berlin/ New York. Splett, Jochen (2009): Deutsches Wortfamilienwörterbuch. Analyse der Wortfamilienstrukturen der deutschen Gegenwartssprache, zugleich Grundlegung einer zukünftigen Strukturgeschichte des deutschen Wortschatzes. 18 Bde. Berlin/ New York. 3.2 Forschungsliteratur Coseriu, Eugenio (1973): Probleme der strukturellen Semantik. Vorlesung gehalten im Wintersemester 1965/ 66 an der Universität Tübingen. Autorisierte und bearbeitete Nachschrift von Dieter Kastovsky. (= Tübinger Beiträge zur Linguistik 40). Tübingen. Cruse, D. Alan/ Hundsnurscher, Franz/ Job, Michael/ Lutzeier, Peter Rolf (Hg.) (2002): Lexikologie. Ein internationales Handbuch zur Natur und Struktur von Wörtern und Wortschätzen. Bd. I, 1 [Die Architektur des Wortschatzes II: Wortfamilien: Beiträge Nr. 86-90, S. 675-712]. (= Handbücher zur Sprach- und Kommunikationswissenschaft / =Handbooks of Linguistics and Communication Science 21.1). Berlin/ New York. Dokulil, Milos (1964): Zum wechselseitigen Verhältnis zwischen Wortbildung und Syntax. In: Travaux linguistiques de Prague 1, S. 215-224. Dokulil, Milos (1968): Zur Theorie der Wortbildung. In: Wissenschaftliche Zeitschrift der Karl-Marx-Universität Leipzig 17, S. 203-211. Fleischer, Wolfgang/ Barz, Irmhild unt. Mitarb. v. Schröder, Marianne (1992): Wortbildung der deutschen Gegenwartssprache. Tübingen. Fleischer, Wolfgang/ Barz, Irmhild unt. Mitarb. v. Schröder, Marianne (2007): Wortbildung der deutschen Gegenwartssprache. 3., unveränd. Aufl. Tübingen. Jochen Splett 126 Herbermann, Clemens-Peter (1981): Wort, Basis, Lexem und die Grenze zwischen Lexikon und Grammatik. Eine Untersuchung am Beispiel der Bildung komplexer Substantive. München. Hundsnurscher, Franz/ Splett, Jochen (1982): Semantik der Adjektive des Deutschen. Analyse der semantischen Relationen. (= Forschungsberichte des Landes Nordrhein-Westfalen. Hrsg. vom Minister für Wissenschaft und Forschung 3137). Opladen. Rozwadowski, Jan von (1904): Wortbildung und Wortbedeutung. Eine Untersuchung ihrer Grundgesetze. Heidelberg. Saussure, Ferdinand de (1967): Grundfragen der Sprachwissenschaft. Hrsg. von Charles Bally und Albert Sechehaye unt. Mitw. von Albert Riedlinger, übersetzt von Herman Lommel. 2. Aufl. mit neuem Register und einem Nachwort von Peter von Polenz. Berlin. Schwarz, Hans (1971): Aufschlußwert. In: Historisches Wörterbuch der Philosophie. Hrsg. von Joachim Ritter. Bd. 1. Basel, Sp. 646f. Wittgenstein, Ludwig (1967): Philosophische Untersuchungen. Wissenschaftliche Sonderausgabe. Frankfurt a.M. 4. Anhang I Schematische Darstellung der internen Struktur eines komplexen Wortes bis hin zur Ebene der Lesarten anhand des Beispiels Kraftfahrzeuginstandsetzung, wie sie im Deutschen Wortfamilienwörterbuch (Splett 2009) vor allem mittels Anordnung und Strukturformeln erfolgt. Ausführlichere Auskunft zu den verwendeten Siglen und zur Vorgehensweise im Einzelnen bietet die Einleitung (Bd. I, S. XIX-XXX). 1) Kraft-fahr-zeug-in-stand-setz-ung F. ((wS)((wV)(wS)))((((wAD)+((wV)S))+((wV)V))sS) 2) Kraft-fahr-zeug N. (wS)((wV)(wS)) 3) In-stand-setz-ung F. (((wAD)+((wV)S))+((wV)V))sS 4) F. Kraft Fahr-zeug N. wS (wV)(wS) 5) in Stand setzen Syntagma ((wAD)+((wV)S))+((wV)V) 6) Syntagma in Stand setzen sw.V. (wAD)+((wV)S) (wV)V 7) st.V. fahren Zeug N. wV wS 8) Präp. / M. in Stand sitzen st.V. wAD (wV)S wV 9) stehen st.V. wV Diese Einträge sind in den jeweiligen Abschnitten der entsprechenden sechs Wortfamilien zu finden: I) KRAFT: 1), 2) und 4) jeweils in Abschnitt 1.2 II) FAHREN: 1), 2), 4) und 7) jeweils in Abschnitt 1.0 III) ZEUG: 1), 2), 4) und 7) in Abschnitt 1.2 IV) IN: 1), 3) und 8) jeweils in Abschnitt 1.4 V) STEHEN: 1), 3) und 8) jeweils in Abschnitt 1.2.2; 9) in Abschnitt 1.0 VI) SITZEN: 1) und 3) jeweils in Abschnitt 2.2.2; 6) in Abschnitt 1.1.2; 8) in Abschnitt 1.0 Wortfamilienwörterbuch als legitimer Ort einer integrierten Wortbildung 127 Die Bedeutungen bzw. die entsprechende Lesart zu den hier relevanten Wörtern sind in den jeweilig genannten Abschnitten der Wortfamilie hinter den entsprechenden Strukturformeln zu finden: 1) Kraftfahrzeuginstandsetzung ‘Instandsetzung von Kraftfahrzeugen’ I) KRAFT, Abschnitt 1.2 II) FAHREN, Abschnitt 1.0 III) ZEUG, Abschnitt 1.2 IV) IN, Abschnitt 1.4 V) STEHEN, Abschnitt 1.2.2 VI) SITZEN, Abschnitt 2.2.2 2) Kraftfahrzeug bes. Amtsspr.: ‘durch einen Motor angetriebenes, nicht an Schienen gebundenes Fahrzeug’ I) KRAFT, Abschnitt 1.2 II) FAHREN, Abschnitt 1.0 III) ZEUG, Abschnitt 1.2 4) Kraft [1.-4.] 5. Physik: ‘physikalische Größe, die Ursache von Bewegungsveränderungen frei beweglicher Körper oder die Ursache von Formveränderungen ist’ [6.] I) KRAFT, Abschnitt 1.2 4) Fahrzeug ‘u.a. mit Rädern, Kufen oder Tragflächen ausgerüstete technische Konstruktion mit Eigen- oder Fremdantrieb zur Beförderung von Personen u. Lasten’ II) FAHREN, Abschnitt 1.0 III) ZEUG, Abschnitt 1.2 7) fahren 1. ‘sich mithilfe einer antreibenden Kraft rollend oder gleitend fortbewegen’ [2.-22.] II) FAHREN, Abschnitt 1.0 7) Zeug [1.-4.] 5. veraltet: ‘Arbeitsgerät, Werkzeug’ [6.-8.] III) ZEUG, Abschnitt 1.2 3) Instandsetzung Amtsspr.: ‘Wiederherstellung, Ausbesserung’ IV) IN, Abschnitt 1.4 V) STEHEN, Abschnitt 1.2.2 VI) SITZEN, Abschnitt 2.2.2 8) in [1.] 2. <m.Akk.> [zur Angabe eines Ziels, auf das hin eine Bewegung stattfindet, der Stelle, des Platzes, wohin sich jmd. begibt, wohin etw. gebracht wird o.Ä., eines größeren Zusammenhangs o.Ä., in den sich jmd. begibt, in den etw. hineingebracht wird] [3.-7.] IV) IN, Abschnitt 1.4 8) Stand [1.-8.] 9. <o.Pl.> ‘Beschaffenheit, Verfassung, Zustand, in dem sich jmd., etw. zu einem bestimmten Zeitpunkt befindet’ [10.-17.] V) STEHEN, Abschnitt 1.2.2 9) stehen [1.-2.] 3. in einer den Funktionsverben ähnlichen Verwendung: ‘sein, sich befinden’ [4.-31.] V) STEHEN, Abschnitt 1.0 6) setzen [1.-3.] 4. in einer den Funktionsverben ähnlichen Verwendung zum Ausdruck, dass man bestimmte Verhältnisse für jmdn., etw. herstellt, dass man jmdn., etw. in einen bestimmten Zustand bringt: ‘jmdn., etw. vorsehen für, ansetzen auf, jmdm. etw. verabreichen, einjagen; etw. tun, herstellen lassen ...’ [5.-21.] VI) SITZEN, Abschnitt 1.1.2 8) sitzen [1.-6.] 7. von Sachen: ‘sich an einer bestimmten Stelle befinden’ [8.-10.] VI) SITZEN, Abschnitt 1.0 Jochen Splett 128 II Kopfleiste der Strukturierten Auflistung der Suffixwörter mit dem Suffix -ITÄT und den entsprechenden Suffixvarianten sowie mit dem Verweis auf die Strukturierten Auflistungen der Suffixwörter mit den verwandten Suffixen -ietät und -itas. (Splett 2009, Bd. 18, S. 58): Suffix -ITÄT; -ET-, -ETÄT, -ETÄTS-, -IT-, -(I)TAT-, -ITÄTEN-, -ITÄTS-, -TÄT, -TÄTSvgl. -IETÄT, -ITAS III Gegenüber der vollständigen Strukturierten Auflistung der Suffixwörter mit dem Suffix -D (Splett 2009, Bd. 16, S. 533-537) hier aus Platzgründen eine verkürzte Darstellung: Suffix -D Bran-d M. → BRENNEN .. Anran-d M. → RINNEN bran-d-marken sw.V. → BRENNEN, MARKE bran-d-schatzen → BRENNEN, SCHATZ Bran-d-anschlag M. → BRENNEN, SCHLAGEN .. Jag-d-zug M. → JAGEN, ZIEHEN bran-d-aktuell Adj. → BRENNEN, AKTU- .. jag-d-rechtlich Adj. → JAGEN, RECHT bran-d-eln sw.V. → BRENNEN Jag-d-bar-keit F. → JAGEN Mäh-d-er M. → MÄHEN Abbrän-d-ler M. → BRENNEN Bran-d-y M. → BRENNEN jag-d-bar Adj. → JAGEN bran-d-ig Adj. → BRENNEN .. zweimäh-d-ig Adj. → MÄHEN, ZWEI jag-d-lich Adj. → JAGEN FLEISCHER/ BARZ, 199; KLUGE/ SEEBOLD, 145; 589f.; PFEIFER, Etym.Wb., 207; 755; 1045. Wortfamilienwörterbuch als legitimer Ort einer integrierten Wortbildung 129 IV Erstellung (A) des jeweiligen Eintrags der Neubildung Frühpensionierungswahn und der im zehnbändigen Duden nicht gebuchten Bildung Frühpensionierung sowie Einordnung (B) in die betreffenden Wortfamilien bzw. in die betreffenden Strukturierten Auflistungen der Suffixe des „Deutschen Wortfamilienwörterbuchs“ (Splett 2009): A Früh-pens-ion-ier-ungs-wahn M. ((wA)((([wF]sS)sV)sS))(wS) abwertend: ‘maßlos übertriebene Auffas- sung von den positiven Auswirkungen von Frühpensionierung’ Früh-pens-ion-ier-ung F. (wA)((([wF]sS)sV)sS) ‘vorzeitige Versetzung in den Ruhestand’ Pens-ion-ier-ung F. (([wF]sS)sV)sS pens-ion-ieren sw.V. ([wF]sS)sV Pens-ion F. [wF]sS B FRÜH 1.3 {Früh}-obst {N.} {Früh}-pensionierung F. (Bd.4, S.184) {Früh}-pensionierungswahn M. (Bd.4, S.184) {Früh}-periode F. PENS- 2.2 Pens-ion-ier-ung F. Früh-{pens-ion-ier-ung F.} (Bd.9, S.91) Zwangs-{pens-ion-ier-ung F.} Leerzeile . . {Pens-ion-ier-ungs}-tod {M.} Früh-pens-ion-ier-ungs-wahn {M.} (Bd.9, S.91) WAHN 1.2.1 Wahn M. Cäsaren-{wahn M.} . . Massen-{wahn M.} - Früh-pensionierungs-{wahn M.} (Bd.13, S.587) -ION: Frühpens-ion-ier-ung (Bd.17, S.586, nach Z.8 v.u.) Frühpens-ion-ier-ungs-wahn (Bd.17, S.587, nach Z.11 v.o.) -IEREN: Frühpens-ion-ier-ung (Bd.17, S.362, nach Z.9 v.o.) Frühpens-ion-ier-ungs-wahn (Bd.17, S.366, nach Z.4 v.u.) -UNG: Frühpens-ion-ier-ung (Bd.18, S.448, nach Z.29 v.u.) Frühpens-ion-ierungs-wahn (Bd.18, S.559, nach Z.21 v.o.) B) Zur Praxis von Wortbildungsangaben im elektronischen Wörterbuch Henning Bergenholtz Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen und als Hilfe bei kommunikativen und kognitiven Informationsbedürfnissen 1. Lexikographie ist Teil der Informationswissenschaft Die Lexikographie wird oft als eine linguistische Teildisziplin (angewandte Linguistik) mit einer steil steigenden Erfolgsentwicklung der letzten 40 Jahre dargestellt. Richtig ist, dass in dieser Zeit eine Reihe von lexikographischen Zeitschriften und lexikographischen Gesellschaften entstanden ist. Falsch und nachteilig ist es dabei gewesen, Lexikographie als einen Zweig der Linguistik zu sehen; und zwar nicht nur aus vielen theoretischen Gründen, sondern vor allem, weil die Forschungsziele und die methodische Tradition der Linguistik einen stark negativen Einfluss auf die theoretische und praktische Lexikographie der letzten 40 Jahre gehabt haben. Nun ist es normalerweise nicht sehr produktiv, wenn man bei interdisziplinärer Forschung und der Erarbeitung konkreter Informationswerkzeuge die disziplinäre Zuordnung als wesentliches Thema bezeichnet und zu viel Kraft auf Fachklassifikationen und Fachzuordnungen verwendet. Dies ist es nur dann, wenn eine bestimmte Zuordnung dazu führt, dass die Forschung und die praktischen Ergebnisse dieser Forschung negativ davon beeinflusst werden. Dies ist bei der Okkupierung der Lexikographie durch die Linguistik allerdings geschehen, wie weiter unten nachgewiesen werden soll. Zunächst aber sollte kurz aufgezeigt werden, warum die Ausarbeitung von Wörterbüchern keine linguistische Disziplin sein kann. Nehmen wir zunächst das Beispiel der vier dänischen Musikwörterbücher, die wir in Dänemark ausgearbeitet haben. An diesen Wörterbüchern haben mitgearbeitet: 1) eine Musikwissenschaftlerin; 2) ein Computerfachmann; 3) ein Lexikograph. Letzterer hat die Grundzüge des Konzepts - in Absprache und nach Diskussionen mit den beiden anderen Mitarbeitern - ausgearbeitet, er hat aber keinen einzigen Wörterbuchartikel geschrieben. Natürlich nicht, da er kein Musikexperte ist. Die Musikwissenschaftlerin, die einzig und allein alle Daten in die Henning Bergenholtz 134 jeweiligen Felder der musikalischen Datenbank eingetragen hat, ist keine Linguistin. Dass sie in der Lage ist, dänische, deutsche, englische, französische und italienische Handbücher zu lesen und Dänisch zu schreiben, macht sie keinesfalls zu einer studierten Linguistin. Die Musikwissenschaftlerin hat natürlich auch kein Textkorpus während der Arbeit verwendet, wie es Linguisten heutzutage für jedwede lexikographische Arbeit fordern, da die Datenbank keine Felder für Kollokationen oder Textbeispiele hat und auch nicht haben sollte, da keine kommunikative Funktion der ausgearbeiteten Musikwörterbücher solche Angaben erfordert. Es wurden jedoch viele Handbücher und Musikwörterbücher - viele nennen sich Musiklexika - benutzt, um fehlendes und ungesichertes Fachwissen zu ergänzen. Der Grund dafür, dass viele annehmen, dass Lexikographie eine linguistische Disziplin sei, hängt damit zusammen, dass Linguisten als Fachexperten bei der Erstellung von kommunikativen (rezeptiven, textproduktiven und translatorischen) allgemeinsprachlichen Wörterbüchern auftreten. Solche Linguisten werden mit der Zeit dann auch Lexikographen und befassen sich auch theoretisch mit lexikographischen Fragestellungen, oft oder eher meistens als systematisierende Beschreiber von vorliegenden allgemeinsprachlichen Wörterbüchern, sie betreiben kontemplative Lexikographie. Das ist natürlich kein Problem an sich, wenn es nicht mit erheblichen theoretischen und praktischen Nachteilen für die praktische und theoretische Lexikographie verbunden wäre. Am deutlichsten stellt sich diese Problematik in der britischen lexikographischen Tradition dar, in der gar keine lexikographischen Theorien überhaupt vonnöten oder gar möglich seien, nur linguistische Theorien, die sehr hilfreich für jedwede lexikographische Praxis sein sollen: This is not a book about ‘theoretical lexicography’ - for the very good reason that we do not believe that such a thing exists. But that is not to say that we pay no attention to theoretical issues. Far from it. There is an enormous body of linguistic theory which has the potential to help lexicographers to do their jobs more effectively and with greater confidence. (Atkins/ Rundell 2008, S. 4) [Hervorh. duch HB] Diese theorieablehnende Haltung findet sich generell bei britischen oder in der britischen Tradition arbeitenden Lexikographen. Ich würde sie Linguisten mit Interesse für Wörterbücher nennen, so auch im Buch eines französischen Linguisten: There are theories of language, there may be theories of lexicology, but there is no theory of lexicography. (Bejoint 2010, S. 161) Man fragt sich, welche linguistischen Theorien die Musikwissenschaftlerin bei den erwähnten Musikwörterbüchern hätte verwenden sollen. Oder der Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 135 Computerspezialist? Oder der Lexikograph? Letzterer hat sich in vielen theoretischen Beiträgen im Übrigen im eigenen Selbstverständnis zu lexikographisch relevanten, aber linguistisch nichtrelevanten Themen befasst, z.B. Bergenholtz (1996, 1998), Almind/ Bergenholtz (2000), Bergenholtz/ Tarp (2002, 2003), Bergenholtz/ Johnsen (2005, 2007), Bergenholtz/ Gouws (2007). In großen Teilen der festlandeuropäischen Lexikographie, insbesondere der nordischen und der deutschen Lexikographie wird Lexikographie ohne Einschränkung als eine wissenschaftliche und gar theoretische Disziplin angesehen. Es gibt auch eigene lexikographische Lehrstühle und viele dazugehörende Stellen an den jeweiligen Universitäten. Am prägnantesten ist die Theorieentwicklung im deutschsprachigen Bereich. Dass ich dennoch nicht von dem großen zukünftigen Nutzen dieser Theorien überzeugt bin, möchte ich im Folgenden begründen. Man wird sehen, dass die Beitragenden zwar theoretisch argumentieren, aber in der Praxis grundlegend als Linguisten zu sehen sind, dass sie zwar Benutzer und benutzerfreundlich als Schlagwörter anführen, jedoch grundlegend als Linguisten denken und argumentieren, nicht als Vertreter eines Faches, das vornehmlich Informationswerkzeuge für Nichtlinguisten als Thema hat, nur ausnahmsweise Informationswerkzeuge für Fachlinguisten und Studenten der Linguistik mit kognitiven, d.h. wissensbezogenen Daten. 2. Neue Beiträge zur Internetlexikographie Ich möchte die kritische These mit einigen Zitaten aus den letzten Ausgaben einer internationalen lexikographischen Zeitschrift exemplifizieren, aus Lexikographica 26, 2010. Ich bringe nur Zitate aus zwei der insgesamt 18 Beiträge zur Internetlexikographie in der betreffenden Ausgabe der Zeitschrift; die übrigen 16 Beiträge sind von der Tendenz her ähnlich: Je mehr Informationen angeboten werden, desto schwerer wird es dem Nutzer, genau die zu finden, die er braucht. (Haß/ Schmitz 2010, S. 4) Es stimmt schon, dass einige Internetwörterbücher einen langsameren Zugriff haben als Printwörterbücher, siehe Beispiele mit Zugriffzeiten in Bergenholtz (2009) und Bergenholtz/ Gouws (2010b). Der Grund war aber nicht, dass die Internetwörterbücher mit dem langsamen Zugriff umfangreichere Datenmengen hatten, sondern dass die technischen Mittel, die es gibt, nicht integriert waren. Was aber schwerer wiegt, ist die Tatsache, dass die betreffenden Internetwörterbücher polyfunktionale Wörterbücher waren, die bis zu mehreren Webseiten für jeden einzelnen Eintrag enthielten. Mit polyfunktional ist der Henning Bergenholtz 136 Wörterbuchtypus gemeint, der typisch ist für Printwörterbücher; man erstellt ein und dasselbe Wörterbuch mit sowohl kommunikativen als auch kognitiven Funktionen für eine sehr breite Benutzergruppe. Dies mag begründbar sein, wenn man nicht ein eigenes Rezeptionswörterbuch, ein eigenes Textproduktionswörterbuch für Muttersprachler, ein eigenes Produktionswörterbuch für Fremdsprachler, ein dokumentarisches Wörterbuch für Linguisten und besonders Sprachinteressierte usw. drucken lässt, weil es sich nicht rentiert. Wenn man eine lexikographische Datenbank hat, kann man aber ohne große Mühe so viele monofunktionale Wörterbücher erstellen, wie man es für nötig hält. Nur so kann man den Informationstod bzw. den Informationsstress vermeiden, den Haß/ Schmitz (2010) zwar als bedrohlich sehen, aber sie sprechen keine der leicht implementierbaren und bekannten Lösungen an. Je mehr unterschiedliche Funktionen ein Online-Wörterbuch erfüllt, desto mehr Vorkenntnisse sollte der Nutzer mitbringen und desto trennschärfer sollte seine Fragestellung sein. (Haß/ Schmitz 2010, S. 4) Im Grunde ist das ein weiteres Beispiel für dieselbe traditionelle Auffassung, dass Wörterbücher polyfunktional sein müssen, so wie die meisten bisherigen Printwörterbücher. Wenn ein konkretes Online-Wörterbuch wie einige Printwörterbücher als Hilfe beim Lesen von Texten konzipiert ist - so z.B. Leth (1800), ein reines Rezeptionswörterbuch für junge Menschen, die religiöse Texte lesen wollen -, soll es lediglich die Bedeutung eines Wortes oder eines mehrwortigen Ausdruckes erklären, sonst gar nichts. Wenn ein Benutzer des dänischen Musikwörterbuchs (Betydning af musikudtryk 2011) nach dem Ausdruck zarzuela sucht, den er in dem Booklet einer CD mit spanischer Musik gelesen hat und nicht versteht, findet er die Antwort auf seine Frage, und mehr auch nicht: zarzuela Kort forklaring en spansk form for syngespil med talt dialog zarzuela Kurze Erklärung eine spanische Balladenform mit gesprochenen Dialogen Man benötigt keine Vorkenntnisse, um zu diesem Eintrag zu kommen, ausreichend ist, dass man imstande ist, zwischen vier Möglichkeiten zu wählen, und von denen den Knopf „einen Musikausdruck verstehen“ betätigt. Ein gutes Werkzeug ist eines, das so eingerichtet ist, dass man es ohne Benutzeranleitung problemlos verwenden kann. Dies gilt auch für Informationswerkzeuge. Die musikalische Datenbank enthält viele weitere Datentypen, es werden in Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 137 diesem Falle nur die Daten eines Datenfeldes aus dem Wörterbuch abgerufen. Informationsstress tritt nicht auf, und eine lange Einarbeitungsphase ist auch nicht nötig. Dies gilt auch, ja insbesondere auch, wenn man eine mehrsprachige, insbesondere eine fachsprachliche Datenbank macht und sie als Basis für ein einziges statt für verschiedene Wörterbücher benutzt: Damit kann die herkömmliche Unterscheidung verschiedener Typen von Wörterbüchern (z.B. ein- und mehrsprachig, ono- und semasiologisch, universal vs. fach- oder zweckspezifisch, etymologisch etc.) entfallen zugunsten einer umfassenden Dokumentation. (Haß/ Schmitz 2010, S. 3) Es ist auffällig, dass ein Gleichheitszeichen gesetzt wird zwischen allen Daten in einer Datenbank und einem konkreten Wörterbuch. Das ist nicht nur höchst altmodisch im Sinne der Datenbanken der achtziger Jahre des vorigen Jahrhunderts, es ist auch noch viel zu linguistisch im Sinne einer philologischen Wissenschaft, dass so ein Wörterbuch oder die ganze Datenbank das Ziel Dokumentation haben sollte. Es besteht sicher Bedarf für wissenschaftliche Dokumentationswörterbücher. Aber nicht alle kommunikativen Wörterbücher sollen dokumentieren, wenn sie gute Werkzeuge sein wollen, sondern instruieren, d.h. eine klare Antwort auf eine Frage geben, die in einer kommunikativen Situation entstanden ist. Wir haben so im Center für Lexikographie an der Universität Aarhus in Zusammenarbeit mit der Universität in Valladolid eine Datenbank für das Rechnungswesen erstellt. Diese Datenbank enthält Angaben zu den Fachsprachen amerikanisches Englisch, britisches Englisch, Englisch des internationalen Standards (IAS/ IFRS), Dänisch, Dänisch nach IAS/ IFRS, Spanisch sowie Spanisch nach IAS/ IFRS. Diese Datenbank ist Basis für verschiedene gedruckte Wörterbücher, z.B. Nielsen et al. (2007) oder Fuertes- Olivera et al. (2010), aber auch für nicht weniger als 22 verschiedene monofunktionale Internetwörterbücher. Wer ein konkretes Textproduktionsproblem für das Schreiben eines englischen Textes hat, erhält nicht Angaben aus allen Feldern der Datenbank, sondern nur die relevanten mit grammatischen Angaben, den Bedeutungsangaben, Kollokationsangaben, einigen Beispielen sowie evtl. Synonymangaben. Angaben zu anderen Sprachen, zum fachlichen Hintergrund, Links usw. benötigt man dafür nicht und erhält sie auch nicht. Das Ziel der Lexikographie ist es, den Wortschatz einer bestimmten Sprache zu bestimmten Zwecken umfassend oder in bestimmten Ausschnitten zu beschreiben. (Klein/ Geyken 2010, S. 81) Es mag sein, dass die Linguistik das Ziel hat, eine Sprache zu beschreiben. Bei Wörterbüchern gilt das nur für wissenschaftliche Dokumentationswörterbü- Henning Bergenholtz 138 cher. Andere Wörterbücher wollen nicht beschreiben, sie wollen Instruktionen an Benutzer geben, die Hilfe bei einem entstandenen Kommunikationsproblem benötigen. Wenn z.B. jemand eine dänische Bilanz schreiben will und nicht sicher ist, ob man benchmark mit dem dänischen Neutrumartikel et oder dem Gemeinschaftsgenus en schreiben sollte, der sucht in dem dänischen Produktionswörterbuch des Rechnungswesens (Danish Dictionary of Accounting: Text Production 2011) und erhält folgende Angabe: benchmark <et, -et, -s, -ene> Ein Textproduktionswörterbuch soll nicht beschreiben, sondern instruieren. Die grammatische Angabe ist daher auch keine Beschreibung im Sinne einer deskriptiven Angabe, sie ist eine proskriptive Angabe (siehe dazu Bergenholtz/ Gouws 2010a). Das heißt, sie ist keine präskriptive Angabe, aber auch keine deskriptive, da auch Gemeinschaftsgenus benutzt wird (en benchmark, benchmarken). Diese Variante wird jedoch dem Benutzer nicht empfohlen, und er wird auch durch weitere Angaben in diesem Wörterbuch nicht informiert. Der Benutzer erhält den nötigen Hinweis, der da besagt, dass die Variante mit Neutrum die von diesem Wörterbuch empfohlene Variante ist. In einem weiteren kognitiven Wörterbuch des Rechnungswesens (Danish Dictionary of Accounting: Knowledge 2011) könnte der Benutzer diese Information erhalten. Die benötigt er nicht, wenn er eine kommunikative Instruktion benötigt und sucht. Es ist weder nötig noch empfehlenswert, den Benutzer mit allen Daten in einem und demselben polyfunktionalen Informationswerkzeug zu überfordern: Die technisch realisierbare Utopie allgemein zugänglicher und vollständiger Dokumentation sämtlichen menschlichen Wissens kann individuelle Nutzer überfordern. (Haß/ Schmitz 2010, S. 4) Im Gegenteil spricht alles dafür, dass man die technischen Möglichkeiten eben gerade dafür nutzt, gezielt bestimmte Typen von Bedürfnissen für bestimmte Benutzertypen zu befriedigen. Es ist zwar richtig, dass die gängige Unterscheidung zwischen Semantik und Enzyklopädie nicht haltbar ist und so auch nicht die zwischen Wörterbuch, Lexikon und Enzyklopädie (siehe dazu Bergenholtz/ Kaufmann 1996). Aber der Grund ist nicht, dass es zum fleißigen Surfen einlädt. Dies kann man als Lexicotainment betreiben, aber für genuine Informationswerkzeuge gilt, dass sie umso besser sind, je zielgerichteter und eindeutiger sie genau das und nur das Informationsangebot zeigen, das der Benutzer für einen bestimmten Informationstypus benötigt. Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 139 Insgesamt gilt, dass die Terminologie und der Beschreibungsapparat der Linguistik für normale Wörterbuchbenutzer unbekannte und auch irrelevante Gebiete darstellen. Der Benutzer kennt die Termini nicht. Wenn sich der Lexikograph (in Form eines verkleideten Linguisten) das vorstellt, müsste der Benutzer in der Tat viel lernen, bevor er seine Informationsbedürfnisse decken kann. Das oben erwähnte Beispiel mit benchmark ist kein Gegenbeispiel. Der übliche Benutzer kennt sicher nicht den Terminus ‘Neutrumartikel’, er kennt nur das Prinzip, dass es zwei Genusartikel im Dänischen gibt. Um die für das Genus von benchmark nötige Information zu erhalten, ist daher nicht vorgesehen, dass der Benutzer einen Knopf wie etwa „Flexionsmorphologie“ wählen soll. Er sollte, wenn er ein solches Problem hat, den Knopf mit dem Text „ich schreibe einen Text“ wählen. Folgende Argumentation geht daher am Benutzerbedürfnis vorbei, bleibt in der Welt der Linguistik: [...] besteht aus einer Reihe von Komponenten, die sich weithin unabhängig voneinander bearbeiten und auch nutzen lassen ... ein Modul Aussprache, ein Modul Morphologie, ein Modul Syntax, ein Modul Semantik, ein Modul Etymologie. (Klein/ Geyken 2010, S. 81) In allen Wörterbüchern, die ich bislang gemacht habe, gab es zwar verschiedene Felder, die die beteiligten Lexikographen mit Inhalt füllen sollten. Für die Benutzer erschienen aber ganz andere Aufteilungen, z.B. in einer Datenbank mit Daten für Dänisch: 1. Ich lese einen Text, 2. Ich schreibe einen Text und kenne das Wort, 3. Ich schreibe einen Text und suche das passende Wort, 4. Ich möchte mehr wissen über ein Wort. Das können Benutzer verstehen. Sie können aber nicht mit Sicherheit Ausdrücke wie Semantik, Enzyklopädie, Etymologie, Flexion, Syntax usw. verstehen. Aus demselben Grund sind die meisten sogenannten Benutzeruntersuchungen nicht nur statistisch gesehen wertlos, da der Versuchsleiter in einer ernst zu nehmenden Befragung nicht selber die Probanden wählen darf, sondern sie als repräsentative Auswahl aus einer bestimmten Gesamtpopulation wählen sollte. Sie sind vor allem auch deswegen wertlos, da meist Fragen in der Art „Schlagen sie vor allem oder wie häufig nach in einem Wörterbuch, um Informationen über Etymologie, Syntax usw. zu erhalten? “ gestellt werden, z.B. Varantola (2002). Da die Probanden meistens Studenten der Linguistik sind, verstehen sie diese Termini. Solche Termini entsprechen jedoch nicht den Grundbedürfnissen eines Informationssuchenden wie „Ich lese einen Text und verstehe das Wort nicht“. Um die durchgehende These zu präzisieren: Wenn man heutzutage gedruckte oder elektronische Wörterbücher ausarbeiten will, benötigt man zunächst eine Datenbank, die so viele Einzelfelder für bestimmte Datentypen enthalten soll, Henning Bergenholtz 140 wie sie in dem oder den daraus zu entnehmenden Wörterbüchern erforderlich sind. Eine Datenbank und ein Wörterbuch sind somit nicht dasselbe. Es scheint nur fast dasselbe zu sein, wenn man aus einer Datenbank ein umfassendes polyfunktionales Informationswerkzeug macht. Für Printwörterbücher halte ich das nur in Einzelfällen für optimal. Für elektronische Wörterbücher nie. 3. Wortbildung und Funktion von Wortbildungsangaben in Informationswerkzeugen Man kann prinzipiell zwischen speziellen und generellen Informationsbedürfnissen trennen. Wenn ein Korrekturleser sich fragt, ob er Zufahrtweg durch Zufahrtsweg (mit Fugen-s) ersetzen soll, hat er ein spezielles Problem. Ein generelles Problem liegt vor, wenn jemand, z.B. ein Fremdsprachenlerner, die Regeln für die Verwendung von Fugen im Deutschen lernen möchte. Traditionell sucht man für spezielle Probleme oft in Wörterbüchern, für generelle Probleme oft in Handbüchern, z.B. in Grammatiken. Bei modernen Wörterbüchern mit verschiedenen Umtexten, z.B. einer Wörterbuchgrammatik, oder bei elektronischen Wörterbüchern mit Links zu anderen Datenbanken, ist diese Tradition so nicht mehr haltbar. Aber nehmen wir nun an, dass es sich um ein Printwörterbuch oder ein elektronisches Wörterbuch handelt, finden sich Daten zu Wortbildung in folgenden Fällen: 1) Lemmaselektion; 2) Sprachgebrauchsangaben zu Varianten; 3) Wortbildungsangaben; 4) Wörterbuchgrammatik; 5) Andere Umtexte, z.B. eine eigene Darstellung von besonderen Regeln der Wortbildung innerhalb eines fachlichen Gebiets; 6) Hilfe beim Zugriff auf andere Daten. Im Folgenden wird am Beispiel einer Datenbank zum Dänischen demonstriert, bei welchen Funktionen bzw. in welchen monofunktionalen Wörterbüchern die hier erwähnten Punkte eine Rolle spielen. Bei Funktionen trennen wir grundsätzlich zwischen vier Haupttypen, die in Einzelfunktionen aufzuteilen sind: - Kommunikative Funktionen (Textrezeption, Textproduktion, Übersetzung, Korrektur); - Kognitive Funktionen (punktuelles Wissen, generelles Wissen, Lernen, Normieren, ...); Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 141 - Operative Funktionen; - Interpretative Funktionen. Wörterbücher sind normalerweise Informationswerkzeuge, die kommunikative und/ oder kognitive Funktionen erfüllen sollen. 4. Eine Datenbank als Basis für fünf monofunktionale und ein polyfunktionales Wörterbuch Auch das Symposium, dessen Beiträge in diesem Band abgedruckt sind, war durchgehend von dem Konzept des polyfunktionalen Wörterbuches geprägt, das dem Benutzer bei sowohl kommunikativen als auch kognitiven Informationsbedürfnissen hilft. Insbesondere die kognitiven Angaben fanden bei den Teilnehmern besondere Beachtung. Das ist auch nötig bei einem Dokumentationswörterbuch oder bei einem Lernwörterbuch. Bei konkreten kommunikativen Textproblemen ist das, so die These dieses Beitrags, jedoch ganz anders, wenn man wie ich das Wörterbuch als Informationswerkzeug sieht. Wir haben eine Datenbank für Datentypen verschiedener Art. Diese Datenbank hat 22 verschiedene Felder (deren Inhalt ich hier aus Platzgründen nicht im Einzelnen erläutern kann), diese Felder haben insgesamt folgende Angaben: Feld Zahl der Angaben in der Datenbank 1. Lemma 110 623 2. Sublemma 3 702 3. Homonymenzahl 10 263 4. Polysemenzahl 36 508 5. Bedeutung 95 469 6. Lexikalische Anmerkung 288 7. Lexikalische Anmerkung Textproduktion 46 8. Grammatik, Wortart 109 588 9. Grammatik, Flexion Klasse 1 112 309 10. Grammatik, Flexion Klasse 99 2 228 11. Grammatische/ orthographische Anmerkung 7 535 12. Erstverweis 6 654 13. Zweitverweis 13 183 14. Kollokation 143 609 15. Beispiel 63 229 16. Wortbildung 71 076 Henning Bergenholtz 142 Feld Zahl der Angaben in der Datenbank 17. Synonym 158 225 18. Antonym 10 471 19. Synonymanmerkung 179 20. Sprichwort 2 407 21. Idiom 21 402 22. Internet-Link 7 898 Tab. 1: Übersicht über die Datenfelder Eine Datenbank ist eine Datenbank - und eben kein Wörterbuch. Aus der Datenbank kann, wenn man das will, ein einziges Wörterbuch herausgezogen werden, was geschieht, wenn Daten aus allen Feldern in den einzelnen Wörterbucheinträgen gezeigt werden. Dabei soll jedoch eine Suche in einem oder mehreren Feldern durch das Computerprogramm vorgenommen werden. Auch die Reihenfolge der Angaben zu jedem Lemma soll festgelegt werden. Eine solche Vorgehensweise hat in etwa das Ergebnis wie in traditionellen, stark polyfunktionalen Wörterbüchern. Und schließlich soll festgelegt werden, was man zeigt, wenn viele Wörterbuchartikel dem Suchkriterium entsprechen. Bei der Suche kann nicht nur im Lemmafeld, sondern prinzipiell in jedem Feld gesucht werden. Wenn dies geschieht, soll jedoch die Suchreihenfolge festgelegt werden. Dabei ist zu trennen zwischen einer maximierenden Suche, wo in allen Feldern in der festgelegten Reihenfolge gesucht wird, und einer minimierenden Suche, wo die Suche stoppt, wenn in einem Feldtyp das Suchkriterium Ergebnisse gebracht hat. Es ist weiterhin zu trennen zwischen einer Fuzzy-Suche, wo das Programm Vorschläge für Wörterbuchartikel bietet, wenn das Suchkriterium keine Ergebnisse gebracht hat, und einer vollständigen Identität zwischen Suchausdruck und Angabe in einem Feld bzw. einer teilweisen Übereinstimmung, wenn der Suchausdruck in einer Angabe enthalten ist. Schließlich besteht bei der Suche im Lemmafeld die Möglichkeit, nicht nur den Lemmaausdruck mit dem Suchausdruck zu vergleichen, sondern mit allen Flexionsformen des Lemmas. Letzteres wird immer in den dänischen Internetwörterbüchern getan. Das dänische Bedeutungswörterbuch (2011) Das erste Wörterbuch, das der Datenbank entnommen wird, ist ein kommunikatives Wörterbuch mit der Funktion Textrezeption. Es wird eine minimierende Suche durchgeführt: Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 143 Suche in Feldern + Suchreihenfolge Feld Reihenfolge im Wörterbuchartikel Reihenfolge, wenn mehr als 10 Wb.art. gefunden Erklärungstext 2 1. Lemma 1 1 1 2. Sublemma 5 3. Homonymenzahl 2 4. Polysemenzahl 4 5. Bedeutung 6 2 (nur 1. Zeile der Bed.ang.) 6. Lexikalische Anmerkung 7 7. Lexikalische Anmer- kung Textproduktion 8. Grammatik, Wortart 3 9. Grammatik, Flexion Klasse 1 10. Grammatik, Flexion Klasse 99 11. Gramm./ orthogr. Anmerkung 12. Erstverweis 13. Zweitverweis (evtl. mehrere) 14. Kollokation (evtl. mehrere) 15. Beispiel (evtl. mehrere) 4 16. Wortbildung (evtl. mehrere) 10 (nur, wenn keine Bed.ang.) Suchwort nicht gefunden, siehe Wort mit demselben Wortstamm 3 17. Synonym (evtl. mehrere) 8 (nur, wenn keine Bed.ang.) Suchwort nicht gefunden, siehe Synonym(e) 5 18. Antonym (evtl. mehrere) 9 (nur, wenn keine Bed.ang.) Suchwort nicht gefunden, siehe Antonym(e) 19. Synonymanmerkung 20. Sprichwort (evtl. mehrere) 21. Idiom (evtl. mehrere) 22. Internet-Link Tab. 2 Feldsuche und gezeigte Daten im dänischen Bedeutungswörterbuch Henning Bergenholtz 144 Wenn ein Wörterbuchbenutzer ein Rezeptionsproblem hat, benötigt er eine Bedeutungsangabe. Wortbildungsangaben würden ihm kaum beim Rezeptionsproblem helfen und werden daher nicht gezeigt. Sie können aber vom Wörterbuchprogramm benutzt werden, wenn das gesuchte Wort nicht lemmatisiert ist, dafür aber die Wortbildungsangabe. Für die Suche im Wortbildungsfeld können wir folgendes Beispiel nehmen: ionosfærisk (dt. ‘ionosphärisch’) wird als Suchwort angegeben. Es wird nicht gefunden, aber man findet ionosfærisk als Wortbildungsangabe bei dem Lemma ionosfære und erhält die dort angeführte Bedeutungsangabe: „den yderste del af atmosfæren fra ca. 80 km og opefter, hvor luften er ioniseret, dvs. luftmolekylerne er spaltet i ioner og elektroner“ (dt.: ‘der äußerste Teil der Atmosphäre über 80 km, dort wo die Luft ionisiert ist, d.h., dass die Luftmoleküle in Ionen und Elektronen gespalten sind’). Diese Bedeutungsangabe kann der Benutzer dann selbst auf das Adjektiv mit demselben Wortstamm übertragen. Sonst gilt prinzipiell, dass mehr Lemmata in einem Bedeutungswörterbuch immer vorteilhafter sind als weniger, d.h. je mehr Komposita oder Derivate, umso besser. Die Diskussion, ob dieses Wort „wörterbuchreif“ ist oder nicht, ist für ein solches Wörterbuch total überflüssig. Wer die Bedeutung eines Wortes nicht kennt, möchte die Bedeutung im Wörterbuch finden können. Dabei spielt es keine Rolle, ob das gesuchte, d.h. das nicht verstandene Wort, normgerecht oder nichtnormgerecht geschrieben wird. Zum Beispiel ist dänisch totaktmotor (dt. Zweitaktmotor) mit einer Bedeutungsangabe im Lemmabestand dieses Wörterbuches enthalten, obwohl der dänische Sprachrat diese Variante nicht zulässt, sondern nur totaktsmotor (mit Fuge). Das dänische Schreibwörterbuch (2011) Wer einen Text schreibt, hat insbesondere orthographische, grammatische oder kollokative Probleme. Dabei ist die Grenze zwischen Kollokationen und Wortbildungen zwar klar und eindeutig, man kann aber Wortbildung als Morphemkollokation beschreiben. Wortbildungsangaben sind daher ein Teil des Datenangebots bei dem Produktionswörterbuch, das hier „Schreibwörterbuch“ genannt wird - es ist ein kommunikatives Wörterbuch mit der Funktion Textproduktion. Logfile-Analysen zeigen jedoch, dass Synonymangaben viel häufiger als Wortbildungsangaben als Links zur weiteren Verwendung des Wörterbuches benutzt werden (wenn eine Angabe selber Lemma ist, ist es automatisch ein Hyperlink in diesem Wörterbuch). Daher kann mit einiger Sicherheit angenommen werden, dass Wortbildungsangaben weniger benutzt werden als Synonymangaben (im dänischen Synonymwörterbuch 2011), wenn ein Benutzer ein Textproduktionsproblem hat für ein Wort, dessen Aus- Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 145 druck er kennt und als Suchwort angeben kann. Es wird für das dänische Schreibwörterbuch (2011) aus folgenden Feldern in der angegebenen Reihenfolge als Wörterbuchartikel gezeigt: Suche in Feldern Feld Reihenfolge im Wörterbuchartikel Reihenfolge, wenn mehr als 10 Wb.art. gefunden 1. Fuzzy- Suche 1. Lemma (Suche im Lemmafeld bedeutet Suche in allen Flexionsformen des Lexems) 1 1 2. Sublemma 2 3. Homonymenzahl 3 4. Polysemenzahl 4 5. Bedeutung 8 6. Lexikalische Anmerkung 7. Lexikalische Anmerkung Textproduktion 9 8. Grammatik, Wortart 5 9. Grammatik, Flexion Klasse 1 6 10. Grammatik, Flexion Klasse 99 11. Grammatik/ orthografische Anmerkung 7 (nur, wenn es eine Anmerkung bei einem Polysem gibt, sonst nicht) 12. Erstverweis 13 (wenn es einen Erstverweis gibt, dann neben Feld 1, 3, 5 auch die Grammatikfelder 8, 9, 11) 13. Zweitverweis (evtl. mehrere) 14. Kollokation (evtl. mehrere) 10 15. Beispiel (evtl. mehrere) 11 16. Wortbildung (evtl. mehrere) 12 17. Synonym (evtl. mehrere) 18. Antonym (evtl. mehrere) 19. Synonymanmerkung 20. Sprichwort (evtl. mehrere) 21. Idiom (evtl. mehrere) 22. Internet-Link Tab. 3 Feldsuche und gezeigte Daten im dänischen Schreibwörterbuch Henning Bergenholtz 146 Ein Beispiel für einen polysemen Wörterbuchartikel aus diesem Wörterbuch nach einer Suche mit dem Suchausdruck etape (dt. ‘Etappe’) zeigt, dass Wortbildungsangaben einen recht großen Platz einnehmen (die unterstrichenen Wortbildungsangaben sind auch als eigene Lemmata vorhanden, die nicht unterstrichenen Wortbildungsangaben (noch) nicht: etape substantiv <en; -n, -r, -rne> 1. Betydning del af en længere rute, som løbes, køres eller cykles i forbindelse med et væddeløb Kollokationer bevæge sig frem i etaper første etape tilbagelægge en etape vinde en etape Eksempler Amerikaneren George Hincapie vandt sidste etape af cykelløbet Tour of California fra Santa Clarita til Pasadena. Orddannelser [Wortbildungen] bjergetape enkeltstartsetape etapeløb etapemål etapesejr etapeudbrud fladlandsetape 2. Betydning militært forsyningssted, der befinder sig bag en fremrykkende hær Orddannelser [Wortbildungen] etapekommandør etapeområde etapestation etapesvin etapevæsen In den Fällen, wo es konkurrierende Wortbildungsvarianten gibt, haben wir einen Fall, wo ein Textproduzent ein klares Problem hat. Er weiß oder nimmt an, dass es zwei oder mehr Varianten gibt, z.B. Zufahrtweg und Zufahrtsweg, weiß aber nicht, welche Variante er wählen soll, insbesondere wenn er keine der Varianten im Wörterbuch oder beide Varianten einfach aufgelistet findet. Ein Textproduktionswörterbuch sollte hier instruktive Hilfe bieten, indem es Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 147 zwar beide Varianten erwähnt, aber explizit eine der Varianten empfiehlt. Das tut ein proskriptives Wörterbuch (Bergenholtz/ Gouws 2010a). In dem hier erwähnten proskriptiven Schreibwörterbuch wird es dadurch getan, dass es zwar bei der nicht empfohlenen Variante eine grammatische Angabe und eine Bedeutungsangabe, aber sonst nur einen Erstverweis gibt, d.h. einen Verweis auf das empfohlene Lemma, und dass anders als bei einem Verweislemma auch Kollokationsangaben, Wortbildungsangaben oder Beispielangaben zu finden sind. Ein Beispiel für einen Verweisartikel mit einer nicht empfohlenen Variante haben wir im folgenden Wörterbuchartikel, wo der Pfeil am Ende des Artikels auf das Lemma verweist, das empfohlen wird, und wo man u.a. Wortbildungsangaben erhalten kann. Mit anderen Worten, man kann, wenn man will, das nicht empfohlene Wort verwenden, man erhält aber nur die allernötigsten Angaben; ausführliche Angaben nur bei dem empfohlenen Lemma: totaktmotor substantiv <en; totaktmotoren, totaktmotorer, totaktmotorerne> Dansk Sprognævn godtager ikke denne skrivemåde uden fuge-s. [dt.: Der dänische Sprachrat lässt diese Schreibweise ohne Fugen-s nicht zu.] Betydning: forbrændingsmotor, hvor stemplerne arbejder i to takter [dt.: Verbrennungsmotor, wo die Kolben in zwei Takten arbeiten] → totaktsmotor Besondere Probleme liegen vor, wenn das Wörterbuch der offiziell festgelegten Norm nicht folgt, so bei folgendem Wortartikel, wo mit einer klaren Begründung auf eine offiziell nicht erlaubte Wortbildung verwiesen wird: kraft-varme-værk substantiv <et; -et, -er, -erne> Dansk Sprognævn godtager kun denne skrivemåde med to bindestreger, som hverken bruges af fagfolk eller i aviser. Der anbefales derfor at bruge skrivemåden uden bindestreger. [dt.: ‘Der dänische Sprachrat lässt nur diese Schreibweise mit zwei Bindestrichen zu, die nicht von Fachleuten und auch nicht in Zeitungen verwendet wird. Wir empfehlen daher die Schreibweise ohne Bindestriche.’] Betydning: anlæg, som producerer elektricitet ud fra varmeenergi [dt.: Anlage, die Elektrizität aus Wärmeenergie produziert] → kraftvarmeværk Da jeder Schüler, Studierende oder Angestellte/ Beamte im öffentlichen Dienst gesetzlich verpflichtet ist, dem dänischen Sprachrat zu folgen, liegt hier eine Aufforderung zur Befehlsverweigerung vor. Der Wörterbuchbenutzer kann jedoch selber wählen, ob er der Begründung im Wörterbuch folgen oder doch lieber gesetzestreu bleiben will. Insbesondere bei Stadt-, Staaten- oder Ländernamen ist es wichtig, dem Benutzer Wortbildungsangaben anzubieten, sodass er die Bezeichnung der dortigen Bewohner verwenden kann, eine Bezeichnung, die auch im Dänischen Henning Bergenholtz 148 sehr unregelmäßig gebildet wird. Zu sagen, dass Namen nicht in ein Wörterbuch gehören, ist natürlich Unsinn, wenn es ein Hilfswerkzeug bei der Textproduktion sein soll. So gibt es im Artikel zu Grenaa, einer Stadt am Kattegat nördlich von Aarhus, mehrere Bezeichnungen in Form von Wortbildungsangaben: Grenaa proprium Dansk Sprognævn godtager både stavemåde med å og aa, men byen foretrækker stavemåde med aa, dvs. Grenaa. [dt.: ‘Der dänische Sprachrat lässt sowohl die Schreibweise mit å als auch mit aa zu, aber die Stadt zieht die Schreibweise mit aa vor, d.h. Grenaa.’] Betydning østjysk havneby, som ligger på Djursland, og som har ca. 14.000 indbyggere [dt.: ‘ostjütländische Hafenstadt, die auf Djursland liegt und die etwa 14.000 Einwohner hat’] Kollokationer besøge Grenaa med de idylliske stræder, torve og gamle købmandsgårde [dt.: ‘Besuche Grenaa mit seinen idyllischen Gassen, Marktplätzen und alten Kaufmannshöfen.’] bo i Grenaa [dt.: ‘in Grenaa wohnen’] få et tilbud på en rejse til Grenaa [dt.: ‘ein Angebot für eine Reise nach Grenaa erhalten’] Grenaa Gymnasium [dt.: ‘Grenaa Gymnasium’] Grenaa Havn [dt.: ‘Grenaa Hafen’] i nærheden af Grenaa [dt.: ‘in der Nähe von Grenaa’] tage til Grenaa med bussen [dt.: ‘den Bus nach Grenaa nehmen’] Eksempler Ingen vil længere bo i Grenaa, hvis sygehuset lukker, mente hun. [dt.: Niemand möchte länger in Grenaa wohnen, wenn das Krankenhaus schließt, meinte sie.] Orddannelser [Wortbildungen] grenaabo [dt.: ‘Bewohner von Grenaa’] grenaaenser [dt.: ‘Bewohner von Grenaa’] grenaagenser [dt.: ‘Bewohner von Grenaa’] grenåbo [dt.: ‘Bewohner von Grenaa’] grenåenser [dt.: ‘Bewohner von Grenaa’] grenågenser [dt.: ‘Bewohner von Grenaa’] Wer dann wissen will, welche dieser Wortbildungen, d.h. Bezeichnungen für Bewohner in Grenaa, er nach Ratschlag des Wörterbuches verwenden soll, kann auf eine der Wortbildungen klicken und sieht dann, ob dies die empfohlene Variante ist oder nicht. Die erste Variante ist es nicht, aber hier erhält man dann den Erstverweis auf die Bezeichnung, die das Wörterbuch nach Anfrage in der Stadtverwaltung von Grenaa empfiehlt: Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 149 grenaabo substantiv <en; -en, -er, -erne> Betydning person, som kommer fra den østjyske havneby Grenaa, som ligger på Djursland → grenaaenser Wie heißt das richtige Wort? (2011) Dieses Wörterbuch ist wie das vorige ein kommunikatives Wörterbuch mit der Funktion Textproduktion. Es wird eine minimierende Suche verwendet. Die gezeigten Wörterbuchartikel sehen fast genauso aus wie beim Schreibwörterbuch. Wortbildungsangaben spielen somit dieselbe Rolle wie vorher für das andere Textproduktionswörterbuch beschrieben. Bei Polysemie werden jedoch nur die Bedeutung bzw. die Bedeutungen gezeigt, die dem Suchkriterium entsprechen. Der größte Unterschied ist, dass der Benutzer anders als beim Schreibwörterbuch zwar in etwa die Bedeutung angeben kann, aber das passende Wort dazu nicht kennt und daher sucht. Das Programm sucht daher in Bedeutungsfeldern: Suche in Feldern + Suchreihenfolge Feld Reihenfolge im Wb.art. bei Klick auf Lemma als Link Reihenfolge, wenn mehr als 10 Wb.art. gefunden 1. Lemma 1 1 2. Sublemma 5 3. Homonymenzahl 2 4. Polysemenzahl 4 2 (bei Polysemie sollen nur die Karte bzw. die Karten mit der gesuchten Bedeutung gezeigt werden) 1 5. Bedeutung 6 6. Lexikalische Anmerkung 2 7. Lexikalische Anm. Textproduktion 8. Grammatik, Wortart 3 9. Grammatik, Flexion Klasse 1 10. Grammatik, Flexion Klasse 99 11. Grammatik/ orthografische Anmerkung 13 (nur, wenn eine solche Angabe bei einem Polysem steht) Henning Bergenholtz 150 Suche in Feldern + Suchreihenfolge Feld Reihenfolge im Wb.art. bei Klick auf Lemma als Link Reihenfolge, wenn mehr als 10 Wb.art. gefunden 12. Erstverweis 7 (bei einem Erstverweis sollen nur die Angaben aus den Feldern 1, 8, 5 gezeigt werden) 13. Zweitverweis (evtl. mehrere) 14. Kollokation (evtl. mehrere) 8 15. Beispiel (evtl. mehrere) 9 16. Wortbildung (evtl. mehrere) 10 17. Synonym (evtl. mehrere) 11 18. Antonym (evtl. mehrere) 12 19. Synonymanmerkung 20. Sprichwort (evtl. mehrere) 21. Idiom (evtl. mehrere) 22. Internet-Link Tab. 4: Feldsuche und gezeigte Daten in Wie heißt das richtige Wort? Die Suche kann mit einem einfachen Suchausdruck, bestehend aus einem oder mehreren Wörtern, vorgenommen werden. Man kann jedoch auch Boole'sche Operatoren verwenden, z.B. seksuel PLUS mand (dt. ‘sexuell’ + ‘Mann’), und erhält mit dieser Suche insgesamt 16 Wörterbuchartikel, u.a. mit den Lemmata ejakulation, bøsse (dt. ‘Ejakulation’, ‘Schwuler’). Wenn man stattdessen nach seksuel MINUS mand PLUS kvinde sucht (dt. ‘sexuell’ - ‘Mann’ + ‘Frau’), erhält man 17 Wörterbuchartikel, u.a. mit den Lemmata prostitueret, frigid, lesbisk (dt. ‘Prostituierte’, ‘frigide’, ‘lesbisch’). Das dänische Synonymwörterbuch (2011) Hier spielen Wortbildungsangaben keine Rolle, weder bei der Suche noch bei der Präsentation der Daten. Ich zeige daher keine Tabelle zur Suche in der Datenbank und Präsentation der Daten. Das dänische orthographische und grammatische Wörterbuch (2011) Auch hier zeige ich keine Tabelle für die Suche in der Datenbank und die Präsentation der Daten. Das Wörterbuch hat in der jetzigen Form keine Relevanz für Wortbildung, wenn man von der Lemmaselektion absieht. Aber das Wörterbuch könnte sie bekommen, wenn eine Wörterbuchgrammatik vorhanden Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 151 wäre, vergleiche das Madagassisch-Deutsche Wörterbuch (1991), wo es eine integrierte Wörterbuchgrammatik mit Verweisen von den einzelnen Wörterbuchartikeln gibt; in dieser Wörterbuchgrammatik gibt es auch ein eigenes Kapitel zur Wortbildung. Das dänische Internetwörterbuch (2011) Das letzte Wörterbuch ist das, was am ehesten der traditionellen Auffassung von der Beziehung zwischen Datenbank und Wörterbuch entspricht: Alle Felder in der Datenbank werden im Wörterbuch gezeigt. Es ist ein polyfunktionales Wörterbuch, primär für die Funktionen Textproduktion, Textkorrektur, Rezeption und sekundär ein kognitives Wörterbuch mit der Funktion „Wissen über Grammatik und Lexik“. Hier ist es allerdings in der jetzigen Fassung nicht optimal, da Umtexte fehlen, u.a. eine Wörterbuchgrammatik mit einem ausführlichen Kapitel zur Wortbildung. Hier fehlen auch Sonderlisten mit allen Wortbildungen, die zu jedem einzelnen Lemma bzw. Polysem angeführt werden können. Es wird eine minimierende Suche angewendet: Suche in Feldern + Suchreihenfolge Feld Reihenfolge im Wörterbuchartikel Reihenfolge, wenn mehr als 10 Wb.art. gefunden 2. Fuzzy- Suche 1. Lemma 1 1 1 2. Sublemma 2 3. Homonymenzahl 3 4. Polysemenzahl 4 5. Bedeutung 10 6. Lexikalische Anmerkung 11 7. Lexikalische Anm. Textproduktion 12 8. Grammatik, Wortart 5 9. Grammatik, Flexion Klasse 1 6 10. Grammatik, Flexion Klasse 99 7 11. Grammatik/ orthografische Anmerkung 8 12. Erstverweis 9 13. Zweitverweis (evtl. mehrere) 21 14. Kollokation (evtl. mehrere) 16 15. Beispiel (evtl. mehrere) 17 16. Wortbildung (evtl. mehrere) 20 17. Synonym (evtl. mehrere) 13 Henning Bergenholtz 152 Suche in Feldern + Suchreihenfolge Feld Reihenfolge im Wörterbuchartikel Reihenfolge, wenn mehr als 10 Wb.art. gefunden 18. Antonym (evtl. mehrere) 14 19. Synonymanmerkung 15 20. Sprichwort (evtl. mehrere) 19 21. Idiom (evtl. mehrere) 18 22. Internet-Link 22 Tab. 5: Feldsuche und gezeigte Daten im dänischen Internetwörterbuch 5. Was ist ein Wörterbuch? Es ist geplant, eine weitere Möglichkeit für die Benutzer einzuführen, die mit dem Angebot der sechs Wörterbücher nicht voll zufrieden sind und daher selber die Suchreihenfolge und die Reihenfolge der Präsentation der einzelnen Felder definieren möchten. Im Prinzip bietet dann die Datenbank zwar nicht unendlich viele, aber doch eine Zahl von verschiedenen Wörterbüchern, die in die Tausende geht. Bei dem Ausblick kann man sich fragen, ob es wirklich gerechtfertigt ist, von verschiedenen Wörterbüchern zu sprechen, die derselben Datenbank entnommen sind. Ich meine, dass man das tun muss und auch gut daran tut, weil sonst der Begriff des Wörterbuches nicht mehr erklärbar werden würde. Umschreibend könnte man sagen, dass man immer dann ein anderes Wörterbuch hat, wenn man eine Menge von Wörterbuchartikeln durch eine bestimmte Suche in der Datenbank und eine bestimmte Präsentation der Daten erhält, die als eigenes Wörterbuch gedruckt werden kann, verschieden von allen anderen möglichen gedruckten Wörterbüchern, die derselben Datenbank entnommen werden. Bei einem Wörterbuch wie dem hier beschriebenen „Wie heißt das richtige Wort? “ (2011) würde in einer gedruckten Version ein umfangreicher Index mit Bedeutungselementen dazugehören. Dieses Verständnis entspricht der Bedeutungsangabe in „Das dänische Internetwörterbuch“ (2011), wo man folgende Definition findet: Wörterbuch lexikographisches Nachschlagewerk, das Wörterbuchartikel mit Angaben zu einzelnen Themen oder sprachlichen Elementen und evtl. auch verschiedene Umtexte enthält und das konsultiert werden kann, wenn jemand Hilfe sucht in Verbindung mit Textrezeption, Textproduktion, Übersetzung oder einfach mehr über ein Wort, einen Wortteil oder eine Wortkombination wissen möchte Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 153 Man kann eine Unterscheidung treffen zwischen solchen lexikographischen Nachschlagewerken, die Hilfe bieten wollen bei Problemen mit einem konkreten Text, und anderen, in denen man generelles oder spezifisches Wissen erhalten kann. Der erste Typ wird oft Wörterbuch, der zweite oft Lexikon oder Enzyklopädie genannt, aber es gibt keine allgemein angenommene Unterscheidung und Benennung der beiden Typen. 6. Literaturverzeichnis 6.1 Wörterbücher Bergenholtz, Henning (1991): Madagassisch-Deutsches Wörterbuch / Rakibolana Malagasy-Alema. I. Zusarb. mit Suzy Rajaonarivo, Rolande Ramasomanana, Baovola Radanielina sowie Jürgen Richter-Johanningmeier, Eckehart Olszowski, Volker Zeiss. u. Mitarb. v. Hantanirina Ranaivoson, Nicole Rasoarimanana, Raymonde Ravololomboahangy und Mavotiana Razafiarivony. Antananarivo. Bergenholtz, Henning (2011): Das dänische Bedeutungswörterbuch / Den Danske Betydningsordbog. In Zusarb. mit Helene H. Jensen, unter Mitw. v. Filip Bodilsen, Kathrine Brosbøl Eriksen, Stine Busk Hedegaard, Torben Jensen, Emilie Dittmer Laursen, Heidi Agerbo Pedersen. Datenbank: Richard Almind. Odense. Internet: http: / / www.ordbogen.com (Stand: 11/ 2011). Bergenholtz, Henning (2011): Das dänische Internetwörterbuch / Den Danske Netordbog. 6. Ausg. In Zusarb. mit Heidi Agerbo Pedersen, unt. Mitw. v. Filip Bodilsen, Kathrine Brosbøl Eriksen, Stine Busk Hedegaard, Helene H. Jensen, Torben Jensen, Emilie Dittmer Laursen. Datenbank: Richard Almind. Odense. Internet: http: / / www.ordbogen.com . (Stand: 11/ 2011). Bergenholtz, Henning (2011): Das dänische orthographische und grammatische Wörterbuch / Den Danske Grammatikog Staveordbog. In Zusarb. mit Heidi Agerbo Pedersen, unt. Mitw. v. Filip Bodilsen, Kathrine Brosbøl Eriksen, Stine Busk Hedegaard, Helene H. Jensen, Torben Jensen, Emilie Dittmer Laursen. Datenbank: Richard Almind: Odense. Internet: http: / / www.ordbogen.com (Stand: 11/ 2011). Bergenholtz, Henning (2011): Das dänische Schreibwörterbuch / Den Danske Skriveordbog. In Zusarb. mit Kathrine Brosbøl Eriksen, unt. Mitw. v. Filip Bodilsen, Stine Busk Hedegaard, Helene H. Jensen, Torben Jensen, Emilie Dittmer Laursen, Heidi Agerbo Pedersen. Datenbank: Richard Almind. Odense. Internet: http: / / www.ordbogen.com (Stand: 11/ 2011). Bergenholtz, Henning (2011): Das dänische Synonymwörterbuch / Den Danske Synonymordbog. In Zusarb. mit Filip Bodilsen, unt. Mitw. v. Kathrine Brosbøl Eriksen, Stine Busk Hedegaard, Helene H. Jensen, Torben Jensen, Emilie Dittmer Laursen, Heidi Agerbo Pedersen. Datenbank: Richard Almind: Odense. ( http: / / www.ordbogen.com ). (Stand: 11/ 2011). Henning Bergenholtz 154 Bergenholtz, Henning (2011): Wie heißt das richtige Wort? / Hvad er det nu, det hedder? In Zusarb. mit Stine Busk Hedegaard, unt. Mitw. v. Filip Bodilsen, Kathrine Brosbøl Eriksen, Helene H. Jensen, Torben Jensen, Emilie Dittmer Laursen, Heidi Agerbo Pedersen. Datenbank: Richard Almind: Odense. Internet: http: / / www.ordbogen.com (Stand: 11/ 2011). Bergenholtz, Inger (2011): Bedeutung von Musiktermini. In Zusarb. mit Richard Almind u. Henning Bergenholtz. Odense. Internet: http: / / www.ordbogen.com (Stand: 11/ 2011). Fuertes-Olivera, Pedro/ Gordo Gómez, Pablo/ Niño Amo, Marta/ de los Rios Rodicio, Angel/ Sastre Ruano, Angeles/ Tarp, Sven/ Velasco Sacristán, Marisol u. Nielsen, Sandro/ Mourier, Lise/ Bergenholtz, Henning (2010): Diccionario de Contabilidad Inglés-Español. Datenbank: Creación y diseño: Richard Almind. Madrid. Leth, Jens (1800): Dansk Glossarium. En Ordbog til Forklaring over det danske Sprogs gamle, nye og fremme Ord og Talemaader for unge Mennesker og for Ustuderede. Et Forsøg. Med en Fortale af Professor Rasmus Nyerup. København. Nielsen, Sandro/ Mourier, Lise/ Bergenholtz, Henning (2007): Regnskabsordbogen engelsk-dansk. Unt. Mitw. v. Mia Johnsen, Jóna Ellendersen u. Rie Bobjerg Nielsen København. Nielsen, Sandro/ Mourier, Lise/ Bergenholtz, Henning (2011): Danish Dictionary of Accounting: Knowledge / Den Danske Regnskabsordbog: Viden. Datenbank: Richard Almind. Odense. Internet: http: / / www.ordbogen.com (Stand: 11/ 2011). Nielsen, Sandro/ Mourier, Lise/ Bergenholtz, Henning (2011): Danish Dictionary of Accounting: Text Production / Den Danske Regnskabsordbog: Tekstproduktion. Datenbank: Richard Almind. Odense. Internet: http: / / www.ordbogen.com (Stand: 11/ 2011). 6.2 Forschungsliteratur Almind, Richard/ Bergenholtz, Henning (2000): Die ästhetische Dimension der Lexikographie. In: Fix, Ulla/ Wellmann, Hans (Hg.): Bild im Text - Text und Bild. Heidelberg, S. 259-288. Atkins, B.T. Sue/ Rundell, Michael (2008): The Oxford guide to practical lexicography. Oxford. Bejoint, Henry (2010): The lexicography of English. Oxford. Bergenholtz, Henning (1996): Grundfragen der Fachlexikographie. In: Gellerstan, Martin/ Järborg, Jerker/ Malmgren, Sven-Göran/ Röjder, Catarina (Hg.): Euralex '96. Proceedings I-II. Papers submitted to the Seventh EURALEX International Congress on Lexicography in Göteborg, Sweden. Göteborg, S. 731-758. Wortbildungsangaben als Hilfe für den Zugriff auf andere Datentypen ... 155 Bergenholtz, Henning (1998): Das Schlaue Buch. Vermittlung von Informationen für textbezogene und textunabhängige Fragestellungen. In: Zettersten, Arne/ Mogensen, Jens Erik/ Pedersen, Viggo Hjørnager (Hg.): Symposium on Lexicography VIII. Proceedings of the Eighth International Symposium on Lexicography May 2-5, 1996 at the University of Copenhagen. Tübingen, S. 93-110. Bergenholtz, Henning (2009): Schnellerer und sicherer Datenzugriff in gedruckten und elektronischen Fachwörterbüchern und Lexika. In: Revue française de linguistique appliquée, dossier: terminologie orientations actuelle 14, 2, S. 81-97. Bergenholtz, Henning/ Gouws, Rufus (2007): Korrekt, volledig, relevant. Dít is die fraag aan leksikografiese definisies. In: Tydskrif vir Geesteswetenskappe 47, 4, S. 568-586. Bergenholtz, Henning/ Gouws, Rufus (2010a): A functional approach for the choice between descriptive, prescriptive and proscriptive lexicography. In: Lexikos 20, S. 26-51. Bergenholtz, Henning/ Gouws, Rufus (2010b): A new perspective on the access process. In: Hermes. Journal of Language and Communications Studies 44, S. 103-127. Bergenholtz, Henning/ Johnsen, Mia (2005): Log files as a tool for improving internet dictionaries. In: Hermes. Journal of Language and Communications Studies 34, S. 117-141. Bergenholtz, Henning/ Johnsen, Mia (2007): Log files can and should be prepared for a functionalistic approach. In: Lexikos 17, S. 1-20. Bergenholtz, Henning/ Kaufmann, Uwe (1996): Enzyklopädische Informationen in Wörterbüchern. In: Weber, Nico (Hg.): Semantik, Lexikographie und Computeranwendungen. Tübingen, S. 168-182. Bergenholtz, Henning/ Tarp, Sven (2002): Die moderne lexikographische Funktionslehre. Diskussionsbeitrag zu neuen und alten Paradigmen, die Wörterbücher als Gebrauchsgegenstände verstehen. In: Lexicographica 18, S. 253-263. Bergenholtz, Henning/ Tarp, Sven (2003): Two opposing theories: On H.E. Wiegand's recent discovery of lexicographic functions. In: Hermes. Journal of Language and Communications Studies 31, S. 171-196. Haß, Ulrike/ Schmitz, Ulrich (2010): Lexikographie im Internet 2010 - Einleitung. In: Lexicographica 26, S. 1-17. Klein, Wolfgang/ Geyken, Alexander (2010): Das Digitale Wörterbuch der Deutschen Sprache (DWDS). In: Lexikographica 26, S. 79-96. Varantola, Krista (2002): Use and usability of dictionaries: Common sense and context sensibility. In: Corréad, Marie-Hélène (Hg.): Lexicography and natural language processing. A festschrift in honour of B.T.S. Atkins. Göteborg, S. 30-44. Pius ten Hacken Wortbildung in elektronischen Lernerwörterbüchern In diesem Beitrag werde ich versuchen, einige allgemeine Überlegungen zur Darstellung der Wortbildung in elektronischen Lernerwörterbüchern mit theoretischen Einsichten zum Wesen des Spracherwerbs, der Lexikographie sowie der Wortbildung zu verbinden. 1. Das Lernen von Sprachen Lernerwörterbücher sind Wörterbücher, die speziell für Nicht-Muttersprachler entwickelt wurden. Gemäß Béjoint (2000, S. 66) wurde 1942 das erste Lernerwörterbuch im modernen Sinn publiziert, und zwar für Englischlernende in Japan. Seither hat sich das Genre des Lernerwörterbuchs stark entwickelt und verbreitet, speziell für Englisch (vgl. Bogaards 1996). Um das Konzept theoretisch einzubinden, sollten wir zuerst kurz die Frage behandeln, wie Lernende sich von Muttersprachlern unterscheiden. 1.1 Erstspracherwerb Seit dem Aufkommen der generativen Grammatik hat der Spracherwerb eine zentrale Stellung in der Sprachwissenschaft erlangt. Obwohl Chomskys Theorie zum Erstspracherwerb (1981) nicht allgemein akzeptiert wird, hat sie dazu geführt, dass Linguisten, die diesen Vorschlag ablehnen, eine alternative Erklärung vorschlagen müssen. Wie in Chomsky (1999) dargestellt, geht die generative Grammatik davon aus, dass sich die Sprache unter dem Einfluss genetischer und umgebungsbedingter Faktoren entwickelt. Ein Kind kommt auf die Welt mit einer Prädisposition, eine Sprache zu lernen. Diese Prädisposition wird ‘Sprachinstinkt’ (engl. language faculty) genannt. Sie ist ein Teil des Gehirns und entwickelt sich im Laufe des physischen und kognitiven Wachstums zu einem vollständig ausgeprägten Sprachmodul (engl. competence). Welche Sprache in diesem Sprachmodul erfasst wird, wird vom Input bedingt, dem das Kind im Laufe der Spracherwerbsperiode begegnet. Eine wichtige Konsequenz dieser Sicht auf Spracherwerb ist, dass es keine unabhängig existierende Sprache als Objekt des Erwerbs gibt. Wie es Chomsky (1980, S. 134) ausdrückt, „in certain fundamental respects we do not re- Pius ten Hacken 158 ally learn language; rather grammar grows in the mind“. Das Kind hat keine Wahl, ob es eine Sprache lernen möchte oder nicht, und braucht keine spezielle Anstrengung zum Spracherwerb. Die Möglichkeit, eine Sprache in dieser „natürlichen“ Weise als Muttersprache zu erwerben, nimmt mit zunehmendem Alter ab. Curtiss et al. (1974) beschreiben einen spektakulären Fall eines Kindes, Genie, das bis zum 13. Lebensjahr praktisch keinen sprachlichen Input hatte. Fälle wie Genie sind vergleichsweise selten. Viel häufiger kommt diese Art des fehlenden sprachlichen Inputs bei gehörlosen Kindern hörender Eltern vor (vgl. Mayberry 1994). Solche Kinder schaffen es nicht mehr, den Rückstand im Spracherwerb nachzuholen, wenn sie bis zum Ende der so genannten ‘kritischen Periode’ für den Spracherwerb keinen entsprechenden Input bekommen haben. Das Konzept der kritischen Periode hat eine neurologische Basis, die, wie von Hensch (2005) dargelegt, vor allem durch Experimente mit der Entwicklung des Sehens bei Katzen und Nagetieren erforscht wurde. 1.2 Zweitspracherwerb, Muttersprache und Norm Wenn wir die generative Sicht auf Erstspracherwerb als Ausgangspunkt nehmen, um Lernerwörterbücher zu betrachten, so müssen zunächst einige Unterschiede klargestellt werden. Erstspracherwerb beruht auf der Fähigkeit des Kindes, unmoderierte sprachliche Äußerungen in der Umgebung zu benutzen, um Sprachkenntnisse aufzubauen. Lernerwörterbücher sind aber für Zweitspracherwerb gemeint, d.h. Spracherwerb nach der kritischen Periode. Es ist allgemein bekannt, dass Zweitspracherwerb alles andere als automatisch vor sich geht. Dies ist ein wichtiger Grund, wieso es überhaupt einen Bedarf an Lernerwörterbüchern gibt. Eine Fremd- oder Zweitsprache wird im Unterschied zur Mutter- oder Erstsprache definiert. Der Begriff ‘Muttersprache’ ist aber keineswegs eindeutig. Franz Beckenbauer und Boris Becker haben beide Deutsch als Muttersprache. Das heißt, dass sie in einer deutschsprachigen Umgebung aufgewachsen sind. Die Bezeichnung ‘Deutsch’ wird hier in zweierlei Weise benutzt, einerseits als Klassifizierung der Sprachkenntnisse von Beckenbauer und Becker, andererseits als Klassifizierung des Sprachgebrauchs in der Umgebung, wo sie aufgewachsen sind. Chomsky (1965) benutzt „competence“ und „performance“ für diese zwei Sichten auf Sprache. Während Sprachkenntnisse und Sprachgebrauch empirische Entitäten darstellen, ist ‘Deutsch’ nur der Name einer nicht genau abgegrenzten Kategorie. Im Übergangsgebiet zwischen Deutsch und Niederländisch gibt es beliebig viele Grenzfälle, wo es kaum möglich ist, ein- Wortbildung in elektronischen Lernerwörterbüchern 159 wandfrei und ohne Willkür zu bestimmen, ob jemand einen deutschen oder niederländischen Dialekt spricht. Der natürliche Spracherwerbsprozess, wie oben beschrieben, bezieht sich nur auf das Resultat der unmoderierten Verarbeitung der wahrgenommenen Umgebungssprache durch das Kind, nicht auf die normierte Schriftsprache. Die deutsche Standardsprache haben Beckenbauer und Becker in einer ähnlichen Weise gelernt, wie sie lesen und schreiben gelernt haben. Da ihre Muttersprache von der deutschen Standardsprache nicht weit entfernt ist, war der Lernaufwand zwar nicht groß, aber der Lernprozess war von einer ganz anderen Art als ihr Erstspracherwerb. Zweitspracherwerb nach der Kindheit unterscheidet sich in mehreren Hinsichten vom Erstspracherwerb: Die Ausgangslage, der Prozess, der Aufwand, das Lernziel und der Erfolg sind unterschiedlich. Ein wesentlicher Unterschied ist, dass ein Lerner einer zweiten Sprache schon eine Sprache beherrscht. Dies ändert nicht nur die Ausgangslage, sondern auch den Lernprozess, der ja diese erste Sprache benutzen kann. Außerdem fällt der Zweitspracherwerb nicht in der gleichen Weise mit einer kognitiven Entwicklung zusammen wie der Erstspracherwerb. Trotz dieser offensichtlichen Vorteile im Zweitspracherwerb ist der Aufwand generell größer und der Erfolg kleiner. Viele Sprachforscher sehen dies als ein weiteres Argument für eine kritische Periode für Spracherwerb. Wie aus der Übersicht in ten Hacken (2007, S. 300-317) hervorgeht, besteht aber innerhalb der generativen Zweitsprachenerwerbsforschung keine Einigung darüber, wie genau die Erstsprache und der genetisch bedingte Sprachinstinkt im Zweitspracherwerb verfügbar sind bzw. eingesetzt werden. Es ist in diesem Kontext, dass Lernerwörterbücher benutzt werden. Obwohl Lernende sich sehr unterschiedliche Lernziele setzen, ist es häufig die Standardform der Sprache, deren Kenntnis angestrebt wird. Deshalb spielt die Standardsprache eine direktere Rolle im Zweitspracherwerb als im Erstspracherwerb. 2. Wörterbücher und Sprachbeschreibung Wörterbücher werden oft als eine Beschreibung der jeweiligen Sprache dargestellt. Mit Hinblick auf die oben angeführte Sicht auf Sprache ist eine solche Darstellung allerdings problematisch. Es wird hier zunächst erklärt, was genau das Problem ist (Kap. 2.1) und wie man zu einer alternativen Interpretation des Wörterbuchs kommen kann (Kap. 2.2). Dann werden die Spezialfälle der Lernerwörterbücher (Kap. 2.3) und der elektronischen Wörterbücher (Kap. 2.4) behandelt. Pius ten Hacken 160 2.1 Sprache und Sprachbeschreibung Sprache kann auf drei Ebenen betrachtet werden, auf der individuellen Ebene, der Ebene der Sprachgemeinschaft und der Ebene des Menschen als Spezies. Im letzten Fall geht es um die genetische Spezifikation. In der generativen Grammatik werden die individuelle und die genetische Ebene als Basis für die wissenschaftliche Beschreibung des Phänomens Sprache angenommen, während Sprache auf der Ebene der Sprachgemeinschaft, wie Chomsky (1980) argumentiert, nicht als empirisches Objekt existiert. Für die lexikographische Arbeit ist die genetische Ebene nicht relevant, da die zu beschreibenden einzelnen Wörter auf dieser Ebene nicht existieren. Im Selbstverständnis der Lexikographie wird die korpusbasierte Beschreibung des Sprachgebrauchs einer bestimmten Sprachgemeinschaft als Basis für das Wörterbuch genommen. Lexikographische Handbücher wie Atkins/ Rundell (2008) und Svensén (2009) beschreiben zwei Methoden der Datensammlung für lexikographische Projekte: ein Leseprogramm und ein Korpus. Svensén (2009, S. 39f.) erwähnt auch die Introspektion als eine mögliche Methode der Datensammlung, hebt aber vor allem die Probleme eines darauf basierenden Verfahrens hervor. Leseprogramme und Korpora unterscheiden sich durch die Art, wie die Sprachkenntnisse der Menschen die Auswahl der Daten beeinflussen. Im Leseprogramm bestimmen die Leser, welche Zitate „interessant“ sind, während eine korpusbasierte Methode auf einer Konkordanz über das gesamte Korpus beruht. In beiden Fällen ist die Quelle der Daten der Sprachgebrauch einer bestimmten Sprachgemeinschaft. Aus chomskyanischer Sicht ist eine rein deskriptive Interpretation des Wörterbuches problematisch, da sich kein empirisches Objekt nachweisen lässt, das von einem Wörterbuch beschrieben werden kann. Wie in ten Hacken (2009a) ausführlicher dargestellt, eignet sich keine der möglichen Perspektiven auf Sprache als Objekt der Beschreibung. Es werden dort drei Perspektiven betrachtet: Sprachkompetenz, Sprachgebrauch und Standardsprache. Die Sprachkompetenz ist der Zustand des Sprachmoduls nach dem Spracherwerb. Sie ist individuell und wird deshalb nicht als Basis für ein Wörterbuch genommen. Sogar dann, wenn die Introspektion als Datenquelle akzeptiert wird, ist das Ziel nicht, ein Wörterbuch eines einzelnen Sprechers zu produzieren. Wortbildung in elektronischen Lernerwörterbüchern 161 Die zentrale Bedeutung der Korpora in der Lexikographie könnte man vielleicht als Zeichen dafür sehen, dass ein Wörterbuch den Sprachgebrauch beschreibt. Diese Sichtweise hat allerdings mehrere Nachteile. Erstens sehen viele Wörterbuchbenutzer die reine Beschreibung des Sprachgebrauchs nicht als die Aufgabe eines guten Wörterbuchs. Dies wird z.B. von der Kontroverse über die dritte Auflage des Webster-Wörterbuchs für Englisch belegt (vgl. Morton 1994). Zweitens ist die Abgrenzung des Sprachgebrauchs, der als Input für ein Wörterbuch dienen sollte, nicht ohne Weiteres vorgegeben, sondern erfordert dauernd Entscheidungen, was als „richtiges“ Deutsch, Englisch usw. akzeptiert wird. Diese Abgrenzung bezieht sich nicht nur auf Fehler, sondern auch auf Kontraste zwischen Dialekt und Standard, höheren und niedrigeren Sprachebenen, Akzeptanz von Lehnwörtern usw. Die meisten Wörterbuchbenutzer würden wahrscheinlich erwarten, dass ein Wörterbuch die „richtige“ Form der Sprache beschreibt, d.h. den Standard. Ein solcher Standard ist aber kein empirisches Objekt, sondern eine Norm, die von bestimmten Leuten festgelegt wird. Deshalb ist ein rein deskriptiver Ansatz nicht mit der Beschreibung einer Norm vereinbar. Die Idee des Wörterbuchs als Beschreibung des Vokabulars einer Sprache scheitert somit an der Unmöglichkeit, eine Form der Sprache zu bestimmen, deren Vokabular gleichzeitig beschreibend betrachtet werden kann und sich als Objekt der Beschreibung in einem Wörterbuch eignet. 2.2 Das Wörterbuch als Hilfsmittel Da sich keine widerspruchsfreie deskriptive Interpretation des Wörterbuchs finden lässt, wird in ten Hacken (2009a) vorgeschlagen, ein Wörterbuch als Hilfsmittel zur Problemlösung zu betrachten. Eine ähnliche Sicht ergibt sich aus der Arbeit von Henning Bergenholtz, z.B. Bergenholtz/ Bergenholtz (2011). In einer von der mentalistischen Sicht auf Sprache inspirierten Darstellung des Wörterbuchgebrauchs ist der Ort, wo lexikalische Probleme formuliert und gelöst werden, das Gehirn bzw. der Geist der Benutzer. Wie von Jackendoff (1983) dargestellt, hat jeder Mensch (wie auch andere Lebewesen) eine Vorstellung der Welt (‘projected world’) im Geist, die auf der Interpretation des sinnlichen Inputs basiert. Diese Vorstellung bildet das Wissen um unsere Umwelt sowie die Basis der Gedanken und der Kommunikation. Sie ist als Teil des Geistes notwendigerweise persönlich. Deshalb besteht die (erfolgreiche) Kommunikation darin, dass eine Person (A) einer anderen (B) die Informationen vermittelt, die es B erlauben, ihre Vorstellung der Welt in einer Weise anzupassen, die A gemeint hat. Pius ten Hacken 162 Eine wesentliche Erkenntnis über Wörterbuchgebrauch in diesem Modell ist, dass das Wörterbuch nicht die Bedeutung, Flexion usw. eines Wortes enthält, sondern nur Informationen zu einem Wort bereitstellt, die von den Benutzern interpretiert werden müssen. Diese Interpretation geschieht in Hinblick auf die in der Vorstellung vorhandenen Informationen über die Welt und auf das Problem, wofür das Wörterbuch konsultiert wird. Ein Beispiel eines solchen Prozesses könnte sich auf (1) beziehen. 1 (1) Dieser Rhythmus veranlasste Richard Wagner, die Sinfonie als „Apotheose des Tanzes“ zu bezeichnen. Eine Leserin von (1), nennen wir sie Anna, hat ein Verständnisproblem. In einem ersten Schritt gelingt es ihr, dieses Problem mit dem Wort Apotheose zu verbinden. Dieser Schritt ist essenziell, damit das Problem in der Wirkungsdomäne eines Wörterbuchs liegt, aber er wird in keinerlei Weise von (1) bedingt. Es gehört zu Annas Verarbeitungsprozess von (1) und kann als Teil der Lösung des Verständnisproblems gesehen werden. Als Nächstes kann Anna das Wort Apotheose im Wörterbuch nachschlagen. Sie weiß, dass es ihr um die Bedeutung dieses Wortes geht, und findet Folgendes dazu: 2 1. a. (bildungssprachlich) Erhebung eines Menschen zum Gott; Vergöttlichung eines Menschen: die Apotheose Napoleons b. (bildungssprachlich) Verherrlichung, Verklärung: die Apotheose der modernen Naturwissenschaft c. (bildungssprachlich, Kunst) Darstellung einer Apotheose (1a) 2. (Theater) wirkungsvolles [verherrlichendes] Schlussbild eines Bühnenstücks Die zentrale Annahme ist jetzt, dass dieser Wörterbucheintrag nicht „die Bedeutung von Apotheose“ enthält, sondern Informationen, die Anna benutzen kann, um ihr Problem mit (1) zu lösen. Ein erster Schritt ist die Auswahl der passendsten Bedeutung. Anna könnte zum Beispiel das Thema des Textes, in dem (1) vorkommt, benutzen, um 1c und 2 auszuschließen. Die Kombination von Apotheose mit Tanz in (1) legt eine Bedeutung wie 1a nicht nahe. Deshalb scheint die beste Vorgehensweise, zu versuchen, 1b zu benutzen, um (1) zu verstehen. Der Erfolg einer Interpretation hängt natürlich stark von Annas Vorkenntnissen ab. 1 Quelle: 7. Sinfonie (Beethoven). In: Wikipedia, http: / / de.wikipedia.org/ wiki/ 7._Sinfonie_(Beethoven) (Stand: 12/ 2011). 2 Dieser Eintrag ist die Information unter Bedeutung im Duden-Online-Wörterbuch, http: / / www.duden.de/ rechtschreibung/ Apotheose (Stand: 12/ 2012). Wortbildung in elektronischen Lernerwörterbüchern 163 Wenn ein solches Szenario die Betrachtung des Wörterbuchs bestimmt, ergibt sich daraus eine Reihe von Folgerungen, die sich zum Teil nicht mit der typischen lexikographischen Betrachtungsweise decken. Erstens ist ein gutes Wörterbuch nicht eines, das die (deutsche) Sprache beschreibt, sondern eines, das die Probleme der Benutzer löst. Deshalb können Lexikographen sich nicht darauf beschränken, das Wörterbuch in seinem Verhältnis zur (deutschen) Sprache zu sehen, sondern müssen sich bei der Erstellung von der Erwartung leiten lassen, welche Probleme auftreten werden und welche Informationen zur Lösung dieser Probleme beitragen. Das Korpus sollte deshalb auch nicht als eine absolute Autorität zur Sprache gesehen werden, sondern als eine Informationsquelle für Lexikographen. Die im Korpus enthaltenen Informationen zum Sprachgebrauch können als Inspirationsquelle einerseits für die möglichen Fragen, andererseits für die Formulierung des Wörterbuchartikels dienen. 2.3 Lernerwörterbücher Der Unterschied zwischen allgemeinen Wörterbüchern und Lernerwörterbüchern findet sich primär im Zielpublikum. Die Benutzer eines Lernerwörterbuch sind Leute, die die Sprache des Wörterbuchs als Zweitsprache lernen. Die Sprachkompetenz in einer Zweitsprache wird ‘Interimsprache’ (engl. interlanguage) genannt. Selinker (1992) gibt eine Übersicht der Entwicklungen, die zur Erkenntnis geführt haben, dass diese Interimsprache als Teil des Sprachmoduls (engl. competence) im Gehirn der Lernenden betrachtet werden sollte. Die Aussage, dass Lernende einer Zweitsprache (z.B. Deutsch) eine niedrigere Ebene der Sprachkompetenz haben als Muttersprachler der gleichen Sprache, kann somit folgendermaßen paraphrasiert werden: Die Sprachnorm (z.B. für Deutsch) ist auf der Basis der Sprachkompetenz einer ausgewählten Gruppe Muttersprachler festgelegt. Die Interimsprache kann in der gleichen Weise mit der Sprachnorm verglichen werden wie die muttersprachliche Sprachkompetenz, aber die Interimsprache weist im Allgemeinen größere Unterschiede zur Norm auf. Da eine Interimsprache kein grundsätzlich anderes Phänomen ist als eine muttersprachliche Sprachkompetenz, ist es sehr wohl vorstellbar, dass es einen fließenden Übergang zwischen den beiden gibt. Wenn wir uns auf den Wortschatz beschränken, so ist dieser Übergang leicht wahrnehmbar. Ein Franzose, nennen wir ihn Bernard, der seit langer Zeit als Professor an einer deutschen Hochschule arbeitet, hat wahrscheinlich einen Wortschatz, der sich in Umfang und Korrespondenz zur Norm kaum von dem einer Muttersprachlerin wie Pius ten Hacken 164 Anna unterscheiden lässt, und wenn dies trotzdem der Fall wäre, kann man das nicht primär aus dem Unterschied zwischen Lerner und Muttersprachlerin erklären, sondern eher aus den Umständen, in denen Anna und Bernard leben. Lernerwörterbücher richten sich aber nicht an Lernende wie Bernard, sondern an solche, die gerade das Sprachniveau erreicht haben, das es ihnen erlaubt, ein einsprachiges Wörterbuch zu benutzen. Ein wesentlicher Unterschied zwischen Lernenden, die zum Zielpublikum eines Lernerwörterbuchs gehören, und Muttersprachlern, die ein allgemeines Wörterbuch benutzen, ist, dass die Lernenden neben dem allgemeinen Ziel, im Wörterbuch Informationen zu finden, mit denen sie ihre Probleme lösen können, auch Hilfe beim weiteren Spracherwerb erwarten. Ein Lernerwörterbuch ist nicht nur eine Informationsquelle über den Wortschatz, sondern auch ein Lehrmittel zur gezielten Erweiterung des Wortschatzes. Bei der Erstellung eines Lernerwörterbuchs sollten somit zwei Eigenschaften des Zielpublikums berücksichtigt werden, die in der Erstellung eines allgemeinen Wörterbuchs keine Rolle spielen. Erstens ist der Wortschatz des Zielpublikums kleiner, zweitens ist neben der allgemeinen Problemlösung auch die Erweiterung des Wortschatzes ein Ziel der Benutzer. Der ersten Eigenschaft kann mit speziellen Definitionen Rechnung getragen werden. Zwei Ansätze, die dieses Ziel verfolgen, sind die Beschränkung des Definitionsvokabulars, wie z.B. im LDOCE (1978), und die Idee, ganze Sätze als Definition zu benutzen, wie z.B. von Hanks (1987) erklärt. Die zweite Eigenschaft bedingt ein grundsätzliches Umdenken in der Gestaltung des Wörterbuchs. Ein Lernerwörterbuch sollte nicht nur Informationen geben, die die Benutzer suchen, sondern auch solche, die unabhängig von einem bestimmten Problem nützlich sind. Idealerweise sollte das Wörterbuch nicht nur das anbieten, was gesucht wird, sondern auch das, wovon die Benutzer gar nicht wissen, dass sie es brauchen. Ich werde diese beiden Perspektiven hier als die der Lernenden und die der Lehrenden bezeichnen. 2.4 Elektronische Wörterbücher Während Lernerwörterbücher sich von allgemeinen Wörterbüchern in ihrem Zielpublikum unterscheiden, werden elektronische Wörterbücher nur durch die Weise, wie sie verfügbar sind, charakterisiert. Sie unterscheiden sich also nicht von allgemeinen, sondern von Papierwörterbüchern. Interessanterweise ist eines der ersten Wörterbücher, dessen elektronische Version breit erforscht wurde, ein Lernerwörterbuch, LDOCE (1978). Wie die Übersicht von Boguraev/ Briscoe (Hg.) (1989) bezeugt, wurde zunächst die Benutzung in der Wortbildung in elektronischen Lernerwörterbüchern 165 Computerlinguistik als bevorzugtes Arbeitsgebiet betrachtet. Inzwischen ist es weitgehend üblich, dass in Buchform publizierte Wörterbücher mit einer CD-ROM versehen sind, die von den (menschlichen) Benutzern am Computer benutzt werden kann. Außerdem sind viele Wörterbücher mit oder ohne Bezahlung im Internet zugänglich. Wegen der breiten Erfahrung mit elektronischen Wörterbüchern ist die Einsicht, dass die Vorteile der elektronischen Darstellung nur dann voll zutage treten, wenn die Struktur der Darstellung dem elektronischen Medium gerecht wird, jetzt Gemeingut (vgl. van Sterkenburg 2003a, S. 5f.). Viele Beiträge in Boguraev/ Briscoe (Hg.) (1989) beschreiben die mühselige Aufarbeitung dessen, was ursprünglich nur zum Drucken gemeint war, für die elektronische Form. Inzwischen werden viele Wörterbücher zunächst als lexikalische Datenbanken konzipiert, und die gedruckte Form ist nur ein Derivat. Die neuen Möglichkeiten bestehen nicht nur in der Form neuer Suchmechanismen, wie van Sterkenburg (2003b) sie für eine onomasiologische Suche beschreibt, sondern auch im fast unbeschränkten Platz, wie von de Caluwe/ Taeldeman (2003) als Argument für die Aufnahme regelmäßiger Wortbildungen erwähnt. Bei den Lernerwörterbüchern nehmen die Benutzer, wie Nesi (1999) erwähnt, vor allem die schnelle Suche wahr. Die Einsicht, dass nur die Kombination der kreativen Exploration der Möglichkeiten mit der Berücksichtigung des Bedarfs zu einem Produkt führt, das das gedruckte Wörterbuch an Benutzerfreundlichkeit übersteigt, bleibt aber weiterhin wichtig. 3. Wortbildung Die Wortbildung ist ein Bereich, wofür in Lernerwörterbüchern eine klar unterschiedliche Behandlung erforderlich ist als in allgemeinen Wörterbüchern. Um dies zu erklären, werde ich hier zunächst einige allgemeine Betrachtungen zur Funktion der Wortbildung in der Sprache (Kap. 3.1) und im Lexikon (Kap. 3.2) formulieren. Dann werde ich kurz die daraus resultierende Sicht auf morphologische Produktivität darstellen (Kap. 3.3). 3.1 Die Bildung neuer Wörter Die Wortbildung ist ein regelbasierter Mechanismus zur Erweiterung des Wortschatzes. Von einem Wortbildungsprodukt wie unweit können die Form, die syntaktischen Eigenschaften sowie die Bedeutung weitgehend aus den entsprechenden Eigenschaften des Wortstamms weit und der Präfigierungsre- Pius ten Hacken 166 gel, die unanhängt, abgeleitet werden. Allerdings kann die Bedeutung nicht immer vollständig auf der Basis der Form vorhergesagt werden. Die Beziehung zu Arzt ist in Augenarzt und Hausarzt nicht dieselbe. Ebenso lässt sich der Unterschied zwischen der Bedeutung des Suffixes -er in Bezug auf eine Maschine (z.B. Anrufbeantworter) oder eine Person (z.B. Fußballspieler) nicht aus der Form ableiten. Wie in ten Hacken (2010) ausführlicher dargestellt, wäre es deshalb nicht richtig, die Wortbildung als regelbedingt (engl. rule-driven) zu bezeichnen, wie es die Syntax ist. Während die Beziehungen zwischen Form und Bedeutung eine verwirrende Vielfalt aufweisen, wenn wir sie aus der Sicht der Form betrachten, klärt sich die Lage merklich, wenn wir die Wortbildung als Lösung eines Benennungsproblems sehen. In dieser Perspektive ist der Ausgangspunkt ein Konzept, das noch keinen Namen hat. Eine Sprecherin, die das Konzept bezeichnen möchte, versucht einen Namen zu benutzen, der von ihren Zuhörern verstanden wird. Der Grund, wieso Anrufbeantworter ein Gerät und nicht eine Person bezeichnet, ist, dass für dieses Gerät ein Name gesucht wurde. In ähnlicher Weise ist die Bildung von Hausarzt zunächst die Lösung eines Benennungsproblems. Bei der Bildung spielt die Existenz einer Reihe von Wörtern vom Typ X-arzt, wo X ein Organ oder einen Körperbereich bezeichnet, keine direkte Rolle. Im Falle von unweit ist interessant, dass es nicht das übliche Antonym von weit ist. Da dafür schon nahe existierte, konnte unweit nur aus dem Bedarf entstehen, ein neues Konzept, das sich von nahe unterscheidet, zu benennen. Bei der Benennung neuer Konzepte stehen Sprechern außer der Wortbildung auch andere Mechanismen zur Verfügung: einerseits die Bedeutungserweiterung existierender Wörter, z.B. durch metaphorische oder metonymische Prozesse, andererseits die Entlehnung, entweder direkt, z.B. Computer im Deutschen, oder als Lehnübersetzung, z.B. Rechner für das gleiche Gerät. Man könnte diese Prozesse als Konkurrenten der Wortbildung betrachten, aber Konkurrenz impliziert eine Absicht, die man der Wortbildung nicht zudichten sollte. Nur Sprecher und Hörer haben Absichten, nicht Prozesse wie Wortbildung. 3.2 Wortbildung und die Struktur des Lexikons Unter ‘Lexikon’ verstehe ich hier den Teil der Sprachkompetenz eines Sprechers bzw. einer Sprecherin, der sich auf den Wortschatz bezieht. Eine Sprecherin des Deutschen als Muttersprache, nennen wir sie Claudia, hat ein Lexikon, das es ihr (zusammen mit Syntax- und anderen Regeln) ermöglicht, Deutsch zu reden und zu verstehen. Die Hauptfunktion der Wortbildungsre- Wortbildung in elektronischen Lernerwörterbüchern 167 geln, wie wir sie oben gesehen haben, ist die Bildung von neuen Benennungen zur Bezeichnung neuer Konzepte. Claudia wird aber in ihrem Leben nur relativ selten grundsätzlich neue Konzepte bilden. Wenn wir den Wortschatz einer Sprache wie Deutsch auf einige Hunderttausend Wörter und die Zahl der Deutschsprechenden auf ungefähr 100 Millionen schätzen, wäre es ein großer Zufall, wenn Claudia überhaupt ein einziges neues Wort in ihrem Leben bilden würde. Dieses Bild bedarf aber einer Korrektur, denn es beruht auf einer Kombination von Zahlen, die nicht miteinander vergleichbar sind. Der Wortschatz einer Sprache wie Deutsch ist eine Konstruktion, die von der Kompetenz ausgewählter Sprecher abgeleitet werden kann, aber nur indem jedes Mal separat beschlossen wird, ob ein bestimmtes Wort bzw. eine bestimmte Bedeutung eines Wortes zur deutschen Sprache gehört. Der Wortschatz ist keine empirische Entität, sondern das Resultat einer Reihe von Klassifikationsentscheidungen. Das Lexikon von Claudia hingegen ist Teil ihrer Sprachkompetenz und somit eine wirklich bestehende, empirische Entität. Die Anwendung einer Wortbildungsregel kommt jedes Mal zum Zuge, wenn Claudia die Regel braucht, um ein entsprechendes neues Wort zu ihrem Lexikon hinzuzufügen, sei es, weil sie ein Konzept benennen möchte, für welches es in ihrem Lexikon noch kein Wort gibt, sei es, weil sie ein entsprechendes Wort hört, das neu für sie ist. Dies ist weit häufiger als der schlecht definierte Vorgang der Bildung eines neuen Wortes im Wortschatz des Deutschen. Neben der Anwendung der Wortbildungsregeln zur Erweiterung des Lexikons spielen die Regeln auch eine wichtige Rolle in der Strukturierung desselben. Es wäre kaum vorstellbar, dass das Lexikon als eine alphabetisch geordnete Liste gestaltet ist. Wenn das der Fall wäre, wäre es leichter, das nächste Wort im Alphabet hervorzurufen, als eines, das semantisch oder phonologisch ähnlich ist. Viel wahrscheinlicher ist es, dass Wörter im Lexikon miteinander in vielen unterschiedlichen Weisen verbunden sind, darunter auch durch Wortbildungsregeln. Für einen Lerner des Deutschen als Fremdsprache, nennen wir ihn David, ist die Wortbildung womöglich noch wichtiger als für Claudia. Während der Lexikonerwerb für Claudia recht anstrengungsfrei vor sich geht, ist er für David ein wichtiger Teil des Zweitsprachenerwerbs. Mit seinem kleineren Lexikon braucht er häufiger Wörter, die nicht im Lexikon vorhanden sind, sowohl aktiv als passiv. Beim Sprechen und Schreiben kann David sich oft mit einer Paraphrase retten, aber beim Zuhören und Lesen sind die Wörter einfach vorgegeben. Außerdem ist die Strukturierung des Lexikons für David viel wichtiger als Mittel, um die verstandenen Wörter im Lexikon verfügbar zu halten und neue Wörter nicht gleich wieder zu vergessen. Pius ten Hacken 168 3.3 Produktivität Ein wichtiger Grund, weshalb Wortbildungsregeln im Zweitspracherwerb relevant sind, ist ihre Produktivität. Das Konzept der Produktivität wird allerdings sehr unterschiedlich verstanden. Einerseits gibt es eine Strömung in der Linguistik, die die Produktivität als eine binäre Eigenschaft betrachtet, z.B. Schultink (1961). Andererseits ist die Auffassung verbreitet, Produktivität sei grundsätzlich graduell, wie z.B. von Baayen (1992) vertreten. Der Vorteil von Corbins (1987) Analyse der Produktivität ist, dass beide Auffassungen gleichermaßen berücksichtigt werden und die Beziehung zwischen ihnen klargestellt wird. Corbin (1987, S. 176-78) unterscheidet drei Konzepte, die gemeinsam der Produktivität entsprechen, régularité (‘Regelmäßigkeit’), disponibilité (‘Verfügbarkeit’) und rentabilité (‘Rentabilität’). Regelmäßigkeit ist eine Eigenschaft, die im Prinzip jede Regel hat. Im Bereich der Wortbildung kann nur eine bestimmte Bildung unregelmäßig sein, nicht die Regel, die sie bildet. Allerdings hat die Existenz eines unregelmäßigen Resultats einer Wortbildungsregel einen negativen Effekt auf die Vorhersehbarkeit der Form und Bedeutung weiterer Bildungen mit dieser Regel. Aronoff (1976, S. 40-43) zeigt auf, wie z.B. die englische Nominalisierungsregel mit dem Suffix -ity weniger produktiv ist nach -ulous als nach -acious, weil im letzten Fall die Form eindeutig ist (z.B. audacity), während es für den ersten zwei mögliche Resultate gibt (vgl. credulity und fabulosity). Das Konzept der Rentabilität stimmt ziemlich genau mit Baayens (1992) Konzept der Produktivität überein. Es geht hier um die quantifizierbare Größe, die die Häufigkeit von neuen Bildungen aufgrund der betreffenden Regel ausdrückt. Das Problem mit der Definition dieser Größe ist, dass berücksichtigt werden sollte, wie groß der mögliche Anwendungsbereich einer bestimmten Regel ist. Da Deutsch mehr Nomina als Verben hat, gibt es mehr Möglichkeiten, eine Regel anzuwenden, die Verben aus Nomina bildet, als eine, die Nomina aus Verben bildet. Die Frage dabei ist, wie diese Erkenntnis im Ausdruck der Größe der Rentabilität quantifiziert wird. Das Konzept der Verfügbarkeit schließlich drückt aus, ob eine Regel überhaupt für die Bildung von neuen Wörtern angewandt werden kann. Es handelt sich hier um ein binäres Konzept, aber nicht das von Schultink (1961), der nur Regeln, die ohne bewusste Absicht angewandt werden, als produktiv bezeichnet. Wortbildung in elektronischen Lernerwörterbüchern 169 Corbin (1987, S. 177) benutzt ihre Analyse der Produktivität als Begründung, wieso sie sich nur mit der Verfügbarkeit beschäftigt. Nur die Verfügbarkeit ist eine Eigenschaft der Sprachkompetenz, und die Verfügbarkeit einer Regel ist eine logische Voraussetzung für die Betrachtung ihrer Rentabilität und der Regelmäßigkeit ihrer Wortbildungsresultate. Ich glaube aber, dass die Regelmäßigkeit und die Rentabilität zwar der Verfügbarkeit untergeordnet sind, gleichzeitig aber auch für das Verständnis der Wortbildung nützliche Konzepte darstellen, wie ich weiter unten nachzuweisen versuchen werde. 4. Darstellung der Wortbildung in Lernerwörterbüchern Nachdem wir in den bisherigen Abschnitten Überlegungen zum Zweitspracherwerb, zum (elektronischen) Wörterbuch und zur Wortbildung formuliert haben, können wir uns jetzt der Kombination dieser Themen zuwenden, die die Behandlung der Wortbildung in elektronischen Lernerwörterbüchern erfordert. 4.1 Bedeutung der Wortbildung im Zweitspracherwerb Ein Lernerwörterbuch ist ein Wörterbuch, das den Zweitspracherwerb unterstützt. Die Benutzer eines solchen Wörterbuchs haben eine Interimsprachkompetenz, mit der sie ein einsprachiges Wörterbuch benutzen können, aber keine, die ihre Bedürfnisse denen von Muttersprachlern angleicht. Im Bereich der Wortbildung werden die Bedürfnisse vom Niveau der Interimsprachkompetenz bedingt. In Kapitel 3.2 haben wir David als Deutschlerner kennengelernt. Seine Benutzung der deutschen Wortbildungsregeln kann sich auf drei unterschiedliche Perspektiven beziehen. Erstens kann er die Regeln als Generalisierungen über ihm bekannte Wörter betrachten. Oft ist diese Perspektive nur unbewusst oder halbbewusst vorhanden, sodass es einen Trigger braucht, um die Existenz dieser Generalisierungen bewusst zu machen. Die Generalisierungen spielen eine wichtige Rolle im Aufbau des Lexikons als Teil der Interimsprachkompetenz und in der Aktivierung der richtigen Einträge dieses Lexikons im Sprachgebrauch. Eine zweite Perspektive ist die der Regeln als Mittel zur Erweiterung des Lexikons. Wie oben erklärt, geht es dabei nicht um die Bildung neuer Wörter als Teil des deutschen Wortschatzes, sondern um die Bildung neuer Wörter im Lexikon, das David als Teil seiner Interimsprachkompetenz des Deutschen hat. Da David als Lerner ein relativ kleines Lexikon hat, wird er ziemlich häufig Pius ten Hacken 170 diese Perspektive der Wortbildungsregeln brauchen, um Texte und gesprochene Sprache zu verstehen. Sie ist am wirkungsvollsten bei geschriebener Sprache, wo er das Rezeptionstempo bestimmen kann. Inwiefern David die Wortbildungsregeln auch im aktiven Sprachgebrauch anwendet, hängt stark von seiner Persönlichkeit ab, daneben auch vom Stand seiner Interimsprachkompetenz und von der kommunikativen Situation. Diese sog. Neubildungsperspektive ist den Lernern meist viel bewusster als die der Generalisierungen, aber das impliziert keineswegs, dass sie die Regeln explizit formulieren könnten. Schließlich gibt es die Perspektive der explizit formulierten Wortbildungsregel. Für Muttersprachler spielt diese Perspektive kaum eine Rolle, außer sie beschäftigen sich mit morphologischer Forschung. Für den Spracherwerb ist die explizite Formulierung aber durchaus nützlich, um die Entwicklung der Generalisierungs- und Neubildungsperspektiven zu beschleunigen und die richtige Anwendung zu unterstützen. 4.2 Darstellung der Wortbildung Für die Besprechung der Darstellung der Wortbildung können wir als Beispiele die deadjektivischen Nominalbildungen Finsternis und Flüssigkeit nehmen. Ein erster Informationstyp, den wir für diese Wörter festhalten können, ist, wie sie gebildet sind. Für Finsternis heißt das, dass das Wort als Bildung von finster mit dem Suffix -nis ausgewiesen wird. Diese Informationen sind häufig schon im Wörterbuch vorhanden, 3 obwohl es oft den Benutzern überlassen wird, die implizite Beziehung explizit zu machen. In einem elektronischen Wörterbuch besteht aber kein Grund, in dieser Weise Platz zu sparen. Außerdem sollte ein Hyperlink eingefügt werden, der gleich zum Eintrag für finster führt. Diese Information ist wichtig, um das Wort Finsternis optimal im Lexikon der Interimsprachkompetenz einzubinden. In dieser Hinsicht verhält sich Flüssigkeit ähnlich wie Finsternis. Ein zweiter Informationstyp ist die Klasse der Wörter, die in gleicher Weise gebildet wurden. Es gibt mehrere Dimensionen der Gleichheit, die dabei als Ausgangspunkt dienen können. Finsternis gehört zur Klasse der Wörter, die mit -nis gebildet werden, ein Adjektiv als Basis haben (im Gegensatz z.B. zu Erkenntnis) und weiblich sind (im Gegensatz z.B. zu Geheimnis). Das Wort gehört auch zur Klasse der Wörter, die finster als Basis haben. Außerdem könnte man alle deadjektivischen Nominalbildungen als eine Klasse betrach- 3 Einen Überblick über die Praxis der Wortbildungsangaben in gedruckten wie elektronischen Wörterbüchern findet sich im Beitrag „Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit“ von Sabina Ulsamer in diesem Band. Wortbildung in elektronischen Lernerwörterbüchern 171 ten, die in dem Fall auch Flüssigkeit einschließt. Diese Information ist selten im Wörterbuch auffindbar, ist aber besonders wichtig, um eine gute Einschätzung der Wortbildungsregeln herbeizuführen. Die Suffigierung mit -nis produziert weibliche und sächliche Ableitungen von Adjektiven, aber Canoo.net (2011) gibt nur je 11 davon. Für die Suffigierung mit -keit hingegen gibt Canoo.net (2011) 1 888 Beispiele. Die Canoo.net (2011) unterliegenden Datenbanken sind im Word Manager-System, beschrieben von ten Hacken (2009b), erfasst worden. Es ist natürlich eine weitere Frage, wie die für ein Lernerwörterbuch relevanten Informationen zu diesen Suffigierungsregeln optimal ausgewählt und dargestellt werden sollten. Ein dritter Informationstyp ist die explizite Formulierung von Wortbildungsregeln. Hier geht es darum, Informationen zu den Suffixen zu geben, die häufig in Wörterbüchern als eigene Einträge aufgeführt werden. So findet man -keit (aber nicht -nis) als Eintrag in Wahrig (1997). Der Unterschied zum zweiten Informationstyp besteht darin, dass dort die Regel im Prinzip implizit bleibt und nur von den Benutzern auf der Basis der Beispiele in ihrem Lexikon erstellt wird. Es wäre aber sinnvoll, die Informationen des zweiten und dritten Typs in einem Lernerwörterbuch so zusammenzubringen, dass falsche Generalisierungen vermieden und richtige gefördert werden. Der Eintrag für -keit in Wahrig (1997) gibt eine genaue Regel, wann -keit statt -heit gebraucht wird. Für ein Lernerwörterbuch wäre es aber auch wünschenswert, -nis zu behandeln, mit der Absicht, das Fehlen einer klaren Regel zu erklären. Es ist interessant festzustellen, wie die drei Informationstypen sich zu den drei Arten der Produktivität, die Corbin (1987) unterscheidet, verhalten. Die Regelmäßigkeit ist zunächst eine Eigenschaft einzelner Bildungen, wie sie im ersten Informationstyp erfasst werden. Die Rentabilität wird am leichtesten wahrgenommen, wenn Regeln als Klassen dargestellt werden, wie im zweiten Informationstyp, denn die Klassengröße gibt über die Rentabilität Aufschluss. Die Verfügbarkeit ist eine absolute Eigenschaft einer Regel, die am deutlichsten im dritten Informationstyp hervortritt. Allerdings geben die Klassengrößen auch interessante Auskünfte über die Regelmäßigkeit. Es ist durchaus plausibel, dass die geringe Klassengröße der Bildungen mit -nis in einer Weise mit der Unvorhersehbarkeit des Wortgeschlechts zusammenhängt, die vergleichbar ist mit dem in Kapitel 3.3 erwähnten Beispiel von -ity. Pius ten Hacken 172 5. Schlussfolgerungen Zum Schluss möchte ich hier die aus dem Vorangegangenen hervorgehenden Erkenntnisse zur Wortbildung in Lernerwörterbuchern kurz zusammenfassen. Wie in Kapitel 2 argumentiert, sind Wörterbücher nicht als Sprachbeschreibung zu betrachten, sondern als Mittel, die die Benutzer brauchen, um Sprachprobleme zu lösen. Die Wörterbücher stellen dazu Informationen bereit, die die Benutzer interpretieren müssen, um die spezifischen Probleme zu lösen. Im Falle von Lernerwörterbüchern sind die Probleme nicht nur einzelnen Wörtern zuzuordnen, sondern auch dem allgemeinen Spracherwerbsprozess. Lerner brauchen Informationen über die Wortbildung (größtenteils unbewusst) als Unterstützung der Lexikonbildung. Deshalb ist die Darstellung der Wortbildung in Lernerwörterbüchern noch wichtiger als in allgemeinen Wörterbüchern. Um die Wortbildung optimal verfügbar zu machen, sollte sie in drei Perspektiven präsentiert werden, erstens als Analyse einzelner Bildungen, zweitens als Klassen von ähnlichen Bildungen und drittens als explizite Regel. Die erste und dritte Perspektive sind auch in Papierwörterbüchern repräsentierbar, aber die zweite erfordert zu viel Platz. Im elektronischen Lernerwörterbuch spielt diese Platzbeschränkung keine Rolle. Wichtig ist aber eine gute Verbindung zwischen den Perspektiven mittels Hyperlinks. Zudem sollte die Darstellung größerer Mengen von Daten so gestaltet werden, dass die Benutzer nicht vom Überfluss der Informationen überwältigt werden. 6. Literaturverzeichnis 6.1 Wörterbücher Canoo.net - Deutsche Wörterbücher und Grammatik. Internet: http: / / www.canoo.net ( Stand: 12/ 2011). Duden Online. Internet: http: / / www.duden.de/ woerterbuch (Stand: 12/ 2012). LDOCE (1978): Dictionary of Contemporary English. Hrsg. von Paul Procter. Harlow. Wahrig, Gerhard (1997): Deutsches Wörterbuch. 6. Aufl. Hrsg. von Renate Wahrig- Burfeind. Gütersloh. 6.2 Forschungsliteratur Aronoff, Mark H. (1976): Word formation in generative grammar. Cambridge, MA. Atkins, B.T. Sue/ Rundell, Michael (2008): The Oxford guide to practical lexicography. Oxford. Wortbildung in elektronischen Lernerwörterbüchern 173 Baayen, Harald (1992): Quantitative aspects of morphological productivity. In: Booij, Geert/ van Marle, Jaap (Hg.): Yearbook of morphology 1991. Dordrecht, S. 109-149. Béjoint, Henri (2000): Modern lexicography: An introduction. Oxford. Bergenholtz, Henning/ Bergenholtz, Inger (2011): A dictionary is a tool, a good dictionary is a monofunctional tool. In: Fuertes-Olivera, Pedro/ Bergenholtz, Henning (Hg.): e-Lexicography: The internet, digital initiatives and lexicography. London, S. 187-207. Bogaards, Paul (1996): Dictionaries for learners of English. In: International Journal of Lexicography 9, S. 279-320. Boguraev, Bran/ Briscoe, Ted (Hg.) (1989): Computational lexicography for natural language processing. London. Chomsky, Noam (1965): Aspects of the theory of syntax. Cambridge, MA. Chomsky, Noam (1980): Rules and representations. New York. Chomsky, Noam (1981): Lectures on government and binding. Dordrecht. Chomsky, Noam (1999): On the nature, use, and acquisition of language. In: Ritchie, William C./ Bhatia, Tej K. (Hg.): Handbook of child language acquisition. San Diego, S. 33-54. Corbin, Danielle (1987): Morphologie dérivationnelle et structuration du lexique. Tübingen. Curtiss, Susan/ Fromkin, Victoria/ Krashen, Stephen/ Rigler, David/ Rigler, Marilyn (1974): The linguistic development of Genie. In: Language 50, S. 528-554. De Caluwe, Johan/ Taeldeman, Johan (2003): Morphology in dictionaries. In: van Sterkenburg (Hg.), S. 114-126. ten Hacken, Pius (2007): Chomskyan linguistics and its competitors. London. ten Hacken, Pius (2009a): What is a dictionary? A view from Chomskyan linguistics. In: International Journal of Lexicography 22, S. 399-421. ten Hacken, Pius (2009b): Word Manager. In: Mahlow, Cerstin/ Piotrowski, Michael (Hg.): State of the art in computational morphology. Berlin, S. 88-107. ten Hacken, Pius (2010): Synthetic and exocentric compounds in a parallel architecture. In: Linguistische Berichte, Sonderheft 17, S. 233-251. Hanks, Patrick (1987): Definitions and explanations. In: Sinclair, John M. (Hg.): Looking up. An account of the COBUILD project in lexical computing and the development of the Collins COBUILD English Language Dictionary. London/ Glasgow, S. 116-136. Hensch, Takao K. (2005): Critical period plasticity in local cortical circuits. In: Nature Reviews Neuroscience 6, S. 877-888. Jackendoff, Ray S. (1983): Semantics and cognition. Cambridge, MA. Pius ten Hacken 174 Mayberry, Rachel I. (1994): The importance of childhood to language acquisition: Evidence from American sign language. In: Goodman, Judith C./ Nusbaum, Howard C. (Hg.): The development of speech perception: The transition from speech sounds to spoken words. Cambridge, MA, S. 57-90. Morton, Herbert C. (1994): The story of Webster's third: Philip Gove's controversial dictionary and its critics. Cambridge. Nesi, Hilary (1999): A users' guide to electronic dictionaries for language users. In: International Journal of Lexicography 12, S. 55-66. Schultink, Henk (1961): Produktiviteit als morfologisch fenomeen. In: Forum der Letteren 2, S. 110-125. Selinker, Larry (1992): Rediscovering interlanguage. Harlow. van Sterkenburg, Piet (2003a): The dictionary: Definition and history. In: van Sterkenburg (Hg.), S. 3-17. van Sterkenburg, Piet (2003b): Onomasiological specifications and a concise history of onomasiological dictionaries. In: van Sterkenburg (Hg.), S. 127-143. van Sterkenburg, Piet (Hg.) (2003): A practical guide to lexicography. Amsterdam. Svensén, Bo (2009): A handbook of lexicography: The theory and practice of dictionary-making. Cambridge. Annette Klosa Wortbildung in elexiko: Gegenwart und Zukunft Beginnend mit der Vergangenheit, nämlich mit einem Rückblick auf die allgemeine Konzeption für die Wortbildungsangaben in elexiko, einem im Aufbau befindlichen Online-Wörterbuch zum Gegenwartsdeutschen, 1 soll in diesem Beitrag anhand einiger Beispiele aus elexiko-Wortartikeln gezeigt werden, wie die Angaben zur Gebildetheit der Stichwörter in elexiko gegenwärtig umgesetzt sind und wie die vorhandenen Recherchemöglichkeiten in diesem Bereich ausgebaut werden könnten. Anschließend wird erläutert, um welche anderen Angaben die Angabe zur Gebildetheit des Stichwortes zukünftig ergänzt werden kann, wobei dies auf die Frage der Lemmatisierung von Wortbildungselementen in elexiko beschränkt bleibt. 2 Zugleich stellen einige Beispiele mit Wortbildungsangaben aus anderen Online-Wörterbüchern eine Vergleichsbasis für elexiko dar. Insgesamt will der Beitrag anhand verschiedener Einblicke in die Praxis der Erarbeitung von Wortbildungsangaben in Online-Wörterbüchern dazu beitragen, sowohl Praxis wie Theorie solcher Angaben im elektronischen Wörterbuch zu diskutieren. 1. Zur Konzeption und Umsetzung der Wortbildungsangaben in elexiko Wortbildung stellt ein besonderes Beziehungsgeflecht zwischen Wörtern her, das in elexiko dargestellt werden soll. 3 Deshalb wird in elexiko unter der Überschrift „Wortbildung“ bei jedem Stichwort, das synchron als im Deutschen gebildet zu analysieren ist, die Bildungsweise (z.B. Derivat, Kompositum) angegeben. Simplizia, also Stichwörter, die nicht das Produkt von Wortbildung sind, werden in elexiko als solche markiert, online erscheinen dann einfach keine Wortbildungsangaben. 4 In (gedruckten) Wörterbüchern gibt es schon länger die Tradition, gebildete Wörter als solche erkennbar zu machen, wie der Passus „[zu ↑ Schranke]“ in Beispiel (1) illustriert: 1 Vgl. www.elexiko.de (Stand: 08/ 2011). Zur Konzeption von elexiko vgl. Haß (Hg.) (2005). Zur praktischen Umsetzung dieser Konzeption vgl. Klosa (Hg.) (2011). 2 Zur Angabe von Wortbildungsprodukten zu einzelnen Stichwörtern in elexiko vgl. den Beitrag „Chancen und Probleme bei der automatischen Ermittlung von Wortbildungsprodukten für elexiko und bei ihrer Präsentation“ von Sabina Ulsamer in diesem Band. 3 Vgl. hierzu und zum Folgenden Klosa (2005, S. 141ff.). 4 Wie die Nutzer von elexiko diese Angaben einschätzen und grundsätzlich die Wichtigkeit von Angaben zur Wortgebildetheit bewerten, wird im Beitrag „Die Wortbildungs- Annette Klosa 176 (1) ein|schrän|ken <sw. V.; hat> [zu ↑ Schranke]: 1. a) verringern, reduzieren; auf ein geringeres Maß herabsetzen: seine Ausgaben [auf das Notwendigste], den Zugverkehr e.; jmds. Macht, Rechte, ein Risiko e.; die TESTA ... musste ihre Produktion e. und Leute entlassen (Danella, Hotel 426) [...] (Duden 2001, S. 977) Allerdings zeigt das Beispiel einschränken, dass dabei „der Wortbildungsaspekt meist von etymologischen Ideen überlagert oder auf eine rein morphologische Auffassung reduziert worden“ (Holly 1986, S. 204) ist. Außerdem werden solche Angaben in vielen Wörterbüchern nur gelegentlich gemacht (vgl. auch Motsch 1982, S. 69), wie ein Blick auf eine mit einschränken vergleichbare Bildung, nämlich eindämmen, im Beispiel (2) zeigt, in dem ein Passus „[zu ↑ Damm]“ fehlt: (2) ein|däm|men <sw. V.; hat>: 1. (fließendes Wasser) durch Bauen eines Dammes in eine bestimmte Bahn, Richtung lenken od. stauen: einen Wildbach e. [...] (Duden 2001, S. 940) Solch unsystematische Angaben zur Wortgebildetheit sind häufig Realität (siehe auch Beispiele hierfür in Kap. 3.1), obwohl Wortbildung „einen Beitrag zur Durchsichtigkeit und Erschließbarkeit des Wortschatzes leisten“ (Holly 1986, S. 204) kann. Da im gedruckten Wörterbuch aus Platzgründen nicht alle Wortbildungsprodukte aufgenommen werden können, ist deshalb zu klären, „inwieweit durch die Angabe von Wortbildungselementen und Wortbildungsregeln [...] das Wörterbuch entlastet oder dem Benutzer eine Hilfestellung bei der Analyse und Synthese nicht aufgenommener Wortbildungen gegeben werden kann“ (Mugdan 1984, S. 238). Da im Online-Wörterbuch elexiko (theoretisch) kein Platzproblem herrscht, muss das Wörterbuch, insbesondere die Stichwortliste, nicht entlastet werden. Teil der elexiko-Stichwortliste sind deshalb auch durchsichtige Wortbildungsprodukte, sie werden aber in Abhängigkeit von ihrer Frequenz im elexiko-Korpus zumeist in einer anderen Bearbeitungstiefe beschrieben als Simplizia und lexikalisierte Bildungen. Derzeit (2012) wird daran gearbeitet, alle gebildeten Stichwörter mithilfe (teil-)automatischer Prozesse nach ihrer Wortbildung zu bestimmen. Neben der Angabe zur Gebildetheit eines Stichworts in elexiko wurde mitgeplant, dass unter der Überschrift „Wortbildungsproduktivität“ in den Wortartikeln verzeichnet werden soll, in welche anderen Wortbildungsprodukte das Stichwort eingegangen ist (vgl. Klosa 2005, S. 151ff.). Diese Aufgabe angaben im Onlinewörterbuch und wie Nutzer sie beurteilen - eine Umfrage zu elexiko“ von Antje Töpel in diesem Band erläutert. Wortbildung in elexiko: Gegenwart und Zukunft 177 wurde zwischenzeitlich an das Projekt „Benutzeradaptive Zugänge und Vernetzungen in elexiko“ übertragen, an der Erfassung von Wortbildungsprodukten für Stichwörter wurde hier inzwischen gearbeitet. 5 Ergänzend sollen zukünftig schließlich Wortbildungselemente des Gegenwartsdeutschen eigene lexikographische Artikel in elexiko erhalten (siehe Kap. 3). 6 2. Angaben zur Gebildetheit der Stichwörter in elexiko Angaben zur Gebildetheit des Stichwortes 7 erfolgen in elexiko entweder bezogen auf das Stichwort als Ganzes oder bei Bedarf lesartenbezogen (d.h. bezogen auf die Einzelbedeutungen). Grundsätzlich wird dabei nach vier Hauptkategorien unterschieden: Ableitung, Zusammensetzung, Kurzwortbildung und Präverbfügung. 8 In der elexiko-Artikelstruktur wird berücksichtigt, dass nicht alle Wortarten mithilfe von Wortbildung ausgebaut werden können. Nur bei den Wortarten, deren Bestand durch Wortbildung erweitert wird (z.B. Verben), werden in der elexiko-Wortartikelstruktur gebunden an die Markierung der Wortart des Stichworts die Wortbildungsarten genannt, die hier tatsächlich vorkommen können. Die Art der lexikographischen Beschreibung der Wortgebildetheit in elexiko wird im Folgenden anhand einiger Beispiele veranschaulicht. Das Beispiel Lehrerin in Abbildung 1 illustriert die Angaben zu einem Derivat. Wo dies möglich ist, wird auf das in eine Bildung eingehende Stichwort (hier Lehrer) verlinkt. Sollten zukünftig einmal Wortbildungsmittel wie im Beispiel das movierende Suffix -in in elexiko beschrieben sein, könnte auch auf diese Einträge verlinkt werden. 5 Zum Projekt „BZVelexiko - Benutzeradaptive Zugänge und Vernetzungen in elexiko“ vgl. http: / / www.ids-mannheim.de/ lexik/ BZVelexiko/ (Stand: 08/ 2011). Zu den Ergebnissen der Arbeit in diesem Projekt vgl. den Beitrag „Chancen und Probleme bei der automatischen Ermittlung von Wortbildungsprodukten für elexiko und bei ihrer Präsentation“ von Sabina Ulsamer in diesem Band. Vgl. auch Klosa (2011b, S. 165f.). 6 Vgl. hierzu auch die Forderungen an Wortbildungsangaben im Wörterbuch, wie sie Pius ten Hacken in seinem Beitrag „Wortbildung in elektronischen Lernerwörterbüchern“ in diesem Band erhebt. 7 Die Angaben zur Gebildetheit des Stichwortes in elexiko basieren auf der Darstellung der Wortbildung in grammis, dem Grammatischen Informationssystem des IDS (vgl. http: / / hypermedia.ids-mannheim.de/ grammis ) und auf der Wortbildungsdarstellung von Donalies (2002). Die hier beschriebenen Wortbildungsarten wurden für die Analyse und lexikographische Beschreibung der Wortbildung in den elexiko-Wortartikeln übernommen. 8 Zur Präverbfügung vgl. Donalies (1999). Annette Klosa 178 Abb. 1: Wortbildungsangaben zu einem Derivat wie Lehrerin in elexiko Bei Komposita (siehe Geheimdienst in Abb. 2) wird entsprechend auf beide in die Bildung eingehende Stichwörter verlinkt. An diesem Beispiel lässt sich auch erkennen, dass die Bildungsbestandteile nicht nur genannt, sondern auch nach ihrer Wortart bestimmt werden. Angegeben wird daneben die Wortbildungsart bzw. der Wortbildungstyp, im Beispiel Geheimdienst „endozentrisches Determinativkompositum“. Abb. 2: Wortbildungsangaben zu einem Kompositum wie Geheimdienst in elexiko Schließlich soll das Beispiel Prof in Abbildung 3 zeigen, warum die Wortbildungsangabe manchmal auch bezogen auf einzelne Lesarten, also Einzelbedeutungen, erfolgen muss. 9 Die Lesart ‘Person’ ist ein Kurzwort aus Professor, die Lesart ‘erfahrener Spieler’ dagegen ein Kurzwort aus Profispieler. Unter den lesartenübergreifenden Angaben auf der ersten Bildschirmseite 9 Zu weiteren Beispielen vgl. Klosa (2011a, S. 148). Wortbildung in elexiko: Gegenwart und Zukunft 179 zum Stichwort Prof wird deshalb darauf verwiesen, dass die Wortbildung bei den einzelnen Lesarten angegeben wird. In anderen Wörterbüchern würden in solch einem Fall vermutlich zwei homonyme Stichwörter Prof lemmatisiert. In elexiko werden aber auch semantisch als nicht verwandt einzustufende Lesarten unter einer Lemmazeichengestaltangabe (d.h. eigentlich unter ein und demselben Formativ) zusammengefasst (vgl. Haß 2005, S. 174f.). Abb. 3: Lesartenbezogene Wortbildungsangaben (hier in einer Zusammenschau) am Beispiel des Stichwortes Prof in elexiko Relativ häufig wird in den elexiko-Wortartikeln die Möglichkeit genutzt, die Gebildetheit des Stichwortes nicht zu analysieren, sondern zur Wortbildung als Ganzes einen Kommentar zu geben. 10 Dies wird dann gemacht, wenn nicht 10 Vgl. hierzu und zum Folgenden Klosa (2011a), S. 148f. Annette Klosa 180 wirklich zu erkennen ist, ob das Stichwort in synchroner Sicht als gebildet einzustufen ist. Solch ein Befund kann deshalb, wie in Abbildung 4 für das Stichwort Dienst gezeigt, in der Artikelstruktur festgehalten werden, ein Wörterbuchhinweis ergänzt die Information. Abb. 4: Kommentierung und Wörterbuchhinweis zur Wortbildung am Beispiel des Stichwortes Dienst in elexiko In elexiko werden Wortbildungsprodukte auch nach ihrer Wortbildungsbedeutung bestimmt, wobei dem Vorschlag im Grammatischen Informationssystem des IDS, grammis, folgend, nur einige besonders präsente Wortbildungsbedeutungen erfasst werden. 11 Dabei wird zwischen nominalen, adjektivischen und verbalen Wortbildungsprodukten und den dort auftretenden Wortbildungsbedeutungen unterschieden. In Tabelle 1 sind als Beispiel alle Möglichkeiten der Angabe der Wortbildungsbedeutung für die Nomina in der elexiko-Artikelstruktur aufgelistet; zugleich gibt die Tabelle darüber Aufschluss, wie viele elexiko-Stichwörter bzw. einzelne ihrer Lesarten bisher den verschiedenen Wortbildungsbedeutungen zugeordnet wurden. Insgesamt wurde bis Ende April 2011 für 493 Lesarten in lexikographisch bearbeiteten Nomen eine Wortbildungsangabe gemacht, die Zahl bislang bearbeiteter Nomen insgesamt lag zu diesem Zeitpunkt bei 881 Stichwörtern. Unter den Stichwörtern, denen keine der vorgesehenen Wortbildungsbedeutungen zugewiesen werden konnte, ist z.B. das Derivat Persönlichkeit. Online sind diese Angaben nicht zu sehen, da sie für ein allgemeinsprach- 11 Zu umfassenderen Darstellungen von Wortbildungsbedeutungen vgl. Motsch (1999) und Deutsche Wortbildung (1973-1992). Wortbildung in elexiko: Gegenwart und Zukunft 181 liches Wörterbuch wie elexiko wohl zu speziell und nur für einen eingeschränkten Kreis an linguistisch interessierten Nutzern wichtig wären. Denkbar wäre, zukünftig wenigstens Recherchen nach semantisch klassifizierbaren gegenüber nicht klassifizierbaren Wortbildungsprodukten und Recherchen nach Wortbildungsprodukten bestimmter semantischer Klassen zu ermöglichen. Wortbildungsbedeutungen Zahl der klassifizierten Lesarten Nomina Agentis (z.B. Arbeiter) 58 Nomina Patientis 0 Nomina Actionis (z.B. Aufforderung) 59 Nomina Acti (z.B. Anfrage) 82 Nomina Qualitatis (z.B. Mobilität) 13 Nomina Loci (z.B. Wohnung) 2 Nomina Instrumenti (z.B. Presse) 5 Diminutiva 0 Movierungen (z.B. Lehrerin) 12 Negation (z.B. Unglück) 1 Zugehörigkeit (z.B. Krankenhaus) 14 Kollektiv (z.B. Mannschaft) 3 Merkmal (z.B. Bauchmensch) 117 Substanz 0 Vergleich 0 Tab. 1: Wortbildungsbedeutungen der Nomina in elexiko (in lexikographisch bearbeiteten Wortartikeln) Das Angebot an erweiterten Suchen in elexiko könnte in Bezug auf Wortbildungsphänomene noch ausgebaut werden. Dem ursprünglichen Konzept für die Angaben zur Wortbildung in elexiko lag (wie auch für alle anderen Angaben) die Idee zugrunde, mithilfe der sehr granularen Auszeichnung der Angaben interessante Abfragemöglichkeiten zu eröffnen (vgl. Müller-Spitzer 2005 und Klosa/ Müller-Spitzer 2007). Beispielsweise kann auf dieser Grundlage derzeit in der erweiterten Suche von elexiko nach allen Stichwörtern eines bestimmten Wortbildungstyps gesucht werden. Zukünftig sollte auch die Beantwortung von solchen Anfragen möglich sein, bei denen mehrere Suchen hintereinander laufen müssen (z.B. zunächst die Suche nach allen Nomen, in dieser Teilmenge nach allen Derivaten, in dieser Teilmenge nach Suffixbildungen und schließlich in dieser Teilmenge nach solchen mit der Wort- Annette Klosa 182 bildungsbedeutung „moviert“). Die derzeit angebotenen Suchmöglichkeiten zur Wortbildung fragen dagegen jeweils nur ein inhaltliches Merkmal innerhalb einer bestimmten Wortart ab. Wie komplexere Abfragemöglichkeiten wie in Tabelle 2 zusammengefasst an der Benutzeroberfläche gestaltet werden könnten, ist allerdings noch zu diskutieren. Mögliche Suchanfrage Beispiele für mögliche Treffer unter den bearbeiteten Stichwörtern Welche nominalen Komposita mit verbalem Bestimmungswort gibt es? Abschiebegewahrsam Welche Nomenderivate sind mit dem Suffix -er gebildet? Amerikaner, Hersteller Welche Verben haben ein adjektivisches Präverb? feststellen, weißwaschen Welche Adjektivkomposita sind aus zwei Adjektiven zusammengesetzt? achtzehn, größtmöglich Welche negierten Adjektive gibt es? grenzenlos, illegal, unabhängig Welche Wortbildungsprodukte enthalten ein Konfix? Ökoterror In welchen Komposita tritt beim Bestimmungswort Vokalalternation auf? Hühnerkäfig, Städteatlas Tab. 2: Mögliche Suchanfragen nach Wortbildungsphänomenen in elexiko 3. Erste Überlegungen zur Lemmatisierung und Beschreibung von Wortbildungselementen in elexiko Als das Projekt elexiko gegründet wurde, war es als umfassendes lexikologischlexikographisches Informationssystem zur deutschen Gegenwartssprache geplant, in dem neben Einwortlemmata, also sozusagen „normalen“ Wörtern wie Kind, rufen, schön, und Mehrwortlemmata wie z.B. blind wie ein Maulwurf, das Rad neu erfinden auch so genannte Wortelementlemmata erfasst werden sollten. Der Gedanke, dass ein umfassendes lexikographisches Online-Nachschlagewerk zu solch unterschiedlichen Arten von Stichwörtern Informationen bieten sollte, hat sich in einer der Benutzungsstudien zu elexiko bestätigt. 12 Tatsächlich erwarteten etwa gleich viele der Probanden in dieser Studie zu elexiko als Stichwörter sowohl „normale“ Wörter wie Wortverbindungen und Wortbildungselemente. 12 Vgl. hierzu genauer den Beitrag „Die Wortbildungsangaben im Onlinewörterbuch und wie Nutzer sie beurteilen - eine Umfrage zu elexiko“ von Antje Töpel in diesem Band. Wortbildung in elexiko: Gegenwart und Zukunft 183 3.1 Metalexikographische Vorschläge zur Behandlung von Wortbildungselementen und einige Beispiele Mit der lexikographischen Behandlung von Wortbildungsmitteln kann elexiko also die Erwartungen der Benutzer erfüllen, aber auch den Forderungen der Wörterbuchforschung nachkommen und eine in vielen gegenwartssprachlichen Wörterbüchern verbreitete Tradition fortsetzen. 13 Für die Lemmatisierung von Wortbildungselementen in einem Wörterbuch können folgende Auswahlkriterien gelten: a) eine hinreichend große Menge der im zugrunde gelegten Wörterbuchkorpus mit diesem Element gebildeten Wörter und b) die synchrone Durchsichtigkeit und Produktivität der Wortbildungsmuster, die das Wortbildungselement „bedient“, damit sich durch ihre semantische Beschreibung auch die Bedeutung von nicht im Wörterbuch verzeichneten Bildungen erschließen lässt. Für die lexikographische Beschreibung von Wortbildungselementen werden in der metalexikographischen Forschung verschiedene Vorschläge gemacht. Lexikographische Angaben zu Wortbildungselementen sollen z.B. die Bedeutungserläuterung, die Angabe der Basiswortart bzw. der Basiswortarten, die Angabe zur Wortart der Wortbildungsprodukte, die Angabe zu orthographischen oder morphologischen Veränderungen an der Basis, die Angabe zu Betonungsverschiebungen, eine Angabe zur Flexion sowie Angaben von Allomorphen enthalten. Solche Angaben sollen unter anderem dazu dienen, einen Nutzer zu befähigen, selbst aktiv neue und korrekte Wörter zu bilden. Dies kann, so wird angenommen, besonders dann gelingen, wenn Artikel zu Wortbildungselementen mit Wortartikeln im Wörterbuch intensiv durch Verweise verknüpft sind. Besonders wichtig ist aber auch (wie z.B. Barz 2001, S. 91 meint), das ganze Spektrum an Lesarten eines Wortbildungselementes herauszuarbeiten und im Wörterbuchartikel zu beschreiben, damit die Repräsentation der Vernetzung zwischen diesen Elementen und den Wortbildungsprodukten gelingen kann. Die Umsetzung der metalexikographischen Vorschläge in Printwörterbüchern des Deutschen erfolgt derzeit nur zum Teil. Wenn überhaupt Wortbildungselemente in Printwörterbüchern lemmatisiert werden, ist z.B. die Vernetzung mit den Stichwörtern und umgekehrt mangelhaft. So wird etwa bei lemmatisierten Derivaten nicht auf den Eintrag zum Wortelementlemma verwiesen, wie Beispiel (3) mit dem Stichwort baumlos aus dem Duden-Universalwörterbuch zeigt, von dem aus nicht auf den Eintrag -los im gleichen Wörterbuch 13 Vgl. hierzu besonders den Beitrag „Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit“ von Sabina Ulsamer in diesem Band und zu dem Folgenden auch Klosa (2005, S. 154ff.). Annette Klosa 184 verwiesen wird. Wortbildungsprodukte, die als Beispiel im Eintrag zu einem Wortbildungselement genannt werden, sind auch nicht immer als Stichwörter ins Wörterbuch aufgenommen. So ist zwar das in Beispiel (3) unter -los genannte Adjektiv baumlos lemmatisiert, das Adjektiv motivlos beispielsweise dagegen nicht. (3) -los: drückt in Bildungen mit Substantiven aus, dass etw. nicht vorhanden ist, dass die beschriebene Person oder Sache etw. nicht hat: baum-, motiv-, schnur-, wohnsitzlos. (Duden 2006) baum|los <Adj.>: keinen Baumbestand aufweisend. (Duden 2006) Eine Beschreibung aller Lesarten eines Wortbildungselementes erfolgt zwar, wie Beispiel (4) anhand des verbalen Präfixes verzeigt. Dieses Beispiel verdeutlicht aber zugleich, dass noch längst nicht alle Vorschläge für eine Angabestruktur der Wortbildungselemente umgesetzt werden. So fehlt in diesem Beispiel etwa die elementare Information, dass verein Präfix ist, mit dem man Verben bildet, also die oben genannte Angabe der Wortart der Wortbildungsprodukte. Diese Information kann nur indirekt aus den genannten Wortbildungsprodukten erschlossen werden. (4) ver- [mhd. ver-, ahd. fir-, far-, mniederd. vör-, vor-; entstanden aus mehreren Präfixen mit etwa den Bed. »heraus-«, »vor-, vorbei-« u. »weg-« (zu einem Subst. mit der Bed. »das Hinausführen über ...«)]: 1. drückt in Bildungen mit Substantiven oder Adjektiven und einer Endung aus, dass sich eine Person oder Sache [im Laufe der Zeit] zu etw. (was im Substantiv od. Adjektiv genannt wird) hin verändert: verarmen, verdorfen, verprovinzialisieren. 2. drückt in Bildungen mit Substantiven oder Adjektiven und einer Endung aus, dass eine Person oder Sache zu etw. gemacht, in einen bestimmten Zustand versetzt, in etw. umgesetzt wird: vereindeutigen, verfeaturen, vermodernisieren, vertüten; verbeamtet, verkauderwelscht. 3. drückt in Bildungen mit Substantiven und einer Endung aus, dass eine Person oder Sache mit etw. versehen wird: vercomputerisieren, verschorfen. 4. drückt in Bildungen mit Verben aus, dass eine Sache durch etw. (ein Tun) beseitigt, verbraucht wird, nicht mehr besteht: verforschen, verfrühstücken, verwarten. 5. drückt in Bildungen mit Verben aus, dass eine Person mit etw. ihre Zeit verbringt: verschlafen, verschnarchen, verspielen. 6. drückt in Bildungen mit Verben aus, dass eine Person etw. falsch, verkehrt macht: verbremsen, verinszenieren. Wortbildung in elexiko: Gegenwart und Zukunft 185 7. drückt in Bildungen mit Verben aus, dass eine Sache durch etw. beeinträchtigt wird: verwaschen, verwohnen. 8. hat in Bildungen mit Verben keine eigene Bedeutung: verbringen, vermelden. (Duden 2006) In elektronischen Wörterbüchern, die nicht aus gedruckten Wörterbüchern entstanden sind, sondern für eine elektronische Präsentation (z.B. im Internet) entwickelt wurden, ist eine Verbesserung der Praxis insbesondere hinsichtlich der Vernetzung der Informationen untereinander festzustellen. Abb. 5: Angaben zum Suffix -heit in Canoo.net Als Beispiel dienen die Einträge in Canoo.net, 14 einem korpus- und computerlinguistisch erstellten Online-Informationssystem zum Deutschen, zum Suffix -heit (vgl. Abb. 5) bzw. zur Bildung Gottheit (vgl. Abb. 6). Im Eintrag zum 14 Vgl. http: / / www.canoo.net (Stand: 08/ 2011). Annette Klosa 186 Suffix -heit findet sich etwa die Information dazu, welche Wortart die Wortbildungsprodukte (nämlich Nomen) mit diesem Suffix und welche Wortart die als Basis dienenden Wörter (nämlich Nomen und Adjektiv) haben können. Mithilfe der Links „Alle Ableitungen“ kann man eine Liste aller zugehörigen Bildungen in dem knapp 170 000 Stichwörter umfassenden Canoo-Wörterbuch aufrufen. Im Eintrag zu einem dieser Stichwörter wird wiederum zurückverlinkt auf den Eintrag zum Suffix -heit, wie am Beispiel Gottheit in Abbildung 6 deutlich wird. Dieses Beispiel zeigt auch, wie in Canoo.net Informationen zur Wortbildungsproduktivität eines Stichwortes gegeben werden. In diesem Beispiel werden etwa die Komposita Muttergottheit und Naturgottheit zu Gottheit gestellt, hier allerdings unter der Überschrift „Ableitungen“ (vgl. Abb. 6). So faszinierend der hohe Grad der Vernetzung all dieser Informationen ist, bleibt doch etwas zu bemängeln, und zwar das Fehlen semantischer Informationen in diesen Beispielen. Abb. 6: Angaben im Eintrag zu Gottheit in Canoo.net Das von Elisenda Bernal Gallén entwickelte Online-Wörterbuch „Diccionari de Sufixos Verbalitzadors del Català“ zu katalanischen Verbsuffixen 15 versucht dagegen, auch mithilfe semantischer Informationen die Vernetztheit des Wortschatzes, hier im verbalen Bereich, zu verdeutlichen. So bietet dieses Wörterbuch eine Klassifikation nach Wortbildungsbedeutungen, hier „argumental“ genannt, an (z.B. ‘causatiu’, ‘pejoratiu’), mit deren Hilfe man auch 15 Vgl. http: / / www.elisendabernal.com/ (Stand: 08/ 2011). Wortbildung in elexiko: Gegenwart und Zukunft 187 suchen kann. Daneben gibt es eine Suchfunktion zu einzelnen Wortbildungselementen (z.B. -ejar, -ificar, -itar) und nach Wortbildungsprodukten, also über eine Liste an Verben. Diese wiederum kann alphabetisch sortiert, nach den Suffixen sortiert oder nach den Wortbildungsbedeutungen sortiert angezeigt werden. Abbildung 7 zeigt das Ergebnis der Suche nach der Kategorie ‘pejoratiu’. Hier wird darüber informiert, dass das Suffix -ejar (in Lesart 5) Verben pejorisiert, die Bildungen comerciejar und trafiquejar werden diesem Suffix zugeordnet. In der Abbildung erscheint hier im rechten Bildschirmbereich das Verb trafiquejar mit den zugehörigen Informationen. Abb. 7: Suchergebnis nach Kategorie ‘pejoratiu’ im Online-Wörterbuch zu katalanischen Verbsuffixen Interessant an diesem Wörterbuch, das sich mit seiner komplexen und hochgradig formalisierten Angabestruktur wohl eher an Fachleute wendet, ist auch die Integration von KWIC-Zeilen, also sehr kurzen Ausschnitten aus Korpusbelegen. Eine genauere Analyse der in diesem Wörterbuch realisierten Angabe- und Vernetzungsstruktur kann hier nicht erfolgen, doch wäre diese sicherlich überaus lohnenswert. 3.2 Wortelementlemmata in elexiko Für die Beschreibung von Wortbildungselementen in elexiko stellen sich zwei grundsätzliche konzeptionelle Fragen, und zwar die der Auswahl der zu lemmatisierenden Elemente und die der lexikographischen Beschreibung der lemmatisierten Elemente. Im Folgenden wird zunächst über die Stichwortauswahl reflektiert, anschließend über mögliche lexikographische Angaben für Wortelementlemmata nachgedacht. Annette Klosa 188 3.2.1 Auswahl der Wortbildungsmittel In der Konzeptionsphase von elexiko war davon ausgegangen worden, dass sich eine Stichwortliste zu Wortbildungsmitteln aus der elexiko-Stichwortliste der Einwortlemmata ermitteln ließe (vgl. Klosa 2005, S. 156f.). In der Stichwortliste treten in linksalphabetischer Sortierung deutlich alle erstgliedfähigen Wortbildungsmittel hervor, in rechtsalphabetischer Sortierung alle letztgliedfähigen Wortbildungsmittel, wie in Tabelle 3 anhand der Bildungen mit ultrabzw. -gerecht ausschnitthaft gezeigt wird. Eine Auswahl der zu lemmatisierenden Wortbildungsmittel aus der elexiko-Stichwortliste wäre allerdings nur indirekt ein korpusgestütztes Vorgehen, da zwar von der korpusgestützt ermittelten Stichwortliste ausgegangen, diese aber redaktionell ausgewertet würde. Sinnvoller scheint der Versuch, Kandidaten für Wortelementlemmata direkt aus einem dem Wörterbuch zugrunde gelegten Korpus zu ermitteln. Nur so kann es gelingen, über das in Wortbildungslehren, Grammatiken und Wörterbüchern erfasste Inventar an Wortbildungselementen gegebenenfalls hinauszukommen oder für schon tradierte Affixe unter Umständen neue Wortbildungsmuster zu erkennen. Zwei Beispiele zu Korpusbefunden in DeReKo, dem Deutschen Referenzkorpus des IDS, können dies illustrieren: Im „Langenscheidt Großwörterbuch Deutsch als Fremdsprache“ ist ein nominales Präfix Gegenlemmatisiert. Dass verstärkt seit den neunziger Jahren des 20. Jahrhunderts ein verbales Wortbildungsmuster mit gegenaufgekommen ist (mit Verben wie gegenfragen, gegenneigen, gegenzeichnen; vgl. Klosa 2003), wurde in diesem Wörterbuch aber noch nicht berücksichtigt. In Wörterbüchern fehlt beispielsweise auch das erst in jüngster Zeit aufgekommene Wortbildungsmuster mit -alarm. Dieses Wortbildungselement hat in Bildungen wie Schlampenalarm, Zickenalarm, Krötenalarm oder Sonnenbrandalarm eine Neubedeutung ‘übertriebene Aufregung wegen jemandem oder etwas’ angenommen. Diese Beispiele zeigen auch, dass ein korpusgeleitetes Vorgehen es ermöglicht, sowohl Affixe (wie gegen-) wie reihenbildende Kompositionsstämme (wie -alarm) zu finden, über deren Lemmastatus natürlich im Einzelfall entschieden werden muss. Gerade diese Frage ist auch in der metalexikographischen Literatur immer wieder diskutiert worden (z.B. Müller 2000; Poethe 1996, S. 194ff. und Starke 1992), eine Erprobung der in der Literatur vorgeschlagenen möglichen Abgrenzungskriterien in der lexikographischen Praxis im Allgemeinen, Wortbildung in elexiko: Gegenwart und Zukunft 189 aber auch im Rahmen des Projektes elexiko steht aber noch aus. In der Praxis erprobt werden müsste auch die Annahme, dass sich nur korpusgestützt wirklich feststellen lässt, welche Wortbildungsmittel (noch) produktiv sind. Bildungen mit ultra- Bildungen mit -gerecht ultrabrutal altengerecht ultracool altersgerecht ultradünn artgerecht ultrafein aufgabengerecht Ultrafiche autogerecht Ultragift bedarfsgerecht ultragiftig bedürfnisgerecht ultrahart behindertengerecht ultrahocherhitzt blindengerecht ultrakonservativ branchengerecht ultrakurz bühnengerecht Ultrakurzwelle computergerecht Ultrakurzwellenempfänger denkmalgerecht Ultrakurzwellensender drehbuchgerecht ultralang endlagergerecht ultraleicht erwachsenengerecht Ultraleichtflieger fachgerecht Ultraleichtflugzeug fahrradgerecht ultraliberal familiengerecht Ultraliberalismus fernsehgerecht usw. usw. Tab. 3: Links- und rechtsalphabetisch sortierte Ausschnitte aus der elexiko-Stichwortliste 3.2.2 Beschreibung und Präsentation der Wortbildungsmittel Eine umfassende lexikographische Beschreibung von Wortbildungsmitteln in elexiko sollte von ihrer distributionellen, morphologischen und semantischen Untersuchung ausgehen, aber auch die Basierung auf einem umfangreichen Wörterbuchkorpus widerspiegeln. Im Einzelnen wären die folgenden Angaben denkbar, wobei hier nur etwas näher auf unter „Weiteres“ zusammengefasste Punkte eingegangen wird. Annette Klosa 190 1. distributionell: - Angabe zur Art des Wortbildungselements (Präfix, Suffix ...) - Angabe dazu, an Wörter welcher Wortarten das Wortbildungselement treten kann - Angabe dazu, welche Wortart die Wortbildungsprodukte mit dem Wortbildungselement haben 2. morphologisch: - Angabe orthographischer Veränderung an dem Basiswort - Angabe morphologischer Veränderung an dem Basiswort - Angabe von Betonungsverschiebung bei Bildungen mit dem Wortelementlemma - Angabe zur morphologischen Charakteristik der Basiswörter (z.B. ein-/ mehrsilbig; nur simplizisch bzw. Derivate und/ oder Komposita; entlehnt bzw. indigen) - wenn möglich, Angabe zur Flexion (welches Genus, Flexionsschema) - Angabe der Allomorphe eines Wortbildungselements - wo möglich, Angabe zur regionalen oder nationalen Verteilung von allomorphen Wortbildungselementen - Angabe zu Fugenelementen 3. semantisch-pragmatisch: - Analyse und Beschreibung des Spektrums an Lesarten - Bedeutungserläuterung pro Lesart - Angabe zur semantischen Charakteristik der Basiswörter (z.B. immer Handlungen oder Personenbezeichnungen) - synonyme und/ oder komplementäre Wortbildungselemente - Zuordnung zu einer Wortbildungsbedeutung - Beispiele für lexikalisierte und nichtlexikalisierte Wortbildungsprodukte mit einem Wortbildungselement - Nennung von Gebrauchsbesonderheiten (z.B. stilistische Markiertheit) 4. Weiteres: - Angabe zur Produktivität 16 des Wortbildungselements (z.B. „hierzu X Bildungen in der elexiko-Stichwortliste“) 16 Zum Produktivitätsbegriff vgl. die Ausführungen im dritten Kapitel von Pius ten Hackens Beitrag „Wortbildung in elektronischen Lernerwörterbüchern“ in diesem Band. Wortbildung in elexiko: Gegenwart und Zukunft 191 - Information zum zeitlichen Verlauf der Bildungen mit einem Wortbildungselement im Wörterbuchkorpus, sodass steigendes oder sinkendes Vorkommen deutlich werden kann - Nennung von Beispiel-Wortbildungsprodukten - ggf. Nennung von Textbelegen zu Wortbildungsprodukten mit einem Wortbildungselement Die Frage nach der Produktivität eines Wortbildungsmusters kann sich nicht nur an der Zahl der damit gebildeten Wortbildungsprodukte bemessen. Zu fragen ist auch, wie häufig die Wortbildungsprodukte selbst sind und ob das Wortbildungselement „in hohem Maße auch für okkasionelle Neubildungen genutzt werden“ (Fleischer/ Barz 1995, S. 57) kann. Neben diesen quantitativen Kriterien, die natürlich nur korpusgestützt beantwortet werden können, spielen für die Beurteilung der Produktivität allerdings auch qualitative Aspekte eine Rolle, z.B. ob das Wortbildungselement an morphologisch oder semantisch sehr verschiedene oder nur an morphologisch oder semantisch sehr spezielle Basiswörter treten kann. Korpusgestützt sind außerdem Aussagen darüber möglich, ab wann neue Wortbildungselemente aufkommen oder neue Wortbildungsmuster mit ihnen entstehen. In vergleichbarer Weise gilt das natürlich auch für Lexeme, sodass als Beispiel dafür, wie man solche Frequenzverläufe in der Zeit visualisieren kann, in Abbildung 8 eine grafische Übersicht über die zeitliche Verteilung der Gebrauchshäufigkeiten zu verosten aus dem Online-Wörterbuch der Neologismen der neunziger Jahre des IDS 17 dient. Abb. 8: Zeitverlaufsgrafik für verosten aus dem Neologismenwörterbuch 17 Vgl. http: / / www.owid.de/ wb/ neo/ start.html (Stand: 08/ 2011). Annette Klosa 192 Eine noch unbeantwortete Frage im Rahmen der Konzeption der Beschreibung von Wortbildungsmitteln in elexiko ist, ob lexikographische Angaben zu Wortbildungselementen wirklich in sinnvoller Weise durch Textbelege ergänzt werden können. Das „Diccionari de Sufixos Verbalitzadors del Català“ zu katalanischen Verbsuffixen (vgl. Abb. 7) bietet beispielsweise kleine Belegausschnitte in KWIC-Zeilen an. Im grammatischen Wörterbuch von grammis (vgl. Abb. 9) werden Korpusbeispiele zu den einzelnen Affixen gezeigt, über deren Nutzen in einer konkreten Benutzungssituation des Wörterbuches nachzudenken ist. Offen scheint daneben, ob eine endliche Menge von Beispielen überhaupt zur Illustration eines an sich unendlich produktiven Wortbildungsmusters dienen kann. So ist auch zu fragen, ob die Lösung von Canoo.net, auf eine Liste aller Bildungen mit einem Wortbildungselement zu verlinken (wie in Abb. 5 gezeigt), eine überzeugende Möglichkeit ist. Es könnte beispielsweise auch, statt auf lemmatisierte Wortbildungsprodukte zu verlinken, direkt ins (elektronische) Wörterbuchkorpus umgeleitet werden und dort eine Suche nach allen, möglicherweise auch nur einmal verzeichneten Wortbildungsprodukten mit einem Wortbildungselement angestoßen werden. Zu überlegen ist, wie lexikographische Angaben zu Wortbildungselementen in geeigneter Form auf dem Bildschirm präsentiert werden können. Die beiden in den Abbildungen 5 und 7 gezeigten Online-Wörterbücher wählen sehr unterschiedliche Darstellungen, das grammatische Informationssystem grammis des IDS, in dem auch Informationen zu Affixen angeboten werden, bietet eine weitere Präsentationsmöglichkeit mit einer schlichten tabellarischen Anordnung, wie in Abbildung 9 mit dem Eintrag zu -abel zu sehen ist. Schließlich ist die Modellierung der Angaben zu Wortbildungsmitteln zu konzipieren, wobei besonders die Modellierung der Vernetzungen zu bedenken ist. So scheint es im elektronischen Medium unverzichtbar, die Einträge zu Wortbildungselementen mit den „normalen“ Stichwörtern zu verlinken und umgekehrt von diesen zurückzuverweisen. Für eine konsistente Vernetzung sind die technischen Grundlagen im Projekt zu schaffen, es ist aber auch zu überlegen, wie diese Vernetzungen für Recherchezwecke und für die Visualisierung von Wortbildungsbeziehungen im Wörterbuch nutzbar gemacht werden können. 18 18 Vgl. die ersten Vorschläge hierzu im Beitrag „Visualisierung von Wortbildungsbeziehungen im elektronischen Wörterbuch“ von Peter Meyer und Carolin Müller-Spitzer in diesem Band. Wortbildung in elexiko: Gegenwart und Zukunft 193 Abb. 9: Eintrag zum Suffix -abel in grammis Die Konzeption der Wortelementlemmata in elexiko sollte generell nicht nur aufgrund der Auswertung der Vorschläge in der metalexikographischen Literatur und der Analyse der Praxis in Online-Wörterbüchern geschehen, sondern auch auf der Basis von Benutzungsstudien. 19 Beispielsweise kann derzeit eigentlich nur vermutet werden, in welchen Benutzungssituationen Nutzer Informationen zu Wortbildungselementen nachschlagen würden und welche Funktionen solche Angaben für unterschiedliche Benutzergruppen erfüllen können. Ebenso ist im Grunde nur durch Benutzungsstudien zu klären, welche Form der Darstellung von Wortbildungsangaben für welche Nutzer in einer bestimmten Nutzungssituation am ehesten geeignet ist. Die Zukunft der Angaben zur Wortbildung in elexiko ist also zumindest teilweise noch ungewiss. 19 Zu Benutzungsstudien, die in Bezug auf elexiko, aber auch generell zu Online-Wörterbüchern durchgeführt wurden, vgl. die Seiten des Projektes „Benutzeradaptive Zugänge und Vernetzungen in elexiko“ unter http: / / www.ids-mannheim.de/ lexik/ BZVelexiko/ (Stand: 08/ 2011). Im Beitrag „Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen - eine Umfrage zu elexiko“ von Antje Töpel in diesem Band werden die Ergebnisse aus den elexiko-Studien zum Bereich der Wortbildungsangaben vorgestellt. Annette Klosa 194 4. Literatur 4.1 Wörterbücher Canoo.net - Deutsche Wörterbücher und Grammatik. Internet: http: / / www.canoo.net- (Stand: 08/ 2011). Diccionari de Sufixos Verbalitzadors del Català. Internet: http: / / www.elisendabernal. com/ (Stand: 08/ 2011). Duden (2001) = Duden - Das große Wörterbuch der deutschen Sprache. Herausgegeben von der Dudenredaktion. Mannheim u.a. Duden (2006) = Duden - Deutsches Universalwörterbuch, 6. Aufl. Mannheim u.a. [CD-ROM]. elexiko (2003ff.). In: Institut für Deutsche Sprache (Hg.): OWID - Online-Wortschatz-Informationssystem Deutsch. Mannheim. Internet: http: / / www.owid.de- (Stand: 08/ 2011). grammis - Grammatisches Informationssystem des IDS Mannheim. Internet: http: / / hypermedia.ids-mannheim.de/ grammis (Stand: 08/ 2011). Langenscheidt Großwörterbuch Deutsch als Fremdsprache (2008). Hrsg. von Dieter Götz, Günther Haensch und Hans Wellmann. In Zusammenarbeit mit der Langenscheidt-Redaktion. Neubearbeitung. Berlin u.a. Neologismenwörterbuch (2003ff.). In: Institut für Deutsche Sprache (Hg.): OWID - Online-Wortschatz-Informationssystem Deutsch. Mannheim. Internet: http: / / www. owid.de (Stand: 08/ 2011). 4.2 Forschungsliteratur Barz, Irmhild (2001): Wortbildungsbeziehungen im einsprachigen Bedeutungswörterbuch. In: Korhonen, Jarmo (Hg.): Von der monozur bilingualen Lexikografie für das Deutsche. Frankfurt a.M., S. 85-100. Deutsche Wortbildung (1973) = Kühnhold, Ingeburg/ Wellmann, Hans: Deutsche Wortbildung. Typen und Tendenzen in der Gegenwartssprache. Eine Bestandsaufnahme des Instituts für deutsche Sprache, Forschungsstelle Innsbruck. Bd. I: Das Verb. Düsseldorf. Deutsche Wortbildung (1975) = Wellmann, Hans: Deutsche Wortbildung. Typen und Tendenzen in der Gegenwartssprache. Eine Bestandsaufnahme des Instituts für deutsche Sprache, Forschungsstelle Innsbruck. Bd. II: Das Substantiv. Düsseldorf. Deutsche Wortbildung (1978) = Kühnhold, Ingeburg/ Putzer, Oskar/ Wellmann, Hans: Deutsche Wortbildung. Typen und Tendenzen in der Gegenwartssprache. Eine Bestandsaufnahme des Instituts für deutsche Sprache, Forschungsstelle Innsbruck. Bd. III: Das Adjektiv. Düsseldorf. Wortbildung in elexiko: Gegenwart und Zukunft 195 Deutsche Wortbildung (1991) = Ortner, Lorelies/ Müller-Bollhagen, Elgin: Deutsche Wortbildung. Typen und Tendenzen in der Gegenwartssprache. Eine Bestandsaufnahme des Instituts für deutsche Sprache, Forschungsstelle Innsbruck. Bd. IV: Substantivkomposita. Berlin/ New York. Deutsche Wortbildung (1992): Deutsche Wortbildung. Typen und Tendenzen in der Gegenwartssprache. Eine Bestandsaufnahme des Instituts für deutsche Sprache, Forschungsstelle Innsbruck. Bd. V: Pümpel-Mader, Maria/ Gassner-Koch, Elsbeth/ Wellmann, Hans: Adjektivkomposita und Partizipialbildungen. Berlin/ New York. Donalies, Elke (1999): Präfixverben, Halbpräfixverben, Partikelverben, Konstitutionsverben oder verbale Gefüge? - Ein Analyseproblem der deutschen Wortbildung. In: Studia Germanica Universitatis Vesprimiensis 3, 2, S. 127-143. Donalies, Elke (2002): Die Wortbildung des Deutschen. Ein Überblick. (= Studien zur Deutschen Sprache 27). Tübingen. Fleischer, Wolfgang/ Barz, Irmhild (1995): Wortbildung der deutschen Gegenwartssprache. Unter Mitarbeit von Marianne Schröder. 2., durchges. und erg. Aufl. Tübingen. Haß, Ulrike (2005): Das Bedeutungsspektrum. In: Haß (Hg.), S. 163-181. Haß, Ulrike (Hg.) (2005): Grundfragen der elektronischen Lexikographie. elexiko - das Online-Informationssystem zum deutschen Wortschatz. (= Schriften des Instituts für Deutsche Sprache 12). Berlin/ New York. Holly, Werner (1986): Wortbildung und Wörterbuch. In: Lexicographica 2, S. 195-213. Klosa, Annette (2003): gegen-Verben - ein neues Wortbildungsmuster. In: Sprachwissenschaft 28, 4, S. 467-494. Klosa, Annette (2005): Wortbildung. In: Haß (Hg.), S. 141-162. Klosa, Annette (2011a): Korpusgestützte Angaben zu Grammatik und Wortbildung. In: Klosa (Hg.) (2011), S. 145-156. Klosa, Annette (2011b): Von Abbildung bis Wortelement: Weitere Ergänzungen und Änderungen in elexiko. In: Klosa (Hg.) (2011), S. 157-172. Klosa, Annette (Hg.) (2011): elexiko. Erfahrungsberichte aus der lexikografischen Praxis eines Internetwörterbuchs. (= Studien zur Deutschen Sprache 55). Tübingen. Klosa, Annette/ Müller-Spitzer, Carolin (2007): Grammatische Angaben in elexiko und ihre Modellierung. In: Gottlieb, Henrik/ Mogensen, Jens Erik (Hg.): Dictionary visions, research and practice. Selected papers from the 12th International Symposium on Lexicography. Copenhagen 2004. Amsterdam, S. 13-37. Motsch, Wolfgang (1982): Wortbildungen im einsprachigen Wörterbuch. In: Agricola, Erhard/ Schildt, Joachim/ Viehweger, Dieter (Hg.): Wortschatzforschung heute. Aktuelle Probleme der Lexikologie und Lexikographie. Leipzig, S. 62-71. Motsch, Wolfgang (1999): Deutsche Wortbildung in Grundzügen. Berlin/ New York. Annette Klosa 196 Mugdan, Joachim (1984): Grammatik im Wörterbuch: Wortbildung. In: Wiegand, Herbert Ernst (Hg.): Studien zur neuhochdeutschen Lexikographie IV. (= Germanistische Linguistik 1-3/ 1983). Hildesheim u.a., S. 237-308. Müller, Peter O. (2000): Deutsche Fremdwortbildung. Probleme der Analyse und der Kategorisierung. In: Habermann, Mechthild/ Müller, Peter O./ Naumann, Bernd (Hg.): Wortschatz und Orthographie in Geschichte und Gegenwart. Tübingen, S. 115-134. Müller-Spitzer, Carolin (2005): Die Modellierung lexikografischer Daten und ihre Rolle im lexikografischen Prozess. In: Haß (Hg.), S. 20-54. Poethe, Hannelore (1996): Wortbildung im Großwörterbuch Deutsch als Fremdsprache. In: Barz, Irmhild/ Schröder, Marianne (Hg.): Das Lernerwörterbuch Deutsch als Fremdsprache in der Diskussion. (= Sprache - Literatur und Geschichte. Studien zur Germanistik 12). Heidelberg, S. 189-207. Starke, Günter (1992): Der Übergang von Kompositionsgliedern zu Suffixen im Spiegel des einsprachigen Wörterbuchs. In: Große, Rudolf/ Lerchner, Gotthard/ Schröder, Marianne (Hg.): Beiträge zur Phraseologie, Wortbildung, Lexikologie. Festschrift für Wolfgang Fleischer zum 70. Geburtstag. Frankfurt a.M. u.a., S. 115-124. 4.3 Internetressourcen BZVelexiko - Benutzeradaptive Zugänge und Vernetzungen in elexiko. Internet: http: / / www.ids-mannheim.de/ lexik/ BZVelexiko (Stand: 08/ 2011). DeReKo - Deutsches Referenzkorpus des IDS. Internet: http: / / www.ids-mannheim.de/ kl/ projekte/ korpora/ (Stand: 08/ 2011). Antje Töpel Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen - eine Umfrage zu elexiko 1. Einleitung Verglichen mit der langen Tradition, über welche die praktische Lexikographie verfügt, ist die Forschung zur Wörterbuchbenutzung noch ein recht junges Gebiet. In den letzten Jahren hat die Beschäftigung mit diesem Thema allerdings stark zugenommen, was sich an der rasch wachsenden Anzahl der einzelnen Untersuchungen zur Wörterbuchbenutzung ablesen lässt, die sich auch in ihrer methodischen Qualität sichtbar von früheren Arbeiten abheben. Daneben zeugen umfangreiche Überblicke (wie Welker 2010), eigene Themenhefte von Zeitschriften (z.B. des International Journal of Lexicography, Heft 1/ 2011) sowie entsprechende Themenschwerpunkte auf den betreffenden Tagungen (beispielsweise auf der EURALEX, der eLEX oder der GAL-Jahrestagung) von einem steigenden wissenschaftlichen Interesse an der Wörterbuchbenutzungsforschung. Der vorliegende Beitrag betrachtet das Thema der Wortbildung im Online- Wörterbuch aus der Perspektive der Wörterbuchbenutzer. Zunächst werden an einzelnen Beispielen die unterschiedlichen Angabebereiche im Internetwörterbuch und die verschiedenen Arten der Wortbildungsangaben aufgezeigt, auf die ein Wörterbuchbenutzer beim Nachschlagen stoßen kann (Kap. 2). Daran anschließend werden mit elexiko und BZVelexiko kurz die beiden Projekte vorgestellt, die an den Mannheimer Nutzerumfragen beteiligt waren. Schließlich werden die Ergebnisse zweier Online-Befragungen präsentiert, die Anfang 2011 am Institut für Deutsche Sprache durchgeführt wurden und an denen insgesamt über 1 100 Personen teilnahmen. In diesem Kontext stehen dabei allein die Teilergebnisse zum Thema Wortbildung im Mittelpunkt (Kap. 3). Ein Ausblick auf die weitere geplante Forschung rundet den Beitrag ab (Kap. 4). 2. Wortbildung im Online-Wörterbuch Auf den ersten Blick mag das Thema „Wortbildung im Wörterbuch“ recht eng umgrenzt wirken. Angaben zur Wortbildung können in Wörterbüchern, also Antje Töpel 198 auch und besonders in Online-Wörterbüchern, jedoch an ganz unterschiedlichen Stellen auftreten. Im Folgenden wird dies exemplarisch an vier Untergruppen gezeigt, wobei jeweils Beispiele aus verschiedenen Internetwörterbüchern vorgestellt werden. 2.1 Wortbildungselemente oder -produkte als Stichwörter Der Nutzer kann dem Thema der Wortbildung im Wörterbuch bereits bei den Stichwörtern begegnen. So sind in vielen Wörterbüchern außer simplizischen Wörtern, Wortverbindungen und Phraseologismen auch Wortbildungsprodukte und Wortbildungselemente verzeichnet. Als Beispiel für ein Online-Wörterbuch, das neben anderen Lemmatypen auch Wortbildungselemente, im Wesentlichen also Präfixe und Suffixe, enthält, dient hier der Duden online, der seit Ende März 2011 unter http: / / www. duden.de frei zugänglich ist. Leider wird den Nutzern nicht transparent gemacht, welches Wörterbuch bzw. welche Wörterbücher in die Inhalte eingeflossen sind, die nach einer Suche bei Duden online präsentiert werden. Von der Substanz her lassen sich bei einem aufgerufenen Artikel unschwer der Rechtschreibduden, das Fremdwörterbuch, das Synonymwörterbuch und das zehnbändige Großwörterbuch (GWDS ) identifizieren. Betrachtet man die Artikel zu einem Wortbildungselement genauer, fällt auf, dass nach dem Stichwort, hier dem Beispiel Mini-, zunächst die Wortart genannt wird und in einem fünfstufigen Kästchensystem Angaben zur Häufigkeit des Stichwortes gemacht werden (vgl. Abb. 1). Anschließend folgen Details zur Rechtschreibung (wie die Worttrennung) und eine Bedeutungsübersicht, deren einzelne Bedeutungserläuterungen in den Unterpunkten mit den später folgenden Beispielen verknüpft sind. Um herauszufinden, wie viele Wortbildungselemente im Duden online verzeichnet sind, wurde eine Suche nach den Begriffen ‘Präfix’, ‘Vorsilbe’, ‘Suffix’, ‘Nachsilbe’, ‘Affix’, ‘Konfix’, ‘Infix’, ‘Zirkumfix’, ‘Morphem’, ‘Wortbildungselement’ und ‘Wortbildungsmittel’ durchgeführt. Als Ergebnis erhält man jeweils sowohl Artikel, die sich mit dem entsprechenden Phänomen auseinandersetzen, die also beispielsweise erklären, was ein Affix ist, als auch durch die Wortartauszeichnung die Stichwörter, die zu der jeweiligen Gruppe gehören. Nach Abzug der Wörterbuchartikel, welche die entsprechenden Erscheinungen (wie ‘Affix’) erklären, verbleiben die reinen Wortelementartikel. Die Suche ergibt, dass bei Duden online rund 420 Präfixe, 400 Suffixe und 47 Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen 199 weitere Wortbildungselemente lemmatisiert sind. 1 Wortbildungselemente sind dabei solche Affixe, die ursprünglich aus dem Fremdwörterbuch stammen und deshalb nicht mit der Markierung ‘Präfix’ oder ‘Suffix’ versehen sind, sondern als ‘Wortbildungselement’ bezeichnet werden. Abb. 1: Wortbildungselemente im Duden online, Beispiel Mini- An dieser Stelle werden die Grenzen einer automatischen Zusammenführung von Substanzen unterschiedlicher Wörterbücher bereits deutlich: Gleiche Inhalte sind nicht gleich benannt und können deshalb nicht mit einer einzigen Suche gefunden werden. Viel schwerer wiegt an dieser Stelle allerdings die Tatsache, dass Inhalte, die in den einzelnen Printwörterbüchern richtig erscheinen, durch die maschinelle Erfassung unter Duden online gravierende Fehler enthalten. So erhält Gepäcks ... online die Wortartmarkierung ‘Präfix’, 1 Zu einer anderen Zählung des deutschen Affixinventars vgl. den Beitrag „Grundlegende Bemerkungen zu einem auf einer pragmatischen Sprachtheorie fußenden Wortfamilienwörterbuch als legitimem Ort einer integrierten Wortbildung“ von Jochen Splett in diesem Band. Antje Töpel 200 was sich nur durch einen Blick in den gedruckten Rechtschreibduden verstehen lässt, wo Gepäcks … mit der Bedeutungserläuterung „österr. für Gepäck ..., z.B. Gepäcksaufbewahrung, Gepäcksstück, Gepäcksträger“ lemmatisiert ist. Aufgrund seiner drei Punkte wurde Gepäcks … offensichtlich automatisch als Präfix kategorisiert. Ebenfalls mit der Wortartmarkierung ‘Präfix’ versehen ist bei Duden online das Element honny…, was sich für den Benutzer wegen der fehlenden weiteren Angaben überhaupt nicht entschlüsseln lässt. An dieser Stelle hilft allein die Printausgabe des Fremdwörterbuchs, wo treffenderweise unter dem Stichwort honni soit qui mal y pense als Anfangswort auch die Variante honny … genannt wird, die bei der Überführung in die Online-Version - wiederum durch die drei Punkte bedingt - in die Kategorie ‘Präfix’ verschoben wurde. Es gibt jedoch auch Wörterbücher, in denen Wortbildungselemente nicht nur einen Teil der Stichwörter ausmachen, sondern in denen ausschließlich Wortbildungselemente verzeichnet sind. Als Online-Wörterbuch ist hier vor allem Michael Quinions Dictionary of affixes zu nennen, das in seinen mehr als 1 250 Einträgen englische Affixe verzeichnet und auf dem Printwörterbuch Ologies and Isms beruht. Wesentlich spezialisierter ist das DSVC, das Diccionari de Sufixos Verbalitzadors del Català, welches katalanische Verbalisierungssuffixe beschreibt. Bei diesem Werk von Elisenda Bernal Gallén handelt es sich um einen Prototyp, der insgesamt 118 Verben des Katalanischen umfasst. Abb. 2: Wortbildungselemente im DSVC, Beispiel comerciejar Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen 201 Abbildung 2 zeigt am Beispiel comerciejar, wie ein solcher Eintrag im DSVC genau aussieht. Die waagrechte Menüleiste ganz oben erlaubt die Sortierung nach Wortbildungsarten bzw. -typen (OM: operador morfològic, ‘morphologischer Operator’), nach Wortbildungsbedeutungen (RCM: regla de construcció de mots, ‘Wortbildungsregel’) sowie nach den einzelnen Verben (alphabetisch, nach OM und RCM). Die linke, schmalere Spalte zeigt die Suchergebnisse, die sich jeweils auf die gesamte Verbgruppe beziehen (hier: Wortbildungstyp ‘ejar5’) mit Angaben zur Verbkonjugation (‘V,1’ sind die Verben auf ‘-ar’), zur Etymologie, zur Aussprache, zur Argumentstruktur, zur Wortbildungsbasis, zur Wortbildungsbedeutung (teilweise grau unterlegt) sowie mit einer Auflistung der zu dieser Gruppe gehörenden Einzelverben. In der rechten, etwas breiteren Spalte werden die Ergebnisse präsentiert, die allein das Einzelverb (in Abb. 2 das Beispiel comerciejar) betreffen. Hier stehen Angaben zur morphologischen Struktur, Einzelheiten zur Argumentstruktur, erneut die Wortbildungsbedeutung, die Verben mit gleichem Stamm, eine grau unterlegte Bedeutungserläuterung sowie mehrere Belege. Wörterbücher können nicht nur die Wortbildungselemente, also die Bausteine für Wortbildungsprodukte, enthalten, sondern auch die Ergebnisse von Wortbildungsprozessen, also die Wortbildungsprodukte selbst. Dies ist im Vergleich zur Lemmatisierung von Wortbildungselementen in der praktischen Lexikographie sogar viel verbreiteter und bereits seit Langem üblich. Je umfangreicher die Stichwortliste eines Wörterbuches ist, umso höher wird auch der Anteil der verzeichneten Wortbildungsprodukte: Die Menge der Simplizia einer Sprache ist begrenzt und vergrößert sich durch Sprachwandel kaum, die möglichen Wortbildungsprodukte sind in ihrer Anzahl hingegen nicht beschränkt und stellen den typischen Ausbaubereich einer Sprache dar. Für das GWDS geht die Redaktion beispielsweise von einem rund fünfzigprozentigen Anteil an Komposita aus, 2 für die elexiko-Stichwortliste schätzt Annette Klosa allein den Anteil der substantivischen Komposita als deutlich höher ein. 2 Diese Zahl nannte Melina Alexa in ihrem Vortrag Modellierung eines semantischen Netzes für lexikografische Anwendungen (am Beispiel der Duden-Ontologie) am 6. Mai 2011 beim ersten Arbeitstreffen des wissenschaftlichen Netzwerkes „Internetlexikografie“ zum Thema Grundfragen der Datenmodellierung für Internetwörterbücher am Institut für Deutsche Sprache in Mannheim. Näheres zum Netzwerk findet sich unter http: / / www.internetlexikografie.de (Stand: 08/ 2011). Antje Töpel 202 Abb. 3: Wortbildungsprodukte in der Stichwortliste von elexiko, Beispiel Farbe Je nach Art der alphabetischen Anordnungsform im Wörterbuch sind die Wortbildungsprodukte in der Stichwortliste unterschiedlich stark präsent. Bei einer glattalphabetischen Sortierung dominieren die Wortbildungsprodukte die Stichwortliste. Die nischenalphabetische und noch mehr die nestalphabetische Sortierung nehmen diese Dominanz etwas zurück, weil sie die Wortbildungsprodukte stärker in den Artikel des Basiswortes integrieren. Abbildung 3 zeigt das am Beispiel eines Ausschnitts aus der glattalphabetisch sortierten elexiko-Stichwortliste deutlich: Schlägt man mit der Einstellung „alle Artikel“ in OWID das Wort Farbe nach (die lesartenübergreifenden und -bezogenen Angaben dazu befinden sich in der breiten, mittleren Spalte), werden in der schmalen linken Spalte jeweils die zwölf Stichwörter davor und danach angezeigt (hier von Farbbildröhre bis Farben tragend ). Im direkten Umfeld des nachgeschlagenen Stichwortes Farbe befinden sich vor allem die Komposita mit dem Stichwort als Bestimmungswort (wie Farbdruck oder Farbeimer), Konversionen (wie färben) oder Suffigierungen (wie farbig, allerdings in Abb. 3 nicht zu sehen). Präfigierungen, Kurzwortbildungen oder die Komposita mit dem Stichwort als Grundwort sind dann an der entsprechenden Stelle des Alphabets eingeordnet. Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen 203 2.2 Wortbildungsanalyse eines Stichwortes Handelt es sich bei einem Stichwort um das Ergebnis eines Wortbildungsprozesses, können dem Nutzer eines Wörterbuchs auch Details zur Wortbildungsanalyse des Stichwortes angeboten werden. Canoo.net stellt im Menüpunkt Wortbildung eine solche automatische Wortbildungsanalyse zur Verfügung (vgl. Abb. 4). 3 Die Zerlegung der gebildeten Wörter (hier das Beispiel Wortbildungslehre) erfolgt dabei nicht nur bis zur Ebene der direkten Ausgangseinheiten (hier Wortbildung und Lehre), sondern geht jeweils so viele Schritte zurück, bis sie auf nicht weiter analysierbare Bestandteile stößt (hier Wort, Bild und lehren). Alle wortfähigen unmittelbaren Konstituenten (hier je nach Ebene der Betrachtung Bild, bilden, Bildung, Wort, Wortbildung, lehren und Lehre) sind mit ihrem entsprechenden Eintrag im Wörterbuch verlinkt. Die nicht wortfähigen Wortbildungsmittel (hier die beiden Suffixe -ung und -e), die Fugenelemente (hier s) sowie die Angaben zur Wortbildungsart und zum Strukturtyp (hier ‘Komposition aus Nomen und Nomen mit der Fuge s’) verlinken direkt auf die zugehörigen Erklärungen der informativen Umtexte. An ihre Grenzen stößt die automatische Wortbildungsanalyse nur bei einigen sehr schwierig zu analysierenden Wortbildungsprodukten, bei denen dann sogenannte „fiktive Einträge“ als Wortbildungsbasis angenommen werden. 4 Abb. 4: Wortbildungsanalyse bei Canoo.net, Beispiel Wortbildungslehre 3 Für ein weiteres Beispiel vgl. Abbildung 6 im Beitrag „Wortbildung in elexiko: Gegenwart und Zukunft“ von Annette Klosa in diesem Band. 4 „Fiktive Einträge sind Wörter, die es geben könnte, die man aber in der wirklichen Sprache nicht gebraucht. Sie werden u.a. in der Wortbildung verwendet, wenn die allgemeinen Wortbildungsregeln für die Ableitung eines Wortes ein bestimmtes Wort voraussetzen, das es nicht gibt.“ (Canoo.net). So wird z.B. das Wortbildungsprodukt verunstalten als Derivation aus ver- und dem fiktiven Eintrag Unstalt erklärt. Antje Töpel 204 Die Wortbildungsangaben, die bei den bearbeiteten Stichwörtern in elexiko verzeichnet sind, werden hingegen vollständig redaktionell erstellt (vgl. Abb. 5). Online sichtbar sind unter der Überschrift ‘Wortbildung’ entweder bei den lesartenübergreifenden oder bei den lesartenbezogenen Angaben Informationen zur Wortbildungsart (im Beispiel ‘explizite Derivation’) sowie zu den Wortbildungsmitteln (die Basis der Wortbildung mit Wortartenangabe - hier das Verb ergänzen - und Wortbildungsaffixe, im Beispiel das Suffix -ung) und zu Fugenelementen. Bei der Wortartikelarbeit werden allerdings noch mehr Merkmale erfasst, wie die Existenz eines Vokalwechsels, die Art einer möglichen Tilgung und/ oder Ersetzung sowie die Wortbildungsbedeutung, die online nicht dargestellt werden. 5 Abb. 5: Wortbildungsanalyse in elexiko, Beispiel Ergänzung 2.3 Wortbildungsprodukte zu einem Stichwort Abgesehen von den Wortbildungselementen bzw. den Wortbildungsprodukten als Wörterbuchstichwörtern und den Wortbildungsanalysen der komplexen Lemmata können in einem Wörterbuch auch Wortbildungsprodukte zu einem Stichwort präsentiert werden. Auch hier bieten sich wieder mehrere Möglichkeiten der Darstellung an. Im Langenscheidt Großwörterbuch Deutsch als Fremdsprache (LWB) werden die aufgenommenen Wortbildungsprodukte lesartenbezogen in den jeweiligen Artikel der Wortbildungsbasis eingebettet (vgl. Abb. 6). Verzeichnet werden sowohl Komposita wie auch Derivate, wobei die Zusammensetzungen noch- 5 Eine ausführliche Darstellung der Wortbildungsangaben in elexiko findet sich im Beitrag „Wortbildung in elexiko: Gegenwart und Zukunft“ von Annette Klosa in diesem Band. Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen 205 mals in Komposita mit dem Stichwort als Grundwort (-K) und in Komposita mit dem Stichwort als Bestimmungswort (K-) differenziert werden. Im Beispiel Deutsch sind das als Komposita Deutschkenntnisse, Deutschkurs, Deutschunterricht (K-, Lesart 1); Amtsdeutsch, Beamtendeutsch, Juristendeutsch, Zeitungsdeutsch, Norddeutsch, Süddeutsch, Hochdeutsch (-K, Lesart 2); Deutschlehrer, Deutschstunde, Deutschunterricht (K-, Lesart 3). Als Ableitungen werden der Lesart 1 deutschsprachig und deutschsprachlich zugeordnet, als deren Wortbildungsbasis jedoch eher (die) deutsche Sprache anzunehmen ist. Abb. 6: Wortbildungsprodukte zum Stichwort Deutsch im LWB Das Neologismenwörterbuch des IDS enthält ebenfalls Wortbildungsprodukte zu den Stichwörtern, die im Artikel der Wortbildungsbasis lesartenbezogen und nach Wortbildungsart getrennt angegeben werden. Die Darstellung ist stärker auf das Medium Internet ausgerichtet als das LWB - die einzelnen Angaben sind übersichtlich auf Registerkarten verteilt, wobei sich die Wortbildungsprodukte unter der Registerkarte „Grammatik“ finden, zudem sind alle Stichwörter verlinkt (vgl. Abb. 7). Antje Töpel 206 Abb. 7: Wortbildungsprodukte zum Stichwort surfen im Neologismenwörterbuch Auch Canoo.net bietet seinen Nutzern zu den Stichwörtern Wortbildungsprodukte an. Im Gegensatz zum LWB oder zum Neologismenwörterbuch werden die Ergebnisse aber vollkommen isoliert in einer Grafik präsentiert. 6 Unter der Überschrift ‘Ableitungen’ werden sie ausgehend vom ganz links stehenden Stichwort in zwei Komplexitätsschritten gezeigt. Die Wortbildungsprodukte werden dabei unabhängig von ihrer Wortbildungsart alphabetisch angeordnet. 2.4 Erweiterte Suchen Angaben zur Wortbildung können im elektronischen Medium nicht zuletzt im Kontext der erweiterten Suchen auftauchen. So bietet das Wörterbuchportal OWID eine Suche nach bearbeiteten Stichwörtern mit bestimmten Wortbildungseigenschaften (wie z.B. Präverbfügungen mit nominaler Basis) an, die wörterbuchübergreifend in den enthaltenen Nachschlagewerken mit Wortbildungsangaben recherchiert. Eine solche Suchmöglichkeit kann die Vielfalt von Wortbildungsprodukten mit gleicher Struktur aufzeigen und ist daher wahrscheinlich vor allem für Fachwissenschaftler von besonders großem Interesse. 6 Für eine Darstellung vgl. Abbildung 5 im Beitrag „Visualisierung von Wortbildungsbeziehungen im elektronischen Wörterbuch“ von Peter Meyer und Carolin Müller-Spitzer in diesem Band. Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen 207 3. Wörterbuchbenutzungsforschung am IDS 3.1 Die Projekte elexiko und BZVelexiko Am Institut für Deutsche Sprache waren mit elexiko und BZVelexiko zwei Projekte in die Benutzungsforschung zu Online-Wörterbüchern involviert. elexiko ( http: / / www.owid.de/ wb/ elexiko/ start.html ) erarbeitet ein korpusbasiertes, einsprachiges Online-Wörterbuch zum Gegenwartsdeutschen mit einer offenen Wortliste, die circa 300 000 Einträge umfasst. Die Bearbeitung des Wörterbuchs erfolgt auf zwei unterschiedlichen Wegen: Zum einen gibt es auf die Breite angelegte, einfache Informationen (beispielsweise zur Rechtschreibung oder Silbentrennung), die für alle Einträge angeboten werden. Zum anderen werden für begrenzte, modular ausgebaute Wortschatzbereiche komplexe Informationen zur Bedeutung, Verwendung, Grammatik und Wortbildung zusammengestellt. 7 Fragen, die sich unter anderem zur Benutzungsforschung ergeben haben, konnten für elexiko in einem eigenen Projekt beantwortet werden - BZVelexiko (Benutzeradaptive Zugänge und Vernetzungen in elexiko). Dabei handelt es sich um ein auf drei Jahre (2009-2011) angelegtes Drittmittelprojekt, das von der Leibniz-Gemeinschaft finanziert wurde. Mit den Schwerpunkten ‘Benutzungsforschung’, ‘Vernetzungen’ und ‘Wortbildungsprodukte’ widmet sich BZVelexiko aktuellen Fragen der elektronischen Lexikographie. 8 3.2 Die Nutzerumfragen und ihre Ergebnisse Im Bereich der Benutzungsforschung wurden von BZVelexiko vier Online- Befragungen durchgeführt, an denen sich insgesamt knapp 2 200 Probanden beteiligten. 9 Die ersten beiden Umfragen liefen im Februar/ März sowie im August/ September 2010 und waren wegen ihrer internationalen Zielgruppe auf Deutsch und Englisch konzipiert. Auch die Themenschwerpunkte waren vergleichsweise breit angelegt: die allgemeine Verwendung von Online-Wörterbüchern (soziale Situationen, Tätigkeiten, Anlässe, Geräte), die Ansprüche an Online-Wörterbücher (Merkmale guter Online-Wörterbücher), die Suchfunktionen sowie die Bewertung unterschiedlicher visueller Repräsentationen 7 Zur Konzeption von elexiko vgl. Haß (Hg.) (2005), zu den Erfahrungen nach fünf Jahren praktischer Arbeit an den Wörterbuchartikeln vgl. Klosa (Hg.) (2011). 8 Für weitere Informationen zu BZVelexiko vgl. die Projektseiten unter http: / / www.ids-mannheim. de/ lexik/ BZVelexiko/ (Stand: 09/ 2011). 9 Zu weiteren Ergebnissen aus diesen Studien vgl. Kapitel 1 im Beitrag „Visualisierung von Wortbildungsbeziehungen im elektronischen Wörterbuch“ von Peter Meyer und Carolin Müller-Spitzer in diesem Band. Antje Töpel 208 eines Wörterbuchartikels. Bei den letzten beiden Befragungen, die im Januar/ Februar sowie im März/ April 2011 liefen, lag der Fokus hingegen auf einsprachigen deutschen Online-Wörterbüchern wie elexiko, weshalb sie ausschließlich auf Deutsch durchgeführt wurden. Thematisch setzten sich diese Umfragen mit folgenden Bereichen auseinander: der Wichtigkeit einzelner Angabebereiche, der Sprache der Benutzeroberfläche, den Funktionen von Belegen, der Darstellung einzelner Angabebereiche sowie dem Ausbau der erweiterten Suchen. An dieser Stelle muss sich die Darstellung allerdings ausschließlich auf die Teilergebnisse konzentrieren, die im Zusammenhang mit der Wortbildung stehen. Eine der Forschungsfragen beschäftigte sich damit, als wie wichtig die Befragten die einzelnen Angabebereiche in einem Online-Wörterbuch einschätzen. Dies spielt für den weiteren Ausbau lexikographischer Angabebereiche eine Rolle. Die Probanden sollten aus den zwölf Bereichen ‘Aussprache’, ‘Bedeutungserläuterung’, ‘Besonderheiten des Gebrauchs’, ‘Grammatik’, ‘Kommentare/ Hinweise’, ‘Orthografie’, ‘Semantische Umgebung’, ‘Sinnverwandte Wörter’, ‘Stichwortarten’, ‘Textbeispiele/ Belege’, ‘Typische Verwendungen’ und ‘Wortbildung’ fünf zufällig ausgewählte in ihrer Wichtigkeit bewerten. Die Einschätzung erfolgte einerseits auf einer siebenstufigen Likert-Skala (von ‘überhaupt nicht wichtig/ nützlich/ hilfreich’ bis ‘sehr wichtig/ nützlich/ hilfreich’) und zusätzlich über ein Ranking der fünf Angabebereiche, bei dem kein Rang mehrfach vergeben werden durfte. Aus Abbildung 8 wird ersichtlich, dass die Angabebereiche ‘Wortbildung’ (Platz 3,71 beim Ranking, 5,24 Punkte auf der Skala), ‘Kommentare/ Hinweise’ und ‘Aussprache’ von den Umfrageteilnehmern als am wenigsten wichtig eingeschätzt werden. Im Vergleich dazu schneiden die Angabebereiche ‘Bedeutungserläuterung’ und ‘Typische Verwendungen’ am stärksten ab. Diese Daten müssen jedoch unbedingt in einem weiteren Kontext interpretiert werden. So liegen die einzelnen Werte insgesamt viel dichter beisammen, als Abbildung 8 suggeriert: Beim Ranking bewegen sich die zwölf Angabebereiche in einer Spanne von gut zwei Plätzen (zwischen 1,78 und 3,96), bei der Bewertung nutzen die Probanden sogar nur etwas mehr als eine Stufe aus (zwischen 5,24 und 6,39). Zudem zwingt das Ranking die Probanden zu einer Vergabe unterschiedlicher Ränge. Da verwundert es nicht, dass etwa im direkten Vergleich zwischen den Angabebereichen ‘Wortbildung’ und ‘Bedeutungserläuterung’ Letztere als etwas wichtiger eingeschätzt wird. Das enge Beieinanderliegen aller zwölf bewerteten Angabebereiche macht insgesamt deutlich, dass für die Probanden in einem Online-Wörterbuch viele Angaben von Bedeutung sind. Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen 209 Abb. 8: Die Wichtigkeit der Angabebereiche in Online-Wörterbüchern (Bewertung und Rangfolge) Der nächste Frageblock setzte sich mit den einzelnen Daten auseinander, die sich die Nutzer in den verschiedenen Angabebereichen wünschen. Auch diese Fragen stehen im Zusammenhang mit einem zukünftigen Ausbau von elexiko. Für jeden Angabebereich wurden den Probanden vier bis fünf in ihrer Reihenfolge randomisierte Datentypen zur Auswahl gestellt, zusätzlich gab es die Antwortoptionen „Sonstiges“ (mit einem Freitextfeld) und „Keine der genannten Informationen“. Mehrfachantworten waren möglich, wodurch sich die Summe von über 100 Prozent erklärt. Überraschend sind die Antworten auf die Frage danach, welche Arten von Stichwörtern die Probanden in einem Online-Wörterbuch vorfinden möchten (vgl. Tab. 1). Die Wortverbindungen erreichen mit 88,67 Prozent der Fälle sogar mehr Nennungen als die „normalen“ Wörter (86,33 Prozent der Fälle). Hier zeigt sich das oft zu beobachtende Interesse vieler Sprecher an festeren Wortverbindungen. In 77 Prozent der Fälle werden die Wortbildungsmittel (in erster Linie Präfixe und Suffixe) genannt, Namen erwarten knapp 60 Prozent der Probanden als Stichwörter. Für die Lexikographen, die sich mit dem Thema der Wortbildung im Wörterbuch auseinandersetzen, ist es besonders erfreulich, dass sich beinahe vier von fünf Befragten Wortbildungsmittel als Stichwörter wünschen. Antje Töpel 210 Erwartete Stichwortarten Häufigkeit Prozent der Fälle Wortverbindungen (blind wie ein Maulwurf, das Rad neu erfinden ...) 266 88,67 „normale“ Wörter (Kind, rufen, schön ...) 259 86,33 Vor- und Nachsilben, d.h. Wortbildungsmittel (anti-, ver-, -ung ...) 231 77,00 Namen (Wagner, Berlin, Norwegen ...) 179 59,67 Sonstiges 26 8,67 Keine der genannten Informationen 2 0,67 Summe 963 321 Tab. 1: Erwartete Stichwortarten in Online-Wörterbüchern Erwartete Einzelangaben im Bereich ‘Wortbildung’ Häufigkeit Prozent der Fälle Verlinkung zu den Bestandteilen eines Stichwortes bzw. zu den Wortbildungsprodukten 177 63,67 Erfassung und Beschreibung einzelner Wortbildungsmittel (Vor- und Nachsilben wie ver- und -ung) 175 62,95 Information dazu, welche anderen Wörter zu einem Stichwort gebildet wurden (Wortbildungsprodukte) 174 62,59 Bildung des Stichwortes (z.B. durch Zusammensetzung aus zwei anderen Wörtern) 168 60,43 Grafik, die das Stichwort mit allen zugehörigen Bildungen (z.B. in Form eines Wortnetzes) zeigt 107 38,49 Sonstiges 8 2,88 Keine der genannten Information 6 2,16 Summe 815 293,17 Tab. 2: Erwartete Einzelangaben in Online-Wörterbüchern im Bereich ‘Wortbildung’ Im Angabebereich ‘Wortbildung’ erwarten die Befragten in gleichem Maße vier Typen von Daten (vgl. Tab. 2): die Verlinkung zu Stichwortbestandteilen bzw. Wortbildungsprodukten (63,67 Prozent der Fälle), Wortbildungsmittel als Stichwörter (62,95 Prozent der Fälle), die Angabe von Wortbildungsprodukten (62,59 Prozent der Fälle) sowie die Wortbildungsanalyse des Stichwortes (60,43 Prozent der Fälle). Seltener wird eine Grafik erwartet, die das Stichwort mit seinen Wortbildungsprodukten darstellt (38,49 Prozent der Fälle). Hier zeigt sich, wie unterschiedlich die Probanden die modernen techni- Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen 211 schen Möglichkeiten bewerten, die in einem Online-Wörterbuch umsetzbar sind. Etablierte Techniken wie die Verlinkung werden befürwortet, wohingegen grafische Darstellungen, deren Mehrwert sich für die Befragten nicht unmittelbar erschließt, weniger häufig erwartet werden. 10 Im dritten und letzten Frageblock, der sich auch mit dem Thema der Wortbildung beschäftigte, wurden für einige ausgewählte Angabebereiche (‘Wortbildungsprodukte’, ‘Semantische Umgebung’ und ‘Typische Verwendungen’) unterschiedliche Darstellungsformen präsentiert. Die Befragten sollten angeben, welche Art der Darstellung ihnen am besten gefällt, wobei es auch die Antwortmöglichkeit „Keine Präferenz“ gab. Per Zufallsauswahl erhielt jeder Proband einen der drei Bereiche zur Beantwortung. Abb. 9: Alphabetische und frequenzorientierte Sortierung der Komposita am Beispiel Zug 10 Vgl. hierzu auch die Diskussion in Kapitel 1 im Beitrag „Visualisierung von Wortbildungsbeziehungen im elektronischen Wörterbuch“ von Peter Meyer und Carolin Müller-Spitzer in diesem Band. Antje Töpel 212 Anhand der Wortbildungsprodukte wurde getestet, ob die Befragten für diese eine alphabetische oder eine frequenzorientierte Sortierung bevorzugen. Beide Darstellungen wurden den Probanden präsentiert, die Reihenfolge war wiederum zufällig (vgl. Abb. 9). Wie aus Tabelle 3 hervorgeht, spricht sich exakt die Hälfte aller Befragten für eine alphabetische Sortierung der Wortbildungsprodukte aus. Mit 36,62 Prozent bevorzugt gut ein Drittel die Sortierung nach Häufigkeit. 13,38 Prozent äußern keine Präferenz. Wertet man die Probanden nach Berufsgruppen getrennt aus, zeigt sich, dass sich die Studierenden der Sprachwissenschaften noch stärker für eine Sortierung der Wortbildungsprodukte nach dem Alphabet aussprechen (62,50 Prozent). Bei den befragten Sprachwissenschaftlern bietet sich hingegen ein anderes Bild: Zum einen votiert hier mit 44 Prozent die größte Gruppe dafür, die Wortbildungsprodukte nach ihrer Frequenz zu sortieren, zum anderen fallen die Unterschiede zwischen den einzelnen Antwortoptionen weniger stark ins Gewicht, die Wahl erfolgt wesentlich ausgeglichener. Bevorzugte Sortierung der Wortbildungsprodukte Probanden Alphabetisch Frequenzorientiert Keine Präferenz Gesamt 50,00% 36,62% 13,38% Studierende der Sprachwissenschaften Ja 62,50% 32,50% 5,00% Nein 45,10% 38,24% 16,67% Sprachwissenschaftler Ja 38,00% 44,00% 18,00% Nein 56,52% 32,61% 10,87% Tab. 3: Die bevorzugte Sortierung der Wortbildungsprodukte Die dargestellten gruppenspezifischen Unterschiede bei der bevorzugten Art der Sortierung der Wortbildungsprodukte zwischen den Probanden wurden im Zusammenhang mit der benutzeroptimierten Umgestaltung von elexiko berücksichtigt: elexiko bietet als Konsequenz aus den Befragungen die Wortbildungsprodukte sowohl in der Sortierung nach Alphabet als auch in der Sortierung nach der Frequenz zum Wechseln an. Die Anfangseinstellung ist dabei die alphabetische Sortierung, weil sich insgesamt mehr Probanden für diese ausgesprochen haben. 11 11 Für eine ausführliche Darstellung dessen, wie die Ergebnisse der Befragungen bei der Neugestaltung von elexiko umgesetzt wurden, vgl. Klosa/ Koplenig/ Töpel (2011). Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen 213 4. Zusammenfassung Dieser Beitrag hat verdeutlicht, wie vielfältig und umfangreich Angaben in Online-Wörterbüchern sein können, die im Kontext der Wortbildung stehen. Ebenso mannigfaltig können die unterschiedlichen Arten sein, wie die einzelnen Angaben letztendlich dargestellt werden. Welche dieser Einzelangaben dabei für die Nutzer von Online-Wörterbüchern relevant sind und wie die Präsentation der Angaben am sinnvollsten aussehen sollte, kann mithilfe der Wörterbuchbenutzungsforschung eruiert werden, wie dies in den letzten Jahren im Rahmen des Projektes BZVelexiko für elexiko geschehen ist. An dieser Stelle konnte nur ein kleiner Ausschnitt aus den Ergebnissen der Nutzerumfragen präsentiert werden. Neben den Online-Befragungen wurde außerdem eine Laborstudie mit Eyetracking durchgeführt. Weitere, ausführlichere Darstellungen zu den Ergebnissen der Benutzerstudien, die im Rahmen des Forschungsschwerpunktes ‘Wörterbuchbenutzungsforschung’ von 2009 bis 2011 im Projekt BZVelexiko umgesetzt wurden, bieten die bereits erwähnten Publikationen sowie die Vorträge, die z.B. im November 2011 auf der eLEX gehalten wurden. Im Zusammenhang mit dem Thema Wortbildung hat sich aus den Nutzerumfragen für elexiko vor allem ein praktischer Schritt ergeben: Die Wortbildungsprodukte wurden, da sich die Meinungen der Nutzer hier je nach Gruppe unterschieden, sowohl in alphabetischer als auch in frequenzorientierter Sortierung in elexiko integriert. 12 5. Literaturverzeichnis 5.1 Wörterbücher Bernal Gallén, Elisenda: DSVC - Diccionari de Sufixos Verbalitzadors del Català. Internet: http: / / www.upf.edu/ pdi/ dtf/ elisenda.bernal/ dsvc/ entrada.htm (Stand: 09/ 2011). Canoo.net - Deutsche Wörterbücher und Grammatik. Internet: http: / / www.canoo.net / (Stand: 09/ 2011). Duden (2009) = Duden - Die deutsche Rechtschreibung. Hrsg. von der Dudenredaktion. 25., völl. neu bearb. und erw. Aufl. Mannheim u.a. Duden (2010) = Duden - Das Fremdwörterbuch. Hrsg. von der Dudenredaktion. 10., aktual. Aufl. Mannheim u.a. 12 Vgl. hierfür den Beitrag „Chancen und Probleme bei der automatischen Ermittlung von Wortbildungsprodukten für elexiko und bei ihrer Präsentation“ von Sabina Ulsamer in diesem Band. Antje Töpel 214 Duden (2010) = Duden - Das Synonymwörterbuch. Hrsg. von der Dudenredaktion. 5., vollst. überarb. Aufl. Mannheim u.a. Duden online. Internet: http: / / www.duden.de / (Stand: 09/ 2011). elexiko (2003ff.): In: Institut für Deutsche Sprache (Hg.): OWID - Online-Wortschatz-Informationssystem Deutsch. Mannheim. Internet: http: / / www.owid.de/ wb/ elexiko/ start.html (Stand: 09/ 2011). GWDS (1999) = Duden - Das große Wörterbuch der deutschen Sprache. Hrsg. von der Dudenredaktion. 3., völlig neu bearb. und erw. Aufl. Mannheim u.a. LWB = Langenscheidt Großwörterbuch Deutsch als Fremdsprache. In: Langenscheidt Online-Wörterbücher. Internet: http: / / services.langenscheidt.de/ hebis / (Stand: 09/ 2011). Neologismenwörterbuch (2005ff.): In: Institut für Deutsche Sprache (Hg.): OWID - Online-Wortschatz-Informationssystem Deutsch. Mannheim. Internet: http: / / www. owid.de/ wb/ neo/ start.html / (Stand: 09/ 2011). Quinion, Michael: Dictionary of affixes. Internet: http: / / affixes.org / (Stand: 09/ 2011). Quinion, Michael (2005): Ologies and Isms. A dictionary of word beginnings and endings. Oxford u.a. 5.2 Forschungsliteratur Haß, Ulrike (Hg.) (2005): Grundfragen der elektronischen Lexikographie. elexiko − das Online-Informationssystem zum deutschen Wortschatz. (= Schriften des Instituts für Deutsche Sprache 12). Berlin/ New York. International Journal of Lexicography (2011): Studies in dictionary use: Recent developments. (= Special issue 24, 1). Institut für Deutsche Sprache (Hg.) (2008ff.): OWID - Online-Wortschatz-Informationssystem Deutsch. Mannheim. Internet: http: / / www.owid.de/ (Stand: 09/ 2011). Institut für Deutsche Sprache (Hg.) (2009ff.): BZVelexiko - Benutzeradaptive Zugänge und Vernetzungen in elexiko. Mannheim. Internet: http: / / www1.ids-mannheim.de/ lexik/ BZVelexiko/ (Stand: 09/ 2011). Institut für Deutsche Sprache (Hg.) (2011): Netzwerk Internetlexikografie. Mannheim. Internet: http: / / www.internetlexikografie.de/ (Stand: 09/ 2011). Klosa, Annette/ Koplenig, Alexander/ Töpel, Antje (2011): Benutzerwünsche und Meinungen zu einer optimierten Wörterbuchpräsentation - Ergebnisse einer Onlinebefragung zu elexiko. In: OPAL - Online publizierte Arbeiten zur Linguistik 3/ 2011, S. 1-35. Internet: http: / / pub.ids-mannheim.de/ laufend/ opal/ pdf/ opal2011-3.pdf (Stand: 12/ 2011). Klosa, Annette (Hg.) (2011): elexiko. Erfahrungsberichte aus der lexikographischen Praxis eines Internetwörterbuchs. (= Studien zur Deutschen Sprache 55).Tübingen. Welker, Herbert Andreas (2010): Dictionary use. Internet: http: / / www.let.unb.br/ hawelker/ images/ stories/ professores/ documentos/ dictionary_use_research.pdf (Stand: 10/ 2012). C) Computergestützte Gewinnung von Wortbildungsangaben und ihre Präsentation Christian Simon Finite-State-basierte Morphologie-Tools und ihre Stärken und Schwächen bei der maschinellen Wortbildungsanalyse 1. Einleitung Was ist ein Morphologie-Tool? Ein Morphologie-Tool ist in der maschinellen Sprachverarbeitung ein Programm, das seine Eingabe anhand einer natürlichsprachlichen Morphologie verarbeitet. Diese Verarbeitung kann sowohl die morphologische Analyse umfassen als auch die Generierung von Wortformen. Bei der morphologischen Analyse bekommt das Tool eine natürlichsprachliche Wortform als Eingabe und liefert als Ausgabe eine Analyse, die ihr zugrunde liegendes Lexem, ihre morphosyntaktischen Flexionsmerkmale sowie Angaben ihrer Gebildetheit enthält. Die Generierung dagegen funktioniert genau umgekehrt: Hier soll aus den entsprechenden Angaben eine flektierte, in der natürlichen Sprache gültige Wortform produziert werden. Dabei ist es ein wesentliches Merkmal eines Morphologie-Tools, dass diese morphologische Verarbeitung des Eingabestrings anhand eines Lexikons und von Regeln bzw. anhand eines statistischen Modells in Echtzeit vorgenommen wird. Das triviale Abrufen von fertigen Ergebnissen aus einer Datenbank oder einer anderen Wissensbasis soll gerade nicht stattfinden. Das Lexikon und das Regelwerk sollen ausdrucksstark genug sein, um mit beliebigen Eingaben umgehen zu können. Zum Einsatz kommen Morphologie-Tools insbesondere als Komponente in komplexeren computerlinguistischen Anwendungen wie der maschinellen Übersetzung oder dem Information-Retrieval. Da sie in solchen Kontexten lediglich eine Analysevorstufe für eine aufwendige Verarbeitung natürlicher Sprache darstellen, müssen sie darüber hinaus sehr schnell sein. In diesem Sinne eignen sie sich auch als Werkzeug, um große Menge von linguistischen Daten um morphologische Informationen anzureichern. Den Anspruch auf eine hundertprozentige Korrektheit der produzierten Ausgaben oder gar eine vollständige Abdeckung der jeweiligen unterstützten Sprache können sie allerdings nicht erfüllen. Ihrem Können sind Grenzen gesetzt, die sich zum einen aus ihrer grundlegenden Funktionsweise heraus ergeben, aber auch aus der Unendlichkeit natürlicher Sprachen sowie der alltäglichen Praxis. In diesem Sinne will dieser Aufsatz eine kurze Einführung in die grundlegende Funktionsweise von Morphologie-Tools geben, die auf der so genannten Finite-State-Technologie basieren. Dabei soll exemplarisch anhand des Mor- Christian Simon 218 phologie-Tools Morphisto (Zielinski/ Simon 2008) gezeigt werden, wo gerade bei der Wortbildungsanalyse ihre Stärken und Schwächen liegen. Der Aufsatz schließt mit einem Ausblick, in dem auch alternative Ansätze für Morphologie-Tools angesprochen werden. 2. Grundlegende Funktionsweise von Morphologie-Tools 2.1 Der Finite-State-Transducer Die Finite-State-Technologie hat sich zur etabliertesten Technologie für Morphologie-Tools entwickelt. Im Kern begründet sie sich auf ein Konzept aus der theoretischen Informatik, dem ‘Finite-State-Transducer’ (FST) bzw. ‘endlichen Transduktor’. Den Finite-State-Transducer muss man sich als eine simple, abstrakte gedachte Maschine vorstellen, die eine beliebige Folge von Symbolen, den ‘String’, abarbeitet und ein Netzwerk von Knoten von einem Startknoten zu einem Zielbzw. Endknoten durchläuft. Während der Übergänge von einem Knoten zum nächsten werden Zeichen ausgegeben, die aneinandergereiht den Ausgabestring bzw. das Ergebnis darstellen. Ein Regelwerk bestimmt das Zusammenspiel von gelesenem Eingabezeichen, Ausgabezeichen, Start- und Zielknoten. Zur Veranschaulichung sei auf die grafische Darstellung eines FST als gerichteter Graph in Abbildung 1 verwiesen: Knoten S ist der Startknoten, E der Endknoten. In den Kantenbeschriftungen stehen die gelesenen Eingabezeichen links vom Doppelpunkt, die zu produzierenden Ausgabezeichen rechts. Formal lässt sich ein FST als ein 6-fach-Tupel A = < > wie folgt definieren (basierend auf Klabunde 1998, Definition 3.9; sowie Mohri 1997, Definition S. 271): Abb. 1: Finite-State-Transducer für Wald, Kind Finite-State-basierte Morphologie-Tools 219 - ist die Menge der Zustände, die der Automat annehmen kann. Für den Automaten in Abbildung 1 ist dies = {S, z0, Sg, Pl, E}. - ist die Menge der möglichen Eingabesymbole. Bei einem FST für deutsche Wortformen entspricht das der Menge der lateinischen Buchstaben plus den deutschen Sondergraphemen ü, ä, ö, ß. Dazu kommt das so genannte ‘leere Wort’ ε, das es dem Automaten erlaubt, einen Übergang vorzunehmen, ohne ein Zeichen lesen zu müssen: - = {A-Z, a-z, Ä, ä, Ö, ö, Ü, ü, ß, ε} - ist die Menge der möglichen Ausgabesymbole, in diesem Fall gilt . - Die Funktion definiert die Übergänge von einem Zustand in den nächsten in Abhängigkeit vom gelesenen Symbol. - Die Funktion definiert die Ausgabe in Abhängigkeit vom derzeitigen Zustand und der gelesenen Eingabe. - Es gib einen Startzustand , in unserem Fall S, von dem aus der FST die Verarbeitung des Eingabestrings beginnt. - bezeichnet die Menge der möglichen Endzustände, an denen die Verarbeitung beendet werden kann; in diesem Fall F = {E}. 2.2 FST-basierte Wortformenanalyse Wie geht der FST vor, wenn eine deutsche Wortform analysiert werden soll? Der in Abbildung 1 dargestellte FST ist dafür konzipiert, die Flexionsparadigmata von Wald und Kind analysieren zu können. 1 Nehmen wir an, dass der Automat auf die Wortform Wälder angewandt wird: Zunächst befindet sich der Automat in seinem Startzustand, also S. Für die Eingabezeichenkette Wäld existiert im Zustand S ein Übergang, nämlich in den Zustand Pl. Bei diesem Übergang wird der Ausgabestring N,mask,Pl ausgegeben. Im Zustand Pl gibt es für den verbleibenden Eingabestring drei mögliche Übergänge: Verfolgen wir den ersten, gelangen wir in den Endzustand E und an die Ausgabe wird Gen angehängt. Da der Automat für diesen Eingabestring einen Endzustand erreicht hat, wird die Eingabe als gültig akzeptiert und die Analyse 1 Der Vollständigkeit halber sollte hier erwähnt werden, dass dieser Transducer lediglich dem Zweck dient, dem Leser die grundlegende Funktionsweise eines FST näherzubringen. Er ist darüber hinaus nichtdeterministisch, d.h., dass es für jedes Eingabesymbol mehr als einen Zielzustand gibt. In der Praxis würde man einen solchen Transducer zunächst in einen deterministischen umwandeln und danach hinsichtlich der Anzahl seiner Zustände minimieren. Christian Simon 220 N,mask,Pl,Gen ausgegeben. Da es aber im Zustand Pl noch zwei weitere Übergänge gibt, erlaubt das so genannte ‘Backtracking’, zur letzten Verzweigungsmöglichkeit zurückzukehren und die übrigen Übergänge zu verfolgen. Damit ergeben sich zusätzlich die Ausgaben N,mask,Pl,Akk sowie N,mask,Pl,Nom. Was passiert nun bei einer falschen Eingabe wie *Wäld ? Der Automat würde bis in den Zustand Pl kommen und dann abbrechen, weil der Eingabestring bereits abgearbeitet worden ist, obwohl noch kein Endzustand erreicht wurde. Für die falsche Eingabe *Wälde gäbe es im Zustand Pl keinen Übergang für die Eingabe e, sodass der Automat ebenfalls stehen bliebe und die Wortform als nicht gültig zurückgewiesen würde. Bei der Eingabe Kind gelangt der Automat zunächst in den Zustand z0 und produziert die Ausgabe N,neut. Von dort erlaubt es das leere Wort ε, sowohl in den Zustand Sg als auch in den Zustand Pl zu springen, ohne dass eine Eingabe gelesen werden muss. Der erste Sprung führt in den Zustand Sg und hängt Sg an die Ausgabe. Danach erlauben wiederum das leere Wort und das Backtracking, dass die Analysen N,neut,Sg,Dat sowie N,neut,Sg,Akk ausgegeben werden. Ein erneutes Backtracking führt dazu, dass der Automat in den Zustand Pl wechselt. Da aber dort schon die Eingabe zu Ende gelesen worden ist, passt kein weiterer Übergang, sodass keine weiteren Analysen mehr ausgegeben werden. 2.3 FST-basierte Wortformengenerierung Eine weitere Eigenschaft, die FSTs für die Computermorphologie so attraktiv gemacht haben, ist die Möglichkeit, die Einmit der Ausgabeseite zu vertauschen und somit den Automaten für die Wortformengenerierung zu nutzen: Nehmen wir an, die Ein- und die Ausgabeseite im FST von Abbildung 1 wären miteinander vertauscht worden. De facto bedeutet dies, dass der String, der rechts vor dem Doppelpunkt stand, nun links davon steht und dass der String links nun rechts steht. Wenden wir den FST mit vertauschter Ein- und Ausgabeseite auf den Eingabestring Wald,N,mask,Sg,Dat an: Für die Teileingabe Wald,N,mask,Sg, springt der Automat zunächst in den Zustand Sg und produziert die Ausgabe Wald. Danach gibt es zwei mögliche Übergänge für die Eingabe Dat: Beide führen in den Endzustand, der eine jedoch produziert die Ausgabe Walde, der andere hängt lediglich das leere Wort an, sodass die Ausgabe Wald entsteht. Finite-State-basierte Morphologie-Tools 221 2.4 Erstellung von Finite-State-Transducern In der Praxis kommen für die Computermorphologie FSTs zum Einsatz, die Millionen von Zuständen und Übergängen haben, sodass eine manuelle Erstellung unmöglich ist. Stattdessen hat man das Problem wie in der Informatik üblich auf eine höhere Abstraktionsebene verlagert, indem man formale Sprachen definiert hat, mit denen sich die Erstellung von FSTs automatisieren lassen. Sie bedienen sich formal bewiesener Eigenschaften von FSTs, wie z.B. ihrer Abgeschlossenheit über der Vereinigung. Mit der Eigenschaft der Vereinigung lassen sich zwei beliebige FSTs zu einem einzigen FST vereinigen, der das Erkennungs- und Ausgabeverhalten von den beiden Ursprungs-FSTs hat. Folgendes Code-Beispiel ist in der Beschreibungssprache des Stuttgart Finite State Toolkits (SFST ) (Schmid 2006) geschrieben: $A$ = {Kind\,N\,neut\,Pl\,Nom}: {Kinder} $B$ = {Kind\,N\,neut\,Pl\,Gen}: {Kinder} $C$ = $A$ | $B$ $C$ Mit $A$ wird ein FST definiert, der Kinder erkennt und dafür die Ausgabe Kind,N,neut,Pl,Nom produziert. $B$ erkennt ebenfalls Kinder, produziert aber die Ausgabe Kind,N,neut,Pl,Gen. In der letzten Zeile werden diese beiden FSTs zu einem FST $C$ vereinigt (Operator |), der für die Eingabe Kinder die zwei bekannten Ausgaben produziert. Dieses Vorgehen ist allerdings trivial und zudem unelegant, weil es einer Wortform eine fertige Analyse zuordnet. Erheblich besser ist es dagegen, generischer zu arbeiten und zwar mit der von Kimmo Koskenniemi entwickelten Two-Level-Morphology (Koskenniemi 1983). Zunächst definieren wir einen FST, der Grundformen einer Morphologie abdeckt, indem die Basisstämme über die Eigenschaft der Vereinigung miteinander verknüpft werden: $LEXIKON$ = Kind | Wald Die Reihe ließe sich mit beliebig vielen weiteren Basisstämmen fortsetzen, der Einfachheit halber bleiben wir bei Kind und Wald. In einem zweiten Schritt konkatenieren wir diesen FST mit einem FST, der die morphosyntaktische Angabe N,neut,Sg,Gen auf den String $s abbildet: $A$ = $LEXIKON$ {\,N\,mask\,Sg\,Gen}: {$s} Christian Simon 222 Für die Eingabe Wald,N,neut,Sg,Gen produziert dieser FST die Ausgabe Wald$s. Das $ ist hier ein beliebiges Sonderzeichen, das vorzugsweise nicht in der natürlichen Sprache, deren Morphologie modelliert werden soll, vorkommt. Als Nächstes modellieren wir einen FST, der jedes Vorkommen von $ durch e ersetzt: ALPHABET = [A-Za-z] $: e $GENITIV1$ = .* Analog dazu brauchen wir noch einen FST, der jedes Vorkommen von $ durch den leeren String (hier durch < > ausgedrückt) ersetzt: ALPHABET = [A-Za-z] $: < > $GENITIV2$ = .* Abschließend werden diese beiden FSTs zu einem großen FST vereinigt. $GENITIVREGELN$ = $GENITIV1$ | $GENITIV2$ Schließlich nutzen wir die Eigenschaft von FSTs aus, dass sie über Komposition abgeschlossen sind. Abgeschlossenheit über Komposition bedeutet, dass man zwei beliebige FSTs, die kaskadiert hintereinander arbeiten, d.h., dass die Ausgabe des ersten zur Eingabe für den zweiten wird, in einen einzigen äquivalenten FST verwandeln kann. Und das geschieht hier: $A$ || $GENITIVREGELN$ Am Ende steht ein FST, der sich genauso verhält, als würde man die Eingabe zunächst vom FST $A$ verarbeiten lassen und dann dessen Ausgabe später auf den FST in $GENITIVREGELN$ anwenden. Damit verwandelt sich eine Eingabe Wald,N,neut,Sg,Gen zunächst in Wald+s und danach kann sie entweder in Waldes umgewandelt werden (FST $GENITIV1$ ) oder aber in Walds (FST $GENITIV2$ ). Und da FSTs auch ihre Seiten vertauschen können, lässt sich der Prozess so umkehren, dass aus Walds die bekannte Analyse Wald,N,neut,Gen,Sg produziert wird. De facto wird das Problem auf zwei Ebenen verlagert. Auf der ersten wird aus der Eingabe eine morphologisch-allophonische Zwischenrepräsentation erstellt (Wald+s), auf der zweiten wird dann daraus das Endergebnis (Walds, Waldes). Und dabei ließe sich die Menge der Basisstämme, auf die man diese Regel anwenden kann, noch mühelos erweitern. Diese Möglichkeit, einerseits phonologische Gesetzmäßigkeiten zu modellieren und gleichzeitig das Lexikon offen zu lassen, hat dem FST-basierten Ansatz für Morphologie-Systeme zum Durchbruch verholfen. Finite-State-basierte Morphologie-Tools 223 3. Morphisto - ein freies Morphologie-Tool für das Deutsche 3.1 Vorstellung von Morphisto Morphisto ist ein auf der FST-Technologie basierendes Morphologie-Tool für das Deutsche. 2 Es stellt eine Weiterentwicklung der Computermorphologie SMOR der Universität Stuttgart (Schmid/ Fitschen/ Heid 2004) 3 dar, die am IDS Mannheim um ein freies Lexikon erweitert wurde (Zielinski/ Simon 2008). SMOR steht unter der Open-Source-Softwarelizenz GPLv2, 4 das Lexikon, das Morphisto zu SMOR beisteuert, unter der CC BY-SA 2.0-Lizenz für nichtkommerzielle Zwecke. 5 Für deutsche Wortformen produziert Morphisto eine Flexionsanalyse sowie eine „flache“ Wortbildungsanalyse; flach in dem Sinne, dass eine Wortform in ihre lexikalischen Komponenten zerlegt wird, aber ohne dass dabei Aussagen über die Hierarchie dieser Zerlegung getroffen werden. Folgendes Beispiel zeigt Morphistos Analyse für die ambige Wortform Staubecken, die sowohl als Stau-Becken bzw. Staub-Ecken bzw. Staub-Eck interpretiert werden kann: analyze> Staubecken Staub<NN>Ecke<+NN><Fem><Akk><Pl> Staub<NN>Ecke<+NN><Fem><Gen><Pl> Staub<NN>Ecke<+NN><Fem><Nom><Pl> Staub<NN>Ecke<+NN><Fem><Dat><Pl> Staub<NN>Eck<+NN><Neut><Dat><Pl> Stau<NN>Becken<+NN><Neut><Akk><Pl> Stau<NN>Becken<+NN><Neut><Akk><Sg> Stau<NN>Becken<+NN><Neut><Gen><Pl> Stau<NN>Becken<+NN><Neut><Nom><Pl> Stau<NN>Becken<+NN><Neut><Nom><Sg> Stau<NN>Becken<+NN><Neut><Dat><Pl> 2 Morphisto-Projektseite: http: / / code.google.com/ p/ morphisto/ (Stand: 09/ 2011). Zum Einsatz von Morphisto im Projekt elexiko vgl. Kapitel 3 im Beitrag „Chancen und Probleme bei der automatischen Ermittlung von Wortbildungsprodukten für elexiko und bei ihrer Präsentation“ von Sabina Ulsamer in diesen Band. 3 SMOR-Projektseite: http: / / www.ims.uni-stuttgart.de/ projekte/ gramotron/ SOFTWARE/ SFST.html (Stand: 09/ 2011). 4 http: / / www.gnu.org/ licenses/ gpl-2.0.html (Stand: 09/ 2011). 5 http: / / creativecommons.org/ licenses/ by-sa/ 2.0/ de/ (Stand: 09/ 2011). Christian Simon 224 Stau<NN>Becken<+NN><Neut><Dat><Sg> stauben<V>Ecke<+NN><Fem><Akk><Pl> stauben<V>Ecke<+NN><Fem><Gen><Pl> stauben<V>Ecke<+NN><Fem><Nom><Pl> stauben<V>Ecke<+NN><Fem><Dat><Pl> stauben<V>Eck<+NN><Neut><Dat><Pl> stauen<V>Becken<+NN><Neut><Akk><Pl> stauen<V>Becken<+NN><Neut><Akk><Sg> stauen<V>Becken<+NN><Neut><Gen><Pl> stauen<V>Becken<+NN><Neut><Nom><Pl> stauen<V>Becken<+NN><Neut><Nom><Sg> stauen<V>Becken<+NN><Neut><Dat><Pl> stauen<V>Becken<+NN><Neut><Dat><Sg> Alle Angaben in spitzen Klammern sind als morphologische Metainformationen zu lesen. Zuerst werden die lexikalischen Komponenten mit ihren jeweiligen Wortarten ausgegeben (<V> für Verb, <NN> für Nomen, <+NN> für das letzte Glied). Danach stehen die morphosyntaktischen Angaben. Wie in Kapitel 1.2 beschrieben, kann Morphisto auch Wortformen generieren: > Staub<NN>Eck<+NN><Neut><Dat><Pl> Staubecken Morphisto versucht beliebige Wortformen des Deutschen zu analysieren, auch fiktive wie hinwissen oder Donaudampfschifffahrtskapitänsmütze. Das setzt natürlich voraus, dass im FST die jeweiligen Übergänge für die entsprechenden Lexeme, Affixe und Wortbildungsregeln vorhanden sind. Hergeleitet werden diese Übergänge durch ein entsprechendes Lexikon, das separat gepflegt wird und bei der Erstellung des Morphisto-FSTs integriert werden muss. 3.2 Das Lexikon Der Erfolg eines regelbasierten Morphologie-Tools steht und fällt mit dem Lexikon: Ein zu kleines Lexikon führt zu einer geringen Trefferquote, ein zu großes kann für einen unkontrollierten Anstieg der Größe des FSTs sorgen: Die technischen Probleme, die sich daraus ergeben, sind eine längere Erstellungszeit des FSTs sowie eine schlechtere Performanz beim Einsatz des FSTs. Die linguistische Gefahr, die sich daraus ergibt, ist die Übergenerierung. Finite-State-basierte Morphologie-Tools 225 Bei der Entwicklung von Morphisto wurde daher Redundanzfreiheit als Ziel verfolgt: Es sollten möglichst nur Simplizia ins Lexikon aufgenommen werden, aus denen die Bildung komplexerer Wortformen hergeleitet werden kann. In diesem Sinne wurde beispielsweise zugunsten der Simplizia Bahn und Hof auf das Lexem Bahnhof als Lexikoneintrag verzichtet: <Base_Stems>Bahn<NN><base><nativ><NFem_0_en> <Base_Stems>Hof<NN><base><nativ><NMasc_es_$e> Der erste Eintrag ist so zu interpretieren, dass der erkannte Stamm Bahn in der Ausgabe wiederum auf Bahn abgebildet wird. Dabei handelt es sich um einen Basisstamm, der wie ein nativer, deutscher Stamm behandelt wird. Das dazugehörige Nomen ist feminin, flektiert im Singular ohne Suffix (0 für ‘Null- Morphem’) und im Plural mit dem Suffix -en. Bei Hof dagegen handelt es sich um ein Maskulinum, dessen Genitiv auf -es gebildet wird (wobei der -e-Einschub optional ist), während für das Plural-Paradigma ein -e angehängt wird und Umlautung ($) stattfindet. Bei der Codierung von morphologischen Zusammenhängen für ein Morphologie-Tool muss man sich von den gedanklichen Vorstellungen der traditionellen Linguistik lösen und sich vor Augen führen, dass die Flexionsparadigmata nicht für ein klassisches Wörterbuch codiert werden, sondern für einen FST. Beim FST in Abbildung 1 brauchte es zwei separate Übergänge für den Stamm Wald und den Stamm Wäld. In diesem Sinne würde ein Lexem wie Cello wie folgt codiert werden: <Base_Stems>Cello<NN><base><nativ><NNeut/ Sg_s> <Base_Stems>Cello: Celli<NN><base><nativ><NNeut/ Pl> Der erste Eintrag beschreibt den Stamm Cello, der auf Cello abgebildet wird, und zwar als reines Singular-Paradigma, das seinen Genitiv auf -s ohne e- Einschub bildet. Der zweite Eintrag lässt den Plural-Stamm Celli auf die Grundform Cello abbilden, wobei keine Suffigierung in diesem Paradigma stattfinden darf. Hinsichtlich seiner Abdeckung sollte das redundanzarme Lexikon von Morphisto den Morphisto-FST in die Lage versetzen, die 30 000 frequentesten Lemmata des Deutschen, wie sie in der DeReWo-Lemmaliste veröffentlicht wurden (IDS Mannheim 2007), analysieren zu können. Das derzeitige Morphisto-Lexikon umfasst 17 759 so genannter Basisstämme, die im Wesentlichen Lexemen entsprechen, von denen 9 718 Substantiv- und Eigennamen- Stämme sind, 4 655 Verbstämme und 3 421 Adjektiv-Stämme. Dazu kommen noch 432 Präfixe und 231 sonstige Einträge, sodass das finale Lexikon in Summe 18 653 Einträge hat. Christian Simon 226 3.3 Morphistos Probleme bei der Wortformenanalyse 3.3.1 Das Problem der unzulänglichen Lexikonabdeckung Unzulänglichkeiten in der Lexikonabdeckung führen dazu, dass Wortformen insgesamt nicht analysiert werden können, selbst wenn die übrigen Morphe, aus denen sich die Wortform konstituiert, bekannt sind. Das erklärt sich damit, dass der FST in seinem Übergangsnetzwerk in einen Zustand gerät, von dem aus keine weiteren Übergänge für dieses Morph existieren. Da es im Deutschen sehr viel motivierte Wortbildung gibt, kommt man mit dem Lexikon von Morphisto recht weit. So kann Morphisto für die 100 000 Einträge umfassende korpusbasierte Wortformenliste DeReWo (IDS Mannheim 2009) lediglich zu 15 114 Einträgen überhaupt keine Analyse ermitteln. Das Hauptproblem stellen dabei Simplizia dar, die aus einer Fremdsprache entlehnt wurden (Fakir), darunter vor allem Anglizismen (Entry), sowie Eigennamen (Hartz) und eher niedrigfrequente Simplizia ( filzen). Es bieten sich nicht sehr viele Lösungsmöglichkeiten für dieses Problem: Das eine ist die manuelle, von Menschen zu leistende Lexikonpflege, die bei Bekanntwerden nichtanalysierbarer Wortformen nötig wird und das Lexikon entsprechend anpasst. Diese Methode wird momentan beim Morphisto-Projekt gepflegt: Auf der Projekt-Homepage gibt es einen so genannten ‘Bug-’ oder ‘Issue-Tracker’, eine Software, die es jedermann erlaubt, Probleme, die mit Morphisto auftauchen, zu protokollieren. Es wird gefragt, mit welcher Version von Morphisto das Problem auftritt, bei welcher Eingabe und was die zu erwartende Ausgabe gewesen wäre. Die Projektverantwortlichen haben dann die Möglichkeit, auf das Problem zu reagieren, es auszudiskutieren, zu beheben oder für nichtig oder gelöst zu erklären. Jeder Schritt, und sei es nur, dass jemand für die Lösung des Problems verantwortlich erklärt worden ist, kann dadurch protokolliert werden. Eine alternative Lösungsstrategie könnte in dem Ansatz von Lindén/ Tuovila (2009) bestehen: Das Lexikon wird automatisch durch das so genannte ‘Morphological Guessing’ um weitere Einträge angereichert. Dabei werden für Lexeme die fehlenden Angaben (insbesondere die Flexionsklasse) erraten. Die aus den erratenen Angaben generierten Wortformen werden dann mit einem Korpus abgeglichen. 3.3.2 Übergenerierungen Einer der offensichtlichsten Mängel bei regelbasierten Morphologie-Tools sind die bereits angesprochenen Übergenerierungen. Übergenerierungen zeich- Finite-State-basierte Morphologie-Tools 227 nen sich dadurch aus, dass das gewünschte Ergebnis (bzw. bei Ambiguitäten die gewünschten Ergebnisse) zwar in der Ergebnismenge enthalten ist, doch nicht alleine: Dabei steht eine beliebig große Anzahl von Analysen, die entweder theoretisch möglich sind oder aber gänzlich falsch. Folgendes Beispiel demonstriert dieses Phänomen für die Wortform lebenslänglich, wobei aus Gründen der Platzökonomie auf die morphosyntaktischen Angaben verzichtet wurde und Duplikate entfernt wurden: > lebenslänglich Leben<NN>Länge<NN>lich<SUFF><+ADJ> Leben<NN>länglich<+ADJ> Leben<NN>lang<ADJ>lich<SUFF><+ADJ> Leben<NN>langen<V>lich<SUFF><+ADJ> leben<V><NN><SUFF>Länge<NN>lich<SUFF><+ADJ> leben<V><NN><SUFF>länglich<+ADJ> leben<V><NN><SUFF>lang<ADJ>lich<SUFF><+ADJ> leben<V><NN><SUFF>langen<V>lich<SUFF><+ADJ> Berücksichtigt man die Semantik von lebenslänglich, so erscheint die Analyse Leben+lang+lich am plausibelsten. Eine Analyse wie leben+lang+lich wäre vielleicht noch vertretbar, während man wohl als Muttersprachler die Analyse leben+langen+lich als inkorrekt entschieden zurückweisen würde. Ein Spezialfall der Übergenerierungen sind Interferenzen, die durch einsilbige Lexeme entstehen, deren Basisstämme in vielen anderen Stämmen sehr frequent vorkommen. Dazu gehören Lexeme wie Ei, Ion oder Uni. Da es sich dabei um Simplizia handelt, hat ihre Existenz im Lexikon seine Berechtigung. Im folgenden Beispiel ist die Analyse von Union als Un-Ion theoretisch denkbar, aber doch sehr unwahrscheinlich: Union<+NN> Un<OTHER>Ion<+NN> Es liegt im Ermessen des Lexikographen, wie mit Einträgen, die Übergenerierungen verursachen, umzugehen ist: Es gibt die Strategie, solche Stämme gar nicht erst ins Lexikon aufzunehmen, nicht zuletzt weil sie bisweilen eher niedrigfrequent sind. Ein weiterer Trick ist ihre Markierung als so genannte ‘Initialstämme’, die nur am Wortanfang als Wortbildungseinheit genutzt werden dürfen. Damit könnte man im folgenden Beispiel die unschöne Analyse Buch+Ei ausschließen: Christian Simon 228 > Büchereiausleihe buchen<V>er<NN><SUFF>ei<NN><SUFF>Ausleihe<+NN> buchen<V>er<NN><SUFF>Ei<NN>Ausleihe<+NN> Bücherei<NN>Ausleihe<+NN> Buch<NN>Ei<NN>Ausleihe<+NN> Das würde aber zu keinem korrekten Ergebnis bei der Analyse von Weichei führen. Eine weitere Strategie, die allerdings die Lexikonerstellung erheblich aufwendiger macht, ist, nur solche Wortstämme aufeinanderfolgen zu lassen, die ein gemeinsames bestimmtes Merkmal aufweisen. Ansatzweise wird das in SMOR bzw. Morphisto bei Basisstämmen und Präfixen gemacht, die beide als klassisch markiert worden sind. Sie sollen verhindern, dass ein als klassisch markiertes Präfix wie amit einem nichtklassischen Basisstamm zusammengeführt wird. Will man dieses Konzept allerdings im großen Maßstab praktizieren, muss man zunächst eine solche Feature-Menge aufstellen und sicherstellen, dass neben den falschen, unterbundenen Analysen nicht auch fälschlicherweise korrekte, gewünschte Analysen unterschlagen werden. Praktikabler ist dagegen die nachträgliche Filterung der Ergebnismenge. Dabei können verschiedene Strategien verfolgt werden. Die einfachste Heuristik ist die Filterung nach Zerlegungen: Es werden bevorzugt nur die Ergebnisse ausgegeben, die die wenigsten Zerlegungen vorweisen. In diesem Sinne würden in den obigen Beispielen nur die Analyse Leben+länglich, leben+länglich, Union und Bücherei+Ausleihe ausgegeben. In bestimmten Fällen kann das aber immer noch nicht helfen. In Zielinski/ Simon/ Wittl (2009) wird ein Verfahren vorgestellt, mit dem die Ergebnisse mithilfe eines statistischen Modells nachgefiltert wurden. Ebenfalls mit statistischen Verfahren, aber nicht erst nach der Ausgabe der Analyseergebnisse arbeitet man mit den so genannten ‘gewichteten (weighted) Finite-State-Transducern (wFST)’. Sie enthalten bereits in ihren Übergängen von einem Zustand in den nächsten Wahrscheinlichkeiten. Am Ende hat dadurch jede Analyse eine Gesamtwahrscheinlichkeit, sodass lediglich jene Analysen mit der größten Wahrscheinlichkeit ausgegeben werden müssen. Ein Morphologie-Tool fürs Deutsche, das sich dieser Methodik bedient, ist TAGH (Geyken/ Hanneforth 2006). 3.3.3 Das Problem der fehlenden Hierarchien Finite-State-Transducer sind formal als endliche Automaten einzustufen und sind damit darauf beschränkt, nur Strings erkennen zu können, die die formalen Eigenschaften einer regulären Sprache haben (vgl. Klabunde 1998, S. 142). Finite-State-basierte Morphologie-Tools 229 Für flektierte Simplizia ist das ausreichend, für komplexe Wortbildungsmuster aber, wie sie besonders im Deutschen vorkommen, nicht. Allein die Bildung des deutschen Partizips II, das man morphologisch als Zirkumfix (ge- Verbstamm-t bzw. ge-Verbstamm-en) auffassen kann, ist von einem endlichen Automaten wie einem FST nicht auf eine elegante Art zu handhaben. Da es keinen Speicher gibt, kann kein Rückschluss auf das bereits erkannte erste Teil gegeführt werden. Abhilfe schafft da der Trick, die Vollform des Partizips II eines Verbs als separaten Wortstamm ins Lexikon aufzunehmen. Verwandt ist dieses Problem mit der Auflösung der sich öffnenden und schließenden Klammern in einem mathematischen Ausdruck, wie er beispielsweise in Programmiersprachen vorkommen kann. Ihre jeweilige Anzahl muss identisch sein. Abhilfe verschafft man sich dort damit, dass man das Problem auf eine komplexere Ebene verlagert, indem man diese Ausdrücke durch eine kontextfreie Grammatik beschreibt und die Erkennung durch einen so genannten ‘Parser’ vornehmen lässt, der anhand der Grammatik eine hierarchische bzw. baumartige Analyse liefern kann. Für den Einsatz als Morphologie- Tool im Sinne von Morphisto wären kontextfreie Grammatiken und Parser aus mehreren Gründen unpraktikabel: Eine entsprechend mächtige kontextfreie Grammatik, die dasselbe leistet wie ein FST mit Millionen von Zuständen und Übergängen, müsste immens groß sein und von Hand erstellt werden. Dazu kommt, dass Parser in der Regel ein erheblich ineffizienteres Laufzeitverhalten haben. Das Reizvolle an FSTs ist dagegen die in Kapitel 1.3 erwähnte Möglichkeit, den FST durch eine abstrakte Beschreibungssprache automatisch erzeugen zu lassen unter Ausnutzung der dort ansatzweise vorgestellten Two-Level-Morphology. Dessen ungeachtet wäre ein Ansatz denkbar, bei dem die flache Analyse, die FST-basierte Tools produzieren, als Vorstufe zu einer hierarchischen Analyse verwendet wird. Dann könnte eine kontextfreie Grammatik für die Wortbildung so aussehen: ComplexNoun = <NN> <NN> | <NN> <NN+> ComplexNoun = <V> <NN> | <V> <NN+> ComplexNoun = ComplexNoun <NN> | ComplexNoun <NN+> Für die Wortform Bahnhofshalle liefert Morphisto die folgenden drei Analysen ohne Flexionsangaben: analyze> Bahnhofshalle bahnen<V>Hof <NN>Halle<+NN> Christian Simon 230 Bahn<NN>Hof<NN>Halle<+NN> Bahn<NN>Hof<NN>Hall<+NN> Mithilfe dieser Grammatik ließen sich für alle drei Zerlegungen diese zwei hierarchischen Darstellungen ermitteln: Abb. 2: Hierarchische Analysen auf Morphisto-Ausgabe für Bahnhofshalle Ein Ansatz, der mithilfe probabilistischer kontextfreier Grammatiken in diese Richtung geht, wird in Schmid (2005) beschrieben. Ein eher einfacheres Verfahren, das durch Hypothesenbildung und Verifikation anhand einer Lemmaliste funktioniert, wurde am IDS Mannheim für eine morphologische Baum- Datenbank für das elexiko-Projekt entwickelt. 6 In Zielinski/ Simon/ Wittl (2009, S. 71) wird es kurz umrissen. Ein statistisches Verfahren, das auf einem Ansatz mit maschinellem Lernen beruht, wird in Marek (2006) vorgestellt. 4. Schlussbetrachtung Shuly Wintner fasst die Vorteile von FST-Morphologie-Systemen dahingehend zusammen, dass sie eine linguistisch motivierte Beschreibung (‘true representation’) von phonologischen und morphologischen Gesetzmäßigkeiten bieten, somit modular sind, dass sie unter den verschiedenen Operationen abgeschlossen und so miteinander kombinierbar sind, hinsichtlich ihrer Größe von den Toolkits kompakt gemacht werden können, effizient sind sowie umkehrbar, d.h., dass sie sowohl analysieren als auch generieren können (Wintner 2007, S. 458). Zur Effizienz von Morphisto lässt sich hinzufügen, dass die in Kapitel 2.3.1 vorgenommene Prozessierung der DeReWo-Wortformenliste 6 Zur Gewinnung von Angaben zu Wortbildungsprodukten in elexiko auf der Grundlage dieser Datenbank vgl. den Beitrag „Chancen und Probleme bei der automatischen Ermittlung von Wortbildungsprodukten für elexiko und bei ihrer Präsentation“ von Sabina Ulsamer in diesem Band. Finite-State-basierte Morphologie-Tools 231 auf einem 2009 handelsüblichen Laptop ca. 7 Sekunden dauerte. In Zielinski/ Simon/ Wittl (2009) wird dargestellt, wie diese Effizienz genutzt wird. Im Rahmen des TextGrid-Projektes ist Morphisto die Kernkomponente eines Webservice, der die morphologische Analyse und Lemmatisierung von ganzen Texten über das Internet erlaubt. Trotz aller Vorzüge sind die FST-basierten Ansätze nicht unumstritten und auch nicht als Ultima Ratio anzusehen. Wie die Probleme der mangelnden Hierarchien und der Übergenerierungen beweisen, sind die Ausgaben dieser Morphologie-Tools in der Praxis erst nach einer Nachbearbeitung wirklich brauchbar. Und hinsichtlich der Effizienz haben Wintners Experimente sogar ergeben, dass ein Vollformenlexikon mit flektierten und morphosyntaktisch bestimmten hebräischen Wortformen, das in einer Datenbank oder in einer Hash-Tabelle innerhalb eines Java-Programms abrufbereit zur Verfügung steht, ab mehr als 1 000 zu analysierenden Wortformen effizienter ist als eine FST-basierte Analyse (Wintner 2007, S. 466f.). Wären FST-basierte Morphologie-Systeme der Königsweg, dann wären auch nicht die diversen anderen Ansätze, die im Laufe der Jahre entwickelt und vorgestellt worden sind, zu erklären. So haben Cohen-Sygal/ Wintner (2006) das Konzept der ‘Finite State Registered Automatons’ vorgestellt, bei dem FSTs um einen Speicher fester Länge angereichert werden. Mit ihnen wollte man die Morphologie semitischer Sprachen, die sich vor allem durch Zirkumfigierungs- und Infigierungsphänomene auszeichnen, beschreibbar und maschinell verarbeitbar machen. Andere Systeme wie das Erlanger ‘JSlim-System’ (Handl et al. 2009) oder das Heidelberger ‘PLAIN-System’ (Visser/ Koch 1996) wiederum setzen auf einer bestimmten Grammatiktheorie auf und stehen der breiten Öffentlichkeit nicht zur Verfügung. Den Anspruch auf eine hundertprozentige Korrektheit der produzierten Ausgaben oder gar eine vollständige Abdeckung der jeweiligen unterstützten Sprache kann kein Morphologie-Tool erfüllen - egal auf welcher Technologie es basiert. Morphologie-Tools sollte man eher als „best-effort approach“ verstehen; man versucht es, so gut es eben geht. In dem jeweiligen Kontext, in dem sie zum Einsatz kommen, haben sie jedoch trotz ihrer Defizite einen berechtigten Platz und praktischen Nutzen. Und die FST-basierten Systeme haben sich dabei bislang am besten etabliert: Gerade für das Deutsche haben sie mit Morphisto einen Vertreter, der offen vorliegt und frei zur Verfügung steht, eine hohe Abdeckung vorweisen kann, stetig weiterentwickelt und verbessert wird und praxistauglich ist. Christian Simon 232 5. Literatur 5.1 Forschungsliteratur Cohen-Sygal, Yael/ Wintner, Shuly (2006): Finite-state registered automata for nonconcatenative morphology. In: Computational Linguistics 32, 1, S. 49-82. Geyken, Alexander/ Hanneforth, Thomas (2006): TAGH: A complete morphology for German based on weighted finite state automata. In: Yli-Jyrä/ Karttunen/ Karhumäki (Hg.), S. 55-66. Handl, Johannes et al. (2009): JSLIM - Computational morphology in the framework of the SLIM theory of language. In: Mahlow/ Piotrowski (Hg.), S. 10-27. IDS Mannheim (2007): Institut für Deutsche Sprache, Programmbereich Korpuslinguistik: Korpusbasierte Wortgrundformenliste DeReWo, v-30000g- 2007-12-31- 0.1, mit Benutzerdokumentation. Internet: http: / / www.ids-mannheim.de/ kl/ derewo/ (Stand: 11/ 2011). Mannheim. IDS Mannheim (2009): Institut für Deutsche Sprache, Programmbereich Korpuslinguistik: Korpusbasierte Wortformenliste DeReWo, v-100000t-2009- 04-30-0.1, mit Benutzerdokumentation. Internet: http: / / www.ids-mannheim.de/ kl/ derewo/ (Stand: 11/ 2011). Mannheim. Klabunde, Ralf (1998): Formale Grundlagen der Linguistik. Ein Arbeitsbuch. Tübingen. Koskenniemi, Kimmo (1983): Two-level morphology: A general computational model for word-form recognition and production. Diss. Univ. Helsinki. Lindén, Krister/ Tuovila, Jussi (2009): Corpus-based lexeme ranking for morphological guesser In: Mahlow/ Piotrowski (Hg.), S. 118-135. Mahlow, Cerstin/ Piotrowski, Michael (Hg.) (2009): State of the art in computational morphology. Workshop on systems and frameworks for computational morphology, SFCM 2009. Zurich, Switzerland, September 2009, Proceedings. Heidelberg/ Berlin. Marek, Torsten (2006): Analysis of German compounds using weighted finite state transducers. Bachelorarb. Universität Tübingen. Mohri, Mehryar (1997): Finite-state transducers in language and speech processing. In: Computational Linguistics 23, 2, S. 269-311. Schmid, Helmut (2005): Disambiguation of morphological structure using a PCFG. In: The Association for Computational Linguistics (Hg.): Proceedings of Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing (HLT/ EMNLP). Vancouver, S. 515-522. Schmid, Helmut (2006): A programming language for finite state transducers. In: Yli- Jyrä/ Karttunen/ Karhumäki (Hg), S. 308-309. Finite-State-basierte Morphologie-Tools 233 Schmid, Helmut/ Fitschen, Arne/ Heid, Ulrich (2004): SMOR: A German computational morphology covering derivation, composition, and inflection. In: Proceedings of the IVth International Conference on Language Resources and Evaluation (LREC 2004). Lisbon, Portugal, S. 1263-1266. Internet: www.lrec-conf.org/ proceedings/ lrec2004/ pdf/ 468.pdf (Stand: 11/ 2011). Visser, Henriette/ Koch, Heinz-Detlev (1996): PLAIN. In: Hausser, Roland (Hg.): Linguistische Verifikation. Dokumentation zur Ersten Morpholympics 1994. Tübingen, S. 89-102. Wintner, Shuly (2007): Strengths and weaknesses of finite-state technology: A case study in morphological grammar development. In: Natural Language Engineering 14, 4, S. 457-469. Yli-Jyrä, Anssi/ Karttunen, Lauri/ Karhumäki, Juhani (Hg.) (2006): Finite state methods and natural language processing. (= Lecture Notes in Computer Science 4002). Berlin. Zielinski, Andrea/ Simon, Christian (2008): Morphisto - An open source morphological analyzer for German. In: Piskorski, Jakub S./ Watson, Bruce W./ Yli-Jyrä, Anssi (Hg.): Finite-state methods and natural language processing, 7th International Workshop, FSMNLP 2008, Ispra, Italy, September 11-12, 2008. (= Frontiers in Artificial Intelligence and Applications 191). Amsterdam u.a., S. 224-231. Zielinski, Andrea/ Simon, Christian/ Wittl, Tilman (2009): Morphisto: Service-oriented open source morphology for German. In: Mahlow/ Piotrowski (Hg.), S. 64-75. 5.2 Internetressourcen CC BY-SA 2.0-Lizenz für nichtkommerzielle Zwecke. Internet: http: / / creativecommons. org/ licenses/ by-sa/ 2.0/ de/ (Stand: 11/ 2011). Morphisto-Projektseite. Internet: http: / / code.google.com/ p/ morphisto/ (Stand: 11/ 2011). Open-Source-Softwarelizenz GPLv2. Internet: http: / / www.gnu.org/ licenses/ gpl-2.0.html (Stand: 11/ 2011). SMOR-Projektseite. Internet: http: / / www.ims.uni-stuttgart.de/ projekte/ gramotron/ SOFTWARE/ SFST.html (Stand: 11/ 2011). Sabina Ulsamer Chancen und Probleme bei der automatischen Ermittlung von Wortbildungsprodukten für elexiko und bei ihrer Präsentation 1. Einleitung Die Problematik der Darstellung von Wortbildungsbeziehungen im Wörterbuch wird seit vielen Jahren in der metalexikographischen Forschung reich diskutiert 1 und hat auch in der elektronischen Lexikographie nicht an Wichtigkeit verloren. Hier ergeben sich durch das nahezu unbeschränkte Platzangebot und durch Hyperlinks neue Möglichkeiten, um Wortbildungszusammenhänge im Wörterbuch sichtbar zu machen. Mehr und mehr wird die lexikographische Arbeit - besonders in der Internetlexikographie - durch automatische und computergestützte Methoden ergänzt und unterstützt (vgl. Klosa 2010). Neue Chancen eröffnen sich mit computerlinguistischen Werkzeugen wie z.B. Morphologie-Tools, 2 die Flexionsparadigmen automatisch generieren und gebildete Wörter in ihre Bestandteile zerlegen können. Am Beispiel des Internetwörterbuchs elexiko soll in diesem Beitrag dargestellt werden, welche Möglichkeiten ein solches Morphologiewerkzeug - speziell Morphisto - in der Internetlexikographie für die Darstellung von Wortbildungsbeziehungen bietet, aber auch, welche Probleme damit einhergehen. Im Rahmen des Forschungsprojekts ‘Benutzeradaptive Zugänge und Vernetzungen in elexiko’ (BZVelexiko) 3 am Institut für Deutsche Sprache wurden Methoden entwickelt, wie aus einer Datenbank morphologisch analysierter Stichwörter alle in der elexiko-Stichwortliste vorhandenen Wortbildungsprodukte zu einem Lemma ermittelt werden können. Das Ziel ist, diese Wortbildungsprodukte zu extrahieren und online zu präsentieren, um eine stärkere Vernetzung der Daten innerhalb des Online-Wörterbuches elexiko zu erreichen. Die Methoden und dahinterstehenden Überlegungen sowie die Entwürfe zur Online-Präsentation der Wortbildungsprodukte sollen in diesem Beitrag beschrieben werden. 1 Vgl. hierzu den Beitrag „Wortbildung in Wörterbüchern - Zwischen Anspruch und Wirklichkeit“ von Sabina Ulsamer in diesem Band. 2 Vgl. hierzu den Beitrag „Finite-State-basierte Morphologie-Tools und ihre Stärken und Schwächen bei der maschinellen Wortbildungsanalyse“ von Christian Simon in diesem Band. 3 Zum Projekt BZVelexiko vgl. http: / / www.ids-mannheim.de/ lexik/ BZVelexiko/ (Stand: 08/ 2011). Sabina Ulsamer 236 Nach einer kurzen Vorstellung des Internetwörterbuchs elexiko in Kapitel 2.1 wird das Konzept zur Wortbildung in elexiko (Kap. 2.2) skizziert. Der Fokus des Beitrages liegt auf der Ermittlung der Wortbildungsprodukte und ihrer Darstellung in den elexiko-Wortartikeln. Im dritten Kapitel werden die Analysen von Morphisto beschrieben und es wird die Vorgehensweise bei der Extraktion der Wortbildungsprodukte aus der Datenbank geschildert. Kapitel 4 stellt die Überlegungen und Entwürfe zur Präsentation der automatisch ermittelten Wortbildungsprodukte vor. In beiden Kapiteln werden die jeweiligen Chancen, aber auch die Schwierigkeiten für die Lexikographie diskutiert. Das abschließende Kapitel 5 zieht ein Resümee. 2. Das Online-Wörterbuch elexiko 2.1 Konzeption elexiko 4 ist ein im Aufbau befindliches Online-Wörterbuch zur deutschen Gegenwartssprache, das sukzessive und kontinuierlich bearbeitet wird. Die 300 000 Stichwörter wurden aus einem eigens für elexiko zusammengestellten Korpus 5 aus deutschsprachigen Zeitungen - sowohl bundesdeutsche, österreichische und schweizerische als auch Texte aus der ehemaligen DDR - frequenzbasiert ermittelt. 6 In elexiko werden redaktionell erstellte mit (teil-)automatisch gewonnenen Angaben kombiniert. Alle Angaben werden korpusbasiert aus dem elexiko-Korpus ermittelt. Die lexikographische Bearbeitung der Stichwörter erfolgt nicht nach Alphabetstrecken, sondern in Teilwortschätzen (so genannten Modulen), die nach unterschiedlichen Kriterien ausgewählt werden. Auch alle automatisch ermittelten Angaben wie die Korpusbelege bei unbearbeiteten Artikeln und die im Folgenden beschriebenen Wortbildungsprodukte erfolgen nach bestimmten Kriterien. 7 2.2 Wortbildung in elexiko Neben der Gebildetheit eines Stichwortes möchte elexiko auch die Wortbildungsaktivität von Stichwörtern zeigen, d.h., in welche anderen Stichwörter 4 Zu elexiko vgl. Haß (2005), Klosa (2011) sowie http: / / ww.owid.de/ elexiko_/ index.html (Stand: 08/ 2011). 5 Zum elexiko-Korpus vgl. Storjohann (2005, S. 55-70). 6 Zur Ermittlung der elexiko-Stichwortliste vgl. Schnörch (2005, S. 71-90). 7 Zur Methodik in elexiko vgl. Haß (2005, S. 1-17), Klosa (2011, S. 9-26), sowie die elexiko- Projektseiten im Internet http: / / www.owid.de/ elexiko_/ Informationen.html und http: / / www.idsmannheim.de/ lexik/ elexiko/ (Stand: 08/ 2011). Chancen und Probleme bei der Ermittlung von Wortbildungsprodukten 237 diese eingehen. 8 Mit diesem zweigleisigen Vorgehen soll Barz' (2001, S. 88f.) Vorschlag Rechnung getragen werden, von primären Wörtern ausgehend ihre Wortbildungsaktivität zu illustrieren, wodurch „man die Entfaltung der Wörter in der Wortbildung erfassen und in Wortnester gruppieren kann“ (ebd., S. 88). Von sekundären, d.h. gebildeten Wörtern ausgehend kann man den jeweils letzten Wortbildungsschritt rekonstruieren, wodurch man die unmittelbaren Motivationsbeziehungen ermittelt und zu Wortbildungstypen kommt (ebd., S. 89). Bei den bereits bearbeiteten Stichwörtern wird in elexiko die Gebildetheit beschrieben und damit Barz' zweite Forderung erfüllt. Die Art der Wortbildung wird angegeben und es wird verzeichnet, aus welchen Bestandteilen das Wort gebildet ist. Um auch Barz' ersten Vorschlag aufzugreifen und die Aktivität eines Stichwortes in der Wortbildung zu zeigen, sollen beispielsweise alle Wortbildungsprodukte zu Jugend angegeben werden, die selbst auch Stichwörter in elexiko sind. Neben den Ableitungen jugendlich und jugendhaft gibt es in der elexiko-Stichwortliste knapp 400 Komposita, die Jugend entweder als Bestimmungswort - wie in Jugendbuch - oder als Grundwort - wie in Dorfjugend - enthalten. Im Unterschied zu Printwörterbüchern möchte elexiko nicht nur eine Auswahl an Wortbildungsprodukten zu einem bestimmten Stichwort zeigen, sondern die gesamte Menge der zugehörigen Wortbildungsprodukte, die in der elexiko- Stichwortliste enthalten sind. So sollen zu einem Nomen wie Fisch nicht nur Nomen-Nomen-Komposita wie Fischmarkt, sondern auch Zusammensetzungen mit anderen Wortarten, beispielsweise Adjektiven wie in fischreich, im Wortartikel Fisch präsentiert werden. Neben Komposita sollen auch die verschiedenen Derivate - hier unter anderem Fischlein, fischig und fischen - zu einem Lemma ermittelt und unter diesem aufgelistet werden. Damit sollen die Stichwörter innerhalb des Wörterbuches stärker miteinander vernetzt werden. Diese Vernetzungen sind nicht von semantischer oder paradigmatischer, sondern von morphologischer Art. Ausgehend von dem primären Wort soll sich ein Netz von Wortbildungen aufspannen, mit dem sich die Nutzer neue lexikologische Zusammenhänge erschließen können. Gerade bei den redaktionell noch nicht ausgearbeiteten Artikeln möchte elexiko auf diese Weise mehr Informationen bieten. 8 Vgl. hierzu den Beitrag „Wortbildung in elexiko: Gegenwart und Zukunft“ von Annette Klosa in diesem Band sowie Klosa (2005). Sabina Ulsamer 238 3. Ermittlung der Wortbildungsprodukte 3.1 Morphologische Analyse der Stichwörter Voraussetzung für die Ermittlung der Wortbildungsprodukte war eine morphologische Analyse aller Stichwörter. Sie mussten in ihre Bestandteile zerlegt und diese morphologisch bestimmt werden. Dazu wurde die gesamte elexiko-Stichwortliste mit dem Tool Morphisto morphologisch analysiert. 9 Morphisto 10 ist eine am IDS im Rahmen des TextGrid-Projektes 11 entwickelte, auf SMOR 12 basierende, frei zugängliche Computer-Morphologie für das Deutsche, die sowohl Flexionsparadigmen generieren als auch eine morphologische Analyse durchführen kann. Für elexiko wurde von den Morphisto- Entwicklern ein Verfahren ausgearbeitet, das aufgrund der morphologischen Analysen komplexen Wortbildungen binär verzweigende, hierarchisch strukturierte Bäume zuweist. Es wird in Zielinski/ Simon/ Wittl (2009, S. 71) 13 skizziert. Mithilfe dieses Verfahrens wurde jedes gebildete Wort der elexiko-Stichwortliste in Komplement und Kopf zerlegt (vgl. Abb. 1). Als Kopf gilt dabei derjenige Teil des Wortes, der die grammatische und morphosyntaktische Kategorie des ganzen Wortes bestimmt. Nach dem Prinzip der Rechtsköpfigkeit - „Right Hand Head Rule“ (Williams 1981) - ist das immer der rechte Bestandteil eines Wortes. Bei Komposita ist das Zweitglied, d.h. das Grundwort, der Kopf der Zusammensetzung. Bei Suffixderivaten ist das Suffix der Kopf der Bildung. Das Komplement ist dann derjenige Teil, der den Kopf ergänzt oder näher bestimmt. Demnach gilt bei Komposita das Bestimmungswort als Komplement. Bei Suffixderivaten ist der Stamm, an den das Suffix angehängt wird, das Komplement. Bei Präfixderivaten übernimmt das Präfix die Aufgabe des Komplements und die Wortbildungsbasis die des Kopfes. 14 Jedes Kom- 9 Zur Generierung der Analysen und Überführung in eine Datenbank für elexiko vgl. den Beitrag „Finite-State-basierte Morphologie-Tools und ihre Stärken und Schwächen bei der maschinellen Wortbildungsanalyse“ von Christian Simon in diesem Band. 10 Zu Morphisto vgl. http: / / www.ids-mannheim.de/ fi/ projekte/ textgrid.html (Stand: 08/ 2011). 11 Zum TextGrid-Projekt vgl. http: / / www.textgrid.de (Stand: 08/ 2011). 12 Zu SMOR vgl. Schmid/ Fitschen/ Heid (2004). 13 Vgl. auch Kapitel 2.3.3 in dem Beitrag „Finite-State-basierte Morphologie-Tools und ihre Stärken und Schwächen bei der maschinellen Wortbildungsanalyse“ von Christian Simon in diesem Band. 14 Ein Problem für die „Right Hand Head Rule“ (RHR) sind Verben, die sich aus einem Präfix und einem Adjektiv oder Nomen als Stamm zusammensetzen, wie das englische ennoble und die deutschen Verben beschweren, erblinden, entziffern und verarzten. Williams selbst sowie Lieber (1981) und Selkirk (1984) fassen diese Fälle als Ausnahmen zur RHR auf und Chancen und Probleme bei der Ermittlung von Wortbildungsprodukten 239 plement und jeder Kopf wurde außerdem mit einem sog. Part-of-Speech-Tag, kurz POS-Tag, ausgezeichnet, also mit einer Kennzeichnung für seine jeweilige Wortart versehen. Dem POS-Tag des Kopfes ist ein Pluszeichen vorangestellt. Suffixe erhalten den POS-Tag für die jeweilige Wortart, die durch die Suffigierung entsteht. So wird ein Suffix wie -heit, das Nomen bildet, mit dem POS-Tag +NN ausgezeichnet. Lemma Komplement Kopf Fisch, NN Markt, +NN Trocken, ADJ Fisch, +NN fisch, NN ig, +ADJ Ur, PREF Fisch, +NN fisch, NN reich, +ADJ Kind, NN heit, +NN Abb. 1: Baumstruktur einiger Wörter mit ihrem jeweiligen POS-Tag Ferner wurde mithilfe von Morphisto für jedes Stichwort die betreffende Wortbildungsregel ermittelt. Das Schema der Wortbildungsregeln ist immer <+TAG> → <TAG> <+TAG>. In zwei Spitzklammern eingeschlossen steht ein POS-Tag mit einem Pluszeichen, dann folgen ein Pfeil und darauf zwei weitere POS-Tags, die jeweils in Spitzklammern eingefasst sind. Die Wortbildungsregel für das Nomenkompositum Fischmarkt lautet <+NN> → <NN> <+NN> und liest sich „ein Nomen besteht aus einem Nomen und einem Nomen“. Handelt es sich um Zusammensetzungen, so hat der zweite POS-Tag nach dem Pfeil, wie der vor dem Pfeil stehende Tag, ein vorangestelltes Pluszeichen. Das Plus symbolisiert den Kopf der Bildung. Die Zusammensetzung fischreich - ein Adjektiv aus dem Nomen Fisch und dem Adjektiv reich - erhält deshalb die Wortbildungsregel <+ADJ> → <NN> <+ADJ>. Das Adjektiv lassen hier auch Präfixe als Köpfe zu, da es scheint, dass die Präfixe die Adjektive und Nomen zu Verben ableiten. Von Morphisto wurden diese Verben entweder gar nicht oder falsch analysiert und zerlegt. Um sie dennoch als Wortbildungsprodukte zu den jeweiligen Adjektiven oder Nomen ermitteln zu können, wurden sie von Hand korrigiert. Dazu wurde Scalises (1988, S. 240) Position übernommen: In einem (gedanklichen) Zwischenschritt wird durch Suffigierung ein mögliches aber nicht-existierendes Wort kreiert, das anschließend präfigiert wird. Auf diese Weise stellt Scalise sicher, dass Präfixe nie Köpfe sind, und die Präfixverben somit keine Ausnahme zur RHR darstellen. Sabina Ulsamer 240 als zweite Konstituente nimmt gemäß der „Right Hand Head Rule“ die Kopfposition der Bildung ein, weshalb die gesamte Zusammensetzung ein Adjektiv ist. In dem Adjektiv-Nomen-Kompositum Trockenfisch ist es umgekehrt: <+NN> → <ADJ> <+NN>. Hier ist das Nomen Fisch Kopf der Konstruktion, und damit ist auch die Zusammensetzung ein Nomen. Ableitungen werden anders notiert. Bei Suffigierungen ist die zweite Tag- Konstituente in der Regel der POS-Tag <SUFF>. Was das Resultat der Suffigierung ist, wird durch den Tag vor dem Pfeil ausgedrückt. Die Ableitung Fischlein hat die Regel <+NN> → <NN> <SUFF>, was bedeutet, dass es sich um ein Nomen handelt, das aus einem Nomen und einem (nomenbildenden) Suffix besteht. Das Adjektiv fischig wurde aus dem Nomen Fisch und dem Suffix -ig gebildet, weshalb die Regel <+ADJ> → <NN> <SUFF> lautet. Das Suffix -ig macht aus dem Nomen Fisch ein Adjektiv. Analog zu <SUFF> lautet der POS-Tag für Präfixe <PREF>, so dass Urfisch die Regel <+NN> → <PREF> <+NN> erhält. 15 In Tabelle 1 sind die in Abbildung 1 dargestellten Wörter mit ihrer jeweiligen Wortbildungsregel zusammengestellt. Lemma Wortbildungsregel Fischmarkt <+NN> → <NN> <+NN> Trockenfisch <+NN> → <ADJ> <+NN> fischig <+ADJ> → <NN> <SUFF> Urfisch <+NN> → <PREF> <+NN> fischreich <+ADJ> → <NN> <+ADJ> Kindheit <+NN> → <NN> <SUFF> Tab. 1: Einige Wörter mit ihrer Wortbildungsregel Ungebildete Stichwörter jeder Wortart werden mit einer Wortbildungsregel in der Form von <+TAG> → Lemma notiert (<+NN> → Kind; <+ADJ> → grün; <+V> → hören). 15 Für ein Präfixverb wie erblinden wurde in der manuellen Korrektur das Komplement ermit dem Tag <PREF>, der Head blind mit dem Head-Tag <+V> und die Regel <+V> → <PREF> <ADJ> eingetragen. Um deutlich zu machen, dass das Adjektiv gemäß Scalise (1988) selbst nicht Kopf der Konstruktion ist, sondern in einem Zwischenschritt erst suffigiert wird, wird es in der Regel nicht mit einem Pluszeichen versehen. Die Regel für solche Präfixverben kann mit der Regel für Suffixableitungen verglichen werden. Die Tag-Konstituente lautet bei diesen <SUFF>, aber <SUFF> ist nicht die Kategorie der gesamten Bildung. Mit dieser Notation wurde es möglich, das Verb erblinden als Ableitung zu dem Adjektiv blind zu extrahieren. Chancen und Probleme bei der Ermittlung von Wortbildungsprodukten 241 Die Analysen wurden in einer Tabelle einer relationalen Datenbank gespeichert. In den Spalten dieser Tabelle sind unter anderem das Lemma selbst, das Komplement, der POS-Tag des Komplements, der Kopf, dessen POS-Tag und die Wortbildungsregel gespeichert (vgl. Tab. 2). Lemma Komplement Kompl_ tag Kopf Kopf_ tag Regel Fisch Fisch +NN <+NN>→Fisch Flussfisch Fluss NN Fisch +NN <+NN>→<NN> <+NN> Fischfabrik Fisch NN Fabrik +NN <+NN>→<NN> <+NN> Fischfabrikschiff Fischfabrik NN Schiff +NN <+NN>→<NN> <+NN> Trockenfisch trocken ADJ Fisch +NN <+NN>→<ADJ> <+NN> Urfisch ur PREF Fisch +NN <+NN>→<PREF> <+NN> fischig Fisch NN ig +ADJ <+ADJ>→<NN> <SUFF> fischen Fisch NN en +V <+V>→<NN> <SUFF> fischreich Fisch NN reich +ADJ <+ADJ>→<NN> <+ADJ> Tab. 2: Vereinfachte Darstellung der Datenbanktabelle Die Speicherung in dieser Basistabelle ermöglichte es, die Spalten der einzelnen Stichwörter nach bestimmten Mustern zu durchsuchen und so die verschiedenen Wortbildungsprodukte unterschiedlicher „Bauart“ zu ermitteln. 3.2 Chancen und Probleme der automatischen morphologischen Analyse Der Vorteil einer automatischen morphologischen Analyse liegt darin, dass innerhalb kurzer Zeit eine große Menge an Wörtern - die elexiko-Stichwortliste enthält ca. 300 000 Einträge - analysiert werden kann. Von Hand ist eine solche Aufgabe nicht in angemessener Zeit zu leisten. Auf der anderen Seite gibt es aber auch Probleme mit einer automatischen Analyse. Es kann vorkommen, dass Wörter nicht oder falsch analysiert sind. Das liegt daran, dass Morphisto diese Wörter nicht „kannte“ und somit auch keine Analyse und morphologische Zerlegung vornehmen konnte. Das trifft vor allem auf Fremdwörter wie Toxoplasmose oder sehr komplexe Wörter wie Staatssekretärsrunde zu. Neben fehlenden Zerlegungen kommen auch falsche Sabina Ulsamer 242 Zerlegungen vor, beispielsweise wurde Kindergartensaal in das Komplement Kindergarten, das Fugenelement -s- und den Kopf Aal zerlegt. Eine andere Problemstelle sind falsche Wortartauszeichnungen in den Tags. Ein Beispiel für eine falsche Auszeichnung und falsche Zerlegung ist das Wort Herbstlaub, das in der Datenbank als Zusammensetzung aus dem Adjektiv herb und dem Nomen Laub gespeichert ist. 3.3 Vorgehensweise zur Ermittlung der Wortbildungsprodukte Ausgangspunkt der Ermittlung der Wortbildungsprodukte war für jede Wortart jeweils zunächst die Ermittlung der Simplizia. Das Ziel war, eine Datenbanktabelle zu erstellen, in der jedem Simplex alle in der Datenbank gespeicherten Komposita und Derivate der verschiedenen Wortarten zugeordnet sind. Von den Simplizia ausgehend sollten die Wortbildungsprodukte, die mit den Simplizia gebildet werden, aus der Datenbank ermittelt werden. Für die nominalen Simplizia wurde eine vereinfachte Arbeitsdefinition von Simplizia festgelegt. Nach dieser gelten alle Nomen, die nicht zerlegt werden können, als Simplizia. Deshalb fallen auch Konversionen wie Tanz oder Druck unter diese Definition. Exemplarisch soll hier die Ermittlung der Wortbildungsprodukte zu den nominalen Simplizia erläutert werden. Die Extraktion der Wortbildungsprodukte zu den adjektivischen und verbalen Simplizia erfolgte analog. Die Simplizia zeichnen sich dadurch aus, dass sie kein Komplement haben. Diese Spalte ist also in der Datenbank bei Simplizia leer. Außerdem entspricht der Kopf dem Lemma, d.h., die Einträge in den Spalten ‘Kopf’ und ‘Lemma’ sind identisch. Nominale Simplizia haben den Kopf-Tag +NN, ihre Wortbildungsregel hat immer die Form <+NN> → Lemma, d.h., auf den Pfeil folgt keine weitere Spitzklammer, sondern direkt das jeweilige Simplex. Eine neue Spitzklammer würde ein gebildetes Wort bedeuten. Die Datenbanktabelle wurde deshalb auf diese Merkmale hin abgefragt und alle Stichwörter, auf die diese Bedingungen zutrafen, wurden ausgewählt und extrahiert. Die so ermittelten knapp 5 600 nominalen Simplizia wurden in einer eigenen Tabelle, der Simplextabelle, gespeichert. Zur anschließenden Ermittlung der Nomenkomposita, die das Simplex enthalten, musste zunächst eine Fallunterscheidung vorgenommen werden: Das Simplex ist entweder Bestimmungswort, also die erste Konstituente, oder das Simplex ist Grundwort, also die zweite Konstituente. Im ersten Fall - das Simplex ist Bestimmungswort - sind die Simplizia aus der Simplextabelle in der Spalte Komplement der Basistabelle gespeichert, wie in Fischfabrik und Fisch- Chancen und Probleme bei der Ermittlung von Wortbildungsprodukten 243 markt zu Fisch. Im zweiten Fall, in dem das Simplex Grundwort ist, sind folglich die Simplizia aus der Simplextabelle in der Spalte ‘Kopf’ der Basistabelle, wie in Brotfisch und Flussfisch (vgl. Abb. 2). Simplextabelle Basistabelle Lemma Lemma Kompl Kopf Regel Aal Aal Aal <+NN>→Aal ... atmen atmen <+V>→atmen Brot Beutefisch Beute Fisch <+NN>→<NN> <+NN> ... bremsen bremsen <+V>→bremsen Ei Brotfisch Brot Fisch <+NN>→<NN> <+NN> ... dunkel dunkel <+ADJ>→dunkel Fisch Fischfabrik Fisch Fabrik <+NN>→<NN> <+NN> ... Fischmarkt Fisch Markt <+NN>→<NN> <+NN> Haus Floß Floß <+NN>→Floß ... Flussfisch Fluss Fisch <+NN>→<NN> <+NN> Abb. 2: Vergleich von Simplex- und Basistabelle zur Ermittlung der Komposita am Beispiel Fisch Dazu wurde eine Anfrage geschrieben, die die Simplextabelle mit der Basistabelle kombiniert. Genauer gesagt wurden die Spalten ‘Komplement’ bzw. ‘Kopf’ der Basistabelle mit der Spalte ‘Lemma’ der Simplextabelle verglichen. Sind sie identisch, dann liegen Determinativkomposita vor. In der Anfrage für Komposita mit dem Simplex als Grundwort muss neben der Gleichheit von Head in der Basistabelle und Lemma der Simplextabelle in einer zusätzlichen Bedingung ausgeschlossen werden, dass die Einträge der Spalte ‘Lemma’ der Basistabelle mit den Einträgen der Spalte ‘Head’ der Basistabelle identisch sind. Lediglich auf Gleichheit von Head und Lemma zu prüfen, würde nämlich - wie in der oben genannten Anfrage - in Simplizia resultieren. Die auf diese Weise ermittelten etwa 106 000 Komposita mit Simplex als Grundwort und die knapp 88 000 Komposita mit Simplex als Bestimmungswort wurden in zwei eigenen Tabellen gespeichert und jede Zusammensetzung wurde ihrem Simplex zugeordnet. Auch Nomen-Adjektiv-Komposita, Adjektiv-Nomen-Komposita und nominale Derivate wurden nach diesem Muster ermittelt. Die Simplextabelle und die Basistabelle wurden kombiniert, wobei die Bedingungen immer die Gleichheit von Head bzw. Komplement der Basistabelle und dem Lemma der Simplexta- Sabina Ulsamer 244 belle und eine spezifische Wortbildungsregel erforderten. Im Falle der Komposita mit einem Nomen als Erstglied und den Suffixableitungen wurde die Gleichheit von Komplement der Basistabelle und Lemma der Simplextabelle erfragt und es wurden die Wortbildungsregeln <+ADJ> → <NN> <+ADJ> (fischreich) bzw. <+NN> → <NN> <SUFF> (Fischlein), <+ADJ> → <NN> <SUFF> (fischig) oder auch <+ADV> → <NN> <SUFF> (löffelweise) gefordert. Im Falle von Präfixableitungen und Komposita mit dem Nomen als Zweitglied lauteten die Regelbedingungen <+NN> → <PREF> <+NN> (Urfisch) bzw. <+NN> → <ADJ> <+NN> (Trockenfisch). Die verschiedenen Wortbildungen mit Adjektiv- und Verbsimplizia lassen sich ganz analog aus der Datenbank erfragen. Außerdem wurde die Korpusfrequenz zu jedem Produkt ermittelt und in einer eigenen Spalte notiert. Die so genannte Wortbildungsrolle zeichnet jedes Simplex hinsichtlich seiner Rolle in dem Wortbildungsprodukt aus. Das Produkt Fischabfall zu Fisch erhält die Rolle ‘compound-c-nn’, da es sich um ein Kompositum aus zwei Nomen handelt, in dem das Simplex Fisch Bestimmungswort, d.h. Komplement ist. Entsprechend wird Beutefisch zu Fisch mit ‘compound-h-nn’ ausgezeichnet; das gleiche Kompositum erhält aber ‘compound-c-nn’, wenn es Beute zugeordnet ist. Ein Adjektiv wie fischig wird mit der Rolle ‘deriv-c-nadj’ versehen, denn das nominale Simplex nimmt in diesem Derivat die Rolle des Komplements ein. Das Resultat der Ableitung ist ein Adjektiv. Lemma Produkt Produkt_Frequenz Wb-Rolle Fisch Anglerfisch 6 compound-h-nn Fisch Aquarienfisch 30 compound-h-nn Fisch Beutefisch 23 compound-h-nn Fisch ... ... ... Fisch Fischabfall 32 compound-c-nn Fisch Fischadler 93 compound-c-nn Fisch ... ... ... Fisch fischen 3 670 deriv-c-nv Fisch fischig 49 deriv-c-nadj Fisch Fischindustrie 68 compound-c-nn Fisch ... ... ... Tab. 3: Ausschnitt aus der Tabelle der Wortbildungsprodukte mit den Wortbildungsprodukten zum Lemma Fisch Chancen und Probleme bei der Ermittlung von Wortbildungsprodukten 245 Die Daten der einzelnen Tabellen werden in eine Gesamttabelle (vgl. Tab. 3) eingefügt, sodass jedem simplizischen Lemma alle Komposita und Derivate zugeordnet werden können, die in der elexiko-Stichwortliste enthalten sind. Aus dieser Gesamttabelle der Wortbildungsprodukte können die Wortbildungsprodukte pro Stichwort extrahiert werden und stehen anschließend für die Online-Darstellung in einem passenden Format zur Verfügung. 3.4 Chancen und Probleme der automatischen Ermittlung der Wortbildungsprodukte aus einer Datenbank Die Chancen der Speicherung von morphologisch analysierten Stichwörtern in einer Datenbank liegen darin, dass man mit einer einzigen Anfrage nach allen Wortbildungsprodukten suchen kann, die ein bestimmtes Lemma, z.B. hier Fisch, enthalten, und eine Liste wie in Tabelle 3 erhält. Lemmata, die durch Wortbildung umgelautet werden, wie beispielsweise ärztlich, werden in der Datenbank zu ihrem Basislemma in Beziehung gebracht; im Falle von ärztlich also Arzt. Wo eine rein zeichenbasierte Suche umgelautete Fälle nicht erfassen kann, ist dies durch die spezielle Speicherung in dieser Datenbank möglich, vorausgesetzt sie wurden zuvor von Morphisto korrekt segmentiert. Durch die Kombination von Tabellen können die vorhandenen Daten neu zusammengestellt und gruppiert werden. Die ermittelten Wortbildungsprodukte mit ihrer Zuordnung zu einem Lemma, den Frequenzinformationen und der jeweiligen Wortbildungsrolle sind in der eigens angelegten Datenbanktabelle für weitere Verarbeitungsschritte zugänglich. Auf diese Weise ist es möglich, die Wortbildungsprodukte in die einzelnen elexiko- Artikel online zu integrieren. Die Schwierigkeiten und Probleme der Datenbank liegen vorrangig in ihrem Datenbestand. Die Datenbank ist nur so gut wie die Daten in ihr. Fehler, die auf Morphisto zurückgehen, resultieren in fehlerhaften Abfrageergebnissen. Wenn Kindergartensaal von Morphisto in Kindergarten und Aal zerlegt ist, dann wird dieses auch als Kompositum zu Aal ermittelt. Wurde ärztlich nicht korrekt in Arzt und -lich segmentiert, sondern vielleicht gar nicht analysiert, ist es nicht möglich, ärztlich als Adjektivableitung zu Arzt zu ermitteln. Dieses Wortbildungsprodukt würde demnach in der Liste der Wortbildungsprodukte zu Arzt fehlen. Um einen ersten Eindruck von der Fehlerzahl zu bekommen, wurden 88 verschiedene Nomensimplizia aus unterschiedlichen Frequenzbereichen ausgewählt und es wurde die Anzahl ihrer Komposita gezählt. Von den so ermittelten 6 652 Komposita waren etwa 792 fehlerhaft analysiert. Das Sabina Ulsamer 246 sind 12% oder 9 falsch analysierte Komposita pro Nomensimplex. Bei anderen Wortbildungsprodukten war die Fehlerzahl noch größer. So waren 15% von 2 762 Nomen-Adjektiv-Komposita falsch zerlegt, von 5 866 Adjektiv- Nomen-Komposita waren 19% fehlerhaft. Eine Fehlerquelle lag bei den Präfixen haupt- und vorder-, die von Morphisto fälschlicherweise als Adjektive analysiert worden waren. Auch homographische Konstituenten und falsche Wortbildungsregeln trugen zu der hohen Fehlerzahl bei. Unter den 8 594 Komposita aus einem Verb und einem Nomen waren 22% inkorrekt. Auch hier waren Homographen die Hauptursache für falsche Zerlegungen. Die 1 262 Adjektivsimplizia waren mit 38 Fehlern auf 100 Wörter die Gruppe mit den meisten Fehlern. Das Hauptproblem waren fälschlich als Simplizia analysierte komplexe Adjektive. Soweit möglich wurden die fehlerhaften Zerlegungen und falschen Wortbildungsregeln von zwei studentischen Hilfskräften innerhalb von 14 Monaten manuell korrigiert. Aufgrund der automatischen morphologischen Analyse und der automatischen Ermittlung der Wortbildungsprodukte ist außerdem keine Zuordnung der Wortbildungsprodukte zu der jeweiligen Lesart der Ausgangslexeme möglich. Das hat Konsequenzen für die Art der Darstellung der Wortbildungsprodukte. 4. Online-Darstellung der Wortbildungsprodukte 4.1 Konzeptuelle Überlegungen Für die Darstellung der Wortbildungsprodukte im elexiko-Stichwortartikel stellen sich die Fragen, - wo die Wortbildungsprodukte platziert werden bzw. wo der Hinweis auf sie platziert wird, - wie deutlich wird, dass sie automatisch ermittelt wurden, - wie sie gruppiert/ sortiert werden, - wie viele gezeigt werden. 16 Auf die automatisch ermittelten Wortbildungsprodukte soll auf der Artikeleingangsseite hingewiesen werden. Da sie - wie bereits erwähnt - nur lesartenübergreifend angezeigt werden können, muss die entsprechende Überschrift, wie die Orthographie, zu den lesartenübergreifenden Angaben gesetzt werden. Sowohl bei bearbeiteten (vgl. Abb. 3, oberer Teil) als auch bei nicht bearbei- 16 Zu Überlegungen für die grafische Darstellung von Wortbildungsbeziehungen vgl. den Beitrag „Visualisierung von Wortbildungsbeziehungen im elektronischen Wörterbuch“ von Peter Meyer und Carolin Müller-Spitzer in diesem Band. Chancen und Probleme bei der Ermittlung von Wortbildungsprodukten 247 teten Artikeln (vgl. Abb. 3, unterer Teil) wird die Überschrift an dieser Stelle platziert. Analog zur Überschrift ‘Belege (automatisch ausgewählt)’ - wie sie in unbearbeiteten Artikeln steht - lautet die Überschrift für die Wortbildungsprodukte ‘Wortbildungsprodukte (automatisch ermittelt)’. Abb. 3: Artikeleingangsseiten des bearbeiteten Stichworts Fisch (oben) und des unbearbeiteten Stichworts Haus (unten) mit dem Hinweis auf die automatisch ermittelten Wortbildungsprodukte Ein so genannter Info-Knopf neben dem Hinweis führt zu einem Informationstext im Glossar. Der Informationstext erläutert in knappen Worten die morphologische Analyse mit Morphisto und wie die Wortbildungsprodukte ermittelt wurden. In diesem Text wird besonderer Wert darauf gelegt, herauszustellen, dass die Wortbildungsprodukte automatisch ermittelt wurden und bereits auf einer automatischen morphologischen Analyse beruhen. Hier wird auch auf die daraus resultierenden Probleme hingewiesen. Im Unterschied zu den automatisch ausgewählten Korpusbelegen werden die Wortbildungsprodukte jedoch nicht auf der Eingangsseite gezeigt, sondern der Link „weiter »“ öffnet eine neue Ansicht, in der die Wortbildungsprodukte präsentiert werden. Sabina Ulsamer 248 In der neuen Ansicht werden die Wortbildungsprodukte getrennt nach ihrer jeweiligen Wortbildungsart auf verschiedene Registerkarten verteilt angezeigt, d.h., es gibt eine Registerkarte für Komposita, eine für Derivate und eine für weitere Wortbildungsprodukte. Innerhalb der Registerkarten für die einzelnen Wortbildungsarten werden die Wortbildungsprodukte nach ihren Bestandteilen bzw. nach dem Resultat ihrer Wortbildung sortiert. Das heißt, in der Registerkarte ‘Komposita’ (vgl. Abb. 4) gibt es für simplizische Nomen die Rubriken ‘Nomen-Nomen-Komposita’, ‘Adjektiv-Nomen-Komposita’, ‘Nomen-Adjektiv-Komposita’ und ‘Verb-Nomen-Komposita’. Die Nomen- Nomen-Komposita werden zusätzlich in zwei Spalten präsentiert, in der einen Spalte die Komposita mit dem Simplex als Bestimmungswort, in der anderen die Komposita mit dem Simplex als Grundwort. Abb. 4: Ansicht für die automatisch ermittelten Wortbildungsprodukte zum Lemma Fisch mit geöffneter Registerkarte für Komposita Chancen und Probleme bei der Ermittlung von Wortbildungsprodukten 249 Innerhalb der Registerkarte ‘Derivate’ (vgl. Abb. 5) werden die Ableitungen nach der resultierenden Wortart, also Nomen (beispielsweise Kinderei zu Kind ), Adjektive (kindlich, kindisch) und Verben ( fischen zu Fisch), gruppiert. Abb. 5: Die Ansicht für die automatisch ermittelten Wortbildungsprodukte zum Lemma Kind mit geöffneter Registerkarte für Derivate Zu jedem Wortbildungsprodukt wird seine Frequenz im elexiko-Korpus angegeben. Die Problematik von absoluten Häufigkeiten bei einem stetig wachsenden Korpus wurde diskutiert. Relative Häufigkeiten geben jedoch ebenfalls nur den Stand zu einem bestimmten Zeitpunkt an und sind bei einem Korpus von ca. 2,8 Milliarden Textwörtern außerdem sehr klein: Stiefkind aus Abbildung 5 hat eine relative Häufigkeit von etwa 3,76e -7 , d.h. 0,000000375714285714285; eine Zahl, die wohl für die meisten Nutzerinnen und Nutzer nicht mehr zu erfassen ist. Eine andere Alternative zu absoluten Häufigkeiten ist die Einordnung der Wortbildungsprodukte in Frequenzklassen. Die Wortbildung Stiefkind würde nach der elexiko-Klassifikation der Frequenzschicht VII angehören. 17 Um diese Information allerdings interpretieren zu können, müssen Nutzerinnen und Nutzer eine weitere Nachschlagehandlung durchführen. Aus diesen Gründen wurde entschieden, absolute Häufigkeiten anzugeben. Die Produkte können sowohl alphabetisch als auch absteigend nach Frequenz sortiert werden. In einer Benutzerstudie zeigte sich eine Präferenz für die alphabetische 17 Für die Definition der Frequenzschichten in elexiko vgl. http: / / www.owid.de/ wb/ elexiko/ glossar/ Frequenzschichten.html (Stand: 08/ 2011). Sabina Ulsamer 250 Sortierung, 18 weshalb diese als Default-Einstellung gewählt wurde. Alle Wortbildungsprodukte sind mit ihren jeweiligen Stichworteinträgen verlinkt, wo weitere Informationen verfügbar sind. Es handelt sich bei dieser Darstellung jedoch nicht um eine Nest- oder Nischenanordnung von Sublemmata, wie sie in manchen Printwörterbüchern zur Darstellung von Wortbildungszusammenhängen gewählt wird. In der für elexiko gewählten Präsentation der Wortbildungsprodukte werden die als Hyperlinks realisierten Lemmata nach Gesichtspunkten der Wortbildung gruppiert; man kann also am ehesten von wortbildungsbestimmten Verweislemma-Gruppen (Engelberg/ Lemnitzer 2009, S. 150) sprechen. 4.2 Chancen und Probleme bei der Darstellung der automatisch ermittelten Wortbildungsprodukte Die gewählte Darstellung zeigt die Wortbildungsaktivität eines Stichwortes. Die Nutzer erfahren so, welches Potenzial das betreffende Stichwort in der Wortbildung hat. Mit der Trennung in die beiden Wortbildungsarten Komposition und Derivation und dort jeweils mit der Gruppierung gemäß ihren Bestandteilen bzw. in die unterschiedlichen Wortbildungsresultate werden die vielfältigen Möglichkeiten zur Wortbildung sichtbar, die sich mit diesem Stichwort ergeben. Die Auflistung aller in der Stichwortliste vorhandenen Wortbildungen, in die das nachgeschlagene Stichwort eingeht, zeigt nicht nur, wie aktiv dieses Stichwort in der Wortbildung ist, sondern macht besonders auch Zusammenhänge zwischen den Stichwörtern deutlich, die sonst nicht hervortreten würden. Die jeweils angegebene Korpusfrequenz liefert zugleich erste Informationen über das jeweilige Produkt, aber auch über das nachgeschlagene Stichwort selbst. Die Korpusfrequenzen der Wortbildungsprodukte zeigen nicht nur, welche Wortbildungsprodukte das Stichwort besonders häufig bildet, sondern sie können gerade bei Komposita einen Einblick in die Diskurse geben, in denen das betreffende nachgeschlagene Stichwort in einer bestimmten Lesart verwendet wird. Folgen die Nutzer den Hyperlinks, gelangen sie zu den Wortartikeln der Wortbildungsprodukte und erhalten dort (im Falle von bearbeiteten Stichwörtern) ausführliche Informationen zur Bedeutung des Stichworts, typische Verwendungsmuster, lexikalische Mitspieler, sinnverwandte Wörter und Grammatikangaben. Die Verlinkung ist gerade für Lerner sehr nützlich, da sie unmittelbar Antworten auf ihre spezifischen Fragen, wie beispielsweise nach dem Genus des Produkts und dessen morphologischem Bauplan, finden. 18 Vgl. hierzu den Beitrag „Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen - eine Umfrage zu elexiko“ von Antje Töpel in diesem Band. Chancen und Probleme bei der Ermittlung von Wortbildungsprodukten 251 Allerdings führen Fehler, die auf Morphisto beruhen, - wie gezeigt - zu fehlerhaften Abfrageergebnissen, was wiederum zu Fehlern und Mängeln in der Darstellung führt. Wurde die falsche Zerlegung von Kindergartensaal nicht korrigiert, wird dieses Kompositum in der Registerkarte ‘Komposita’ unter der Rubrik ‘Nomen-Nomen-Komposita’ in der Spalte ‘als Grundwort’ im Artikel des Simplexes Aal angezeigt statt korrekt unter Saal. Wurde eine Wortbildung wie ärztlich gar nicht analysiert oder statt Arzt in das fiktive Komplement Ärzt und -lich zerlegt, so fehlt ärztlich in der Registerkarte ‘Derivate’ unter der Rubrik ‘Adjektive’ im Artikel Arzt. Ein weiteres der bereits erwähnten technischen Probleme setzt sich auch auf Darstellungsebene fort: die Zuordnung der Wortbildungsprodukte zu den Lesarten ihrer jeweiligen Ausgangslexeme. So werden die Komposita Zugreise, Charakterzug, Musikzug, Atemzug, Schachzug und Seilzug, die das Lemma Zug in jeweils unterschiedlichen Lesarten verwenden, alle lesartenübergreifend im Artikel Zug präsentiert. Die Zuordnung zu den Lesarten müssen die Nutzerinnen und Nutzer selbst vornehmen. Bei der Zusammensetzung Zugspitze kann es sich sowohl um die Spitze eines Zuges in der Lesart ‘Bahn’, um die Spitze eines Zuges der Lesart ‘Gruppe’ als auch um einen Eigennamen, nämlich den Namen von Deutschlands höchstem Berg, handeln. 5. Fazit In diesem Beitrag wurde mit einem Anwendungsbeispiel eines automatischen morphologischen Analyse-Tools in der Internetlexikographie eine neue Methode zur Darstellung von Wortbildungsbeziehungen im elektronischen Wörterbuch vorgestellt. Ein computerlinguistisches Werkzeug wurde genutzt, um eine sprachliche Ressource zu erstellen, die neue Möglichkeiten in der Wörterbucherstellung eröffnet. Mit der morphologisch analysierten Stichwortliste wurden die Wortbildungsprodukte zu simplizischen Nomen, Adjektiven und Verben durch Datenbankanfragen systematisch und umfassend ermittelt, um sie online in die Wortartikel der jeweiligen Simplizia integrieren zu können. In jedem Bearbeitungsschritt lagen Chancen und Probleme, die hier angesprochen wurden. Trotz der in der automatischen morphologischen Analyse und in der automatischen Ermittlung der Wortbildungsprodukte begründeten Probleme bietet sich auf diese Weise die Möglichkeit, die Daten des Wörterbuchs stärker miteinander zu vernetzen. Die Nutzer erhalten mit der gewählten Darstellung einen Einblick in das Wortbildungssystem und haben damit Material zur eigenen Wortschatzerweiterung zur Hand. Der von Holly (1986, S. 205) beklagten „Atomisierung“ des Wortschatzes im Wörterbuch und „in den Köpfen der Sabina Ulsamer 252 Benutzer“ wird mit der im vierten Kapitel vorgestellten Präsentation der Wortbildungsprodukte entgegengewirkt. Die „totale Herrschaft des Alphabets“ (Wiegand 1977, S. 102) wird zumindest teilweise aufgehoben. Das zeigt sich interessanterweise gerade in der alphabetischen Sortierung der Bestimmungswortkomposita: In der am linken Rand stets sichtbaren striktalphabetischen Stichwortliste von elexiko liegen zwischen den Komposita Zugabteil und Zuganschluss das Stichwort Zugang und seine 35 Komposita und Derivate, sodass die Wortbildungsaktivität von Zug nicht direkt hervortritt. Im Reiter „Komposita“ des Simplexes Zug wird in der alphabetischen Sortierung der Bestimmungswortkomposita die Liste der Komposita mit Zug als Bestimmungswort nicht unterbrochen. Auf Zugabteil folgen direkt Zuganschluss und die anderen Komposita mit Zug als Bestimmungswort. Die Verlinkung zu den jeweiligen Stichworteinträgen lässt die angegebenen Wortbildungsprodukte nicht „unkommentiert“ (van der Colff 1998, S. 199), denn die Nutzer gelangen über den Link zu den gerade für Lerner wichtigen morphosyntaktischen und grammatischen Angaben. Erst so dienen die Wortbildungsprodukte der Textproduktion. Die Präsentation aller automatisch ermittelten Wortbildungsprodukte, in die ein Lemma eingeht, macht nicht nur das Wortbildungspotenzial eines Lemmas sichtbar, sondern offenbart auch Wortbildungszusammenhänge, die in einem gedruckten Wörterbuch nicht hervortreten (können). In einem Online-Wörterbuch wie elexiko bietet sich dagegen die Möglichkeit, auch auf Wortbildungsebene die Stichwörter miteinander zu vernetzen. 6. Literatur 6.1 Wörterbücher elexiko (2003ff.). In: Institut für Deutsche Sprache (Hg.): OWID - Online-Wortschatz-Informationssystem Deutsch. Mannheim. Internet: http: / / www.elexiko.de Stand: (08/ 2011). 6.2 Forschungsliteratur Barz, Irmhild (2001): Wortbildungsbeziehungen im einsprachigen Bedeutungswörterbuch. In: Korhonen, Jarmo (Hg.): Von der monozur bilingualen Lexikografie für das Deutsche. Frankfurt a.M., S. 85-100. Engelberg, Stefan/ Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4., überarb. u. erw. Aufl. Tübingen. Haß, Ulrike (Hg.) (2005): Grundfragen der elektronischen Lexikographie. elexiko − das Online-Informationssystem zum deutschen Wortschatz. (= Schriften des Instituts für Deutsche Sprache 12). Berlin/ New York. Chancen und Probleme bei der Ermittlung von Wortbildungsprodukten 253 Haß, Ulrike (2005): elexiko - Das Projekt. In: Haß (Hg.), S. 1-17. Holly, Werner (1986): Wortbildung und Wörterbuch. In: Lexicographica 2, S. 195- 213. Klosa, Annette (2005): Wortbildung. In: Haß (Hg.), S. 141-162. Klosa, Annette (2010): On the combination of automated information and lexicographically interpreted information in two German online dictionaries. In: Granger, Sylviane/ Paquot, Magali (Hg.): eLexicography in the 21st century. New challenges, new applications. Proceedings of eLex 2009. Louvain-la-Neuve, S. 157-163. Klosa, Annette (Hg.) (2011): elexiko − Erfahrungsberichte aus der lexikografischen Praxis eines Internetwörterbuchs. (= Studien zur Deutschen Sprache 55). Tübingen. Lieber, Rochelle (1981): On the organization of the lexicon. Bloomington. Scalise, Sergio (1988): The notion of ‘head’ in morphology. In: Booij, Geert/ van Marle, Jaap (Hg.): Yearbook of morphology. Dordrecht, S. 229-245. Schmid, Helmut/ Fitschen, Arne/ Heid, Ulrich (2004): SMOR: A German computational morphology covering derivation, composition, and inflection. In: Proceedings of the IVth International Conference on Language Resources and Evaluation (LREC 2004). Lisbon, Portugal, S. 1263-1266. Internet: www.lrec-conf.org/ proceedings/ lrec2004/ pdf/ 468.pdf (Stand: 11/ 2011). Schnörch, Ulrich (2005): Die elexiko-Stichwortliste. In: Haß (Hg.), S. 71-90. Selkirk, Elisabeth (1982): The syntax of words. Cambridge, MA. Storjohann, Petra (2005): Das elexiko-Korpus: Aufbau und Zusammensetzung. In: Haß (Hg.), S. 55-70. van der Colff, Adri (1998): Die Komposita in Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In: Wiegand, Herbert Ernst (Hg.): Perspektiven der pädagogischen Lexikographie des Deutschen I. (= Lexicographica. Series Maior 86). Tübingen, S. 193-207. Wiegand, Herbert Ernst (1977): Nachdenken über Wörterbücher: Aktuelle Probleme. In: Drosdowski, Günther/ Henne, Helmut/ Wiegand, Herbert Ernst (Hg.): Nachdenken über Wörterbücher. Mannheim, S. 51-102. Williams, Edwin (1981): On the notions ‘lexically related’ and ‘head of word’. In: Linguistic Inquiry 12, 2, S. 245-274. Zielinski, Andrea/ Simon, Christian/ Wittl, Tilman (2009): Morphisto: Service-oriented open source morphology for German. In: Mahlow, Cerstin/ Piotrowski, Michael (Hg.): SFCM 2009, CCIS 41. Heidelberg, S. 64-75. Sabina Ulsamer 254 6.3 Internetressourcen BZVelexiko - Benutzeradaptive Zugänge und Vernetzungen in elexiko. Internet: http: / / www.ids-mannheim.de/ lexik/ BZVelexiko/ (Stand: 08/ 2011). elexiko. Internet: http: / / www.ids-mannheim.de/ lexik/ elexiko/ (Stand: 08/ 2011). Morphisto. Internet: http: / / www.ids-mannheim.de/ lexik/ TextGrid/ morphisto.html ( Stand: 08/ 2011). TextGrid. Internet: http: / / www.textgrid.de (Stand: 08/ 2011). Peter Meyer / Carolin Müller-Spitzer Überlegungen zur Visualisierung von Wortbildung in elektronischen Wörterbüchern Für Wortbildungsangaben bietet sich eine mit visuell-grafischen Methoden arbeitende Darstellung im elektronischen Wörterbuch aus mehreren Gründen besonders an. So scheint angesichts der oft großen Zahl von Wortbildungsprodukten eines Lemmas eine übersichtlich strukturierte, nach Benutzerwünschen filter- und sortierbare Präsentation dieser Produkte, die die Beschränkungen einer einfachen textuellen oder tabellarischen Beschreibung überwindet, wünschenswert. Bei Wortbildungsanalysen wiederum ist eine Veranschaulichung der rekursiven Analyseschritte beispielsweise durch einen Baumgraphen durchaus auch für den Laiennutzer instruktiv. Insgesamt liegt bei lexikographischen Angaben zur Wortbildung eine explorative Darstellung abseits der Suche nach konkreten Einzelinformationen nahe. Eine solche Nutzung kann möglicherweise besonders gut durch Visualisierungsverfahren unterstützt werden. In diesem Beitrag präsentieren und diskutieren wir zunächst einige Untersuchungen aus der Benutzungsforschung zu elektronischen Wörterbüchern, die sich mit der nutzerseitigen Beurteilung des Mehrwerts multimedialer und benutzeradaptiver Elemente befassen (Kap. 1). In einem zweiten Teil versuchen wir, ausgehend von den Stärken und Schwächen vorhandener Ansätze in diesem Bereich, Antworten auf die Frage zu finden, welche Anforderungen an Visualisierungstechniken und -strategien in elektronischen Wörterbüchern gestellt werden müssen, um einen solchen Mehrwert zu erhalten (Kap. 2). Abschließend stellen wir als praktisches Beispiel für eine mögliche Umsetzung solcher Anforderungen den Prototyp einer Software zur interaktiven Erkundung von Wortbildungsangaben im Wörterbuch vor (Kap. 3). 1. Einsatz von Multimedia: Ergebnisse aus der Benutzungsforschung Im Vergleich zu gedruckten Wörterbüchern sind elektronische Wörterbücher ein sehr junges Phänomen. Von Anfang an wurden in der digitalen Lexikographie jedoch die vielversprechenden Möglichkeiten diskutiert, die das mittlerweile nicht mehr so neue Medium für Nachschlagewerke bereithält. Neue Aspekte waren beispielsweise die Abkehr vom Alphabet als meistgewählter Ordnungsstruktur, die selektive, benutzeradaptive Darstellung lexikographi- Peter Meyer / Carolin Müller-Spitzer 256 scher Inhalte und auch die Einbindung unterschiedlicher Medien wie Ausspracheangaben als Tondateien oder die Integration von (bewegten) Bildern bzw. grafischen Darstellungen (vgl. de Schryver 2003). Nach wie vor gibt es jedoch nur wenige elektronische Wörterbücher, die diese Möglichkeiten konsequent nutzen. Fraglich ist dabei, ob dies daran liegt, dass der tatsächliche Nutzen z.B. von multimedialen Darstellungen überschätzt wird und diese in Wahrheit nur „nette Add-ons“ sind -, oder ob es andere Gründe gibt, warum so wenige digitale Wörterbücher multimediale Elemente (abgesehen von Audio-Angaben) oder benutzeradaptive Darstellungen einsetzen. Diese Frage ist ein Thema neben vielen anderen für die Benutzungsforschung zu elektronischen Wörterbüchern, denn es ist nicht a priori klar, wie Benutzer die Nützlichkeit solcher Elemente einschätzen. In einem interdisziplinären Forschungsprojekt sind wir deshalb dieser Frage nachgegangen (vgl. ausführlicher Koplenig 2011 sowie Müller-Spitzer/ Koplenig/ Töpel 2011, i.Dr.; Informationen online unter www.benutzungsforschung.de ). Zur Klärung genereller Fragen in Bezug auf die Benutzung von Online-Wörterbüchern wurden im Jahr 2010 zwei internationale Online-Studien durchgeführt. 1 An der ersten Studie nahmen 684 Personen teil, während die Fallzahl in der zweiten Studie bei 390 Teilnehmenden lag. Um zunächst zu sehen, welche Kriterien für ein gutes Online-Wörterbuch von Benutzern als besonders wichtig eingeschätzt werden, wurden die Teilnehmer in der ersten Studie gebeten, zehn Aspekte eines guten Online-Wörterbuchs hinsichtlich ihrer Wichtigkeit zunächst in einer 5-Punkte-Likert-Skala (1 = sehr wichtig, 5 = unwichtig) zu bewerten und anschließend in einem Ranking in eine individuelle Reihenfolge zu bringen (vgl. Abb. 1). Unsere Hypothese war dabei, dass die meisten Probanden voraussichtlich alle Aspekte als sehr wichtig bis wichtig einstufen würden und dass sich die echte Rangfolge erst im Ranking zeigen wird, in dem alle Kriterien auf die Plätze 1-10 verteilt werden und so eine deutliche Abstufung erfolgen musste. Die Kriterien, die die Teilnehmer bewerten mussten, waren im Einzelnen: - Adaptivität: Man kann die Benutzeroberfläche an eigene Ansprüche anpassen. - Animation zum Stöbern: Es werden Links und Querverweise zu anderen Suchergebnissen präsentiert, die den Nutzer unter Umständen interessieren könnten. 1 Zu weiteren Ergebnisse aus diesen Studien vgl. den Beitrag „Die Wortbildungsangaben im Onlinewörterbuch und wie Nutzer sie beurteilen - eine Umfrage zu elexiko“ von Antje Töpel in diesem Band. Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 257 - Erreichbarkeit: Man kann sich darauf verlassen, die einzelnen Artikel auch in Zukunft unter der bisherigen Internetadresse erreichen zu können. - Inhaltliche Verlässlichkeit: Man kann sich auf die Richtigkeit und Urheberschaft der Angaben verlassen. - Multimedialität: Grafiken, Audiodateien oder andere Medien sind in das Online-Wörterbuch eingebunden. - Regelmäßige Aktualisierung: Etwaige Fehler werden regelmäßig verbessert, neue Wortartikel und sprachliche Entwicklungen werden regelmäßig online publiziert. - Schnelligkeit: Keine/ kaum Wartezeit vergeht während des Seitenaufbaus. - Übersichtlichkeit: Menüführung und Struktur der Seite ermöglichen ein schnelles Auffinden der gesuchten Informationen. - Vernetztheit mit anderen Wörterbüchern: Die Artikel präsentieren auch Links zu anderen Wörterbüchern. - Vernetztheit mit Korpus: Die Artikel sind mit der zugrunde liegenden Textsammlung (Korpus) vernetzt. Abb. 1: Ranking aus der ersten Online-Studie Peter Meyer / Carolin Müller-Spitzer 258 Entgegen unserer Hypothese zeigten allerdings sowohl die Bewertung in der Skala als auch das Ranking ein ähnliches Ergebnis: Die klassischen Kriterien von Nachschlagewerken - inhaltliche Verlässlichkeit, Übersichtlichkeit - wurden sowohl auf der Skala als auch im Ranking als sehr wichtig eingestuft, wohingegen der Einsatz sowohl von Multimedia als auch von benutzeradaptiven Darstellungen als unwichtig bewertet wurde (vgl. Abb. 2). Dies ist wiederum als ein Zeichen dafür zu werten, dass die Teilnehmer eine klare Vorstellung davon haben, was für sie ein gutes Online-Wörterbuch ausmacht. Abb. 2: Ergebnis des Ratings und des Rankings (Durchschnitt) aus der ersten Online-Studie Mit diesem Ergebnis ist allerdings noch nicht die Frage beantwortet, warum die Teilnehmer diese klare Rangfolge wählten. Liegt es daran, dass diese Eigenschaften für die Benutzer wirklich nicht wichtig sind, oder kennen sie einfach zu wenige Beispiele für gute multimediale Elemente oder mögliche benutzeradaptive Präsentationen? Sollte Letzteres die Antwort sein, müssten wiederum Probanden, die gute, sinnvolle Elemente präsentiert bekommen, diese anschließend besser bewerten als solche, denen keine gezeigt werden; es müsste sich sozusagen ein Lerneffekt zeigen. Um dies zu testen, haben wir in der zweiten Online-Studie ein Experiment integriert. Den Teilnehmern der zweiten Studie wurden mögliche multimediale und benutzeradaptive Elemente in einem Frageblock (S1) präsentiert. Alle Aspekte wurden dabei sprachlich erläutert sowie durch Abbildungen illustriert (vgl. Tab. 1). Anschließend wurden die Probanden gebeten, die Features zu bewerten (nach den Aspekten ‘wichtig’, ‘nützlich’ und ‘hilfreich’). Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 259 Bereich Feature Erläuterung Multimedia Ausspracheangaben Im Unterschied zu einem gedruckten Wörterbuch kann ein Online-Wörterbuch Audiodateien enthalten, welche die Aussprache des jeweiligen Wortes, der Wortgruppe oder des Satzes an einem Beispiel belegen. Kollokationen als Graphen In einem Online-Wörterbuch kann man Kollokationen, d.h. allgemein gesagt häufig auftretende Wortverbindungen, als Graphen darstellen. Das folgende Bild gibt ein Beispiel für einen solchen Kollokationsgraphen. Illustrationen In ein Online-Wörterbuch kann man Illustrationen einbinden. Benutzeradaptivität Anpassung entsprechend früherem Verhalten Je nachdem, welche Angabebereiche eines Online-Wörterbuchs der Benutzer bei vergangenen Suchanfragen besonders häufig verwendet hat, passt sich die Benutzeroberfläche automatisch an die Bedürfnisse des Benutzers an. So wird der Zugang zu individuell relevanten Informationen erleichtert. Dabei ‘merkt’ sich das Online-Wörterbuch, über welche Angabebereiche sich der jeweilige Benutzer häufig informiert: Wenn der Benutzer zum Beispiel ein Online-Wörterbuch häufig konsultiert, um nach Synonymen zu suchen, dann erscheint auf der Startseite ein Suchfenster speziell für diese Art von Suchvorgang. Ein bekanntes kommerzielles Beispiel ist die Homepage des Versandhandels Amazon, deren Präsentation sich an den jeweiligen Besucher und dessen bisherige Kaufpräferenzen anpasst. Wahl eines Profils Hierunter versteht man die Möglichkeit, auf der Startseite eines Online-Wörterbuchs ein spezielles Profil auszuwählen, welches die Inhalte optimal an die Bedürfnisse des Benutzers anpasst. Hierzu wählt der Benutzer unterschiedliche Benutzertypen bzw. Benutzungssituationen aus, bestimmte Voreinstellungen strukturieren dann die Präsentation der Inhalte. dynamische Ansichten Hierunter versteht man die Möglichkeit, sich eine individualisierte Benutzeroberfläche für das Online-Wörterbuch zusammenzustellen. Dabei hat der Benutzer die Wahl zwischen verschiedenen Angabebereichen - etwa der Paraphrase, Sinnrelationen, grammatischen Informationen oder auch Belegen. Tab. 1: Sprachliche Erläuterungen zu Aspekten von Benutzeradaptivität und Multimedia aus der zweiten Online-Studie Peter Meyer / Carolin Müller-Spitzer 260 In einem zweiten Frageblock (S2) wurden die Teilnehmer gebeten, auf einer 7-Punkte-Likert-Skala (1 = stimme überhaupt nicht zu, 7 = stimme voll und ganz zu) einzustufen, inwiefern sie den folgenden zwei Statements zustimmen: - Die multimediale und benutzeradaptive Gestaltung eines Online-Wörterbuchs ist eine Arbeitserleichterung. - Die multimediale und benutzeradaptive Gestaltung eines Online-Wörterbuchs ist eine technische Spielerei. Um einen möglichen Lerneffekt zeigen zu können, wurde die Reihenfolge der beiden Frageblöcke randomisiert: Teilnehmern in der Lerneffekt-Bedingung wurden zunächst die Beispiele in S1 gezeigt, anschließend sollten sie ihre Bewertungen in S2 abgeben. Teilnehmer in der Nicht-Lerneffekt-Bedingung mussten S2 beantworten und erhielten erst anschließend die Erläuterungen und Abbildungen zur Illustration. Im Ergebnis 2 zeigte sich, dass sich die Hypothese bestätigte: Eine Varianzanalyse (F (1,379) = 12,27, p < 0,001) belegt einen hochsignifikanten Lerneffekt: Versuchspersonen, denen zuerst potenzielle adaptive und multimediale Merkmale präsentiert werden, stufen deren Nützlichkeit höher ein (M = 5,02; SD = 1,30) als Personen, denen solche Information vorenthalten wird (M = 4,50; SD = 1,54) (vgl. Abb. 3). Ein hoher F-Wert deutet generell darauf hin, dass zwischen den Gruppen ein Unterschied besteht. Bei dem p-Wert handelt es sich um die Irrtumswahrscheinlichkeit in Form des sogenannten „empirischen Signifikanzniveaus“. Je kleiner die Irrtumswahrscheinlichkeit, umso eher kann man von einem statistisch bedeutsamen Ergebnis ausgehen. Dabei sagt der oben ausgewiesene Wert aus, dass die Wahrscheinlichkeit, dass es sich bei dieser unterschiedlichen Bewertung um einen Zufall handelt, kleiner als 1 ‰ ist (vgl. Jann 2002, S. 141ff.). Unsere Benutzungsstudien deuten damit darauf hin, dass es sinnvoll ist, neue Möglichkeiten multimedialer Darstellungen oder benutzeradaptiver Elemente auszuloten, da Benutzer deren Relevanz durchaus zu schätzen scheinen. Die Diskussion um gute Visualisierungsmöglichkeiten ist daher auch aus Nutzersicht für die praktische Lexikographie von besonderem Interesse. 2 Siehe ausführlicher zur Methode und zu den Resultaten Koplenig (2011). Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 261 Abb. 3: Abhängigkeit der Bewertung multimedialer Elemente von vorheriger Präsentation dieser Elemente 2. Allgemeine Überlegungen zur Visualisierung von Wortbildung Bei einer visuellen Aufbereitung von Informationen zur Wortbildung in einem konkreten elektronischen Wörterbuch müssen unter anderem folgende inhaltlich eng miteinander verwobene Punkte geklärt werden: 1) Was genau soll für den Benutzer in einer konkreten Benutzungssituation des Wörterbuchs der Ausgangspunkt für eine Visualisierung sein? Sie kann beispielsweise im Zusammenhang mit einem direkt aufgerufenen oder durch einen Suchvorgang gefundenen Wörterbucheintrag gestartet werden; in diesem Fall wäre also ein Lemma, gegebenenfalls auch eine konkrete Lesart des betreffenden Wortes, der Ausgangspunkt. Denkbar ist aber ebenso, dass die vom Benutzer geforderte Spezifikation eines bestimmten Wortbildungstyps als Ausgangspunkt oder erster Schritt der Visualisierung fungiert. 2) Welche Interaktionsabfolgen sind innerhalb der Visualisierungskomponente vorgesehen und welche Informationen bzw. welche Typen von Informationen sollen in jedem Schritt einer solchen Abfolge angezeigt werden? 3) Welche gestalterischen Mittel sollen in den einzelnen Interaktionsschritten eingesetzt werden? Hier geht es natürlich zum einen um die grafische Gestaltung (Farben, Typographie, räumliche Anordnung, Verwendung von Symbolen, Formen und Bildern), zum anderen aber auch um die Veränderung dieser Gestaltung in der Zeit, wenn „Animationen“ verwendet werden sollen. Peter Meyer / Carolin Müller-Spitzer 262 4) Welcher Zweck soll mit der Wahl bestimmter Visualisierungsstrategien verfolgt werden? Welchen Mehrwert bietet die Wahl gegenüber alternativen Visualisierungen bzw. gegenüber einer rein textuellen Gestaltung? Im Folgenden wird der Schwerpunkt zunächst auf den beiden zuletzt genannten Fragen nach der Wahl konkreter Visualisierungsmittel und deren Nutzen liegen. Dabei werden wir uns insgesamt eher auf der Ebene konkreter Programmfunktionen bewegen; zu allgemeinen kognitiven und wahrnehmungspsychologischen Fragen bei der Wahl von grafischen Darstellungsmitteln sei etwa auf Ware (2009) verwiesen. Zur grundsätzlichen Bedeutung visueller Strategien beispielsweise für Lernzwecke existieren ausgearbeitete theoretische Ansätze, von denen die auch experimentell gut bestätigte Dual-Coding- These (vgl. Paivio 1986) vielleicht die bekannteste ist. Es zeigt sich recht schnell, dass jegliche Antwort auf die oben gestellten Fragen Implikationen auch für die sinnvolle Gestaltung einer allgemeinen Visualisierungsstrategie (siehe oben Punkte 1 und 2) hat, da es von Letzterer abhängt, welche Gestaltungsmittel überhaupt in den vorgesehenen Interaktionssituationen jeweils zur Verfügung stehen. Dabei wird es uns insgesamt nicht darum gehen, absolute Kriterien für die Bewertung der Nützlichkeit oder Tauglichkeit von Visualisierungsmitteln und -strategien aufzustellen, da eine solche Bewertung nur im Kontext der Betrachtung eines konkreten Wörterbuchs und einer konkreten Benutzungssituation mit bestimmten Informationsbedürfnissen des Nutzers möglich ist. Wir beschränken uns darauf, mögliche Kriterien für die Bewertung von Visualisierungen zu nennen; für verschiedene Benutzungssituationen und Visualisierungsziele werden jeweils nur bestimmte dieser Kriterien relevant sein. 2.1 Probleme mit vorhandenen Visualisierungslösungen Visualisierungen werden bereits vielerorts in vorhandenen lexikographischen Online-Anwendungen verwendet. Eine kritische Betrachtung dieser Technologien soll hier als Ausgangspunkt für die Entwicklung unseres Kriterienkataloges dienen. Vergleichbare Beobachtungen finden sich in kürzerer Form z.B. auch bei Robichaud (2011). Der kostenfrei verfügbare grammatisch-lexikographische Online-Sprachservice Canoo.net ( http: / / www.canoo.net/ ) verfügt über eine sehr umfangreiche Informationskomponente zur deutschen Wortbildung. Ausgehend von einem im Prinzip beliebigen Lexem werden durch Klicken auf einen „Wortbildung“- Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 263 Link sowohl eine rekursive Wortbildungsanalyse als auch eine Aufzählung von Wortbildungsprodukten als gerichteter azyklischer Graph dargestellt; in Abbildung 4 am Beispiel des Lemmas zügeln: Abb. 4: Wortbildungsanalysen und -produkte in Canoo.net Jeder Knoten im Graph ist ein Hyperlink, der auf eine neue Seite führt, auf der die entsprechenden Wortbildungsinformationen für das angeklickte Lemma präsentiert werden. Die Visualisierung besteht also aus miteinander verlinkten statischen Einzeldarstellungen; jeder Graph ist eine Bilddatei mit anklickbaren, verlinkten Bereichen. Der Mehrwert der Visualisierung durch einen Graphen besteht in erster Linie darin, dass mehrere Derivationsbzw. Ableitungsschritte in einer Darstellung zusammengefasst werden. So wird in der Analyse letztlich gezeigt, wie das Wort rekursiv in seine morphologischen Konstituenten zerlegt werden kann; die Bezeichnungen der Wortbildungsverfahren sind dabei mit Begriffserklärungen verlinkt. Nachteilig ist, dass bei Wörtern mit zahlreichen Wortbildungsprodukten sehr schnell die Übersicht verloren geht und der Benutzer gezwungen ist, mit der Suchfunktion des Browsers nach der gewünschten Information zu fahnden oder sich durch womöglich langwieriges Scrollen einen Überblick zu verschaffen, wie etwa hier bei den Wortbildungsprodukten von Zug (vgl. Abb. 5). Peter Meyer / Carolin Müller-Spitzer 264 Abb. 5: Wortbildungsprodukte zum Lemma Zug in Canoo.net Hier ist es für den Benutzer bei umfangreichen Seiten besonders schwierig, zwei weit voneinander entfernte Hyperlinks auf derselben überlangen HTML - Seite zu verfolgen. - Eine weitere Schwierigkeit entsteht dadurch, dass der Benutzer durch Anklicken eines Hyperlinks jeweils auf eine völlig neue Seite kommt und ihm keine Dokumentation der konkreten bisherigen Interaktionsgeschichte zur Verfügung steht, sodass er dafür auf die Verwendung der ‘zurück’/ ‘vorwärts’-Schaltflächen des Browsers oder sein Gedächtnis angewiesen ist. Die Verwendung der Schaltflächen ermöglicht allerdings im Allgemeinen keine vollständige Rekonstruktion der Interaktionsgeschichte: Begibt man sich von einer HTML -Seite A per Link auf eine Seite B, von dort mit der ‘zurück’-Schaltfläche nach A zurück, sodann per Link auf eine Seite C, ist Seite B nicht mehr mit den besagten Schaltflächen erreichbar. Die einzige Lösung - die eher für erfahrene Browser-Benutzer infrage kommt - besteht darin, ggf. Hyperlinks in einem neuen Browsertab oder -fenster zu öffnen. Aus den genannten Beobachtungen ergeben sich zwei Desiderata, die beide die Übersichtlichkeit der Präsentation und damit verbunden die Entlastung Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 265 des Gedächtnisses betreffen: Informationen sollten auch bei Visualisierungsverfahren in übersichtlichem Umfang präsentiert werden; eine Darstellung der Interaktionsgeschichte oder doch wenigstens eine Auflistung bislang betrachteter Lemmata kann für bestimmte Nutzer hilfreich sein. Ein bemerkenswertes Beispiel für den Einsatz von animierten und interaktiven Visualisierungen im lexikographischen Umfeld bietet das kommerzielle Webportal Visual Thesaurus ( http: / / www.visualthesaurus.com ). Hier geht es allerdings nicht um Wortbildungsinformationen, sondern um die visuelle Aufbereitung eines auf WordNet basierenden semantischen Netzes. Ausgangspunkt für den Benutzer ist die Eingabe des gewünschten Lemmas in ein Suchfeld. In einem Java-Applet (vgl. Abb. 6) wird ein entsprechender Ausschnitt des Netzes dargestellt; jedes Lemma ist mit farbigen Kreisen verbunden, die jene Synsets repräsentieren, zu denen die einzelnen Lesarten des Lemmas gehören. Die Farbe des Kreises codiert die Wortart; Relationen zwischen Synsets sind durch gestrichelte Linien angedeutet. Abb. 6: Informationen zu loom im Visual Thesaurus Peter Meyer / Carolin Müller-Spitzer 266 Die im Visual Thesaurus zum Einsatz kommenden dynamischen Visualisierungstechniken haben für den Benutzer erkennbaren Mehrwert: 1) Der Benutzer kann die Menge an angezeigter Information zu einem aktuell betrachteten Graphen kontrollieren. Zum einen werden bestimmte Erläuterungen (semantische Erläuterung der Synsets; semantische Relationen) nur angezeigt, wenn man den Mauszeiger über dem zugehörigen grafischen Element ruhen lässt. Zum anderen lassen sich in Einstellungsdialogen gezielt Informationstypen ein- und ausblenden, insbesondere die angezeigten Wortarten und Relationen. 2) Die angezeigte Informationsmenge ist dynamisch erweiterbar und veränderbar. Der Benutzer hat jederzeit die Wahl, ausgehend von einem im Graphen angeklickten Lemma oder Synset einen völlig neuen Graphen anzeigen zu lassen oder aber den bestehenden Graphen um Synsets, Lemmata bzw. Relationspartner zu erweitern. Auch das Entfernen von Graphenteilen ist möglich. 3) Die Interaktionsgeschichte lässt sich auf verschiedenen Ebenen dokumentieren: durch den vom Benutzer gestalteten Graphen selbst; durch eine automatische Erfassung der Browsergeschichte (die jedoch nur die Auswahl von je neuen Lemmata als Ausgangspunkt für einen neuen Graphen erfasst und die oben genannten Probleme der Benutzung der ‘vorwärts’/ ‘zurück’- Schaltflächen aufweist); und durch das Anlegen einer Merkliste interessierender Lemmata, die per Drag-and-drop aus dem Graphen in die Liste hinübergezogen werden können. Mit der Maus kann die Position von Graphenknoten verändert sowie der Graph als Ganzes verschoben werden. Beim Ziehen von Graphenknoten verändert sich auch die Position anderer Knoten, ebenso wie beim Hinzufügen und Löschen von Graphenelementen. Die fließenden Animationen machen die Bedienung ästhetisch reizvoll; das aus den Positionsänderungen aller Knoten im Graphen jeweils resultierende Layout des Graphen ist jedoch für den menschlichen Benutzer nicht vorhersagbar. Bei einer großen Zahl von Knoten wird die freie Anordnung in zwei Dimensionen bald im Detail unübersichtlich und kann durch gezieltes Verschieben von Knoten, die jedoch im Allgemeinen nicht an ihrem durch den Mauszeiger angezeigten Zielpunkt verbleiben, aus dem genannten Grund nur bedingt verbessert werden. Das Problem ist hier also die zu große Anzahl an Freiheitsgraden in der grafischen Darstellung oder, anders gesagt, die fehlende Semantisierbarkeit der Positionsinformationen. Nicht die absolute oder relative Lage der Knoten in zwei Dimensionen Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 267 zueinander sagt etwas über ihre Relationen zueinander aus, sondern letztlich ist nur relevant, welche Knoten durch Kanten verbunden sind. Insbesondere werden die grafischen Freiheitsgrade auch nicht dazu genutzt, zusätzliche Detailinformationen zu codieren, wie etwa nähere Details der Bearbeitungsgeschichte des aktuell angezeigten Graphen. 2.2 Mögliche Anforderungen an sinnvolle Visualisierungsstrategien und -mittel für die Darstellung von Wortbildungsinformationen Im Folgenden stellen wir eine Anzahl von Anforderungen an eine Visualisierungskomponente für lexikographische Wortbildungsangaben zusammen. Die meisten dieser Anforderungen sind, wie betont, jeweils nur in bestimmten Nutzungskontexten relevant, lassen sich aber andererseits in verallgemeinerter Form natürlich auch außerhalb des hier diskutierten Anwendungsbeispiels anwenden. Vieles hiervon findet sich in der Standardliteratur zum Thema Visualisierung, ohne dass wir im Folgenden jeweils explizit darauf hinweisen werden; vgl. z.B. Ware (2009), Spence (2007), Chen (2006), Mazza (2009). Wir formulieren jeweils einen bestimmten allgemeinen Mehrwert, den Visualisierungstechniken bieten können, und leiten daraus vor dem Hintergrund der Stärken und Schwächen der beiden oben exemplarisch besprochenen Visualisierungskomponenten ab, welche Anforderungen insbesondere an Gestaltungsmittel und Visualisierungsstrategie gestellt werden können, um den genannten Mehrwert zu erhalten. 1) Ein klarer Vorteil einer grafisch aufbereiteten Präsentation gegenüber einer rein textuellen Darstellung besteht darin, dass sie durch die zusätzlichen gestalterischen Mittel (räumliche Anordnung, Farben- und Formenwahl) stärker strukturierbar und daher einfacher zu rezipieren ist. So können beispielsweise Aussagen über Relationen zwischen Lemmata („X ist Derivat von Y“) direkt z.B. in räumliche Relationen übersetzt werden; Attribute, also einstellige Relationen („X ist ein Verb“) lassen sich gut durch Farben oder Formen repräsentieren. Grundvoraussetzung für eine übersichtliche Darstellung ist eine wohlüberlegte und kognitiv zugängliche Organisation der bildlichen Information: a) Die Darstellung sollte von einer einleuchtenden, möglichst weniger Erläuterungen bedürfenden visuellen Metapher geleitet sein. Naheliegend ist im Bereich der Wortbildung die Verwendung von Graphen, insbesondere von Baumgraphen, die jedem Benutzer aus anderen Kontexten vertraut sind (vgl. Stammbäume; Menüstruktur in Computeranwendungen). Peter Meyer / Carolin Müller-Spitzer 268 b) Das jeweilige Bildschirmformat muss ausgenutzt werden, für die Darstellung am PC also auf das gängige Querformat abgestimmt sein, auch um unnötiges und Übersicht zerstörendes Scrollen zu vermeiden. Für Baumgraphen mit großer Tiefe etwa kann es sinnvoll sein, diese auf die Seite gelegt darzustellen und in Leserichtung „wachsen“ zu lassen; flache Baumgraphen mit hohem Verzweigungsgrad „wachsen“ besser von oben nach unten. Vgl. zur Rolle von räumlichen (und auch zeitlichen) Beschränkungen bei Visualisierungstechniken Spence (2007, S. 97ff.). c) Der allgemeinen Forderung nach einer strukturierten, nicht überladenen Darstellung kann, je nach konkretem Fall, unter anderem durch eine einheitliche und leicht erfassbare sowie ggf. kurz in einer Legende erläuterte Farben- und Formenzuordnung sowie durch klare räumliche Orientierungsrichtungen Rechnung getragen werden. Letzteres betrifft z.B. die „Wachstumsrichtung“ von Baumgraphen und die Freiheitsgrade in der Beweglichkeit von Kanten und Knoten bei sukzessiver Erweiterung des Graphen. 2) Die visuelle Aufbereitung von Informationen erleichtert die Aufmerksamkeitsfokussierung durch interaktiv veränderbare Filterung und Portionierung des Inhalts sowie durch die größere Zahl an Möglichkeiten zur Hervorhebung wichtiger Details. Die Umsetzung umfasst u.a. folgende Aspekte: a) Inhalte sowie ihre interaktive Bearbeitung und die Suche nach weiteren zugehörigen Informationen lassen sich filtern, indem es einen klar definierten, möglichst übersichtlichen Ausgangspunkt für den Visualisierungsprozess gibt, von dem aus auf wenigen klar umrissenen Interaktionswegen Erweiterungen und Veränderungen des angezeigten Inhalts möglich sind. b) Nicht interessierende Aspekte der Darstellung sollte der Benutzer selbst selektiv ausblenden können; bei starkem Anwachsen der angezeigten Menge an Informationen sollte die Anwendung selbst eine Standardstrategie für das Ausblenden z.B. der am längsten angezeigten Details aufweisen. c) In Fällen, wo eine große Zahl von listenartig dargestellten Informationen vorliegt (z.B. zahlreiche Wortbildungsprodukte zu einem gegebenen Lexem), sollten nach Möglichkeit zunächst nur diejenigen Listenpunkte angezeigt werden, die im jeweiligen Anwendungskontext als besonders relevant gelten können (beispielsweise die Wortbildungs- Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 269 produkte mit der höchsten Korpusfrequenz). Der Benutzer sollte dann natürlich die Möglichkeit erhalten, per Mausklick die gesamte Liste einzusehen und ggf. einen anderen Ausschnitt der Liste anzeigen zu lassen. d) Detailinformationen zu angezeigten Punkten sollten erst nach Anklicken in einem separaten Bereich angezeigt werden, um die Darstellung schlank zu halten. 3) Visualisierungen sind gut geeignet für interaktive Benutzungsabläufe, insbesondere das schrittweise Erweitern, Löschen, Verändern und Umordnen von Informationen mit der Maus. So kann der Benutzer die bereits angesprochene Selektion und Auswahl von jeweils aktuell präsentierten Details in einem dialogischen Prozess selber steuern. Vorhandene Informationen können aus der Perspektive des konkreten Nutzerinteresses gezielt gesucht und in neuer Weise zusammengestellt und verknüpft werden. Wesentliche Herausforderung ist hier die sinnvolle Gestaltung und Einschränkung der möglichen Interaktionsabläufe: a) Die während der Bedienung jeweils entstehende grafische Landschaft sollte auf geeignete Weise relevante Aspekte der bisherigen Interaktionsgeschichte dokumentieren. Idealerweise reflektiert die grafische Struktur in irgendeiner Form die Geschichte ihrer Entstehung, im einfachsten Fall dadurch, dass mit der zeitlichen Abfolge eine räumliche oder farbliche Orientierung korrespondiert, später hinzugefügte Elemente also z.B. weiter rechts stehen oder eine hellere Farbe aufweisen. Zusätzlich können auch durch per Mausklick abrufbare Listen bisher besuchter Lemmata o.Ä. hilfreich sein. Interaktionsergebnisse, die der Nutzer aktiv durch seine Selektionsvorgänge erzeugt hat, sollte er - etwa lokal als Datei oder innerhalb der Webanwendung - für die spätere Verwendung oder weitere Modifikation sichern (persistieren) können. b) Aus dem Gesagten ergibt sich erneut eine Motivation für die weiter oben schon genannten Forderungen nach möglichst konstanten grafischen Verhältnissen, speziell Orientierungsrichtungen und Elementpositionen. Animationen, die bereits angezeigte Information verändert darstellen, indem z.B. die Position von Knoten im Graphen verschoben wird oder Farben verändert werden, sollten entsprechend sparsam eingesetzt werden und vor allem dann zur Anwendung kommen, wenn räumliche Begrenzungen oder andere Beschränkungen eine Veränderung der Darstellung wirklich nahelegen oder aber der Nutzer eine Ver- Peter Meyer / Carolin Müller-Spitzer 270 änderung interaktiv herbeiführt. Durch Begrenzung der Freiheitsgrade der Darstellung, also etwa der möglichen Bewegungsrichtungen eines Knotens, wird das Resultat einer Animation (z.B. die Endpunkte der Bewegung beteiligter Elemente) vorhersehbarer. Werden zusätzlich die Geschwindigkeit der Veränderung und die Anzahl der sich verändernden grafischen Parameter niedrig gehalten, können Animationen den wichtigen Zweck erfüllen, dem Nutzer gerade die Invarianten einer sich verändernden Darstellung buchstäblich „vor Augen zu führen“; vgl. hierzu die gestalttheoretischen Überlegungen bei Ware (2009, S. 187ff.). c) Außer den grafischen Invarianten bei interaktiver Veränderung der Darstellung sollte es auch semantische Invarianten geben, die eine einheitliche Interpretierbarkeit angezeigter Elemente ermöglichen. So müssen, wenn ein Element verändert oder ausgetauscht wird (Beispiel: ein Wortbildungsprodukt eines gegebenen Lemmas wird durch ein anderes ersetzt), alle von diesem Element abhängigen Informationen (im Beispiel etwa die übrigen Wortbildungsbestandteile des ersetzten Elements) ebenfalls in der Darstellung ersetzt werden. Solche kaskadierenden Veränderungen können grafisch ansprechend und visuell leicht nachvollziehbar gestaltet werden. d) Jeder Interaktionsschritt sollte eine im wahrsten Sinne des Wortes einsichtige Semantik haben; einer klar definierten Änderung oder Erweiterung einer Informationsmenge sollte also eine grafisch gut isolierbare Änderung bzw. Erweiterung der Darstellung entsprechen. Die relative Gewichtung der genannten Kriterien hängt stark von der jeweils gewählten Visualisierungsstrategie ab. Diese Strategie wird ihrerseits wesentlich von der inhaltlichen Struktur des abzubildenden Wissensgebietes bestimmt. 3. Praktisches Beispiel: Interaktive Erkundung von Wortbildungsbestandteilen und -produkten Um die Möglichkeiten von interaktiven Visualisierungsverfahren im Bereich lexikographischer Wortbildungsinformationen und die Probleme bei der Umsetzung der oben diskutierten Anforderungen an die Benutzerfreundlichkeit besser ausloten zu können, haben wir - als Fallstudie im Sinne von Spence (2007, S. 185ff.), - einen Software-Prototyp für eine entsprechende Anwendungskomponente implementiert. Den Funktionsumfang dieses Prototyps stellen wir in diesem Abschnitt kurz vor dem Hintergrund der in Kapitel 2.2 disku- Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 271 tierten Kriterien vor und verweisen daher der Kürze halber gelegentlich in eckigen Klammern auf die zugehörige Nummerierung. Die Anwendungskomponente hat eine verhältnismäßig eingeschränkte Zielgruppe von fachlich interessierten und vorgebildeten Benutzern. Sie ermöglicht die mit der Maus steuerbare Analyse der Wortbildung ausgewählter lexikalischer Einheiten sowie die Erkundung ihres Wortbildungspotenzials im Rahmen einer einheitlichen Darstellung und in rekursiver Weise, das heißt, jeder angezeigte Wortbildungsbestandteil bzw. jedes Wortbildungsprodukt kann selber wiederum auf seine Wortbildungsbestandteile oder Wortbildungsprodukte hin befragt werden. Wesentlicher Bestandteil der Visualisierung ist eine Darstellung von Wörtern und Wortbildungsbeziehungen in einem Baumgraphen. Für unsere Zwecke haben wir die Softwarekomponente als Desktopanwendung in Java implementiert; mit minimalen Änderungen kann das Programm daher auch als Bestandteil einer Webanwendung (Java-Applet) im Browser laufen. Gerade für die Darstellung von Graphen und Netzen stehen mittlerweile zahlreiche frei verfügbare Softwarebibliotheken zur Verfügung, etwa JGraph für Java ( www. jgraph.com ), das JavaScript InfoVis Toolkit ( thejit.org ) für JavaScript und Graphviz ( www.graphviz.org ), das beispielsweise serverseitig als Bibliothek zum Erzeugen von Bilddateien einsetzbar ist. Grundelemente der Darstellung sind farbige Kästchen (im Folgenden graphentheoretisch als ‘Knoten’ bezeichnet), die lexikalische Einheiten in einem Wörterbuch repräsentieren und miteinander durch Linien (‘Kanten’) verbunden sind, die Wortbildungsrelationen symbolisieren. Lexikalische Einheiten können z.B. Lemmata oder deren zugehörige Lesarten sein; im Folgenden nennen wir die von einem Knoten repräsentierte lexikalische Einheit kurz ‘Objektwort’. Um die Darstellung zu vereinfachen, betrachten wir im Weiteren nur nominale Simplizia und Nomen-Nomen-Komposita als Beispiele für Objektwörter. Die Knoten befinden sich auf einer Zeichenfläche; sie sind der Ort, auf den sich fast alle mausgesteuerten Nutzeraktionen beziehen, sodass die Symbole und grafisch abgesetzten Felder in einer Knotendarstellung den Raum der möglichen Interaktionen vorgeben [vgl. Kap. 2.2 unter 2a)]. Jeder Interaktionstyp hat klar umrissene Veränderungen der Gesamtdarstellung zur Folge [vgl. Kap. 2.2 unter 3d)], denn in jedem Bearbeitungsschritt geht es um das Hinzufügen, Löschen oder Verändern eines einzelnen Knotens. Allerdings sind in manchen Fällen Anpassungen an weiteren Stellen des Graphen erforderlich; so verschwinden bei der Löschung eines Knotens sinnvollerweise auch alle seine Nachkommen [vgl. Kap. 2.2 unter 3c)]. Peter Meyer / Carolin Müller-Spitzer 272 Ausgangspunkt der Visualisierung [vgl. Kap. 2.2 unter 2a)] ist eine vom Benutzer im elektronischen Wörterbuch ausgewählte lexikalische Einheit, die beim Aufrufen der Wortbildungskomponente als zunächst einziges Objektwort auf der Zeichenfläche erscheint: Abb. 7: Der Wurzelknoten der Graphendarstellung Nähere Informationen zum Objektwort erscheinen beim Klicken auf das „i“- Symbol, beispielsweise als Dialog, der sich über die dann leicht abgedunkelte Zeichenfläche legt, oder in einem besonderen Informationsbereich. Es ist auch denkbar, solche Informationen schon dann als ‘Tooltip’ anzuzeigen, wenn man den Mauszeiger über dem Knoten schweben lässt, oder dann, wenn man, in welcher Weise auch immer, mit dem Knoten per Mausklick interagiert. Entscheidend ist die interaktiv beeinflussbare Filterung angezeigter Information [vgl. Kap. 2.2 unter 2c)]. Klickt man auf das „+“-Zeichen, öffnet sich ein Kontextmenü, aus dem der Nutzer eine Wortbildungsinformation zum Objektwort auswählen kann. Dies kann bei Simplizia insbesondere die Frage nach Komposita mit dem jeweiligen Simplex als Vorder- oder Hinterglied sein; bei Komposita kann nach Vorder- oder Hinterglied gefragt werden oder nach anderen Komposita mit distributionsähnlichem Vorderbzw. Hinterglied: Abb. 8: Auswahl eines oder mehrerer Kinderknoten Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 273 Die Auswahl eines Informationstyps führt zur Anzeige weiterer Objektwörter in jeweils eigenen Knoten auf der Zeichenfläche. Diese Knoten ermöglichen ihrerseits wiederum die Anzeige zugehöriger Wortbildungsbestandteile und -produkte. Die Wortbildungsbeziehungen zwischen Objektwörtern werden durch Kanten (Verbindungslinien) symbolisiert, deren Farbe, ebenso wie die der „Zielknoten“, den Relationstyp codiert, der aber auch sprachlich als „Überschrift“ des jeweiligen Zielknotens angezeigt wird [vgl. Kap. 2.2 unter 1c)]: Abb. 9: Graphendarstellung mit sechs Knoten Aus graphentheoretischer Sicht handelt es sich um einen gerichteten Baum, dessen Wurzelknoten durch das Ausgangs-Objektwort repräsentiert wird. In der grafischen Umsetzung befinden sich alle Knoten derselben Tiefe in einer Spalte; alle Kinder eines Knotens bilden innerhalb der Spalte eine Gruppe Peter Meyer / Carolin Müller-Spitzer 274 direkt untereinander angeordneter Knoten. Dabei ist der Abstand von Nachbarknoten innerhalb einer Gruppe deutlich kleiner als der Abstand zwischen benachbarten Knoten aus verschiedenen Gruppen. Schließlich sind die Knoten in jeder Spalte in der Standardeinstellung möglichst nahe an einer imaginären horizontalen Mittelachse ausgerichtet, was, zusammen mit der „Baumwachstumsrichtung“ von links nach rechts, das für die Anwendung unterstellte Monitor-Querformat ausnutzt [vgl. Kap. 2.2 unter 1b)]. Die genannten grafischen Invarianten lassen als einzigen darstellerischen Freiheitsgrad bei einem gegebenen Graphen die Reihenfolge, in der die Kinderknoten eines Knotens innerhalb ihrer Gruppe untereinanderstehen. Die eindeutigen und unveränderlichen Orientierungen im zweidimensionalen Raum [vgl. Kap. 2.2 unter 1c)] erhöhen deutlich die Übersichtlichkeit und Vorhersagbarkeit der Gesamtdarstellung: Abb. 10: Invarianten der grafischen Darstellung Die eingesetzte visuelle Metapher [vgl. Kap. 2.2 unter 1a)] ist eine leicht fassliche und vertraute Kombination einer „Stammbaum“-Darstellung mit einer Auflistung in Spaltenform. Vergleichbare Verfahren kommen wegen ihrer Übersichtlichkeit und Flexibilität zum Beispiel bei Programmen zur Navigation in Dateisystemen zur Anwendung, so etwa in der Spaltendarstellung der Finder-Anwendung unter dem Betriebssystem Mac OS X; vgl. Abb. 11. Ganz Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 275 allgemein ist die Verwendung von Graphen, speziell auch Baumgraphen, ein wichtiges Thema in der Visualisierungsforschung, vgl. Chen (2006, S. 65ff.), Mazza (2009, S. 63ff.). Abb. 11: Kombination eines Baumgraphen mit einer spaltenorientierten Darstellung im Programm Finder des Betriebssystems Mac OS X Aus der starken Beschränkung der möglichen Darstellungen eines gegebenen Graphen folgt, dass vom Benutzer durchgeführte Modifikationen, die im Normalfall inhaltlich nur einen oder zwei Knoten betreffen, auf der grafischen Ebene oft zu einer Veränderung der Position vieler Knoten führen müssen. Dies betrifft das Entfernen eines nicht weiter interessierenden Knotens mit dem „-“-Symbol [vgl. Kap. 2.2 unter 2b)], das Hinzufügen von Knoten und das mit der Maus per Ziehen und Ablegen mögliche Umsortieren von Knoten, die als Kinder eines anderen Knotens zu einer Gruppe gehören. In solchen Fällen muss häufig entweder innerhalb einer Spalte Platz für neue Knoten geschaffen oder aber entstandener Leerraum durch Bewegung zur horizontalen Mittelachse beseitigt werden. Hier ist der Einsatz einer Animation sinnvoll [vgl. Kap. 2.2 unter 3b)]. Vor allem beim Umsortieren und Löschen kann es, da alle Nachkommen eines Knotens ebenfalls ihre Lage ändern bzw. gelöscht werden müssen [vgl. Kap. 2.2 unter 3c)], zu größeren Veränderungen kommen. Diese Veränderungen müssen durch eine langsame Bewegung aller Graphenelemente in ihre jeweilige neue Position so präsentiert werden, dass der Benutzer nachvollziehen kann, welche Aspekte des Graphen konstant geblieben sind, was sich also nicht geändert hat. Besonders relevant ist dies auch, wenn ein Knoten mitsamt seiner bereits angezeigten Nachkommen als Ausgangspunkt einer neuen Darstellung gewählt wird, alle übrigen Knoten also gelöscht werden [vgl. Kap. 2.2 unter 2b)] - dies ist eine der mit dem „+“- Menü anwählbaren Optionen. Peter Meyer / Carolin Müller-Spitzer 276 Um sinnvoll mit den oft langen Listen von Wortbildungsprodukten eines gewünschten Typs umgehen zu können, werden in unserem Prototyp in einem Knoten stets nur wenige Wortbildungsprodukte dieses Typs gezeigt (standardmäßig etwa die frequentesten). Eines der angezeigten Wörter in diesem Listenausschnitt, per Default zunächst das oberste, ist als Objektwort des Knotens hervorgehoben. Durch Klick auf den Listenausschnitt wird die gesamte Liste zugänglich und es kann ein anderes Objektwort und damit auch ein anderer angezeigter Listenausschnitt gewählt werden: Abb. 12: Auswahl eines anderen Listenabschnitts Durch diese selektive Anzeige von Details wird „information overload“ (vgl. schon Jansz/ Manning/ Indurkhya 1999) vermieden und die Übersichtlichkeit erhöht [vgl. Kap. 2.2 unter 2c)]. Wird in einem Knoten, der einen Typ von Wortbildungsprodukten repräsentiert, auf die beschriebene Weise ein neues Objektwort ausgewählt, so müssen die abhängigen Informationen in allen Nachkommen-Knoten angepasst werden, um die Darstellung konsistent zu halten [vgl. Kap. 2.2 unter 3c)]. Diese Veränderung wird dem Benutzer durch einen kurzen Animationsvorgang angezeigt - alle von Veränderungen betroffenen Knoten und die dorthin führenden Kanten leuchten kurz rot auf. Der entstehende Graph ist zu jedem Zeitpunkt auch ein teilweises Abbild des bisherigen Interaktionsablaufs [vgl. Kap. 2.2 unter 3a)], denn das Erweitern der Darstellung erfolgt stets in Leserichtung durch Anfügen neuer Kinderknoten. Es sollte möglich sein, den aktuellen Graphen als Datei abzuspeichern; denkbar ist auch, in einem gesonderten Darstellungsbereich eine Liste bislang besuchter Objektwörter in der Reihenfolge ihres Abrufs anzuzeigen, die ebenfalls abgespeichert und später wieder geladen werden kann. Es sollte dann Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 277 möglich sein, Wörter in der Liste anzuklicken, um sie entweder im angezeigten Graphen zu finden oder aber sie als Ausgangspunkt für einen neuen Graphen zu wählen. Zweifellos ist die Funktionalität des vorgestellten Software-Prototyps nur für einen recht eingeschränkten Kreis von Nutzern von Interesse. Im vorliegenden Kontext ist dies jedoch von untergeordneter Bedeutung, da es uns in erster Linie um die Formulierung und praktische Umsetzung von Anforderungen an den sinnvollen Einsatz von Visualisierungstechniken im Bereich der Wortbildung ging. Es sollten jedoch modellhaft einige Strategien bei der Konzeption und Implementierung von Visualisierungssoftware in der Lexikographie deutlich geworden sein. Mit der von uns verwendeten visuellen Metapher des Baumgraphen bewegen wir uns auf recht traditionellem Gebiet; schon in Jansz/ Manning/ Indurkhya (1999) findet sich mit der Webanwendung Kirrkirr die Grundidee einer „webbased application for interactive exploration of dictionaries“, die über eine in Java implementierte, graphbasierte Visualisierungskomponente verfügt. Die Autoren betonen, dass für sie „the clarity and simplicity of the graph displayed“ gerade „from a serious language learning viewpoint“ von großer Wichtigkeit sei, ein Punkt, der angesichts wachsender Rechenleistung, gerade auf der Clientseite, und der raschen Evolution der Standardtechnologien des Internets ( HTML5 , CSS3 , JavaScript-Bibliotheken) von großer Bedeutung bleibt. Inspirationen für neue Formen der grafischen Umsetzung finden sich im Netz jedoch zuhauf; anregende Beispiele findet man beispielsweise beim Many-Eyes-Projekt ( www-958.ibm.com ). 4. Zusammenfassung und Ausblick Im vorliegenden Beitrag haben wir einleitend empirische Anhaltspunkte aus der Wörterbuchbenutzungsforschung für die These vorgestellt, dass multimediale und benutzeradaptive Elemente in elektronischen Wörterbüchern von Nutzern signifikant besser hinsichtlich ihrer Nützlichkeit und Wichtigkeit beurteilt werden, wenn ihnen bereits gute Beispiele für solche Elemente bekannt sind. Es ist daher von allgemeinem lexikographischen Interesse, Kriterien für die Qualität und den funktionalen Mehrwert von Visualisierungstechniken zu formulieren und die Umsetzbarkeit solcher Kriterien am praktischen Beispiel zu untersuchen. Dies haben wir in den vorangehenden Abschnitten an einem Anwendungsbeispiel aus dem Bereich der Wortbildung exemplarisch vorgeführt. Peter Meyer / Carolin Müller-Spitzer 278 Sicherlich sind unsere Überlegungen und Vorschläge zum Einsatz von Visualisierungen auch im Kontext der elektronischen Lexikographie nur bedingt verallgemeinerbar. Trotz der vielbeschworenen Möglichkeiten des „Web 2.0“ gibt es bemerkenswert wenige Arbeiten, die sich systematisch mit dem Einsatz von Multimediaelementen und speziell mit Visualisierungsverfahren im Kontext von Online-Wörterbüchern befassen. Wünschenswert ist in diesem Bereich ein enges Zusammenspiel von Benutzungsforschung, die auf empirischer Basis den Mehrwert vorliegender Lösungen untersuchen kann (vgl. allgemein Chen 2006, S. 173ff.), und praktisch-informatischer Arbeit, um weitere Visualisierungstechniken auf konzeptioneller wie auf Implementierungsebene auszuarbeiten. Erforderlich ist schließlich auch eine stärkere Einbettung solcher Untersuchungen in das umfangreiche informatische Forschungsfeld der Mensch-Computer-Interaktion, vgl. Shneiderman et al. (2010). 5. Literatur Chen, Chaomei (2006): Information visualization: Beyond the horizon. 2. Aufl. London u.a. de Schryver, Gilles-Maurice (2003): Lexicographers' dreams in the electronic dictionary age. In: International Journal of Lexicography 16, 2, S. 143-199. Jann, Ben (2002): Einführung in die Statistik. München/ Wien. Jansz, Kevin/ Manning, Christopher/ Indurkhya, Nitin (1999): Kirrkirr: Interactive visualisation and multimedia from a structured Warlpiri dictionary. In: Proceedings of AusWeb99, the Fifth Australian World Wide Web Conference, S. 302-316. Internet: http: / / ausweb.scu.edu.au/ aw99/ papers/ manning/ paper.html ( Stand: 11/ 2011). Koplenig, Alexander (2011): Understanding how users evaluate innovative features of online dictionaries - an experimental approach. In: Kosem/ Kosem (Hg.), S. 147-150. Kosem, Iztok/ Kosem, Karmen (Hg.) (2011): Proceedings of eLex 2011. Trojina, S. 147- 150. Internet: http: / / www.trojina.si/ elex2011/ Vsebine/ proceedings/ elex2011-18.pdf ( Stand: 11/ 2011). Mazza, Riccardo (2009): Introduction to information visualization. London. Müller-Spitzer, Carolin/ Koplenig, Alexander/ Töpel, Antje (2011): What makes a good online dictionary? - Empirical insights from an interdisciplinary research project. In: Kosem/ Kosem (Hg.), S. 203-208. Internet: http: / / www.trojina.si/ elex2011/ Vsebine/ proceedings/ elex2011-27.pdf ( Stand: 11/ 2011). Müller-Spitzer, Carolin/ Koplenig, Alexander/ Töpel, Antje (i.Dr.): Online dictionary use: Key findings from an empirical research project. In: Granger, Sylviane/ Paquot, Magali (Hg.): Electronic lexicography. Oxford. Paivio, Allan (1986): Mental representations: A dual coding approach. Oxford. Zur Visualisierung von Wortbildung in elektronischen Wörterbüchern 279 Robichaud, Benoît (2011): A graph visualization tool for terminology discovery and assessment. In: Boguslavsky, Igor/ Wanner, Leo (Hg.): Proceedings of the 5th International Conference on Meaning-Text Theory, Barcelona, September 8-9, 2011, S. 243-252. Internet: http: / / olst.ling.umontreal.ca/ pdf/ proceedingsMTT2011.pdf ( Stand: 11/ 2011). Shneiderman, Ben/ Plaisant, Catherine/ Cohen, Maxine/ Jacobs, Steven (2010): Designing the user interface: Strategies for effective human-computer interaction. 5., internat. Aufl. Upper Saddle River, NJ u.a. Spence, Robert (2007): Information visualization: design for interaction. 2. Aufl. Harlow/ München u.a. Ware, Colin (2009): Information visualization: perception for design. 2. Aufl. Amsterdam/ Heidelberg u.a. Der vorliegende Band enthält die Beiträge eines von der Deutschen Forschungsgemeinschaft geförderten internationalen Kolloquiums am Institut für Deutsche Sprache, Mannheim, die sich mit Wortbildung im elektronischen Wörterbuch aus unterschiedlicher Perspektive beschäftigen. Die Beiträgerinnen und Beiträger beleuchten theoretische Aspekte von Wortbildung im Wörterbuch, die Praxis von Wortbildungsangaben im elektronischen Wörterbuch und die computergestützte Gewinnung von Wortbildungsangaben und ihre Präsentation. Hiermit wird die Diskussion zum Thema „Wortbildung im elektronischen Wörterbuch“ angestoßen, welche die Beschäftigung mit den Möglichkeiten und Grenzen der Darstellung von Wortbildungsphänomenen im gedruckten Wörterbuch fortsetzt. Auch im elektronischen Medium gilt, dass durch die Analyse der Gebildetheit von Stichwörtern, durch die Aufnahme von Wortbildungsprodukten zu einem Stichwort und schließlich durch die Lemmatisierung von Wortbildungsmitteln die Vernetztheit des Wortschatzes aufgezeigt werden kann. Benutzbarkeit und Effektivität von Wörterbüchern lassen sich hierdurch erhöhen.