eBooks

Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen

2011
978-3-8233-7631-6
Gunter Narr Verlag 
Antje Töpel

Die vorliegende Arbeit beschäftigt sich im theoretisch orientierten ersten Teil mit der Geschichte des Ansatzes, in Lernerwörterbüchern einen kontrollierten Definitionswortschatz zu verwenden. Zudem wird die kontroverse Diskussion um den kontrollierten Definitionswortschatz in der Metalexikografie wiedergegeben. Den Hauptteil der Arbeit bildet die korpusbasierte Analyse des Definitionswortschatzes des Langenscheidt Taschenwörterbuchs Deutsch als Fremdsprache und des Duden/Hueber Wörterbuchs Deutsch als Fremdsprache. Zum einen werden sowohl quantitative als auch qualitative Merkmale des verwendeten Definitionswortschatzes untersucht, zum anderen geht es um die Frage, inwieweit die beiden Wörterbücher ihren Eigenanspruch eines computerkontrollierten Definitionswortschatzes einhalten. Die Untersuchung schließt damit einerseits eine metalexikografische Forschungslücke, andererseits enthält sie Empfehlungen an die praktische Lexikografie.

Antje Töpel Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen Anspruch und Wirklichkeit Studien zur Deutschen Sprache F O R S C H U N G E N D E S I N S T I T U T S F Ü R D E U T S C H E S P R A C H E S T U D I E N Z U R D E U T S C H E N S P R A C H E 5 6 Studien zur Deutschen Sprache F O R S C H U N G E N D E S I N S T I T U T S F Ü R D E U T S C H E S P R A C H E Herausgegeben von Arnulf Deppermann, Stefan Engelberg und Ulrich Hermann Waßner Band 56 Antje Töpel Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen Anspruch und Wirklichkeit Redaktion: Franz Josef Berens Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http: / / dnb.d-nb.de> abrufbar. © 2011 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Gedruckt auf säurefreiem und alterungsbeständigem Werkdruckpapier. Internet: http: / / www.narr.de E-Mail: info@narr.de Satz: Tröster, Mannheim Druck und Bindung: Hubert & Co., Göttingen Printed in Germany ISSN 0949-409X ISBN 978-3-8233-6631-7 Inhalt Vorwort ........................................................................................................ 11 Epigraf ......................................................................................................... 13 1. Einleitung ........................................................................................ 15 1.1 Hinführung zum Thema ................................................................ 15 1.2 Thema und Ziel der Arbeit............................................................ 16 1.3 Aufbau der Arbeit .......................................................................... 18 2. Theoretische Grundlagen .............................................................. 21 2.1 Terminologie ................................................................................... 21 2.1.1 Wörterbuch und Lernerwörterbuch.................................................. 21 2.1.2 Einsprachige und mehrsprachige Wörterbücher .............................. 27 2.1.3 Definition und Definitionswortschatz .............................................. 33 2.2 Der historisch-philosophische Hintergrund des kontrollierten Definitionswortschatzes ........................................ 38 2.2.1 Das Vocabulary Control Movement ................................................. 38 2.2.1.1 Harold Edward Palmer und A Grammar of English Words ................................................................................. 39 2.2.1.2 Charles Kay Ogden und sein Basic English ........................... 42 2.2.1.3 Michael Philip West und die New Method ............................. 45 2.2.1.4 Albert Sydney Hornby und das Oxford Advanced Learner's Dictionary of Current English .............................................. 53 2.2.1.5 Georges Gougenheim, René Michéa, Paul Rivenc, Aurélien Sauvageot und das Français Fondamental ............................ 55 2.2.1.6 Alfred Haase und sein Englisches Arbeitswörterbuch ............ 58 2.2.1.7 Jay Alan Pfeffer und sein Grunddeutsch ............................... 60 2.2.1.8 Weitere Projekte ................................................................. 62 2.2.1.9 Zusammenfassung .............................................................. 64 2.2.2 Die semantischen Primitiva ............................................................. 65 2.2.2.1 Denis Diderot und Jean Le Rond d'Alembert mit ihrer Encyclopédie .............................................................. 65 2.2.2.2 Anna Wierzbicka und die Semantic Primitives ....................... 67 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 6 2.2.2.3 Weitere Ansätze .................................................................. 71 2.2.2.4 Zusammenfassung .............................................................. 73 2.3 Der Forschungsstand zum kontrollierten Definitionswortschatz .................................................................... 74 2.3.1 Der kontrollierte Definitionswortschatz in der Diskussion.............. 74 2.3.1.1 Argumente für den Einsatz eines kontrollierten Definitionswortschatzes in Lernerwörterbüchern ................... 74 2.3.1.2 Argumente gegen den Einsatz eines kontrollierten Definitionswortschatzes in Lernerwörterbüchern ................... 87 2.3.2 Kriterien für die Selektion eines kontrollierten Definitionswortschatzes ................................................................. 102 2.4 Die Anwendung kontrollierter Definitionswortschätze in Lernerwörterbüchern .................................................................. 115 2.4.1 Englischsprachige Lernerwörterbücher ......................................... 116 2.4.1.1 Longman Dictionary of Contemporary English (LDOCE) ......................................................................... 116 2.4.1.2 Oxford Advanced Learner's Dictionary of Current English (OALD) ................................................................ 121 2.4.1.3 Cambridge International Dictionary of English (CIDE) und Cambridge Advanced Learner's Dictionary (CALD) ...... 127 2.4.1.4 Vergleich zwischen LDOCE, OALD und CIDE/ CALD ......... 133 2.4.2 Die deutschen Lernerwörterbücher und ihr Verhältnis zum kontrollierten Definitionswortschatz.............................................. 135 3. Wörterbuchanalyse ...................................................................... 147 3.1 Vorstellung der untersuchten Wörterbücher ............................ 148 3.1.1 Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTWDaF).............................................................. 148 3.1.2 Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (DHWDaF)..................................................................................... 162 Inhalt 7 3.2 Methodisches Vorgehen ............................................................... 173 3.2.1 Auswahl der untersuchten Lemmata.............................................. 173 3.2.2 Aufbereitung der Primärdaten........................................................ 182 3.2.2.1 Primärdaten des LTWDaF 2 ............................................. 182 3.2.2.2 Primärdaten des DHWDaF 2 ............................................ 190 3.2.3 Annotation und Auswertung der Primärdaten................................ 196 3.3 Lemmatypübergreifende Analyse des untersuchten Definitionswortschatzes ............................................................... 198 3.3.1 Länge der Definitionen, Umfang und Verzeichnung des Definitionswortschatzes ................................................................. 198 3.3.1.1 Analyse des LTWDaF 2 ..................................................... 198 3.3.1.2 Analyse des DHWDaF 2 ................................................... 200 3.3.2 Zusammensetzung des untersuchten Definitionswortschatzes ...... 202 3.3.2.1 Wortart und Wortartengruppe ........................................... 202 3.3.2.1.1 Bestimmung der Wortarten und Wortartengruppen ............. 202 3.3.2.1.2 Analyse des LTWDaF 2 ................................................... 205 3.3.2.1.3 Analyse des DHWDaF 2 ................................................. 213 3.3.2.2 Herkunft ........................................................................ 222 3.3.2.2.1 Bestimmung der Herkunft ............................................... 222 3.3.2.2.2 Analyse des LTWDaF 2 ................................................... 224 3.3.2.2.3 Analyse des DHWDaF 2 ................................................. 227 3.3.2.3 Wortbildung ................................................................... 230 3.3.2.3.1 Bestimmung der Wortbildungsarten .................................. 230 3.3.2.3.2 Merkmale des untersuchten Definitionswortschatzes ......... 232 3.3.2.3.2.1 Analyse des LTWDaF 2 ................................................... 232 3.3.2.3.2.2 Analyse des DHWDaF 2 ................................................. 237 3.3.2.3.3 Merkmale des nicht verzeichneten Definitionswortschatzes .................................................. 243 3.3.2.3.3.1 Analyse des LTWDaF 2 ................................................... 243 3.3.2.3.3.2 Analyse des DHWDaF 2 ................................................. 252 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 8 3.4 Lemmatypspezifische Analyse des untersuchten Definitionswortschatzes ............................................................... 259 3.4.1 Länge der Definitionen, Umfang und Verzeichnung des Definitionswortschatzes ................................................................. 260 3.4.1.1 Analyse des LTWDaF 2 ..................................................... 260 3.4.1.2 Analyse des DHWDaF 2 ................................................... 265 3.4.2 Zusammensetzung des untersuchten Definitionswortschatzes ...... 272 3.4.2.1 Wortart und Wortartengruppe ............................................. 272 3.4.2.1.1 Analyse des LTWDaF 2 ..................................................... 272 3.4.2.1.2 Analyse des DHWDaF 2 ................................................... 283 3.4.2.2 Herkunft ........................................................................... 293 3.4.2.2.1 Analyse des LTWDaF 2 ..................................................... 293 3.4.2.2.2 Analyse des DHWDaF 2 ................................................... 295 3.4.2.3 Wortbildung ..................................................................... 298 3.4.2.3.1 Analyse des LTWDaF 2 ..................................................... 298 3.4.2.3.2 Analyse des DHWDaF 2 ................................................... 305 3.5 Vergleich des untersuchten Definitionswortschatzes mit pädagogischen Wortschätzen ...................................................... 317 3.5.1 Vergleich des untersuchten Definitionswortschatzes mit dem Grundwortschatz Langenscheidt Basic German Vocabulary ..................................................................................... 317 3.5.1.1 Grundlagen ....................................................................... 317 3.5.1.2 Analyse des LTWDaF 2 ..................................................... 323 3.5.1.3 Analyse des DHWDaF 2 ................................................... 326 3.5.2 Vergleich des untersuchten Definitionswortschatzes mit dem Frequenzwörterbuch Frequency Dictionary .......................... 332 3.5.2.1 Grundlagen ....................................................................... 332 3.5.2.2 Analyse des LTWDaF 2 ..................................................... 337 3.5.2.3 Analyse des DHWDaF 2 ................................................... 341 3.5.3 Vergleich des untersuchten Definitionswortschatzes mit dem Zertifikatswortschatz Zertifikat Deutsch................................ 346 3.5.3.1 Grundlagen ....................................................................... 346 3.5.3.2 Analyse des LTWDaF 2 ..................................................... 350 3.5.3.3 Analyse des DHWDaF 2 ................................................... 356 Inhalt 9 3.6 Zusammenfassung der Wörterbuchanalyse .............................. 362 4. Schlussfolgerungen....................................................................... 373 4.1 Empfehlungen an die praktische Lexikografie für die Gestaltung des Definitionswortschatzes ........................ 373 4.2 Resümee und Ausblick................................................................. 380 Nachbemerkung ........................................................................................ 385 5. Literatur........................................................................................ 387 5.1 Wörterbücher/ Korpora/ Lehrmaterialien .................................. 387 5.2 Forschungsliteratur ..................................................................... 393 6. Verzeichnis der Abkürzungen und Symbole.............................. 419 7. Abbildungsverzeichnis................................................................. 425 8. Tabellenverzeichnis ...................................................................... 432 Vorwort Die vorliegende Arbeit wurde 2009 von der Philologischen Fakultät der Universität Leipzig als Dissertationsschrift angenommen. Erstbetreuerin der Dissertation war Prof. Dr. Irmhild Barz (Universität Leipzig), die weiteren Gutachten fertigten Dr. Kathrin Kunkel-Razum (Dudenredaktion) und Prof. Dr. Hans Wellmann (Universität Augsburg) an. Für die Veröffentlichung in der Reihe Studien zur deutschen Sprache - Forschungen des Instituts für Deutsche Sprache wurde die ursprüngliche Fassung leicht überarbeitet und an einigen Stellen gekürzt. Die zitierte Literatur wurde im Wesentlichen auf dem Stand von 2009 belassen und nur an einigen Stellen aktualisiert. Besonders im Analyseteil konnten später erschienene Wörterbuchauflagen nicht berücksichtigt werden. Die Datensammlung, die der empirischen Analyse zugrunde liegt, kann online unter www.ids-mannheim.de/ pub/ materialien/ sds56.pdf eingesehen werden. Mannheim, im November 2010 Antje Töpel Epigraf Sophies Großvater war Ingenieur. Mit Sechzig bekam er eine Krankheit, die ihm seine Erinnerung nahm, und in den letzten Jahren seines Lebens schrieb er dicke Notizbücher voll, die ihm seine Sprache retten sollten. Am Anfang kannte ihr Großvater noch die meisten Worte. [...] Doch mit den Jahren fiel es ihm immer schwerer, sich an bestimmte Begriffe zu erinnern. Wenn er zum Beispiel Batterien für sein Radio brauchte, ging er in ein Elektrogeschäft und sagte, ich brauche das, was man haben muss, um sich beim Baden gut zu behandeln, denn er hörte gern Musik, während er in der Badewanne saß. Natürlich konnten die Verkäufer im Elektrogeschäft nichts damit anfangen. Sie [...] schickten ihn in einen Sanitärladen, wo man ihm derart aufdringlich einen neuen Duschkopf verkaufen wollte, dass ihr Großvater traurig wurde und nach Hause ging. Als er dann eines Tages im Supermarkt zufällig Batterien sah, nahm er die Verpackung und schrieb [...] den gesamten Text der Batterieverpackung in sein Notizbuch, weil er nicht wusste, welches der vielen Wörter die richtige Bezeichnung für das war, was er haben wollte: Daimon Sparpack 4 x 1,5 V Mignonzellen. Hält entscheidend länger als herkömmliche Zink-Kohle Batterien. Über den Packungstext schrieb er in allerbester Ingenieursstandarddruckschrift: Das muss ich sagen, wenn ich das Gerät brauche, das mich beim Baden gut behandelt. Das ging eine Weile gut. Aber mit der Zeit war seine Krankheit so weit fortgeschritten, dass er sich auch an die Bedeutung des Wortes ‘Baden’ nicht mehr erinnerte. Er musste immer mehr Worte durch andere Worte ersetzen. So übertrug er von Notizbuch zu Notizbuch seine Gebrauchsanleitungen für das tägliche Leben, und er umschrieb fast jeden Begriff durch die Verwendung des Wortes ‘behandeln’; er schachtelte zahllose Relativsätze ineinander, in deren Zentrum es immer etwas zu behandeln gab. Wenn er auf der Suche nach seinen Schlüsseln war, zog er seine Frau am Ärmel, deutete auf die Tür und sagte, ich muss etwas haben, um das zu behandeln. In der Sparkasse wollte er Geld abheben und sagte der Bankangestellten, er brauche das Gerät, das ihn immer gut behandele, und die Leute in den Geschäften fingen an, die Polizei zu rufen, wenn er auftauchte. [...] Als ihm die letzten Worte zu entgleiten drohten, begann er, Beipackzettel und Gebrauchsanleitungen in seine ganz eigene Sprache zu übersetzen. Eine Sprache, die nur er verstand und die sich ständig veränderte, sodass er immer mehr Wörter brauchte, um sich von Notizbuch zu Notizbuch zu erklären, was er damals gemeint hatte. (Beuse 1999, gekürzt und leicht verändert). 1. Einleitung 1.1 Hinführung zum Thema Das Epigraf stammt aus Stefan Beuses Erzählung Verschlußzeit, in der die Protagonistin Sophie die fortschreitende Demenzerkrankung ihres Großvaters und seinen Umgang damit thematisiert. 1 Die dort beschriebene Situation weist zahlreiche Parallelen zum Themenbereich dieser Dissertation auf, die sich mit dem Definitionswortschatz in einsprachigen Lernerwörterbüchern des Deutschen auseinandersetzt. Am augenscheinlichsten ist die Tatsache, dass sowohl Definitionen in einsprachigen Wörterbüchern als auch der demente Großvater Wörter umschreiben. Im Fall des Großvaters liegt die Motivation für diese Umschreibung darin, dass die Wörter aus seinem aktiven Wortschatz verschwunden sind, in einsprachigen Wörterbüchern soll dem Benutzer 2 auf diese Weise die Bedeutung des nachgeschlagenen Lemmas erläutert werden. Dadurch vergrößert sich jeweils der Umfang des mündlich oder schriftlich Kommunizierten. In beiden Fällen werden bei der Umschreibung ähnliche Hilfsmittel verwendet - andere Wörter der gleichen Sprache. Auch die Strukturen ähneln sich: Der Großvater stellt beispielsweise das Verb behandeln in das Zentrum seiner Paraphrasen. In den Wörterbuchdefinitionen wiederholen sich Verben wie ausdrücken oder verwenden sehr häufig, wie die Definition des Lemmas andererseits im Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTWDaF 2) zeigt - ‘verwendet, um bei zwei Gegensätzen auszudrücken, dass man vom zweiten Gegensatz spricht’. Außerdem wird die Syntax des Großvaters durch das Ersetzen von immer mehr Wörtern durch Umschreibungen fortlaufend komplexer, ein Phänomen, das auch bei Wörterbuchdefinitionen beschrieben wird. Gemeinsamkeiten ergeben sich zudem aus dem Gefühl der Anstrengung, das wohl jeder Fremdsprachenlerner einmal erlebt hat und über das auch im Zusammenhang mit dem Demenzkranken berichtet wird. Der Großvater befindet sich in einer ähnlichen Situation der Sprachlosigkeit wie der Lerner einer Fremdsprache. Aus dieser Situation ergibt sich jedoch zugleich einer der wichtigsten Unterschiede: Der Prozess verläuft bei beiden in entgegengesetzter Richtung, denn während der Kranke sei- 1 Mit der kunstvoll konstruierten Erzählung Verschlußzeit gewinnt Beuse (1999) den Preis des Landes Kärnten beim Ingeborg-Bachmann-Wettbewerb. Der vollständige Text findet sich unter http: / / bachmannpreis.orf.at/ bp99/ texte/ beuse_text.htm . Teile der Geschichte verarbeitet Beuse (2000) auch im Roman Kometen. 2 Aus Gründen der Lesbarkeit wird im gesamten Text das generische Maskulinum verwendet, dieses schließt die weibliche Form jeweils ein. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 16 ne Sprache verliert, baut der Lerner sie aus. Beim Großvater bleibt zudem trotz des Wortschatzverlustes die Struktur der Sprache erhalten, ein Lerner erwirbt auch diese erst beim Aufbau der Sprache. Das liegt darin begründet, dass der Demenzkranke seine eigene Muttersprache verliert. Der Lerner verfügt außerdem grundsätzlich über ein gesundes Sprachvermögen, nur in einer anderen Sprache. Beim Großvater ist dieses Sprachvermögen hingegen aufgrund seines beeinträchtigten Denkvermögens ebenfalls gestört. Dies äußert sich in seinen willkürlichen Definitionen, da er Wichtiges und Unwichtiges nicht mehr voneinander unterscheiden kann und seine eigene Wahrnehmung vollständig auf die Umwelt projiziert. Im Folgenden wird dieser Sprachverlust nicht mehr thematisiert, vielmehr steht der Erwerb von Sprache durch nicht muttersprachliche Lerner im Mittelpunkt. 1.2 Thema und Ziel der Arbeit Diese Arbeit befindet sich in mehrfacher Hinsicht im Übergangsbereich verschiedener Fachgebiete. Zum einen ist sie im Bereich der germanistischen Linguistik angesiedelt, sie besitzt jedoch starke Bezüge zum Gebiet Deutsch als Fremdsprache, da Wörterbücher für fremdsprachige Lerner des Deutschen untersucht werden. Berührungspunkte ergeben sich aufgrund der historischen Hintergründe zudem mit der Anglistik/ Amerikanistik und der Romanistik, vor allem der Französistik. Zum anderen verbindet die Dissertation die theoretische lexikografische Forschung dieser Philologien mit der Praxis der Wörterbucherstellung im Bereich Deutsch als Fremdsprache. Daraus erwächst ein doppelter Anspruch, was die Zielstellung betrifft: Denn abgesehen von der Erkenntnis für die Lexikografie- und Lexikologieforschung verbindet sich mit der Arbeit ein ganz konkreter praktischer Nutzen für zukünftige lexikografische Projekte auf dem Gebiet Deutsch als Fremdsprache in der Sprachindustrie, also beispielsweise den Wörterbuchverlagen. Das Thema Definitionswortschatz ist für das Englische auf einer theoretischen Ebene recht ausführlich erforscht, weil fast alle großen Lernerwörterbücher dieser Sprache von einem kontrollierten Definitionswortschatz Gebrauch machen. Selbst dort fehlen jedoch bisher umfassende Untersuchungen 3 , die sich mit dem Umfang und der Zusammensetzung des verwendeten Definitionswortschatzes auseinandersetzen. Es existiert bisher lediglich ein Test aus den 1980er-Jahren, der in einer Stichprobe überprüft, inwieweit der kontrollierte Definitionswortschatz im Wörterbuch lemmatisiert ist (Herbst 1986). Außerdem gibt es mehrere nicht auf das Englische beschränkte Untersuchungen zur 3 Die Bezeichnungen Untersuchung und Studie werden synonym verwendet. Einleitung 17 Beeinträchtigung des Verstehens von Wörterbuchdefinitionen durch unbekanntes Vokabular allgemein (Kharma 1985, Müllich 1990, Kostrzewa 1994, Wingate 2002). Für deutsche Lernerwörterbücher besteht mit Klosa (2004) nur ein Test, der für eine kleine Stichprobe die Lemmatisierung des Definitionswortschatzes überprüft. Daneben wird die mögliche Anwendung des Prinzips des kontrollierten Definitionswortschatzes auf deutsche Lernerwörterbücher recht kritisch betrachtet (Götz / Haensch 1998, Götz 1999). So gibt es für das Deutsche weder eine breite Diskussion der Arbeit mit einem kontrollierten Definitionswortschatz auf Forschungsebene noch einen wirklichen Einsatz dieses Prinzips in der lexikografischen Praxis. Dies veranlasst Götz/ Haensch (1998, S. 348) zu folgender Feststellung: „Die lexikografische Erläuterung eines Wortes birgt Probleme, die man derzeit bestenfalls abschätzen kann.“ Wenig später schlagen sie vor: „Auch hier könnte die lexikografische Forschung ansetzen.“ (ebd., S. 349). Gleiches gilt für den Bereich, der sich mit der Analyse von Texten auf Lexemebene beschäftigt, weshalb Best (1998, S. 94) urteilt, dass beispielsweise „die Erfassung des Verhaltens der Wortarten erst ganz am Anfang steht“. Das Ziel dieser Dissertation ist deshalb, die bestehenden Forschungslücken zu schließen und die Erkenntnisse in konkrete Empfehlungen für die praktische Lexikografie umzusetzen. Hierfür wird das Thema Definitionswortschatz einerseits erstmals umfassend theoretisch dargestellt. Andererseits wird eine Untersuchung zum Umfang und zur Zusammensetzung des Definitionswortschatzes bestehender deutscher Lernerwörterbücher durchgeführt. Aus dieser Zielsetzung leiten sich die folgenden theoretischen und praktischen Fragestellungen ab, die im Rahmen dieser Arbeit beantwortet werden: - In welcher historischen Tradition steht das Verfahren, den in Lernerwörterbüchern verwendeten Definitionswortschatz zu reduzieren? Welche Vorbilder gibt es dafür und wo wird es aktuell angewandt? Wie setzt sich die Forschung mit diesem Thema auseinander? Wie stellt sich die Situation der Wörterbücher für Deutsch als Fremdsprache dar? - Welche Eigenschaften besitzt der Definitionswortschatz in den ausgewählten deutschen Lernerwörterbüchern? Welche Aussagen lassen sich über seinen Umfang treffen? Wie setzt er sich im Einzelnen zusammen - was kann hinsichtlich der Wortarten, der Herkunft und der Wortbildung beobachtet werden? Gibt es Besonderheiten, die sich auf die Spezifik des jeweiligen Lemmas zurückführen lassen? Über welche Gemeinsamkeiten und über welche Unterschiede verfügen die analysierten Wörterbücher? Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 18 - Inwieweit deckt sich der Definitionswortschatz mit anderen pädagogischen Wortschätzen, wie dem Grundwortschatz, dem Frequenzwortschatz und dem Zertifikatswortschatz? - Welche Empfehlungen ergeben sich in Bezug auf den Definitionswortschatz aus dieser Untersuchung für die Wörterbuchverlage? 1.3 Aufbau der Arbeit Aus den oben skizzierten Fragestellungen ergibt sich eine Gliederung der Arbeit in einen theoretisch orientierten ersten Teil (Kap. 2) und in einen zweiten Teil, der die Wörterbuchanalyse enthält (Kap. 3). Im ersten Teil werden die theoretischen Grundlagen geschaffen, die mit dem Definitionswortschatz in Zusammenhang stehen. Hierfür werden im Kapitel 2.1 die wesentlichen Termini des Fachgebietes Metalexikografie diskutiert, die in der vorliegenden Arbeit im Zentrum stehen - Wörterbuch, Lernerwörterbuch, einsprachiges/ mehrsprachiges Wörterbuch, Definition und Definitionswortschatz. Das Kapitel 2.2 widmet sich der Tradition, in der die Idee der Reduzierung des verwendeten Definitionswortschatzes steht. Von Bedeutung sind dabei zwei historische Linien: Zum einen handelt es sich um das Vocabulary Control Movement (Kap. 2.2.1). Diese Bewegung vereint unterschiedliche Projekte, die sich mit der pädagogisch-didaktischen Vereinfachung einer zu lernenden Fremdsprache beschäftigen. Zum anderen geht es um das Konzept der semantischen Primitiva (Kap. 2.2.2). Dieser aus der Sprachphilosophie stammende Ansatz sucht nach übereinzelsprachlichen lexikalischen Basen, um Erkenntnisse über die mentale Grundstruktur des Menschen zu gewinnen. Anschließend wird eine Übersicht über den Forschungsstand zum kontrollierten Definitionswortschatz gegeben (Kap. 2.3). Diese führt auf, welche Vorteile und welche Nachteile in der Literatur beschrieben werden (Kap. 2.3.1) und nach welchen Selektionskriterien die Auswahl eines kontrollierten Definitionswortschatzes erfolgen kann (Kap. 2.3.2). Kapitel 2.4 setzt sich mit der heutigen Situation auseinander - der Anwendung eines kontrollierten Definitionswortschatzes in englischsprachigen und deutschen Lernerwörterbüchern. 4 Diese theoretischen Grundlagen stellen den Ausgangspunkt für die folgende Untersuchung am Definitionswortschatz der deutschen Lernerwörterbücher dar. 4 Diese Arbeit unterscheidet zwischen deutschen und englischsprachigen Lernerwörterbüchern. Denn es stammen zwar alle besprochenen Lernerwörterbücher deutscher Sprache aus Deutschland, bei den englischsprachigen Lernerwörterbüchern gehören jedoch auch welche (beispielsweise COBUILD) zu englisch-amerikanischen Verlagen. Einleitung 19 Den Hauptteil der Arbeit bildet das Kapitel 3, die korpusbasierte, statistisch deskriptive Analyse des Definitionswortschatzes zweier deutscher Lernerwörterbücher. Das eigens dafür erstellte Korpus setzt sich in Form einer Stichprobe aus Definitionen dieser Lernerwörterbücher zusammen, was eine geeignete Methode ist, die im Kapitel 1.2 präsentierten Fragestellungen zu beantworten. Auf die Vorstellung der beiden ausgewählten Wörterbücher - des Langenscheidt Taschenwörterbuchs Deutsch als Fremdsprache (LTWDaF) und des Duden/ Hueber Wörterbuchs Deutsch als Fremdsprache (DHWDaF) - im Kapitel 3.1 folgt im Kapitel 3.2 eine ausführliche Beschreibung des methodischen Vorgehens, das der Untersuchung zugrunde liegt. Im Mittelpunkt der Analyse stehen dabei sowohl quantitative als auch qualitative Merkmale des Definitionswortschatzes, der in der gewählten Stichprobe verwendet wird. Die lemmatypübergreifende Untersuchung (Kap. 3.3) beschreibt zunächst die Länge der Definitionen und den Umfang des untersuchten Definitionswortschatzes (Kap. 3.3.1). Hier wird ebenfalls analysiert, an welcher Stelle der verwendete Definitionswortschatz über den Lemmabestand des jeweiligen Wörterbuchs hinausgeht. Das nächste Kapitel (3.3.2) widmet sich ausführlich den einzelnen Merkmalen des Definitionswortschatzes aus der Stichprobe. In mehreren Unterkapiteln wird jeweils seine Zusammensetzung in Bezug auf die Wortart (Kap. 3.3.2.1), die Herkunft (Kap. 3.3.2.2) und die Wortbildung (Kap. 3.3.2.3) beschrieben. Das Unterkapitel zur Wortbildung teilt sich dabei noch einmal auf, da zunächst der komplette Definitionswortschatz (Kap. 3.3.2.3.2) und später die nicht im Wörterbuch lemmatisierten Wörter (Kap. 3.3.2.3.3) untersucht werden. Diese Merkmalsparameter aus dem Kapitel 3.3 spielen auch im Kapitel 3.4 eine Rolle, das sich mit den lemmatypspezifischen Unterschieden beschäftigt und auf diese Weise untersucht, welchen Einfluss die Wortart des Lemmas auf den verwendeten Definitionswortschatz nimmt. Mit dem Kapitel 3.5 beginnt die Öffnung der Wörterbuchanalyse nach außen, über die Grenzen der Definitionen der beiden Lernerwörterbücher hinaus. So kann festgestellt werden, über welche Schnittmengen mit anderen didaktischen Wortschätzen der Definitionswortschatz verfügt und an welchen Stellen sich Unterschiede ergeben. Die Erkenntnisse darüber helfen den Wörterbuchredaktionen, in Zukunft die positiven Effekte besser zu nutzen, die aus der Überschneidung der einzelnen Wortschätze resultieren. Als Vergleichswortschätze werden dabei der Grundwortschatz Langenscheidt Basic German Vocabulary (Kap. 3.5.1), der Frequenzwortschatz im Frequency Dictionary (Kap. 3.5.2) sowie der Zertifikatswortschatz Zertifikat Deutsch (Kap. 3.5.3) genutzt. In allen Analysekapiteln werden zunächst in einem Unterkapitel die Ergebnisse zum Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTWDaF) präsentiert. Im Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 20 Unterkapitel zum Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (DHWDaF ) erfolgt dann die vergleichende Gegenüberstellung der Ergebnisse zu beiden Wörterbüchern. Die Zusammenfassung der Wörterbuchanalyse im Kapitel 3.6 beschreibt die wichtigsten der gewonnenen Erkenntnisse als Thesen geordnet. Um für die Wörterbuchredaktionen den praktischen Wert dieser Dissertation zu erhöhen, stellt das abschließende Kapitel 4 die zentralen Resultate der Arbeit in Form von Empfehlungen für die Gestaltung des Definitionswortschatzes in Lernerwörterbüchern des Deutschen dar. Die Datensammlung, die der empirischen Analyse zugrunde liegt, kann online unter www.ids-mannheim.de/ pub/ materialien/ sds56.pdf eingesehen werden. 2. Theoretische Grundlagen Dieses erste große Kapitel meiner Arbeit beschäftigt sich mit den theoretischen Grundlagen, die den Hintergrund für die praktische Untersuchung im Kapitel 3 bilden. Dafür setzt sich das Kapitel 2.1 mit wichtigen oder widersprüchlich verwendeten Termini auseinander. Das Kapitel 2.2 beleuchtet mit dem Vocabulary Control Movement und den semantischen Primitiva die historischen Zusammenhänge, in denen die Idee steht, in Wörterbüchern für Nichtmuttersprachler mit einem beschränkten Definitionswortschatz zu arbeiten. Eine Übersicht über den aktuellen Forschungsstand wird im Kapitel 2.3 gegeben, hier stehen die Vor- und Nachteile beim Einsatz eines beschränkten Definitionswortschatzes sowie die Kriterien seiner Auswahl im Mittelpunkt. Das Kapitel 2.4 widmet sich schließlich der Frage, in welchen Wörterbüchern der Ansatz, mit einem beschränkten Definitionswortschatz zu arbeiten, bereits angewendet wird. Ein eigener Fokus liegt hierbei auf den deutschen Wörterbüchern. 2.1 Terminologie In der lexikografischen Forschung verwenden die einzelnen Wissenschaftler viele Bezeichnungen sehr unterschiedlich, weshalb diese Termini 5 , beispielsweise Definition, im nachfolgenden Kapitel auf die Art beschrieben werden, wie sie in der vorliegenden Arbeit verstanden und angewendet werden. Des Weiteren werden einige für die Arbeit grundlegende Ausdrücke - wie Wörterbuch - definiert, die in der Forschung zwar nicht unbedingt divergent gebraucht werden, die aber auch in der alltäglichen Sprache eine Rolle spielen und die deshalb vom fachsprachlichen Gebrauch unterschieden werden müssen. 2.1.1 Wörterbuch und Lernerwörterbuch An Definitionen des Terminus Wörterbuch herrscht in der lexikografischen Literatur kein Mangel. Eine zwar relativ alte, jedoch sehr umfassende und trotz aller zwischenzeitlichen Entwicklungen immer noch gültige Definition findet sich bei Hausmann (1985, S. 369): Das Wörterbuch ist eine durch ein bestimmtes Medium präsentierte Sammlung von lexikalischen Einheiten (vor allem Wörtern), zu denen für einen bestimmten Benutzer bestimmte Informationen gegeben werden, die so geordnet sein müssen, dass ein rascher Zugang zur Einzelinformation möglich ist. 6 [Hervorh. i. Orig.] 5 Synonym zu Terminus wird (Fach-)Ausdruck verwendet. 6 Die Orthografie folgt den aktuellen Empfehlungen der Duden-Redaktion. Auch Zitate wurden an die amtliche Rechtschreibung angepasst. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 22 Diese Definition enthält bereits alles Wesentliche: Erstens geht Hausmann auf die Bindung an ein bestimmtes Medium ein, welches aber kein Printmedium sein muss - elektronische Wörterbücher sind also implizit schon berücksichtigt. Zweitens beschreibt er das Wörterbuch als Sammlung von Lexemen, folglich nicht nur von Wörtern, sondern beispielsweise auch von Phraseologismen oder Affixen. 7 In jedem Fall handelt es sich jedoch nur um eine Sammlung von etwas. Ein Anspruch auf Vollständigkeit besteht nicht, bedingt durch die Dynamik des Wortschatzes. Ebenfalls angesprochen werden die Benutzer- und Informationsspezifik von Wörterbüchern (z.B. Wörterbücher für bestimmte Berufsgruppen bzw. Altersstufen oder nur mit stilistischen oder etymologischen Angaben) sowie der schnelle Zugriff, der durch die systematische Anordnung der Lemmata 8 ermöglicht wird. Was unterscheidet nun jedoch ein Wörterbuch von einem enzyklopädischen Lexikon? Sweet (1964, S. 141) fasst den Unterschied wie folgt zusammen: „The fundamental distinction between a dictionary and a cyclopaedia is, that the dictionary has to explain words, the cyclopaedia has to explain things.“ (Hervorh. i. Orig.). Diese - zugegebenermaßen stark idealisierte - Unterscheidung spiegelt sich vor allem in der Art der Informationen wider, die im Artikel zum jeweiligen Lemma gegeben werden. Während in einem Wörterbuch sprachliche Informationen wie Schreibung, Aussprache, Grammatik und Pragmatik des Lexems im Vordergrund stehen, liegt im enzyklopädischen Lexikon der Fokus eindeutig auf den sachlichen Informationen zum außersprachlichen Referenten des sprachlichen Zeichens (vgl. zuletzt Landau 2001, S. 6f.). 9 Deshalb werden Wörterbücher auch dem Bereich der Sprachlexikografie, Lexika dem Bereich der Sachlexikografie zugeordnet (vgl. zuletzt Wiegand 1988a, S. 745ff.). 10 Die Diskussion darüber, in welche Nachschlage- 7 Unter Lexem wird hier die abstrakte Grundeinheit lexikalischer Elemente verstanden, die beim sprachlichen Handeln in einzelne Formen umgesetzt wird. So kann das Lexem Buch beispielsweise in den Wortformen Buchs oder Bücher realisiert werden. Lexeme können 1. Elemente unterhalb der Wortebene (Morpheme), 2. Wörter oder 3. Elemente oberhalb der Wortebene (komplexe lexikalische Zeichen) sein. Hausmann (1985, S. 369) bezeichnet dieses Konzept in seiner Definition mit dem Terminus lexikalische Einheit. In dieser Arbeit wird als lexikalische Einheit hingegen die Verbindung einer lexikalischen Form mit einer Bedeutung im Sinn von Cruse (1986, S. 77) verstanden: „A lexical unit is then the union of a lexical form and a single sense.“ 8 In Anlehnung an Wolski wird hier zwischen den Termini Lemma und Stichwort unterschieden (vgl. Wolski 1989, S. 363ff.). 9 Vgl. dazu auch Müller (1980, S. 40), Jehle (1990a, S. 217). 10 Vgl. dazu auch Hausmann (1985, S. 370). Theoretische Grundlagen 23 werke welche Informationen gehören, lässt sich besonders gut an der Debatte um die Definition im einsprachigen Wörterbuch verfolgen, die im Kapitel 2.1.3 skizziert wird. Neben der Art der Informationen, die in Wörterbüchern bzw. in Lexika enthalten sind, spielt der Umfang der gegebenen Informationen eine große Rolle, was wiederum mit der Funktion der Nachschlagewerke zusammenhängt: Genügt für Wörterbücher die Menge an Informationen, die ausreicht, damit der Benutzer das Lemma erkennt und identifizieren kann, liegt die Erwartungshaltung beim Nachschlagen in einem Lexikon eher bei umfangreichen und möglichst vollständigen sachbezogenen Informationen (Bosque 1982, S. 112). Wörterbücher erfüllen ganz unterschiedliche Funktionen. Sie unterstützen den Benutzer sowohl bei der Rezeption und Produktion von Texten als auch bei der systematischen Erlernung des Wortschatzes einer Sprache, weshalb sie teilweise genauer als Lese-, Schreib- oder Lernwörterbuch bezeichnet werden (vgl. zuletzt Herbst/ Klotz 2003, S. 19). 11 Béjoint verwendet anstelle der Bezeichnungen Rezeption und Produktion die Termini decoding (Lesen und Hören in der Fremdsprache sowie Übersetzen in die Muttersprache) und encoding (Schreiben und Sprechen in der Fremdsprache sowie Übersetzen in die Fremdsprache) (Béjoint 1981, S. 209). Barz unterscheidet zwischen einer deskriptiven und einer präskriptiven Funktion von Wörterbüchern (Barz 2001, S. 204). Erstere dient Dokumentations- und Informationszwecken, entspricht also der Rezeptions- und teilweise auch der Produktionsseite. Unter dem Aspekt der Präskription liefert das Wörterbuch dem Benutzer eine Anleitung zum regelgerechten Sprachgebrauch, was wiederum mit der Produktion, aber auch mit dem systematischen Lernen korrespondiert. Mit jeder dieser Funktionen verknüpfen sich divergierende Ansprüche an das Wörterbuch: Ein für die Rezeption ausgerichtetes Wörterbuch sollte beispielsweise über eine besonders große Anzahl verzeichneter Lemmata verfügen, also über eine extensive Makrostruktur. 12 Für ein Schreibwörterbuch ist hinge- 11 Mit Funktionen von Wörterbüchern beschäftigen sich auch Hausmann (1974, S. 99), Jehle (1990a, S. 300), Kempcke (1992, S. 172), Barz/ Schröder (1994, S. 132), Zöfgen (1994a, S. 16), Barz (1995, S. 13), Barz (2001, S. 206ff.) und Nation (2001, S. 281f.). 12 Die Bezeichnung Makrostruktur wird hier im Sinn von Engelberg/ Lemnitzer (2009, S. 143) verstanden: „Die Makrostruktur eines Wörterbuchs ist die Menge seiner Lemmata und die Ordnung, die über diese Lemmata gelegt wird.“ Alle über das Wörterverzeichnis hinausgehenden Teile des Wörterbuchs werden als Wörterbuchaußentexte bezeichnet. Zu anderen Auffassungen des Terminus Makrostruktur vgl. Baldinger (1960, S. 526) und Wiegand (1989a, S. 371f.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 24 gen eher von Bedeutung, dass die einzelnen Artikel zum Lemma ausführlich sind und somit die Mikrostruktur 13 des Wörterbuchs umfangreiche Angaben enthält, z.B. zu den Kollokationen: The best dictionary for decoding is the one that contains the largest number of entries, all other things being equal. [...] The best dictionary for encoding is one that provides the most detailed guidance on syntax and collocation, including perhaps advice on pitfalls to avoid. It is obviously a daunting task to prepare a dictionary that will be as satisfactory for encoding as for decoding. (Béjoint 1981, S. 210) Ein Wörterbuch für die systematische Erweiterung der Vokabelkenntnisse sollte die verzeichneten Lexeme auf jeden Fall lernpsychologisch sinnvoll gliedern, also beispielsweise nach Sachgebieten und nicht alphabetisch (Hausmann 1974, S. 113). Lernerwörterbücher repräsentieren „den pädagogischen Typ des einsprachigen Wörterbuchs“ (Wellmann 2004, S. 90) und sind damit auf eine spezielle Benutzergruppe ausgerichtet. 14 Die meisten Lernerwörterbücher sind einsprachig, es gibt zwar auch zweisprachige, diese sind jedoch sehr selten (Zöfgen 1994a, S. 253). 15 Neben der Bezeichnung Lernerwörterbuch verwenden einige Wissenschaftler den Terminus Lernwörterbuch, sie betonen also nicht den Adressaten, sondern die Funktion des Wörterbuchs (zuletzt Zöfgen 1994a, S. 16f.). 16 Für Zöfgen besteht zwischen beiden jedoch ein Unterschied, da im Lernwörterbuch der Akzent auf der Anordnung der Lemmata (Zöfgen 1985b, S. 16) und der „kontrollierten Kompetenzerweiterung“ (Zöfgen 1986, S. 69; 1994a, S. 17) liegt. Synonym zu Lernerwörterbuch findet sich der Terminus L 2-Wörterbuch, beispielsweise bei Zöfgen (1994a, S. 9). Im Deutschen wird - vor allem in den Titeln entsprechender Wörterbücher - die Bezeichnung Wörterbuch Deutsch als Fremdsprache bevorzugt (vgl. Kap. 2.4.2, Tab. 2). Das liegt zum einen an der neutraleren und weniger spezifischen For- 13 Der Terminus Mikrostruktur bezeichnet den Aufbau des einzelnen Artikels in einem Wörterbuch. Zu weiteren Einzelheiten und älteren Auffassungen vgl. Baldinger (1960, S. 526) und Wiegand (1989b, S. 410f.). 14 Die Metalexikografie macht mehrere unterschiedliche Vorschläge zur Typologisierung von Wörterbüchern, beispielsweise nach Benutzungsmöglichkeiten (Kühn 1989) oder nach sich teilweise überschneidenden Kriterien (Zgusta 1971, S. 197ff.; Hausmann 1985, S. 379ff.; Hausmann 1989e; Engelberg/ Lemnitzer 2009, S. 26ff.; Herbst/ Klotz 2003, S. 200ff.). 15 Wenn in dieser Arbeit ohne nähere Bestimmung von Lernerwörterbüchern die Rede ist, bezieht sich das auf die einsprachigen. Zu den bilingualisierten Lernerwörterbüchern vgl. Kapitel 2.1.2. 16 Vgl. dazu auch Zöfgen (1985b, S. 13; 1986, S. 70). Theoretische Grundlagen 25 mulierung, zum anderen an der dadurch möglichen Ausweitung der Benutzergruppe auf Lehrer. Nicht zuletzt werden so werbestrategisch günstige Assoziationen mit den entsprechenden Institutionen und Publikationen geweckt, beispielsweise den Instituten, an denen Deutsch als Fremdsprache gelehrt wird, sowie den theoretischen und praktischen Standardwerken des Faches (Rothenhöfer 2004, S. 15ff.). Lernerwörterbücher wenden sich an den nicht muttersprachlichen Lerner und bemühen sich als selektive Wörterbücher in ihrer Lemmaauswahl und Präsentation auf dessen spezifische Bedürfnisse einzugehen: „A learner's dictionary is a synchronic monolingual dictionary intended to meet the demands of the foreign user.“ (Herbst 1990, S. 1379). 17 Dies geschieht vor allem, indem die Makrostruktur des Wörterbuchs - also die Anzahl der verzeichneten Lemmata - relativ klein gehalten wird, um in den einzelnen Artikeln eine umfangreiche Mikrostruktur mit reichhaltigen Informationen zur Aussprache, Grammatik, Stilistik, Pragmatik, Idiomatik und Semantik des Lemmas bereitstellen zu können (vgl. zuletzt Kernerman 2006, S. 1263). 18 So äußert sich auch Jehle (1990a, S. 204): Makro- und Mikrostruktur stehen in einem umgekehrt proportionalen Verhältnis zueinander: Während im extensiven Wörterbuch für den Muttersprachler mikrostrukturelle Armut mit makrostrukturellem Reichtum korreliert, hängt im Lernerwörterbuch die Exhaustivität der Mikrostruktur eng mit der Selektivität der Makrostruktur zusammen. Trotz der umfangreichen Mikrostruktur wird im Lernerwörterbuch ganz bewusst auf die Angabe bestimmter Informationen verzichtet, so z.B. auf die Etymologie der Lemmata (vgl. zuletzt Landau 2001, S. 131). 19 Denn das Interesse des fremdsprachigen Benutzers ist es nicht, „to be more fully informed about the 17 Ähnliche Definitionen des Terminus Lernerwörterbuch finden sich bei Cowie (1983a, S. 105), Cowie (1983b, S. 138), MacFarquhar/ Richards (1983, S. 114), Martin (1985, S. 171f.), Zöfgen (1986, S. 69f.), Kromann (1992, S. 159), Barz/ Schröder (1994, S. 131f.), Hartmann (1994, S. 16), Zöfgen (1994a, S. 16ff.), Barz (1995, S. 13), Kromann (1995, S. 503f.), Schafroth/ Zöfgen (1998, S. 5) sowie Barz (2001, S. 210). 18 Auch in früheren Arbeiten wird das Verhältnis von Mikro- und Makrostruktur im Wörterbuch diskutiert, vgl. hierzu Stein (1979, S. 11), Béjoint (1981, S. 207), Ayto (1983, S. 98), MacFarquhar/ Richards (1983, S. 114), Kirkpatrick (1985, S. 10), Zöfgen (1985b, S. 10, 21), Whitcut (1986, S. 112), Zöfgen (1986, S. 70), Jehle (1990a, S. 204), Kempcke (1992, S. 172), Barz/ Schröder (1994, S. 131f.), Barz (1995, S. 13), Bergenholtz/ Tarp (1995, S. 48), Barz/ Schröder (1996, S. IV), Nesi (2000, S. 137), Engelberg/ Lemnitzer (2009, S. 27), Barz (2001, S. 210), Landau (2001, S. 16). 19 Ähnlich bereits Hausmann (1974, S. 101f.), Strevens (1987, S. 77) und Stein (1989, S. 12). Vgl. hierzu jedoch Battenburg (1991, S. 28). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 26 language, but to gather information that will enable him to communicate more effectively“ (Béjoint 1981, S. 209). Die Ausspracheangaben richten sich im Lernerwörterbuch sinnvollerweise nach dem IPA, dem internationalen phonetischen Alphabet (vgl. zuletzt Landau 2001, S. 18). 20 Für Béjoint werden Lernerwörterbücher als functional dictionaries - er spricht von MLDs (monolingual learner's dictionaries) - ebenfalls durch das besondere Verhältnis von Mikro- und Makrostruktur charakterisiert. Die Qualität der Angaben steht vor der Quantität der Lemmata. Die Lemmata (hauptsächlich häufige Lexeme) werden in einer einfachen, alltäglichen Sprache erklärt. Neologismen, Archaismen, Dialektismen, fachsprachliche und seltene Wörter werden nicht aufgenommen. Zusätzliche Angaben wie Verbstrukturen, unregelmäßige Formen, Zählbarkeit von Substantiven oder Aussprache werden gemacht; der Wörterbuchartikel enthält viele Beispiele und Kollokationen (Béjoint 1994/ 2000, S. 73f.). 21 Kirkpatrick ergänzt, dass im Lernerwörterbuch die Sememe - die einzelnen Bedeutungen des Lemmas - besser unterschieden werden müssen, dass Funktionswörter stärker berücksichtigt werden und mehr Markierungen Verwendung finden (Kirkpatrick 1985, S. 11f.). 22 Nach Béjoint können ähnliche Sememe im Lernerwörterbuch zusammengefasst werden (Béjoint 1981, S. 213). 23 Neben dem Hauptfaktor - der speziellen Relation von Mikro- und Makrostruktur - gibt es viele weitere, durch die sich Lernerwörterbücher von Wörterbüchern für Muttersprachler unterscheiden. Neubauer stellt in diesem Zusammenhang Fragen nach der Reihenfolge, in der die Bedeutungen im Artikel aufgelistet werden sollen, nach der Menge des in den Artikeln enthaltenen Sachwissens sowie nach der Art der Beispielsätze und deren Funktion (Neubauer 1987, S. 54). Wellmann (2004, S. 91) merkt an: Es [ein Lernerwörterbuch, A.T.] richtet sich nach Prinzipien und ist vor allem von dem Bemühen um Einfachheit, Klarheit (deutliche Abhebung von vergleichbaren Lexemen), Verständlichkeit (und Transparenz), Anwendbarkeit (auch: Merkfähigkeit) bestimmt. 20 Ähnlich bereits Béjoint (1981, S. 214), Kirkpatrick (1985, S. 9), Whitcut (1986, S. 116), Strevens (1987, S. 77), Stein (1989, S. 12) und Kempcke (1992, S. 179). 21 Zu einigen Aspekten vgl. auch Béjoint (1981, S. 209), Whitcut (1986, S. 112), Zöfgen (1986, S. 70), Strevens (1987, S. 77), Stein (1989, S. 11f.), Battenburg (1991, S. 17), Nesi (2000, S. 106, 137), Barz (2001, S. 211), Landau (2001, S. 8, 16f., 305) sowie Kernerman (2006, S. 1263). 22 Zu einigen Aspekten vgl. auch Stein (1989, S. 12), Zöfgen (1986, S. 70), Barz/ Schröder (1994, S. 135), Barz/ Schröder (1996, S. IV) und Barz (2001, S. 210f.). Markierungen geben Gebrauchsbeschränkungen von Lemmata an, beispielsweise stilistisch, fachsprachlich oder regional. Zu den einzelnen Diasystemen vgl. Kapitel 3.3.2.1.2. 23 Vgl. auch Kharma (1985, S. 89). Theoretische Grundlagen 27 Wellmann (2004, S. 91) betont weiterhin, wie wichtig „die Bewährung in der alltäglichen Nutzung“ sei, wozu beispielsweise das schnelle Auffinden des gesuchten Wortes zählt (ebd., S. 92). 24 Das Kriterium der Verständlichkeit sollte dabei Vorrang vor den Kriterien der Vollständigkeit und der Genauigkeit besitzen (Klein/ Randow 1990, S. 381). 25 Unter didaktischen Gesichtspunkten unterstreichen Barz/ Schröder (1994, S. 132) die Wichtigkeit von Tabellen, Abbildungen und Übersichten. Auch die Durchbrechung der alphabetischen Ordnung, um Wortbildungsreihen und Wortbildungsnester zu integrieren, motiviert sich aus dieser didaktischen Funktion des Lernerwörterbuchs (Barz/ Schröder 1996, S. IV). Bereits 1987 nennt Strevens (1987, S. 77) neben einer ausführlichen Einleitung aus der Sicht des Englisch-Muttersprachlers „the use of controlled and simplified language in framing definitions, in deference to the learner's reduced command of English“ als ein Merkmal von Lernerwörterbüchern. 26 Atkins (1985, S. 23) fordert nicht nur für diese „to provide users not only with what they know they want, but with what they don't know they want, as well“. Viele der hier genannten Kriterien - vor allem die von Wellmann angesprochenen Prinzipien der Einfachheit, der Klarheit, der Verständlichkeit, der Anwendbarkeit und der Bewährung im Alltag - sollten natürlich nicht nur von Lernerwörterbüchern, sondern im Idealfall von allen Wörterbüchern erfüllt werden. Dies wurde und wird in der Wörterbuchbenutzerforschung im Zuge der Diskussion über die Benutzerfreundlichkeit auch zunehmend eingefordert (Herbst/ Klotz 2003, S. 27ff.). 2.1.2 Einsprachige und mehrsprachige Wörterbücher Wörterbücher lassen sich nicht nur nach ihrem Adressaten, sondern auch nach der Zahl der in ihnen enthaltenen Sprachen klassifizieren. Man unterscheidet demzufolge zwischen einsprachigen (monolingualen) und mehrsprachigen (multilingualen) Wörterbüchern, wobei letztere meist zweisprachig (bilin- 24 Vgl. auch Béjoint (1981, S. 211). 25 Vgl. auch Heath/ Herbst (1988, S. 315f.), die mehrmals die Vorrangigkeit der Verständlichkeit betonen. 26 Vgl. auch MacFarquhar/ Richards (1983, S. 114f.), Zöfgen (1986, S. 70), Bergenholtz/ Tarp (1995, S. 48), Barz/ Schröder (1996, S. IV ), Cowie (1999b, S. 175), Landau (2001, S. 16, 74) sowie Kernerman (2006, S. 1263). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 28 gual) sind. 27 Typische Beispiele für multilinguale Wörterbücher mit mehr als zwei enthaltenen Sprachen sind Fachwörterbücher, die - teilweise in Kombination mit Bildwörterbüchern - ausgewählte Lexeme in mehreren (meist vier bis sechs) Sprachen präsentieren. Dabei sind die Lemmata oft onomasiologisch geordnet, also nach Sachgruppen (vgl. zuletzt Barz 2001, S. 208). 28 Die mehrsprachigen Wörterbücher sind älter als die einsprachigen. Die typischen monolingualen Wörterbücher für Nichtmuttersprachler (Lernerwörterbücher), auf die im Folgenden besonders eingegangen wird, entstehen erst im Zuge der direkten Methode im Fremdsprachenunterricht, die einen einsprachigen Unterricht ohne den Umweg über die Muttersprache fordert. 29 Eine Mischform aus ein- und mehrsprachigen Wörterbüchern bildet das bilingualisierte Wörterbuch, bei dem Teile des Wörterbuchartikels in der Muttersprache des Benutzers verfasst sind. Dabei handelt es sich meist um semantische Angaben, wie beispielsweise muttersprachliche Äquivalente für die einzelnen Sememe (vgl. zuletzt Kernerman 2006, S. 1263). 30 Der Hauptunterschied zwischen mono- und bilingualen Wörterbüchern besteht darin, dass erstere die Bedeutung mittels Definitionen umschreiben, wohingegen letztere auf Äquivalente in Form von Wortgleichungen zurückgreifen, woraus eine unterschiedliche Metasprache resultiert (vgl. zuletzt Zgusta (2006, S. 92f.). 31 Bei den einsprachigen Wörterbüchern liegt der Fokus demzufolge auf dem Erklären (ermöglicht durch die Reflexivität der Sprache), bei den mehrsprachigen auf dem Übersetzen (ermöglicht durch die Vergleichbarkeit von Sprachen) (Henne 1980, S. 779). Aus den unterschiedlichen Eigenschaften ein- und mehrsprachiger Wörterbücher ergeben sich bestimmte Vor- und Nachteile. Gegen monolinguale Wör- 27 Teilweise werden diese Termini jedoch auch anders verstanden. Haensch (1997, S. 52) unterscheidet monolinguale und plurilinguale Wörterbücher, letztere können bilingual oder multilingual sein. Hausmann (1985, S. 377ff.) unterteilt die mehrsprachigen Wörterbücher in zweisprachige und vielsprachige (polyglotte) Wörterbücher. Das Metzler Lexikon Sprache (2010, S. 771) differenziert in drei Stufen zwischen ein-, zwei- und mehrsprachigen Wörterbüchern. 28 Vgl. auch Hausmann (1985, S. 379), Haensch (1991, S. 2924). 29 Ab den 1860er- und 1870er-Jahren entstehen im Zusammenhang mit der direkten Methode zahlreiche Konzeptionen, die den Erwerb der Fremdsprache analog zum Erwerb der Muttersprache gestalten wollen (Neuner 2007, S. 228). 30 Vgl. auch Kharma (1985, S. 89), Hartmann (1994, S. 17f.). 31 Vgl. auch Zgusta (1971, S. 294, 312ff.), Baxter (1980, S. 330), MacFarquhar/ Richards (1983, S. 112), Atkins (1985, S. 19f.), Béjoint/ Moulin (1987, S. 100), Hartmann (1994, S. 16f.) und Landau (2001, S. 8f.). Theoretische Grundlagen 29 terbücher spricht vor allem die Tatsache, dass ein lexikografischer Zirkel nie vollständig vermieden werden kann, da Objekt- und Metasprache identisch sind (vgl. Kap. 2.3.1.1). 32 Daher kommt es im Zusammenspiel mit zu schwierigen grammatischen Strukturen oder unverständlichen Definitionen in einer unnatürlich klingenden Sprache teilweise zu einer eher negativen Einstellung der Benutzer gegenüber einsprachigen Wörterbüchern in der Fremdsprache. Trotzdem werden sie von Lehrenden (und oftmals sogar von Lernenden gleichermaßen) als nützlicher erachtet (vgl. zuletzt Wingate 2002, S. 22ff.): 33 Monolinguals are good for you (like wholemeal bread and green vegetables); bilinguals (like alcohol, sugar and fatty food) are not, though you may like them better. [...] Students like bilinguals because they bring instant satisfaction, while teachers prefer monolinguals for their long-term benefits. (Atkins 1985, S. 22) Béjoint kommt 1981 bei einer Befragung von 122 französischen Englischstudenten im zweiten bis vierten Studienjahr zu folgendem Ergebnis: 36 Prozent der Befragten sind mit dem einsprachigen Wörterbuch zufriedener als mit dem zweisprachigen, hingegen bevorzugen nur 17 Prozent das bilinguale (Béjoint 1981, S. 217). Bei einer Untersuchung der Wörterbuchbenutzungsgewohnheiten von 279 Englisch- und Französischlernern durch Ripfel stellt sich weiterhin heraus, dass fortgeschrittene Lerner - im Gegensatz zu Anfängern - das einsprachige Wörterbuch als das wichtigste Hilfsmittel beim Sprachenlernen erachten (Ripfel 1989, S. 184). Völlig ungeeignet ist das monolinguale Wörterbuch jedoch in der Situation, in welcher der Lerner bereits ein Konzept im Kopf hat und nur noch das fremdsprachige Lexem dafür sucht, „and it is difficult to see how a monolingual dictionary can ever be made to serve this purpose equally well, since its reader has first to know the word in order to be able to look it up“ (Ellegård 1978, S. 228f.). 34 Vor allem am Anfang des Spracherwerbs bietet die Benutzung des zweisprachigen Wörterbuchs für die Lerner 32 Vgl. auch Wingate (2002, S. 23), Wiegand (1977, S. 62ff.). Wiegand verwendet in diesem Zusammenhang allerdings nicht die Bezeichnung Metasprache, sondern spricht von Kommentarsprache (vgl. Kap. 2.3.1.1). 33 Zu den Einstellungen der Benutzer gegenüber dem einsprachigen Wörterbuch vgl. auch Tomaszczyk (1979, S. 116), Baxter (1980, S. 330ff.), Béjoint (1981, S. 217), Tomaszczyk (1983, S. 46), Neubauer (1984, S. 117), Atkins (1985, S. 19ff.), Kharma (1985, S. 87f.), Zöfgen (1985a, S. 5), Béjoint/ Moulin (1987, S. 99ff.), Galisson (1987, S. 98ff.), Summers (1988, S. 11), Piotrowski (1989, S. 77), Ripfel (1989, S. 184), Bogaards (1991, S. 94), Hartmann (1994, S. 21), Zöfgen (1994a, S. 253ff.), Atkins/ Varantola (1997, S. 32) und Laufer/ Kimmel (1997, S. 362). 34 Vgl. auch Béjoint/ Moulin (1987, S. 100), Bogaards (1991, S. 96) und Wingate (2002, S. 23). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 30 daher ein gewisses Maß an Sicherheit (vgl. zuletzt Carter 1998, S. 151). 35 Das liegt auch daran, dass das bilinguale Wörterbuch geringere Anforderungen an den Lerner stellt, der beim Nachschlagen immer noch auf seine Muttersprache zurückgreifen kann, um die Fremdsprache zu verstehen (vgl. zuletzt Laufer/ Kimmel 1997, S. 362). 36 Für bestimmte Informationen ist eine Konfrontation mit der eigenen Muttersprache jedoch sogar noch bei fortgeschrittenen Lernern hilfreich: It is becoming clear that elements of a student's native language are capable of helping him in learning another language. By focusing on how two languages contrast semantically, syntactically, pragmatically, and culturally, bilingual dictionaries may assist learners in ways monolingual works cannot. (Battenburg 1991, S. 22) Tomaszczyk (1983, S. 45) argumentiert ähnlich: „The important thing [...] is that some semantic and syntactic properties of words do not become apparent until one has confronted them with their counterparts in another language.“ In manchen Fällen ist eine Übersetzung in die Muttersprache wesentlich effektiver als eine schwierige Definition in der Zielsprache, wie Martin anhand des alltäglichen Konzeptes Blätterteig ( puff pastry) darlegt (Martin 1985, S. 172). 37 Tomaszczyk betont daneben die Notwendigkeit zweisprachiger Wörterbücher, um kulturgebundene Lexeme erklären zu können (Tomaszczyk 1983, S. 43). Vor einer Darstellung der Vorteile der monolingualen Wörterbücher stellt sich die elementare Frage, warum unbekannte Wörter überhaupt in einer Fremdsprache semantisiert werden sollten. Kostrzewa (1994, S. 6f.) nennt eine Vielzahl sehr unterschiedlicher Gründe: - Die Richtlinien der gymnasialen Oberstufe schreiben die Arbeit mit dem einsprachigen Wörterbuch vor, - die lexikografischen Definitionen ähneln in monolingualen Wörterbüchern sowohl den Äußerungen des Lehrenden im Unterricht als auch - den Äußerungssequenzen von Muttersprachlern, - der Lerner wird zusätzlich mit der Fremdsprache konfrontiert, was das Hörverstehen fördert, 35 Vgl. auch MacFarquhar/ Richards (1983, S. 111), Underhill (1985, S. 105). 36 Vgl. auch Baxter (1980, S. 333), Béjoint (1981, S. 217), Atkins (1985, S. 21). 37 Vgl. auch Whitcut (1986, S. 112) und Bogaards (1991, S. 95). Zur grundsätzlichen Schwierigkeit der Verwendung eines kontrollierten Definitionsvokabulars bei Konkreta vgl. Kapitel 2.3.1.2. Theoretische Grundlagen 31 - der vorschnellen Bildung von Vokabelgleichungen wird vorgebeugt, - in multinationalen Lerngruppen ist die Semantisierung nicht anders möglich und - die Vokabel wird so mit dem fremdsprachigen Netzwerk verknüpft. Underhill (1985, S. 104) argumentiert ähnlich und zählt als Vorteile der fremdsprachigen Semantisierung auf: - Die Benutzer müssen in der Fremdsprache denken, - der passive Wortschatz wird schneller ausgebaut, da die Bedeutungen in der Fremdsprache verstanden werden müssen, - der Gebrauch hochfrequenter Funktionswörter kann so angemessener wiedergegeben werden, - die Lerner erhalten Einblicke in Definitionen und Beispielsätze und lernen, auch mit Definitionen umzugehen, die auf den ersten Blick unklar sind, - die Beispielsätze können dabei als alternativer Zugang zu den Bedeutungen dienen, - der Lehrer kann seine Rolle als Informationsträger schrittweise an das Wörterbuch abgeben und damit - die Lerner zu einem selbst gesteuerten Lernen führen. 38 Die letzten beiden Gründe machen Herbst/ Stein (1987, S. 125) für jede Art von Wörterbuch geltend: „The dictionary is a tool that will wean learners away from the classroom teacher and guide them towards further independent study.“ Bereits damit spricht eine Reihe von Gründen für die einsprachigen Wörterbücher. Hanks (1979, S. 38) bezeichnet gute monolinguale Wörterbücher zudem als „the mirror of society“. Im Anschluss an den von einem Lehrer geleiteten Unterricht übernehmen sie dessen Rolle - mehr als bilinguale Wörterbücher: „These dictionaries are also, in most cases, the only ‘authorities’ students can turn to after leaving school, [...] they are the only bases for individual progress.“ (Götz 1999, S. 227). Sie dienen in stärkerem Maß als mehrsprachige Wörterbücher der Kompetenzerweiterung des Lerners, fördern sein Selbstver- 38 Underhill geht dabei vom Erwerb des Englischen als Fremdsprache aus und spricht speziell von dieser Situation, weshalb seine Argumentation hier auf die fremdsprachige Semantisierung an sich verallgemeinert wird. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 32 trauen im Umgang mit der Fremdsprache und erfüllen so eher dessen Wunsch nach einem „authoritative standard of usage“ (Ellegård 1978, S. 239). Gründe dafür sind, dass sie die Lemmata nicht nur in einer simplen, oft gar nicht vollständig zutreffenden Wortgleichung darstellen, sondern die Lemmata durch die Definition und die Vernetzung in die Wortumgebung (grammatische Kategorien, typische Syntagmatik, Ausdrucksvarianten, pragmatische und stilistische Gebrauchsregeln) tiefergehend charakterisieren (vgl. zuletzt Wingate 2002, S. 23). 39 Dadurch können vor allem sprachspezifische Konzepte besser vermittelt werden, denn „monolinguals describe their language from within, as it were“ (Götz 1999, S. 226). 40 Aus diesem Grund sind sie vollständiger, wie Tomaszczyk (1983, S. 49) anhand eines Beispiels erläutert: „My Polish- English dictionary gives a more or less full account of the Polish lexicon, but its coverage of the English lexicon is reduced by what was left in the Polish sieve or filter through which it had been passed.“ Einsprachige Wörterbücher fördern zudem das Denken und Handeln in der Zielsprache, also das Erlernen der Fremdsprache, ohne den Umweg über die Muttersprache gehen zu müssen, was sie vor allem in der Textproduktion unentbehrlich macht (vgl. zuletzt Wingate 2002, S. 23). 41 Nach einem Experiment mit Französisch lernenden niederländischen Studenten urteilt Bogaards, zweisprachige Wörterbücher führen häufiger zu richtigen Übersetzungen, allerdings ist die Behaltensleistung - also das Lernen von Wortschatz - bei der Verwendung eines einsprachigen Wörterbuchs höher (Bogaards 1991, S. 98ff.). Baxter (1980, S. 335) schlussfolgert aus der unterschiedlichen Repräsentation der Semantik in den beiden Wörterbuchtypen für das Beispiel Englisch als Fremdsprache: „Use of a bilingual dictionary encourages the tendency to always employ a single lexical item. A monolingual English dictionary, by demonstrating that definition is always possible, encourages conversational definition.“ Einsprachige Wörterbücher unterstützen demzufolge die Entwicklung der Kommunikationsfähigkeit in der Fremdsprache (ebd.). Neben den genannten sprachlich-didaktischen Vorzügen bieten monolinguale Wörterbücher außerdem erhebliche wirtschaftliche Vorteile für die entspre- 39 Vgl. auch Baxter (1980, S. 330f.), Béjoint (1981, S. 217), Underhill (1985, S. 105), Béjoint/ Moulin (1987, S. 101), Galisson (1987, S. 99), Summers (1988, S. 11), Piotrowski (1989, S. 74f.), Battenburg (1991, S. 23), Bogaards (1991, S. 95), Landau (2001, S. 9f., 16), Nation (2001, S. 289) sowie Wellmann (2002, S. 129). 40 Vgl. auch Béjoint/ Moulin (1987, S. 101), Piotrowski (1989, S. 74). 41 Vgl. auch Atkins (1985, S. 21), Underhill (1985, S. 104), Galisson (1987, S. 99), Wingate (1999, S. 441). Theoretische Grundlagen 33 chenden Verlage, weil sie von Lernern einer jeden beliebigen Muttersprache gekauft und verwendet werden können. Sie müssen nicht für jedes Sprachenpaar einzeln erstellt werden, der Markt umfasst potenziell die gesamte Welt (vgl. zuletzt Engelberg/ Lemnitzer 2009, S. 29). 42 Wenn es für jede Sprache zunächst einmal ein gutes einsprachiges Wörterbuch gäbe, hätten Lerner kleinerer Sprachen auch nicht mehr das Problem, dass es für das von ihnen gesuchte Sprachenpaar kein Wörterbuch gibt - sie könnten zumindest auf das monolinguale Wörterbuch ihrer Zielsprache zurückgreifen. Dieses müsste dann allerdings für Sprecher jeder Muttersprache geeignet sein. Aus den dargelegten Argumenten wird ersichtlich, „that both monolingual and bilingual dictionaries are capable of assisting language learners in distinct ways“ (Battenburg 1991, S. 24). 43 Piotrowski (1989, S. 81) formuliert dies für das Englische so: Both types of dictionaries are complementary and both have something else to offer the users. At present the greatest difference between them is that monolingual dictionaries can be more successfully used to check how to use English words in a correct way, while bilingual dictionaries can show how to say something in English at all. Dem Lerner sollte demzufolge erstens die Möglichkeit gegeben werden, beide Wörterbuchtypen je nach Situation sinnvoll einzusetzen (vgl. zuletzt Nation 2001, S. 289). 44 Zweitens sollte der Lerner die Fähigkeit erwerben, mit beiden Wörterbuchtypen angemessen umzugehen und ihnen das Maximum an Informationen zu entnehmen. 2.1.3 Definition und Definitionswortschatz Es dürfte in der lexikografischen Forschung wohl kaum einen Terminus geben, der so häufig diskutiert wird und dabei so umstritten ist wie der der so genannten Definition. Viele Wissenschaftler stoßen sich zum einen daran, dass der Ausdruck Definition auch in anderen Fachgebieten verwendet wird, zum anderen aber vor allem an seiner begrifflichen Nähe zur logischen, wissenschaftlichen und enzyklopädischen Definition. Deshalb präzisieren zahlreiche Linguisten, beispielsweise Hausmann, Zöfgen oder Wellmann, den Ausdruck und 42 Vgl. auch Ellegård (1978, S. 241), MacFarquhar/ Richards (1983, S. 111), Atkins (1985, S. 15), Cowie (1989, S. 42), Battenburg (1991, S. 20f.). 43 Vgl. auch MacFarquhar/ Richards (1983, S. 111). 44 Vgl. auch Baxter (1980, S. 335), Tomaszczyk (1983, S. 46), Bogaards (1991, S. 96). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 34 sprechen von lexikografischer Definition oder Bedeutungsdefinition. 45 Ähnlich einzuordnen ist auch Landau, der an einigen Stellen lexical definition verwendet (Landau 2001, S. 153ff.). Was unterscheidet nun die lexikografische Definition von anderen Definitionen, und worin besteht die Diskussion um den Terminus genau? Die lexikografische Definition „enumerates only the most important semantic features of the defined lexical unit, which suffice to differentiate it from other units“ (Zgusta 1971, S. 253). Stellvertretend sei hier Wiegands Kritik an dem Ausdruck Definition etwas ausführlicher dargelegt, weil kein anderer Forscher in einer solchen Schärfe argumentiert. Zudem beziehen sich die meisten in ihren Stellungnahmen direkt auf ihn, beispielsweise Zöfgen und Wolski. 46 Wiegand (1989c, S. 542) konstatiert, nur wenn „es einen gemeinsprachlichen Gebrauch gibt, der sich vom wissenschaftlichen durchgängig unterscheidet“, könne man in der Metalexikografie von Definition sprechen, ansonsten sei dies „unzweckmäßig und nicht gerechtfertigt“ (ebd.). Weiterhin nennt er es „falsch, sie [die lexikografische Definition, A.T.] als wissenschaftliche Definition irgendeiner traditionellen Art aufzufassen“ (ebd.) und „irreführend, Teile solcher Angaben mit der Terminologie aus der aristotelischen Definitionslehre zu bezeichnen“ (ebd.). Lexikografische Definitionen seien weder präskriptiv noch analytisch, denn das Lemma werde durch sie semantisch nicht vollständig beschrieben (Wiegand 1985, S. 55f.). Gegen den Ausdruck Explikation, wie ihn unter anderem Henne benutzt, wendet sich Wiegand (1989c, S. 543) ebenfalls, da „Explikationen der Präzisierung von sprachlichen Ausdrücken für bestimmte Zwecke der Wissenschaft dienen“. Aus den dargestellten Gründen lehnen Wiegand und einige weitere Wissenschaftler die Verwendung der Bezeichnung Definition für die Metalexikografie ab und gebrauchen stattdessen folgende Ausdrücke, die sich jedoch teilweise auf umfassendere Konzepte beziehen: - Bedeutungsangabe bei Harras, Lemberg und Neubauer, - Bedeutungserklärung bei Henne, Quasthoff/ Hartmann und Müller, - Bedeutungserläuterung bei Wiegand, Zöfgen, Kühn und Neubauer, 45 Die Bezeichnung lexikografische Definition verwenden Zgusta (1971, S. 252), Viehweger (1982, S. 147; 1987, S. 34), Werner (1984, S. 387), Hausmann (1985, S. 373), Wegner (1989, S. 896), Zöfgen (1994a, S. 126), Kromann (1995, S. 504), Kolde (2000, S. 84; 2001, S. 281), Wellmann (2004, S. 97) und Bergenholtz (2005, S. 125). Als Bedeutungsdefinition bezeichnen Wellmann (1984, S. 371) und Barz (2001, S. 209) diesen Teil des Wörterbuchartikels. 46 Die genauen Quellenangaben sind Zöfgen (1994a, S. 127ff.) und Wolski (2002, S. 4). Theoretische Grundlagen 35 - Bedeutungsumschreibung bei Barz/ Schröder, - Explikation bei Neubauer und Kostrzewa, - (semantische) Explikation bei Henne, - Bedeutungsexplikation bei Werner, Kempcke und Weber, - semantischer Kommentar bei Zöfgen, - Umschreibung/ Paraphrase bei Wotjak, - lexikalische Paraphrase bei Wiegand und Zöfgen, - Bedeutungsparaphrase bei Engelberg/ Lemnitzer und Wolski, - Bedeutungsparaphrasenangabe (BPA) bei Wiegand, Zöfgen und Wolski, - Wortdefinition bei Klare. 47 Interessant ist die Tatsache, dass diese Diskussion vor allem in der deutschsprachigen Lexikografieliteratur geführt wird. Forscher aus dem englischamerikanischen oder französischen Raum bzw. in englischer oder französischer Sprache publizierende Wissenschaftler, wie beispielsweise Ayto, Hausmann, Herbst, Ilson, Jehle, Martin, Wingate oder Standop verwenden die Bezeichnung Definition ohne Weiteres (Weber 1996, S. 8). Dies wird aus verschiedenen Gründen auch in der vorliegenden Arbeit so gehandhabt. Erstens besteht beim Ausdruck Definition jener Unterschied zwischen dem alltäglichen und dem wissenschaftlichen Gebrauch, den Wiegand (1989c, S. 542) als Bedingung für die Verwendung des Terminus in der Metalexikografie fordert. Der Benutzer weiß, dass, wenn im Zusammenhang mit Wörterbüchern von der Definition eines Wortes die Rede ist, die Erklärung seiner Bedeutung im Wörterbuchartikel gemeint ist und assoziiert den Ausdruck nicht mit der 47 Die genauen Quellenangaben für die jeweiligen Termini lauten: Bedeutungsangabe (Harras 1977, S. 159; 1986, S. 136; Lemberg 1998, S. 138ff.; Neubauer 1991, S. 521), Bedeutungserklärung (Henne 1976, S. 102; 1977, S. 47; 1980, S. 781; Quasthoff/ Hartmann 1982, S. 102; Müller 1984, S. 360), Bedeutungserläuterung (Wiegand 1981, S. 160; 2000a, S. 202; Zöfgen 1994a, S. 129; Kühn 1998, S. 35, Neubauer 1998, S. 250), Bedeutungsumschreibung (Barz/ Schröder 1994, S. 132), Explikation (Neubauer 1980, S. 1, Kostrzewa 1994, S. 15), (semantische) Explikation (Henne 1972, S. 114f.), Bedeutungsexplikation Werner 1982, S. 65; Kempcke 1992, S. 209, Weber 1996, S. 8), semantischer Kommentar (Zöfgen 1985b, S. 43), Umschreibung/ Paraphrase (Wotjak 1988, S. 20), lexikalische Paraphrase (Wiegand 1976, S. 127; 1977, S. 64; 2000a, S. 202; Zöfgen 1994a, S. 129), Bedeutungsparaphrase (Engelberg/ Lemnitzer 2009, S. 265; Wolski 2002, S. 4), Bedeutungsparaphrasenangabe (BPA) (Wiegand 1989c, S. 540; Zöfgen 1994a, S. 129; Wolski 2002, S. 4) und Wortdefinition (Klare 1988, S. 23). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 36 logischen Definition in der Philosophie. Zweitens wird der Terminus Definition in der Forschung noch immer am häufigsten verwendet, keiner der anderen Vorschläge hat sich bisher gegen ihn durchsetzen können, wohl auch, weil die Neubenennungen oft wesentlich umständlicher und komplizierter sind. Hinzu kommen die lange Tradition der Bezeichnung und ihr internationaler Gebrauch. Wenn man sich bei der Verwendung von Definition im Kontext der Wörterbuchforschung der Herkunft des Ausdrucks aus der Philosophie sowie seiner unterschiedlichen Inhalte in beiden Disziplinen bewusst ist, steht seinem Gebrauch nichts mehr im Weg. Unter Definition soll im Folgenden nur jener Teil des Wörterbuchartikels verstanden werden, der nach dem Lemma zumeist paraphrasenartig die Bedeutung des Lexems wiedergibt. Die anderen Abschnitte des Wörterbuchartikels, wie die phraseologischen Angaben sowie die Beispielsätze, tragen zwar ebenfalls nicht unerheblich zum Verständnis der Semantik des Lexems bei, erklären in erster Linie jedoch seinen Gebrauch. Sie zählen deshalb nicht zur Definition und werden hier als semantischer Kommentar bezeichnet. 48 Nach der Klärung der Bezeichnung Definition ist die Bestimmung des Terminus Definitionswortschatz problemlos möglich: „Der Definitionswortschatz, auch Definitionsvokabular genannt, ist der Wortschatz, der in den Bedeutungserklärungen verwendet wird“, definieren Engelberg/ Lemnitzer (2009, S. 266). 49 Auf das oben beschriebene Verständnis von Definition angewendet, bedeutet dies: Der Definitionswortschatz ist der Wortschatz, der in den Definitionen verwendet wird. Dabei spielt zunächst keine Rolle, ob die enthaltenen Lexeme auf irgendeine Weise kontrolliert, begrenzt oder beschränkt sind. Wird das in den Definitionen benutzte Vokabular daraufhin kontrolliert, ob die Grundform des Lexems selbst im Wörterbuch als Lemma vorhanden 48 Dies deckt sich mit der Auffassung Wiegands, der als semantischen Kommentar die pragmatischen Markierungsangaben, die Beispielangaben und - als Zentrum - die Bedeutungsparaphrasenangabe versteht. Den Terminus Bedeutungsparaphrasenangabe verwendet Wiegand anstelle des Ausdrucks Definition (2000b, S. 1420). Auch Zöfgen fasst unter der Bezeichnung semantischer Kommentar mehrere Teile des Wörterbuchsartikels zusammen: die lexikalische Paraphrase - bei ihm ein Ausdruck für Definition - Synonyme, Antonyme und Sachfelder (1985b, S. 43). 49 An dieser Stelle ist besonders interessant, dass beispielsweise Engelberg/ Lemnitzer den Terminus Definitionswortschatz bzw. Definitionsvokabular ohne Weiteres verwenden, obwohl sie den Ausdruck Definition vermeiden. Unklar bleibt, wie Engelberg/ Lemnitzer den Ausdruck lexikalische Einheit verstehen - ob im Sinn von Hausmann oder wie Cruse (vgl. Kap. 2.1.1, Anm. 7). Theoretische Grundlagen 37 ist, spricht man von einem computerkontrollierten Definitionswortschatz. 50 Dabei geht es um die Formseite des Lexems, nicht um seine Semantik. 51 In Wörterbüchern mit einem computerkontrollierten Definitionswortschatz kann dieser somit im Extremfall höchstens all diejenigen Wörter umfassen, die selbst lemmatisiert sind. Er ist also auf die Anzahl der Lemmata des Wörterbuchs beschränkt. Beide Wörterbücher, an denen die vorliegende Untersuchung durchgeführt wird, also sowohl das Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTWDaF 2) als auch das Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (DHWDaF 2), nehmen dies für sich in Anspruch. In der englischsprachigen Wörterbuchpraxis existiert daneben noch ein weiterer Ansatz im Zusammenhang mit dem Definitionswortschatz - die Begrenzung des Definitionsvokabulars auf eine Menge von ca. 2 000 bis 3 500 Wörter, die meist im Anhang in Form einer Liste abgedruckt sind und mit denen dann alle Lemmata des Wörterbuchs definiert werden. In diesem Fall liegt die Größe des Definitionswortschatzes also deutlich unter der Anzahl der im Wörterbuch verzeichneten Lemmata. Ein solcher Definitionswortschatz wird als kontrollierter/ begrenzter/ beschränkter Definitionswortschatz bzw. als kontrolliertes/ begrenztes/ beschränktes Definitionsvokabular bezeichnet. Die auf diese Weise verfassten Definitionen heißen kontrollierte Definitionen bzw. „controlled definitions“ (Geeraerts 2003, S. 91). Im Gegensatz zur vorliegenden Arbeit, in der diese Termini vollkommen bedeutungsgleich verwendet werden, unterscheidet Whitcut (1988, S. 49) noch zwischen einem beschränkten und einem kontrollierten Vokabular. In ersterem (dem so genannten limited vocabulary) „all the permitted words are listed before one begins to write“, bei letzterem (dem controlled vocabulary) liegt der Fokus darauf, einfachere Wörter zu bevorzugen: „one merely attempts as one goes along to prefer the simpler word“ (ebd.). Engelberg/ Lemnitzer (2009, S. 266) betonen, wie wichtig die Begrenzung des Definitionswortschatzes ist: „Besonders Lernerwörterbücher bemühen sich, den Umfang des Definitionswortschatzes zu kontrollieren, d.h. auf eine festgelegte Menge von lexikalischen Einheiten zu beschränken.“ Im Englischen gilt die Verwendung eines kontrollierten Definitionswortschatzes inzwischen als „Charakteristikum moderner Learner's Dictionaries“ (Carstensen 1988 , S. 45; Hervorh. i. Orig.). Bald (2002, S. 189) geht in seiner Einschätzung sogar noch weiter: „For learners' dictionaries now a defining vocabulary seems 50 Rey-Debove bezeichnet diese Wörterbücher deshalb als „geschlossene Systeme“ (Rey-Debove 1971, S. 200 und Kapitel 2.3.2). 51 Zum Fehlen von Wörterbüchern, die bei ihrem Definitionswortschatz eine Kontrolle auf Sememebene durchführen, vgl. Kapitel 2.3.1.2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 38 to have become obligatory.“ Anhand dieses letzten Zitats wird deutlich, dass es in der Literatur noch ein anderes terminologisches Verständnis gibt. Hauptsächlich im Bereich der englisch-amerikanischen Forschung wird der Ausdruck defining vocabulary meist schon als kontrollierter/ begrenzter/ beschränkter Definitionswortschatz verstanden. So erklären Hartmann/ James (1998, S. 35) in ihrem Dictionary of Lexicography das Lemma defining vocabulary als „the controlled use of vocabulary in definitions“. Ähnlich äußert sich aber auch Werner (1982, S. 66) zum Terminus: Es wird jeweils eine Teilmenge lexikalischer Einheiten als Definitionswortschatz aus der Gesamtmenge des Wortschatzes ausgegrenzt, und die Bedeutungen der restlichen Menge lexikalischer Einheiten dürfen nur - direkt oder indirekt über Reduktion in mehreren Schritten - mittels dieser kontrollierten Menge Definitionswortschatz expliziert werden. 52 Neubauer (1980, S. 1f.) verwendet andere Termini, um die Beschränkung des in den Definitionen verwendeten Wortschatzes auszudrücken: Einen nicht kontrollierten Definitionswortschatz bezeichnet er als Explikationssprache, einen kontrollierten Definitionswortschatz als Explikationsvokabular, wodurch sich Parallelen zu Bald, Hartmann/ James und Werner ergeben. 2.2 Der historisch-philosophische Hintergrund des kontrollierten Definitionswortschatzes Dieses Kapitel beschäftigt sich mit den historischen Vorläufern des Konzepts, in Lernerwörterbüchern einen beschränkten Definitionswortschatz zu verwenden. Zwei große Ansätze spielen dabei eine besondere Rolle - die Idee des so genannten Vocabulary Control Movements sowie die Suche nach semantischen Primitiva. Um beide Ansätze geht es in diesem Kapitel. 2.2.1 Das Vocabulary Control Movement Die Bewegung der Wortschatzkontrolle (Vocabulary Control Movement) entsteht in den 1920er- und 1930er-Jahren im Kontext der pädagogisch-didaktischen Bemühungen, Englisch als Fremdsprache im Ausland leichter lehren und lernen zu können. Das vermittelte und im Unterricht verwendete Vokabular soll für diesen Zweck auf eine Art Grund- oder Kernwortschatz bzw. auf eine Basissprache reduziert werden, deren Grundlage meist Frequenzunter- 52 Vgl. auch Klein/ Randow (1990, S. 375) und Svensén (1993, S. 135). Werner versteht den Ausdruck lexikalische Einheit wie Hausmann, vgl. Kapitel 2.1.1, Anm. 7. Theoretische Grundlagen 39 suchungen zum Wortschatz bilden. Nachfolgend werden wichtige Projekte des Englischen, aber auch des Französischen und Deutschen, in meist chronologischer Ordnung vorgestellt. 53 2.2.1.1 Harold Edward Palmer und A Grammar of English Words Harold Edward Palmer (1877-1949), der „father of British applied linguistics“ ( Stein 2002, S. 4), leitet als gebürtiger Londoner von 1923 bis 1936 das Institute for Research in English Teaching (IRET) in Tokio, nachdem er bereits von 1902 bis 1914 in Verviers (Belgien) nach der Berlitz-Methode Englisch als Fremdsprache unterrichtet hat. Neben der Vermittlung von Englisch als Fremdsprache im Allgemeinen (The Scientific Study and Teaching of Languages 1917, The Principles of Language-Study 1921, A Grammar of Spoken English 1924, English through Actions 1925) und der Phonetik (English Intonation 1922) gilt sein Hauptforschungsinteresse der Wortschatzkontrolle. So will Palmer in Japan im Auftrag des Bildungsministeriums vereinfachte Lesetexte für den Unterricht herstellen, mit dem Ziel „to ease the learning burden of the foreign learner by presenting only (or at least initially) those words which could be shown to carry the main weight of everyday communication“ (Cowie 1999a, S. 4). 1930 veröffentlicht Palmer auf der 7. Jahreskonferenz der Englischlehrer den First Interim Report on Vocabulary Selection - eine Liste mit 3 000 so genannten head-words. Diese head-words sind jedoch nicht als Verbindung einer Wortform mit einer Bedeutung zu verstehen, sondern stärker als Kern einer Wortfamilie, da jedes head-word seine zugehörigen Flexionsformen sowie gebräuchliche Wortbildungsprodukte aus Derivation und Komposition enthält. 54 Bongers (1947, S. 16) zeigt sich von dieser Liste tief beeindruckt: „We proved that 95 % of everyday English as spoken and written is made up of the words given in Palmer's word-list“. 55 Ein Jahr später folgt Palmers revidierte Fassung, der Second Interim Report on Vocabulary Selection - zwei einzelne Listen mit je 500 Wörtern (The First 500 Words of Most Frequent Occurrence und The Second 500 Words of Most Frequent Occur- 53 Die Chronologie bezieht sich dabei zum Teil auf die Lebens- und Schaffenszeit des jeweiligen Wissenschaftlers, zum Teil auf das Publikationsdatum der entsprechenden Werke. 54 Das gemeinsame Aufführen von Flexionsformen und Wortbildungsprodukten könnte auch ein Resultat der zu dieser Zeit noch nicht vollständig vollzogenen Profilierung der Wortbildungslehre sein. Zur Geschichte der Wortbildungslehre vgl. Stepanowa/ Fleischer (1985, S. 15ff.). Zur Weiterentwicklung dieser Liste bei West siehe Kapitel 2.2.1.3. 55 Dieses überzeugende Ergebnis versucht Bongers durch die Zusammenstellung einer eigenen Liste, der KLM-Liste, noch zu übertreffen. Nach seinen Angaben deckt die KLM-Liste sogar 97,5 Prozent eines durchschnittlichen Textes ab, was Bongers vor allem durch Veränderungen bei den ersten 1 000 Wörtern erreicht (Bongers 1947, S. 54ff.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 40 rence) sowie 600 Wörter für die Verwendung im Unterricht (The First 600 Words for a Classroom Vocabulary). Dadurch ist das Vokabular bereits in einzelne Stufen beziehungsweise Zonen eingeteilt, die sich in etwa mit einer Dartscheibe und ihren konzentrischen Kreisen vergleichen lassen. 56 Aus diesem Erfahrungsschatz heraus publiziert Palmer gemeinsam mit Albert Sydney Hornby 57 , den er 1931 an das Institut holt, 1934 The IRET Standard English Vocabulary, das eintausend Wörter umfasst und 1937 unter dem Titel Thousand-Word English veröffentlicht wird. Über den Charakter dieser Wortlisten äußert sich Cowie (1999a, S. 5) wie folgt: Their word-lists, that is to say, were alphabetical arrangements of ‘word-families’ (to use Palmer's term), each entry being headed by a simple word, or root, and consisting of a cluster of inflectionally and/ or derivationally related forms and common compounds. Ihr Vorgehen beschreiben Palmer/ Hornby (1937, S. 12) als „partly subjective, partly objective, and partly the empirical [method, A.T.]“. Die durch Empirie ermittelten Listen erhalten eine vom subjektiven Urteil abhängige Korrektur, sie setzen sich aus empirischen, objektiven und subjektiven Bestandteilen zusammen: The subjective part of the compilation consisted in their drawing up a list based on their individual and joint experiences as writers of text material and teachers. The objective part consisted in their comparing their list with frequency lists produced at the time. And finally, they tried their list out by two years of rewriting and simplifying literary texts. (Stein 2002, S. 5; vgl. auch Cowie 1999b, S. 19) In seiner 1938 veröffentlichten Grammar of English Words geht Palmer diesen Weg konsequent weiter. Der Untertitel One Thousand English Words and Their Pronunciation, Together with Information Concerning the Several Meanings of Each Word, Its Inflections and Derivatives, and the Collocations and Phrases into Which It Enters erläutert bereits genau den Inhalt des Werkes. Palmer wählt eintausend Wörter, die er für den ausländischen Lerner als schwierig einschätzt. Gründe für die Einstufung als kompliziertes Wort können sein: die Zugehörigkeit zu unterschiedlichen Wortarten, unterschiedliche Bedeutungen, unterschiedliche Satzbaupläne, unregelmäßige oder in der Be- 56 Zu diesem Abschnitt vgl. Cowie (1999b, S. 3ff., 17f.) sowie Stein (2002, S. 4f.). Vgl. auch Bongers (1947, S. 41f., 72ff., 205ff.), Fries/ Traver (1950, S. 56f.), McArthur (1978, S. 53ff.), Howatt (1984, S. 230ff.), McArthur (1989, S. 57), Cowie (1999a, S. 4). 57 Zu Albert Sydney Hornby siehe Kapitel 2.2.1.4. Theoretische Grundlagen 41 deutung abweichende Flexionsformen oder Ableitungen sowie stark lexikalisierte Kollokationen, Phraseologismen oder Komposita (Palmer 1964, S. III f .). 58 Insgesamt erinnert A Grammar of English Words sehr stark an den Aufbau späterer Lernerwörterbücher: „Like a dictionary it is a collection of words in alphabetical order, but unlike a dictionary it gives the grammar of each word in detail.“ (Palmer 1964, S. III). Allein die Definitionen der Lemmata fehlen, die Bedeutungen werden stattdessen anhand von Beispielen verdeutlicht. Auch Palmer wird sich während seiner Arbeit zunehmend dessen bewusst, dass er damit „the essential framework of a dictionary“ (Cowie 1999a, S. 6) geschaffen hat, „that this dictionary would have a strongly productive character“ (ebd.). Ein Ausschnitt - der Artikel zu honour - verdeutlicht dies: Abb. 1: Ausschnitt aus A Grammar of English Words (Palmer 1964, S. 81) 58 Vgl. auch Bongers (1947, S. 230ff.), Cowie (1999b, S. 20ff., 36ff.), Stein (2002, S. 6). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 42 Palmer vermerkt im Artikel die Nichtzählbarkeit des Substantivs. Die Aussprache wird ebenso aufgeführt wie die Wortart und wichtige Kollokationen in Wortgruppen oder Beispielsätzen. Der Eintrag ist relativ ausführlich nach einzelnen Sememen gegliedert. Auch die grafische Gestaltung durch Symbole ist differenziert: Das Absatzzeichen kennzeichnet typische Kollokationen mit Präpositionen, das Dreieck steht vor wichtigen Wortbildungsprodukten. Zum Produzieren von Texten stellt dieses Werk eine außerordentliche Hilfe für den nicht muttersprachlichen Lerner dar, Cowie (1999b, S. 6) bezeichnet es als „a highly innovative foreign learners' dictionary“. 2.2.1.2 Charles Kay Ogden und sein Basic English Der Brite Charles Kay Ogden (1889-1957) erreicht zunächst durch seine Herausgeberschaft größere Bekanntheit: 1912 gründet er das Cambridge Magazine, von 1920 bis 1931 ediert er die Zeitschrift Psyche, ab 1921 gibt er The International Library of Psychology, Philosophy and Scientific Method heraus. Auf dem Gebiet der modernen Sprachwissenschaft und der Sprachphilosophie kennt man ihn hauptsächlich durch sein 1923 gemeinsam mit Ivory Armstrong Richards veröffentlichtes Werk The Meaning of Meaning. Darin entwickelt er eine Theorie der Bedeutung und greift das bereits seit der Antike existierende semiotische Dreieck mit den Eckpunkten symbol (Form), thought/ reference (Bedeutung) und referent (Referent) auf. 59 In den Zwanzigerjahren entwickelt Ogden - ganz dem damaligen Zeitgeist entsprechend - die Welthilfssprache Basic English (1930 unter dem gleichnamigen Titel publiziert). Basic steht als Akronym für B ritish A merican S cientific I nternational C ommercial und soll als vereinfachte Form des Englischen laut Ogden innerhalb einer Woche erlernbar sein. Zu den Ursprüngen äußert sich Richards wie folgt: We were comparing definitions - definitions of anything from a table to a force and from a rabbit to a concept - and we were struck by the fact that, whatever you are defining, certain words keep coming into your definitions no matter how diverse the things you are defining. This suggests that there might be a limited set of words in terms of which the meanings of all other words might be stated. If so, then a limited language is possible [...]. (Richards 1939, S. 735) 60 59 Vgl. hierzu Howatt (1984, S. 325), Gordon (1994, S. Xff.), Stein (2002, S. 10). 60 Hier bezieht sich Richards auf die „words of particular lexicographic usefulness“ (Ayto 1984, S. 53), auf die im Kapitel 2.3.2 näher eingegangen wird. Theoretische Grundlagen 43 Basic English als „scientifically selected vocabulary minimum“ (Stein 2002, S. 11) besteht neben einer einfachen Grammatik aus 850 Lexemen, einem „nach einem sehr klugen psychologischen System ausgewählten Wortschatz“ (Horst 1946, S. 9). Dieser setzt sich aus 600 things, 150 qualities und 100 operations zusammen. Auf emotionale oder stilistisch markierte Wörter wird verzichtet, wie schon die Auflösung des Akronyms Basic betont, was Whitcut (1988, S. 51) zu folgender Bemerkung veranlasst: „They [Ogden and Richards, A.T.] were not concerned with enabling people to drink together“ . Things und qualities werden hauptsächlich von Substantiven und Adjektiven gebildet, die operations sind eine äußerst vielfältige Mischung aus Verben, Präpositionen, Junktionen und Pronomen. 61 Die echten Verben sind dabei in der Minderheit, es gibt nur 14, außerdem je zwei Hilfs- und Modalverben. Alles andere soll mithilfe von Funktionsverbgefügen ausgedrückt werden. Die grammatischen Regeln von Basic erlauben es aber, die Endungen -ing und -ed zu verwenden, sodass eine Fülle von Verbformen zur Verfügung steht, wenn beispielsweise aus dem thing (to) act plötzlich acting oder acted werden kann. Dies zeigt auch der folgende Ausschnitt: Abb. 2: Ausschnitt aus Basic English (Horst 1946, S. 151) Die mittlere Spalte gibt die Aussprache an. Derivate - beispielsweise changer aus change oder unchemical aus chemical - können zusätzlich gebildet werden. 62 Des Weiteren dürfen im Basic English Verben und Präpositionen zu mehrgliedrigen Verben wie get in/ on/ off zusammengesetzt werden. Laut Pfeffer (1975, S. 7) ergeben sich allein durch letztere Kombinationsmöglichkeit „mehr als 360 Tätigkeitswörter“. Im Hinblick auf die dabei neu entstehende 61 Die Einteilung der Wortarten in der vorliegenden Arbeit orientiert sich an der Darstellung der Duden-Grammatik (vgl. Duden-Grammatik (2009, S. 145ff.) und Kap. 3.3.2.1.1). 62 Im Basic English wird keine klare Grenze zwischen Wortbildung und Flexion gezogen, weil sowohl Wortbildungsaffixe wie -er als auch Flexionsmorpheme wie -ed an die things treten können. Zur Abgrenzung von Wortbildung und Flexion vgl. Fleischer/ Barz (1995, S. 3ff.) und Duden-Grammatik (2009, S. 638); zur historischen Entwicklung und Profilierung der Wortbildungslehre vgl. Stepanowa/ Fleischer (1985, S. 15ff.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 44 Semantik, die nicht aus den Bedeutungen der einzelnen Bestandteile ableitbar ist, muss dieses Vorgehen äußerst kritisch eingeschätzt werden. Hinzu kommen außerdem 51 international words, zwölf Namen von Wissenschaften und 15 special names sowie eine weitere Liste mit Internationalismen, mit den Namen für die Monate, für die Wochentage, mit einigen Maßeinheiten, Ortsnamen und den Zahlen. Durch diese zusätzliche Liste, vor allem aber durch die Möglichkeit, Derivate und Komposita zu bilden, geht die eigentliche Anzahl der lexikalischen Elemente des Basic English weit über die genannten 850 hinaus, „sodass die 850 die Arbeit von 7 000 und bei geschickter Anwendung selbst von 20 000 tun“ (Horst 1946, S. 11). Auf ähnliche Zahlen kommen auch Fries/ Traver, die zeigen, dass die 850 Wörter des Basic English nicht weniger als 18 416 Bedeutungen im Oxford English Dictionary (OED) enthalten. Im Durchschnitt besitzt also jedes Wort des Basic English 14,6 verschiedene Lesarten, ohne die zusätzlichen Lesarten, die nicht im OED verzeichnet sind (Fries/ Traver 1950, S. 81). Als äußerst modern ist die Systematisierung der Lexeme anzusehen. Sie sind lernstrategisch günstig nach Themengebieten, wie beispielsweise Körper, Familie, Wissenschaft, geordnet oder werden als Gegensatzpaare (z.B. high - low, good - bad ) präsentiert. So kann jedes neu gelernte Wort gleich in eine netzartige Struktur bereits vorhandener Wörter eingeknüpft werden. 63 Der Erfolg und die Verbreitung von Basic English sind enorm. Als der Zweite Weltkrieg ausbricht, existieren bereits um die 150 Bücher, die über und in Basic English geschrieben sind. 1943 zieht die „cause célèbre“ (Howatt 1984, S. 250) sogar die Aufmerksamkeit des britischen Premierministers Winston Churchill auf sich (vgl. zuletzt Stein 2002, S. 16). 64 Ogden „hat mit diesem System den ohne Zweifel genialen Versuch gemacht, aus den tiefsten psychologischen Einsichten in das Verhältnis des Denkens zur Sprache heraus den einfachsten Weg zum Englischen zu schaffen“ (Horst 1946, S. 12). Die Vorteile von Basic English liegen dabei vor allem in seiner Möglichkeit als „a useful system for producing clear and comprehensible written texts“ (Carter 1998, S. 28; Hervorh. i. Orig.). Die Publikation führt aber auch zu heftigen Kontroversen, vor allem zwischen Ogden, Palmer und West (vgl. zuletzt Battenburg 1994, S. 137ff.). 65 Das stärkste Argument gegen Basic 63 Zu diesem Abschnitt vgl. Carter (1998, S. 24f.) und Stein (2002, S. 10ff.). Vgl. auch Horst (1946, S. 10ff.), Fries/ Traver (1950, S. 50ff.), Gougenheim et al. (1964, S. 27f.), McArthur (1978, S. 56ff.), Howatt (1984, S. 251ff.), Neubauer (1980, S. 42ff.), Gordon (1994, S. XIIff.). 64 Vgl. auch Horst (1946, S. 13f.), Howatt (1984, S. 254f.), Gordon (1994, S. XIVff.). 65 Vgl. auch Howatt ( 1984, S. 253). Theoretische Grundlagen 45 English als „a purely subjective wordlist and an ‘island vocabulary’“ (Bongers 1947 , S. 44) besteht darin, „that it produced ‘unnatural’ English“, mit dem eine alltägliche Kommunikation nicht möglich ist, weil grundlegende Ausdrücke wie beispielsweise Thank you oder Good-bye nicht enthalten sind (Howatt 1984, S. 254). 66 Außerdem gibt es für Basic English keine Muttersprachler (ebd.). 67 Die deutschsprachige Forschung argumentiert ähnlich: Basic English „bildet das Lexikon einer Kunstsprache und nicht das des authentischen Englischen; denn viele geläufige Wörter wie to eat, to read, to bring, many, wife etc. fehlen“ (Scherfer 1985 , S. 416; Hervorh. i. Orig.). 68 Von französischer Seite wird Ogden sogar ein gewisser Vorsatz unterstellt: „Ceux qui apprenaient le Basic English ont cru qu'ils apprenaient l'anglais. Et les promoteurs du Basic English ont entretenu l'équivoque“ (Gougenheim et al. 1964 , S. 28). Aus diesem Grund kann Basic English nicht die Grundlage eines allgemeinen Fremdsprachenunterrichtes bilden. Neubauer bemängelt, Basic English sei aufgrund seiner auf das Englische beschränkten Auswahlkriterien nicht auf das Deutsche anwendbar (Neubauer 1980, S. 43). 2.2.1.3 Michael Philip West und die New Method Michael Philip West (1888-1973) - „also a major contributor to the movement“ (Cowie 1999a, S. 3) - arbeitet wie Palmer als gebürtiger Brite im außereuropäischen Ausland auf dem Gebiet der Vermittlung der englischen Sprache. West ist ab 1912 in der südasiatischen Region Bengalen als Leiter der Pädagogischen Hochschule (Teachers' Training College) in Dhaka tätig, der heutigen Hauptstadt Bangladeschs, ebenso als Oberschulrat für die Städte Tschittagong (Bangladesch) und Kalkutta sowie als Ehrendozent für Pädagogik an der Universität von Dhaka. 69 In den Zwanzigerjahren führt West die bis dahin umfangreichste Studie zu den Bedürfnissen von Englischlernern durch. Er räumt dem Leseverstehen 66 Vgl. auch Bongers (1947, S. 119ff.), Gougenheim et al. (1964, S. 28), McArthur (1978, S. 57), Carter (1998, S. 28). 67 Eine ausführliche Kritik an Basic English findet sich beispielsweise in Bongers (1947, S. 119-134). 68 Ähnlich auch Gougenheim et al. (1964, S. 28). 69 Zu diesem Abschnitt vgl. Howatt (1984, S. 246), Tickoo (1988, S. 294), Battenburg (1994, S. 133), Cowie (1999b, S. 6). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 46 dabei die höchste Priorität ein, da Englisch in Bengalen außerhalb der Verwaltungszentren im mündlichen Sprachgebrauch kaum eine Rolle spielt. Für das Verständnis gedruckter Texte ist die Beherrschung der englischen Sprache jedoch wichtig, weil der überwiegende Anteil der Druckerzeugnisse auf Englisch erscheint. 70 Die Ergebnisse der Studie werden 1926 in Bilingualism (with Special Reference to Bengal) veröffentlicht. Für West besteht das Hauptdesideratum in einfachen Lesetexten, die auf einem eingeschränkten Vokabular basieren, weshalb er die Arbeit an Materialien nach seiner New Method beginnt (Howatt 1984 , S. 215). Dabei widmet er sich den beiden Hauptschwierigkeiten: der lexikalischen Selektion und der lexikalischen Distribution. Im Rahmen der lexikalischen Selektion ersetzt West systematisch veraltete und veraltende Wörter durch ihre modernen Entsprechungen, beispielsweise nought durch nothing oder ere durch before. Der zweite Punkt betrifft die Verteilung der neuen Wörter in einem Text. Denn Texte sind nicht nur unverständlich, wenn zu viele unbekannte Wörter darin vorkommen, sondern auch, wenn diese zu dicht beisammenstehen. West ändert das Verhältnis von unbekanntem Wort zu bekannten Wörtern von durchschnittich 1 : 7,4 auf durchschnittlich 1 : 44,7 (Howatt 1984 , S. 247f., Cowie 1999b, S. 7). So entstehen „reading books that would, both in subject matter and in vocabulary load, be measurably suited to the learner“ (Tickoo 1988, S. 296). Ihr Ergebnis überzeugt: „The children made better progress in reading with texts that did not introduce too many new words too quickly“ (Howatt 1984 , S. 248). Ab 1927 beginnt die Veröffentlichung der New Method Readers auf Grundlage der Ergebnisse der Studie. Für die ersten drei Bände verwendet West einen Wortschatz von 1 072 Wörtern, für die ersten fünf insgesamt 1 779. Es folgen New Method Conversation (1933), New Method Composition (1938) und The New Method Dictionary (1935), letzteres Werk entsteht gemeinsam mit James Gareth Endicott. 71 Auf Wests Initiative hin findet 1934 in New York die Carnegie-Konferenz 72 statt, ein Treffen beinahe aller Experten auf dem Gebiet der Vermittlung der englischen Sprache, wie beispielsweise Harold Edward Palmer, Lawrence 70 Vgl. dazu Howatt (1984, S. 245f.), Tickoo (1988, S. 295f.), Cowie (1999b, S. 6f.). 71 Zu diesem Abschnitt vgl. Howatt (1984, S. 249), Tickoo (1988, S. 296f.), Battenburg (1994, S. 134f.), Stein (2002, S. 17). 72 Die Konferenz wird von der Carnegie Corporation of New York organisiert, einer seit 1911 bestehenden gemeinnützigen Stiftung des Industriellen Andrew Carnegie (1835-1919) (vgl. Carnegie Corporation of New York 2010). Theoretische Grundlagen 47 William Faucett 73 und Edward Lee Thorndike 74 . Ogden nimmt die Einladung nicht an, wahrscheinlich aufgrund der Rivalitäten zwischen ihm und West wegen seines Basic English. Im folgenden Jahr treffen sich West, Palmer und Faucett als Unterausschuss mit Thorndike als Berater erneut, diesmal in London unter der Schirmherrschaft des Pädagogikinstitutes der Londoner Universität. Ziel ist es, in gemeinsamer Anstrengung Wege und Kriterien für die Auswahl einer Wortschatzliste für das Englische zu finden. Die Ergebnisse werden 1936 im Interim Report on Vocabulary Selection for the Teaching of English as a Foreign Language veröffentlicht, der oft auch als Carnegie-Report oder kurz als Interim Report bezeichnet wird und der den Vorläufer von Wests 1953 erschienener General Service List of English Words bildet. McArthur kommt aufgrund der zu 93 Prozent übereinstimmenden Wörter zwischen der Carnegie-Liste und Ogdens Basic English zu dem Schluss: „Ogden may not have attended the conference, but his words certainly did.“ (1978, S. 60). Die erste Wortschatzliste des Interim Reports ist für allgemeine Zwecke zusammengestellt, „to ensure an adequate structural basis for any specialised use that may be required“ (Interim Report 1936, S. 10). Sie beruht zunächst nicht ausschließlich auf Frequenzuntersuchungen, sondern auch auf Intuition, Erfah- 73 Lawrence William Faucett (1892-1978) unterrichtet ebenso Englisch als Fremdsprache im Ausland, vor allem in China. Anschließend ist er am Pädagogikinstitut der Londoner Universität tätig. In den späten Zwanzigerjahren entwickelt er den ersten groß angelegten Englischkurs für Ausländer, The Oxford English Course (1933), der aus einem Paket aus Sprach-, Lesebuch und zusätzlichem Lehrbuch auf jeweils vier Niveaustufen besteht und weiteres Material enthält. Dieser modulare Aufbau setzt sich später allgemein für Sprachkurse durch (Howatt 1984 , S. 215f.). 74 Edward Lee Thorndike lebt von 1874 bis 1949 und wird als US-amerikanischer Psychologe und Professor der Columbia-Universität vor allem im Rahmen seiner Behaviorismus-Theorie bekannt, z.B. durch das 1913 veröffentlichte A Psychology of Learning. Für die Lexikografie ist er wegen seiner Wortfrequenzstatistiken von Relevanz, die er 1921 in The Teacher's Word Book publiziert, was er in Zusammenarbeit mit Irving Lorge 1944 schließlich zu The Teacher's Word Book of 30,000 Words erweitert. Als einer der ersten Wissenschaftler berücksichtigt Thorndike bei der Analyse seines Korpus mit rund vier Millionen laufenden Wörtern die Reichweite des Wortes, also das Vorkommen in unterschiedlichen Texten. Dabei geht er allein von den Ergebnissen seiner Wortzählungen aus, ohne diese selbst zu korrigieren, weshalb sein Vorgehen auch als objective quantitative method bezeichnet wird (Bongers 1947, S. 40; Fries/ Traver 1950, S. 21; Pfeffer 1964, S. 1f.; McArthur 1978, S. 49ff.; Cowie 1999b, S. 16f.). Irving Lorge ist es, der nach der Carnegie-Konferenz hauptsächlich die semantischen Untersuchungen zu den rund 2 000 caption words durchführt, deren Ergebnisse als Semantic Count of English Words (1938) und in der noch ausführlicheren Studie A Semantic Count of the 570 Commonest Words (1949) herausgegeben werden (Bongers 1947, S. 22; Howatt 1984, S. 256f.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 48 rung und verschiedenen anderen Kriterien. 75 Neben der Worthäufigkeit ( frequency) sind dies der strukturelle Wert (structural value - alle Synsemantika sind enthalten), die Universalität (universality - geografische Verbreitung), die Anwendbarkeit (subject range - Themenbreite), der Definitionswert ( definition words - Nützlichkeit für das Erklären anderer Wörter), der Expansionswert (word-building - Wortbildungsaktivität) und der Stil (style - Wörter der mittleren Stilebene). 76 Die Liste enthält 2 060 Stichwörter, so genannte caption/ head words, die im Unterschied zu bisherigen Aufstellungen nach Wortarten und Semantik unterteilt sind. Abb. 3: Ausschnitt aus dem Interim Report (1936, S. 269) Wie aus der Abbildung 3 ersichtlich wird, steht das caption/ head word dabei in Großbuchstaben, es folgt die Hauptverwendungsweise des Wortes mit typischen Verwendungsweisen sowie kursiv gesetzte Komposita und Derivate, wobei die Wortarten jeweils angegeben sind. Bei polysemen caption/ head words wird die jeweilige Bedeutung in Klammern beschrieben. Zu weit über die ursprüngliche Bedeutung hinausgehende Sememe oder auch Wortverbindungen stehen am Ende des Eintrags in eckigen Klammern, nummeriert mit (x). Sinnvolle Kombinationen für die Vermittlung von Wortschatz werden mit (*) bezeichnet. Gedacht ist die Sammlung der caption/ head words, die wie Wests späteres Werk den Titel A General Service List trägt, als „a foundation vocabulary for school use in the teaching of English to non-English-speaking pupils from twelve to eighteen years of age“ (Interim Report 1936, S. 30). Dabei ist das Anliegen - im Unterschied etwa zu Ogdens Basic English - „the 75 Zu den Kriterien für die Auswahl eines kontrollierten Definitionswortschatzes vgl. Kapitel 2.3.2. 76 Vgl. Interim Report (1936, S. 12ff.). Theoretische Grundlagen 49 simplification of teaching, not [...] the simplification of language“ (Interim Report 1936, S. 1). Als Hauptquelle dient A Study of English Word-Values, Statistically Determined from the Latest Extensive Word-Counts (1932) von Lawrence William Faucett und Itsu Maki, weiterhin werden unter anderem der First Interim Report on Vocabulary Selection und der Second Interim Report on Vocabulary Selection verwendet. Insgesamt liegen der Untersuchung 13 Listen zugrunde (Stein 2002, S. 17ff.). 77 Bei einer Beurteilung des Werkes aus heutiger Sicht muss bedacht werden, dass es sich um vorläufige Listen handelt, zu deren Kommentierung und Weiterentwicklung ausdrücklich aufgerufen wird (Interim Report 1936, S. 3f.): They worked on an interim report, planning supplements and refinements which never materialized. Circumstances have made their achievements appear monolithic and authoritarian where they probably had no intention of putting them forward as such. (McArthur 1978, S. 63) Neben der allgemeinen Liste sollen also Vokabelsammlungen für spezifischere Zwecke zusammengestellt werden, beispielsweise für das Schreiben von Briefen, das Geschichtenerzählen, eine Liste mit Affixen und eine mit Wörtern zum Definieren anderer Wörter (Interim Report 1936, S. 12). So verrät bereits der Untertitel von Wests General Service List of English Words, die als „acme of achievement in the movement“ (McArthur 1978, S. 61) gilt, welche zusätzlichen Inhalte dort berücksichtigt werden: With Semantic Frequencies and a Supplementary Word-List for the Writing of Popular Science and Technology. Die Idee zu dieser Liste mit 425 wissenschaftlichen und technischen Wörtern wird sicherlich durch Ogdens Bemühungen in dieser Richtung beeinflusst. Als geradezu revolutionär kann bei West der Vorstoß gelten, die Häufigkeiten der einzelnen Bedeutungen polysemer Lexeme anzugeben. Dies liest sich dann so: 77 Zu diesem Abschnitt vgl. auch Interim Report (1936, S. 1ff.), Bongers (1947, S. 48f., 211ff.), Fries/ Traver (1950, S. 67ff.), Gougenheim et al. (1964, S. 19f.), Bright/ McGregor (1970, S. 20ff.), McArthur (1978, S. 56, 60f.), Howatt (1984, S. 255ff.), Tickoo (1988, S. 297), Cowie (1999b, S. 7, 22f.) und Kapitel 2.2.1.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 50 Abb. 4: Ausschnitt aus A General Service List of English Words (West 1960, S. 237) Die Ziffer (hier 710 e) direkt hinter dem Lemma honour gibt die absolute Häufigkeit des Auftretens in den untersuchten Texten des Korpus 78 mit fünf Millionen laufenden Wortformen an. Der Buchstabe e bedeutet, dass für die Frequenz dieses Lemmas nur zweieinhalb Millionen laufende Wörter untersucht werden, in denen honour 355 Mal vorkommt. Anschließend wird die Vorkommenshäufigkeit auf die fünf Millionen hochgerechnet, also auf 710 verdoppelt. Die Lexeme werden zunächst nach Wortarten - hier honour als Substantiv beziehungsweise als Verb - und innerhalb dieser nach einzelnen Bedeutungen unterschieden. Beispielsätze und typische Kollokationen werden genannt. Die grafische Gestaltung ist insgesamt sehr großzügig, eine gestrichelte Linie trennt beispielsweise die Wortbildungsprodukte ab. Am auffälligsten sind die bereits erwähnten relativen Häufigkeitsangaben in Prozent hinter den einzelnen Sememen, durch die sowohl Lerner als auch Lehrer der Sprache wissen, welche Bedeutungen eines Lemmas die zentralen sind. So ist beispielsweise bei dem Adjektiv honourable zu sehen, dass die Bedeutung ‘ehrenvoll, ehrbar’ im Korpus 52 Prozent der Fälle ausmacht, ‘ehrenwert’ jedoch nur 36 Prozent. Da weniger häufige Verwendungsweisen weggelassen 78 Zum Terminus Korpus vgl. Kapitel 3.2.1. Theoretische Grundlagen 51 werden, summiert sich die Gesamtzahl nicht auf einhundert Prozent. West betont neben der Häufigkeit vor allem die folgenden Faktoren, die über die Auswahl als Lemmata für sein Wörterbuch entscheiden: 1. die Schwierigkeit/ Leichtigkeit des Lernens, 2. die Notwendigkeit, eine Idee auszudrücken, 3. die Abdeckung durch Synonyme, 4. die Stilebene (die mittlere wird bevorzugt), 5. intensive und emotionale Wörter. Letztere sind weniger wichtig für den Lerner, denn für Emotionen hat er laut West seine Muttersprache. 79 So gilt Wests General Service List of English Words insgesamt als „highly informative, though space-consuming“ (McArthur 1978, S. 62). Ihre Bedeutung für die englischsprachige Lexikografie kann kaum hoch genug eingeschätzt werden: „Most modern controlled vocabulary lists are based on Wests General Service List .“ (Stein 1979, S. 5). 80 Wests Bemühungen richten sich zur gleichen Zeit darauf, ein Wörterbuch für Englisch als Fremdsprache zu erstellen, wobei die Definitionen der Wörter das Hauptproblem darstellen. Diese sollen mit einem so genannten minimum adequate definition vocabulary verfasst werden, um Probleme beim Verstehen der Definitionen zu vermeiden (Cowie 1999a, S. 9). Den Ausgangspunkt dafür bilden die 1 779 Wörter der fünf Bände der New Method Readers, die durch mögliche Weglassungen und nötige Ergänzungen modifiziert werden und schließlich 1 923 Wörter umfassen, mit denen die 23 898 Lemmata des Wörterbuchs umschrieben werden können. Nach einer weiteren Reduzierung beträgt die letztendliche Größe des Definitionsvokabulars des 1935 erschienenen New Method Dictionary 1 490 Wörter. Der Aufbau der Artikel soll wiederum anhand des Beispiels honour verdeutlicht werden (vgl. Abb. 5). 81 Auffällig sind hier zunächst die Ziffern in den runden Klammern direkt hinter dem Lemma. Sie stehen für die Aussprache der Vokale, ersetzen so die Lautschrift im Wörterbucheintrag und werden in einer Legende auf dem hinteren Bucheinband erklärt. Die Ziffer 5 steht beispielsweise für das kurze, offene O [ ]. The New Method Dictionary wird mit rund einer jährlichen Neuauflage sofort ein Erfolg. Es dient „as a model for reputable dictionary makers' defining vocabularies“ (Tickoo 1988, S. 298) und gilt bis zum Erscheinen des späteren OALD als „the EFL [English as a foreign language, A.T.] dictionary“ (Stein 2002, S. 21; Hervorh. i. Orig.). Ein ähnliches Urteil fällt auch Batten- 79 Allgemein zu den Kriterien für die Selektion eines kontrollierten Definitionswortschatzes siehe Kapitel 2.3.2. 80 Zu diesem Abschnitt vgl. West (1960, S. IXf.), Bright/ McGregor (1970, S. 20), McArthur (1978, S. 61f.), Cowie (1999b, S. 22f.), Stein (2002, S. 21ff.). 81 Zu diesem Abschnitt vgl. Fries/ Traver (1950, S. 66f.), Tickoo (1988, S. 298), Battenburg (1994, S. 139f.), Cowie (1999b, S. 23f., 33ff.), Stein (2002, S. 20f.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 52 burg (1991, S. 14): „[It] was a significant pioneering work, for it marked the first time an English monolingual dictionary was designed specifically for second and foreign language learners.“ (vgl. auch Battenburg 1994, S. 132). The New Method Dictionary bildet auch die Basis für das 1960 erstmals veröffentlichte International Reader's Dictionary, eine leicht veränderte und aktualisierte Version dieses Wörterbuchs, die sich hauptsächlich durch die Verwendung des internationalen phonetischen Alphabets unterscheidet. Die theoretischen Grundlagen zu The New Method Dictionary werden im ebenfalls 1935 durch West publizierten Definition Vocabulary dargelegt, „an account of how the defining vocabulary had been systematically chosen, checked and revised“ (Cowie 1999a, S. 9). In diesem Werk setzt sich West (1999a, S. 9) mit vielen Problemen einsprachiger Wörterbücher auseinander, welche die Forschung erst Jahrzehnte später ausführlich beschäftigen, beispielsweise the fondness for defining the known [...] in terms of the unknown [...], and the tendency to resort to ‘scatter-gun’ techniques, whereby ‘one fires off a number of near or approximate synonyms in the hope that one or other will hit the mark and be understood’. Weiterhin erkennt er, dass sich durch die Verwendung eines beschränkten Definitionsvokabulars der Umfang des Wörterbuchs vergrößert, da die Definitionen durch mehrfache Umschreibungen oder durch die Nennung von Beispielen länger werden. 82 Abb. 5: Ausschnitt aus The New Method Dictionary (West/ Endicott 1961, S. 158) Über die Bezeichnung minimal adequate vocabulary äußert sich West (1963, S. 38) später in seinem Werk Teaching English in Difficult Circumstances: 82 Zu diesem Abschnitt vgl. Fries/ Traver (1950, S. 65f.), Battenburg (1994, S. 142ff.), Cowie (1999a, S. 9), Cowie (1999b, S. 24), Landau (2001, S. 74). Theoretische Grundlagen 53 A Minimum Adequate Vocabulary is not an Island Vocabulary, nor a Foundation Vocabulary. It is not a caravan which can be lived in but cannot be added on to, nor a set of foundations in the ground which may be built on later but cannot be lived in now; it is a usable first stage. It can be added to later, but, even if it is not, it is complete and workable so far as it goes, and so is likely to be amplified in use, where an incomplete and unusable foundation course of mere structures is not, and is apt to be forgotten. In diesem Buch listet West die 1 200 Wörter seines Mindestwortschatzes sowohl alphabetisch als auch thematisch geordnet auf, die dann mithilfe anderer Werke wie der General Service List of English Words für den Sprachgebrauch semantisch spezifiziert werden sollen (vgl. West 1963, S. 95ff.). 2.2.1.4 Albert Sydney Hornby und das Oxford Advanced Learner's Dictionary of Current English Wenn Harold Edward Palmer der „father of British applied linguistics“ (Stein 2002, S. 4) ist, so kann Albert Sydney Hornby (1898-1978) guten Gewissens als sein Ziehsohn bezeichnet werden. Hornby reist nach seinem Universitätsstudium in London 1923 nach Tokio, wo er Englisch unterrichtet und Mitglied des von Palmer geleiteten IRET wird. Der Kontakt zu Palmer intensiviert sich im Lauf der Jahre zunehmend, beide Forscher arbeiten zusammen an mehreren Projekten. So geht die Initiative zur 1 000 Wörter umfassenden Liste des 1934 gemeinsam veröffentlichten IRET Standard English Vocabulary (1937 unter dem Titel Thousand-Word English publiziert) ursprünglich von Hornby aus. Nach der Abreise von Palmer 1936 übernimmt Hornby bis 1942 die Herausgabe des Instituts-Bulletins, als er wegen des Krieges Japan verlässt und in den British Council eintritt, für den er bis 1945 im Iran und anschließend als linguistischer Berater in London tätig ist. Am Vorbild des Bulletins orientiert sich Hornby von 1946 bis 1950 als erster Herausgeber der Zeitschrift English Language Teaching (heute English Language Teaching Journal) des British Council, in der er in den Folgejahren eine Vielzahl von Artikeln veröffentlicht, unter anderem eine Reihe zum Thema Sprachpädagogik. Darin werden zahlreiche grundlegende, heute selbstverständlich erscheinende Regeln für die Arbeit an neuem Sprachmaterial im Unterricht aufgestellt, z.B.: „new linguistic items and patterns [are] presented ‘situationally’ in class first, followed by oral work based on a text and exercises in speech and writing“ (Howatt 1984 , S. 317). Die Formulierungsmuster für das Englische publiziert Hornby 1954 in A Guide to Patterns and Usage in English. Im gleichen Jahr beginnt auch die Veröffentlichung des zunächst dreibändigen Kurses Oxford Progressive English for Adult Learners mit Texten und anderen Lehrmaterialien. 83 83 Zu diesem Abschnitt vgl. Howatt (1984, S. 217, 260ff., 316f.) sowie Cowie (1999b, S. 8ff.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 54 Als Hornbys Hauptwerk ist jedoch ein Wörterbuch anzusehen, das in den Jahren 1937 bis 1940 in Japan geschrieben wird und das heute - mehr als 60 Jahre nach seinem ersten Erscheinen - noch immer ein Standardwerk für Englisch als Fremdsprache ist und vor allem in Schulen häufig Verwendung findet. Es erscheint 1942 zuerst unter dem Titel Idiomatic and Syntactic English Dictionary in Tokio bei Kaitakusha, 1948 als Learner's Dictionary of Current English (OALD 1) in London bei der Oxford University Press, jeweils in Zusammenarbeit mit Edward Vivian Gatenby und Hugh Wakefield. 1952 wird der Titel in Advanced Learner's Dictionary of Current English geändert, unter dem es auch 1963 in der zweiten Auflage erscheint (OALD 2). In Anlehnung an das Oxford English Dictionary wird 1974 der Verlagsname in den Titel aufgenommen, seither heißt es Oxford Advanced Learner's Dictionary of Current English (OALD 3-7). Mitherausgeber sind 1974 Anthony Paul Cowie und Jack Windsor Lewis. 84 Abb. 6: Ausschnitt aus A Learner's Dictionary of Current English (1948, S. 601f.) (für den Zweck der Abbildung grafisch aufbereitet [Anm. d. Red.]) 84 Zu diesem Abschnitt vgl. Howatt (1984, S. 261f., 317), McArthur (1989, S. 59), Stein (1989, S. 10). Zu weiteren Ausgaben - ab dem OALD 5 1995 mit kontrolliertem Definitionswortschatz - vgl. Kapitel 2.4.1.2. Theoretische Grundlagen 55 Wie aus der Abbildung 6 hervorgeht, ist bereits das OALD 1 von 1948 wesentlich umfangreicher als alle bisher besprochenen Werke. Die Wörterbuchartikel sind mikrostrukturell sehr fein gegliedert, in ihrem grundsätzlichen Aufbau bestehen sie bis heute in dieser Art fort. Howatt ( 1984 , S. 262) würdigt Hornbys Verdienst wie folgt: One might say that, just as Johnson ‘fixed’ the English of the eighteenth century, Hornby ‘fixed’ English as a foreign language, and later works have built on the foundations he laid. It became the standard work of reference, not only in traditional dictionary terms, but in a broader sense, by developing the principle that a work for learners of English should demonstrate how the language is used, and show the collocational contexts in which the words normally occur. 2.2.1.5 Georges Gougenheim, René Michéa, Paul Rivenc, Aurélien Sauvageot und das Français Fondamental Auch für das Französische gibt es im 20. Jahrhundert Bemühungen um die Entwicklung einer vereinfachten Form der Sprache. Nach dem Zweiten Weltkrieg möchte die UNESCO die Bildungssituation weiter Bevölkerungskreise durch die Stärkung der so genannten Kultursprachen verbessern. Die französische Verwaltung hat mehrere Gründe, ein solches Projekt voranzutreiben: erstens die politische Unabhängigkeit vieler Überseegebiete bei gleichzeitiger Beibehaltung des Französischen als Amtssprache, zweitens die zunehmende Anzahl an Immigranten aus den nordafrikanischen Staaten, an ausländischen Studenten und Arbeitern sowie nicht zuletzt die stark wachsende Bedeutung des Englischen. So ruft das nationale Bildungsministerium 1951 ein Komitee unter der Leitung von Georges Gougenheim ins Leben, das am Centre de Recherche et d'Étude pour la Diffusion du Français (C. R. E. D. I. F.) an der École Normale Supérieure in St. Cloud bei Paris eine Sprache entwickeln soll, die als französische Antwort auf Basic English gelten kann. 85 Als 1954 Le Français Élémentaire und 1956 L'Élaboration du Français Élémentaire von Gougenheim, Michéa, Rivenc und Sauvageot veröffentlicht werden, kommt es wegen der Bezeichnung élémentaire zu Kritik, weil sie zu negativ klinge. Sie war jedoch absichtlich gewählt worden, da de base zu stark an Basic English erinnern würde. Deshalb ändert man den Namen 1959 in Français Fondamental um. Wie Basic English besteht auch das Français Fondamental aus einem ausgewählten Vokabular und einer einfachen Gram- 85 Zu diesem Abschnitt vgl. Gougenheim (1958, S. 5f.), Gougenheim et al. (1964, S. 9ff.), Stein (2002, S. 27). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 56 matik, versteht sich allerdings stärker als Basic English „comme une langue ouverte“ (Gougenheim et al. 1964 , S. 13). Der Wortschatz umfasst beim Français Fondamental 1 475 Wörter in der ersten und etwa 1 500 Wörter in der zweiten Stufe, sodass das selegierte Vokabular insgesamt knapp 3 000 Wörter enthält. Ein dazugehöriges Wörterbuch wird ebenfalls geplant. In der ersten Version, dem Dictionnaire Fondamental (1958), enthält es zwar 3 000 Lemmata, jedoch decken sich diese nicht mit dem Vokabular des Français Fondamental. Die neue Version, nun mit 3 500 Lemmata und auf Grundlage des Français Fondamental, wird deshalb unter dem Titel Dictionnaire Fondamental de la Langue Français publiziert. 86 Abb. 7: Ausschnitt aus Gougenheim (1958, S. 137) Der Wörterbuchausschnitt (Abb. 7) zeigt, dass die einzelnen Artikel weniger großzügig gegliedert sind als in den vorgestellten englischen Projekten. Der Artikel zum Beispiellemma honneur enthält die Lautschrift und die Wortartenbezeichnung mit Genus. Daneben werden die einzelnen Bedeutungen definiert und Beispiele sowie feste Verbindungen genannt. Gougenheim, Michèa, Rivenc und Sauvageot arbeiten bei der Auswahl der Lexeme für das Dictionnaire Fondamental de la Langue Français nach drei miteinander kombinierten Prinzipien: erstens der Wortfrequenz - „la fréquence des mots dans la langue parlée“ (Gougenheim et al. 1964 , S. 13; Her- 86 Zu diesem Abschnitt vgl. Gougenheim (1958, S. 5f.), Gougenheim et al. (1964, S. 10ff.) und Stein (2002, S. 27f.). Theoretische Grundlagen 57 vorh. i. Orig.), zweitens der Verfügbarkeit - „la recherche des mots disponibles les plus utiles“ (Gougenheim et al. 1964, S. 13; Hervorh. i. Orig.) und drittens dem so genannten rationalen Empirismus - „l'empirisme rationnel“ (ebd . ). 87 Um Wörter nach ihrer Frequenz auszuwählen, werden speziell für diesen Zweck aufgezeichnete Gespräche analysiert und anschließend die am häufigsten vorkommenden Wörter mit anderen Häufigkeitslisten abgeglichen und als Grundlage verwendet. 88 Bei der Analyse dieser Liste macht man folgende Feststellungen: Words of high frequency are relatively stable as vocabulary items. They include above all grammatical words and basic verbs. Among the less stable and infrequent items we find nouns and proper names. They are highly dependent on the topic of conversation or text chosen. (Stein 2002, S. 28f.) 89 René Michéa liefert nun die theoretische Basis, um ein stabiles Vokabular für einen Basiswortschatz auszuwählen. Er unterscheidet dafür zwischen athematischen und thematischen Wörtern. Die athematischen Wörter - bestehend aus grammatischen Wörtern sowie einigen Adjektiven, Verben und Substantiven mit sehr allgemeiner Bedeutung - sind thematisch nicht gebunden und können unabhängig vom Inhalt des Gespräches oder des Textes verwendet werden. Anders ist es bei den thematischen Wörtern, die durch ihre speziellere Bedeutung unterschiedlich fest an ein bestimmtes Thema gebunden sind und deren Häufigkeit demzufolge stark vom Text bestimmt wird. Unter den thematischen Wörtern gibt es nun wiederum auch solche, die nur selten verwendet werden, obwohl sie den Sprechern vertraut sind und sie ihnen jederzeit zur Verfügung stehen. Die verfügbaren Wörter mit starker Bindung an ein bestimmtes Thema bezeichnet Michéa als mots disponibles. Gougenheim et al. (1964, S. 138f.) führen als Beispiel das Wort Gabel an, das nicht sehr frequent ist, obwohl die Sprecher mit dem außersprachlichen Referenten tagtäglich umgehen. Latzel (1993, S. 173) gibt Michéas mots disponibles mit dem Ausdruck Verfügungswortschatz wieder. Die Verfügbarkeit der thematischen Wörter findet Michéa heraus, indem er insgesamt 16 centres d'intérêt bestimmt (z.B. Körperteile, Tiere und Berufe), zu denen Versuchspersonen jeweils die 20 häufigsten Substantive nennen sollen. Befragt werden 904 Schüler im Alter von 12 bis 13 87 Der rationale Empirismus bzw. moderne Empirismus fordert die Verwendung empirischer Begriffe sowie die logische Begründbarkeit oder Bewährung getroffener Aussagen und legt damit für die Philosophie ähnliche Kriterien an wie für die empirischen Wissenschaften (vgl. Stegmüller 1989, S. 346ff.). 88 Die Häufigkeitslisten finden sich bei Gougenheim et al. (1964) geordnet nach der Frequenz (S. 69ff.) sowie alphabetisch (S. 89ff.). 89 Vgl. dazu auch Gougenheim et al. (1964, S. 114ff., 137f., 143f.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 58 Jahren aus 30 verschiedenen Klassen, die aus vier Regionen Frankreichs stammen. Nach der gleichen Methode fragt Gougenheim die Leser der Zeitschrift Vie et Langage nach den 20 Verben, die ihrer Meinung nach am wichtigsten sind. 90 Auf der Grundlage der Frequenz- und der Verfügbarkeitsuntersuchungen werden anschließend nach den Prinzipien des rationalen Empirismus die Wörter für ein Basisvokabular des Französischen ausgewählt. Dabei soll es sich um einen gebräuchlichen, so leicht wie möglich zu lernenden und anwendungsbezogenen Wortschatz mit pädagogischem Charakter handeln. Die erste Niveaustufe des Français Fondamental besteht bei 1 475 Wörtern zu 46,9 Prozent aus Substantiven, zu 22,9 Prozent aus Verben, zu 17,1 Prozent aus grammatischen Wörtern und zu 6,6 Prozent aus Adjektiven. Die fehlenden 6,5 Prozent setzen sich aus Adverbien und Interjektionen zusammen. Vor allem der hohe Anteil an Verben bildet den wichtigsten Unterschied zu Ogdens Basic English. 91 Das Erscheinen von Français Fondamental hat breite Auswirkungen: Systematisches Lehrmaterial wird vorbereitet, Videokurse werden geplant. Touristenführer, Radio- und Fernsehkurse verwenden es ebenso als Grundlage wie Wörterbuchverlage und das nichtfranzösische Ausland für die Lehrplanerstellung des Französischunterrichts (Stein 2002, S. 32). 2.2.1.6 Alfred Haase und sein Englisches Arbeitswörterbuch Alfred Haase (1894-1982) beginnt die zirka 30-jährige Arbeit an seinem Lebenswerk aus der Unzufriedenheit heraus, dass Schüler zumeist nur über ein schlechtes Vokabelwissen verfügen. Um dies zu ändern, befürwortet er ein systematisches Vokabeltraining, wobei die Auswahl des zugrunde liegenden Wortschatzes jedoch nicht allein auf statistischen Untersuchungen basiert. Haase ist - im Unterschied zu den Projekten von Palmer, West, Hornby oder Gougenheim - der Erste, der sein Wörterbuch aus der Perspektive des Nichtmuttersprachlers verfasst. Er berücksichtigt neben der Wortfrequenz die Kriterien praktische Brauchbarkeit , 92 Wortbedeutung, Alltagssprache und 90 Dieses Vorgehen hängt inhaltlich eng mit den Tests zur Vertrautheit von Lexemen zusammen, geht nur genau umgekehrt vor, da aktiv nach den Wörtern gefragt wird und nicht vorgegebene Wörter nach dem Grad ihrer Vertrautheit eingeschätzt werden (vgl. Kap. 2.3.2). 91 Zu diesem Abschnitt vgl. Michéa (1950, S. 188f.), Gougenheim et al. (1964, S. 144f.), Kühn (1979, S. 34ff.), Stein (2002, S. 28f.). 92 Mit dem Kriterium praktische Brauchbarkeit beziehungsweise Reichweite überschneiden sich die Kriterien Anwendbarkeit bei West (vgl. Kap. 2.2.1.3) beziehungsweise disponibilité bei Gougenheim (vgl. Kap. 2.2.1.5). Theoretische Grundlagen 59 Wortbildungsaktivität 93 . Vor allem die praktische Brauchbarkeit und die Wortbildungsaktivität ergeben zusammen die Wertigkeit eines Lexems, wobei nur die undurchsichtigen Wortbildungsprodukte die Wertigkeit beeinflussen. Mithilfe dieser Kriterien entwickelt Haase sechs Wortwertigkeitsstufen: 1) 1 000 grundlegende Wörter, 2) 1 000 wesentliche Wörter, 3) 1 000 wichtige Wörter, 4) 1 000 merkenswerte Wörter, 5) 2 000 nützliche Wörter sowie 6) ziemlich seltene und seltene, aber praktisch wichtige und aktuelle Wörter. Die ersten beiden Wertigkeitsniveaus bilden die Unterstufe, die Niveaus drei und vier die Mittelstufe, der Rest die Oberstufe. Untersuchungen von Haase an einer Anzahl von Texten britischer und amerikanischer Autoren, beispielsweise Joseph Conrad, Ernest Hemingway und Herbert George Wells, von Texten aus der Times sowie von fiktiven Gesprächen zeigen folgende Abdeckung des Wortschatzes: Die erste Stufe deckt über 80 Prozent des in den Texten vorkommenden Vokabulars ab, die zweite Stufe etwa acht bis zehn Prozent, die dritte Stufe zirka vier Prozent, die vierte Stufe rund zwei Prozent, die fünfte Stufe ebenfalls etwa zwei Prozent. Mit einer Kenntnis von 2 000 Wörtern (und ihren Wortfamilien) sind also rund 90 Prozent eines durchschnittlich schwierigen Textes verständlich, bei 4 000 Wörtern sogar um die 96 Prozent. Haases Englisches Arbeitswörterbuch umfasst das Vokabular der Stufen 1 bis 5 sowie ausgewählte Wörter der Stufe 6, insgesamt 6 000 Lexeme plus etwa ebenso viele Derivationen und Komposita. Dabei ist der grundlegende Wortschatz - worunter Haase die ersten 2 000 Wörter versteht - durch Fettdruck hervorgehoben. Er soll nach dreijährigem Unterricht aktiv beherrscht werden. 94 Ein Artikel aus dem Englischen Arbeitswörterbuch sieht folgendermaßen aus: Abb. 8: Ausschnitt aus Englisches Arbeitswörterbuch (Haase 1961, S. 116) Die hochgestellte Ziffer hinter dem Lemma macht deutlich, dass es sich bei honour um ein Wort der zweiten Stufe handelt. Auch die deutschen Entsprechungen sind nach ihrer Wertigkeit angeordnet. Der hochgestellte Punkt zeigt an, dass to honour in der Bedeutung ‘beehren’ etwa ein bis zwei Stufen seltener ist als in der Bedeutung ‘ehren’. Die letzte eckige Klammer verweist auf 93 Das Kriterium Wortbildungsaktivität entspricht dem Expansionswert bei West (vgl. Kap. 2.2.1.3). 94 Zu diesem Abschnitt vgl. Haase (1961 , S. 7ff.), Stein (2002, S. 33ff.), Jendreyzik (2003). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 60 das an anderer Stelle verzeichnete dishonourable bzw. auf dishonour. Haases Ziel ist es, mit dem Englischen Arbeitswörterbuch ein „working tool for vocabulary teaching and vocabulary acquisition“ (Stein 2002, S. 35) zu schaffen, das Verfassern von Lehrbüchern, Lehrern und Lernern eine Hilfe bietet, die Schwierigkeit von Texten und Prüfungsleistungen besser einzuschätzen und sich auf die Benutzung einsprachiger Wörterbücher vorzubereiten. 95 2. 2.1.7 Jay Alan Pfeffer und sein Grunddeutsch Das ehrgeizigste Projekt innerhalb der Bewegung des Vocabulary Control Movements, das sich mit der deutschen Sprache auseinandersetzt, ist wegen des enormen statistischen Aufwands Jay Alan Pfeffers Grunddeutsch. Pfeffer orientiert sich für seine Arbeit stark an allen vorher erschienenen Wortschatzlisten anderer Sprachen, verfolgt aber nicht nur pädagogische, sondern universellere Ziele. So kommt es auch zu einer Zusammenarbeit von Regierungsverantwortlichen und Forschern der USA mit den deutschsprachigen Ländern. 1960 gründet Pfeffer das Institute for Basic German in Buffalo, das 1962 nach Pittsburgh verlegt wird und in München eine Außenstelle unterhält. Von München aus beginnt man 1960 mit der Auswahl von soziologisch repräsentativen Deutsch-Muttersprachlern aus der Bundesrepublik, aus der DDR, aus Österreich und aus der Schweiz. Insgesamt 400 Sprecher aus unterschiedlichen Regionen werden zu 25 Themen (z.B. Familie, Sport oder Kunst) interviewt, was nach der Transkription zirka 595 000 laufende Wortformen ergibt. 96 Nach der Eliminierung dialektaler und umgangssprachlicher Lexik und der Rückführung auf die Grundformen verbleiben noch 25 000 Lexeme, die nach den Kriterien Universalität, Anwendbarkeit und Unentbehrlichkeit auf 737 reduziert werden. 97 Im nächsten Schritt werden nach dem Vorbild des Français Fondamental durch Befragungen thematisch gebundene Wörter ermittelt. Pfeffers Untersuchung ist allerdings wesentlich umfangreicher und methodisch ausgefeilter als die von Gougenheim. Er bittet rund 5 400 Schüler (also fünfmal so viele wie Gougenheim ) im Alter von 15 bis 16 Jahren aus 82 Schulen, die über 48 Städte verteilt sind, um Auskunft. Sie sollen zu 21 Themen je 20 Substantive, zwölf 95 Zu diesem Abschnitt vgl. Haase (1961, S. 10f.) und Stein (2002, S. 36). 96 Tschirner (2006, S. 1280) gibt ohne Quellennachweis mit 398 Texten (Zahl der Interviewten) und zirka 650 000 laufenden Wortformen leicht abweichende Zahlen an. 97 Zu diesem Abschnitt vgl. Pfeffer (1964, S. 7ff.; 1975, S. 10ff.), Kühn (1979, S. 35) und Stein (2002, S: 37f.). Allgemein zu den Kriterien für die Selektion eines kontrollierten Definitionswortschatzes vgl. Kapitel 2.3.2. Theoretische Grundlagen 61 Verben und acht Adjektive nennen, wobei dieses Verhältnis zwischen den Wortarten auf Wortzählungen des Deutschen basiert. 98 Aus den 833 000 genannten Lexemen (19 700 unterschiedlichen Substantiven, 6 800 Verben und 7 400 Adjektiven) werden vor allem nach dem Kriterium der Anwendbarkeit 347 Wörter ausgewählt und zu den 737 bereits ermittelten hinzugefügt. Anschließend wird die Summe von 1 084 Lexemen nach lexikalischen Gesichtspunkten durch 185 Wörter ergänzt, sodass die erste Stufe von Grunddeutsch, die 1964 als Grunddeutsch. Basic (Spoken) German Word List. Grundstufe erscheint, letztendlich 1 269 Wörter umfasst. Die 185 ausgewählten Wörter vervollständigen beispielsweise Reihen (gestern und morgen werden zu heute hinzugefügt), füllen lexikalische Lücken (gelb und braun fehlen bis dahin bei den Farbadjektiven), ergänzen Hierarchie- oder Teil-Ganzes-Beziehungen (Tier zu Hund und Katze, Gesicht zu Mund und Nase), Gegenteile (Antwort zu Frage), Bestandteile häufiger Komposita (Rad von Fahrrad), grundlegende Ableitungen (Fahrer zu fahren) und relevante Konzepte (taub). 99 Abb. 9: Ausschnitt aus Grunddeutsch. Basic (Spoken) German Word List. Grundstufe (Pfef- fer 1964, S. 21) Der Ausschnitt zeigt, dass Wörter einer Wortfamilie gemeinsam verzeichnet werden. Eine Mikrostruktur der Artikel besteht kaum. Die Zahlen hinter den Lemmata geben die Häufigkeit und die Reichweite der Verwendung des Wortes an. Erinnerung kommt beispielsweise in den 595 000 laufenden Wörtern 56-mal vor, dabei wird es von 42 der 450 Sprecher verwendet. 1965 wird von Grunddeutsch eine Version mit englischen Äquivalenten veröffentlicht, was eine intensive Beschäftigung Pfeffers mit der Semantik seines Grundwortschatzes voraussetzt, um für die englischen Entsprechungen die Kernbedeutungen zu finden. Aus dieser Arbeit heraus entsteht 1968 als Phraseologismenwörterbuch auch Grunddeutsch. Basic (Spoken) German Idiom List. Grundstufe (Stein 2002, S. 39f.). 98 Das zugrunde gelegte Verhältnis von 5 : 3 : 2 zwischen den Wortarten Substantiv, Verb und Adjektiv findet sich in ähnlicher Weise auch in anderen Zählungen zur Verteilung der Wortarten, vgl. Kapitel 3.2.1. 99 Zu diesem Abschnitt vgl. Pfeffer (1964, S. 10ff.), Kühn (1979, S. 35) und Stein (2002, S. 38f.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 62 Abb. 10: Ausschnitt aus Grunddeutsch. Basic (Spoken) German Dictionary (Pfeffer 1970a, S. 51) 1970 erscheint die Mittelstufe von Grunddeutsch. Basic (Spoken) German Word List, deren Vokabular vor allem auf der deutschen Schriftsprache beruht und aus 1 536 Lexemen besteht, die wiederum nach Häufigkeit und Reichweite ausgewählt werden. Grund- und Mittelstufe von Grunddeutsch umfassen ingesamt 2 805 Wörter, die etwa 90 Prozent der Alltagssprache abdecken sollen. Im gleichen Jahr wird auch das Wörterbuch Grunddeutsch. Basic (Spoken) German Dictionary publiziert, das zirka 3 000 der gebräuchlichsten Lexeme des Deutschen umfasst, deren Verwendung in rund 8 000 Beispielsätzen erklärt wird (Pfeffer 1970a, S. IX). 100 Die Lexeme sind auf Deutsch lemmatisiert, das Wörterbuch enthält jedoch auch einen englisch-deutschen Index. Die Sternchen vor dem Lemma beziehen sich auf seine Frequenz des Lexems - absteigend von zwei zu einem bis keinem Sternchen. Auf die grammatischen Angaben folgen die Hauptbedeutungen des Lemmas mit dem englischen Äquivalent, wobei monoseme Lemmata lediglich 1. enthalten. Nach der englischen Entsprechung findet sich ein Beispiel. Redewendungen und Kollokationen sind eingerückt, werden aber nach dem gleichen Muster erfasst. 2.2.1.8 Weitere Projekte Von den zahlreichen anderen Ansätzen, die noch mit dem Vocabulary Control Movement in Verbindung stehen, sollen im Folgenden drei wichtige kurz skizziert werden - das Radioprogramm Special English, das europäische Projekt Threshold Level (T-level) English sowie Hindmarshs Cambridge English Lexicon. Noch während des Zweiten Weltkrieges startet in den USA das von der Regierung finanzierte Multimediaprojekt Voice of America, in dessen Rahmen 1959 die Programme mit Special English auf Sendung gehen. Das Ziel von Special English ist es anfangs, „to communicate by radio in clear and simple English with people whose native language was not English“ (Voice of America 2008). Dies wird später durch das nationale Anliegen ergänzt, speziell zur Verbreitung des amerikanischen Englisch beizutragen sowie - neben allgemeinen Nachrichten und wissenschaftlichen Neuigkeiten - über das Leben in den 100 Vgl. hierzu auch Stein (2002, S. 40). Theoretische Grundlagen 63 USA zu informieren. Special English nutzt hierfür ein Kernvokabular von 1 500 Wörtern, meist primärer Wortschatz, der Gegenstände, Handlungen und Emotionen beschreibt. Auf die Verwendung von Passiv und Phraseologismen wird verzichtet, die kurzen und syntaktisch einfachen Sätze sollen jeweils nur einen Gedanken ausdrücken. Hinzu kommt, dass die Sprechgeschwindigkeit auf zirka zwei Drittel des normalen Englisch reduziert wird. Special English ist zwar ursprünglich nicht als Lernsendung gedacht, wird jedoch weltweit sehr häufig zu diesem Zweck eingesetzt. 101 Der Europarat initiiert das Projekt Threshold Level (T-level) English, um die Zusammenarbeit zwischen den europäischen Staaten beim Lehren und Lernen von Fremdsprachen zu verbessern. 1971 wird ein Expertenkomitee des Rates für kulturelle Zusammenarbeit (Council for Cultural Co-Operation; CDCC) unter der Leitung von John Leslie Melville Trim beauftragt, für die Erwachsenenbildung in Europa ein einheitliches System von Leistungspunkten (Credits) zu entwickeln, was 1973 zur Publikation von Systems Development in Adult Language Learning führt . Jan Ate van Ek veröffentlicht zwei Jahre später Threshold Level English in a European Unit/ Credit System for Modern Language Learning by Adults. Dieses Werk basiert auf den großen Vorgängern von Palmer, West und Hornby und soll als Rahmen für den Erwerb unterschiedlicher Sprachen dienen, „[it] supplies the words, phrases and idiomatic structures which learners will need for all the language objectives that are specified“ (Stein 2002, S. 45). Im Anhang dieses Werkes ist dies am Beispiel des Englischen mit einem Vokabular von 1 500 Wörtern (davon 1 050 für den produktiven und 450 für den rezeptiven Gebrauch) illustriert. In den Folgejahren erscheinen die Versionen für andere europäische Sprachen. 102 1977 wird eine Version für den Einsatz in der Schule verfasst und 1990 erscheint die zweite Auflage des T-Level English für Erwachsene. 103 In den Siebzigerjahren wird noch ein weiteres Projekt angeregt: Der British Council beauftragt in Zusammenarbeit mit der Universität von Cambridge Roland Hindmarsh 104 mit der Begutachtung der Ansprüche für das Cambridge 101 Zu diesem Abschnitt vgl. Chmela (2006, S. 4) und Voice of America (2008). 102 Nach Englisch (1975) erscheinen 1976 die Versionen für Französisch (Un niveau-seuil), 1979 für Spanisch (Un nivel umbral), 1980 für Deutsch (Kontaktschwelle) und 1981 für Italienisch (Livello soglia). 103 Zu diesem Abschnitt vgl. Ek/ Trim (1984, S. 2f., 79ff.), Howatt (1984, S. 281ff.) und Stein (2002, S. 42ff.). 104 Hindmarsh besitzt ebenfalls einen pädagogischen Hintergrund - er unterrichtet in den 1950er-Jahren Englisch als Fremdsprache an einer weiterführenden Schule (secondary school) in Uganda. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 64 First Certificate in English. 105 Als Ergebnis erscheint 1980 erstmals das Cambridge English Lexicon, das 4 470 Lemmata umfasst, die in über 8 000 Bedeutungen spezifiziert werden. Die Bedeutungen werden dabei nach ansteigendem Schwierigkeitsgrad und abnehmender Vorkommenshäufigkeit insgesamt sieben Niveaustufen zugeordnet: Abb. 11: Ausschnitt aus Cambridge English Lexicon (Hindmarsh 1980, S. 71) Wie das Beispiel zeigt, ist die Mikrostruktur der Artikel weniger stark ausgeprägt als bei Palmer oder West. Jedes Wortbildungsprodukt erhält einen neuen Eintrag. Die Ziffern vor den einzelnen Bedeutungen entsprechen der Niveaustufe. Außerdem gibt es im Cambridge English Lexicon 22 Anhänge, in denen Lemmata aus der Hauptliste nach grammatischen und inhaltlichen Gesichtspunkten geordnet werden, beispielsweise eine Liste mit zusammengesetzten Adjektiven oder den Wochentagen. Zielgruppe des Werkes ist jedoch nicht der Lerner selbst, sondern „text editors, curriculum planners, examination setters and course writers“ (Hindmarsh 1980, S. XII). 106 2.2.1.9 Zusammenfassung „The vocabulary-control movement arose out of an interest in how and where we use words: in stenography, spelling, reading and language learning generally.“ (McArthur 1978, S. 66). Wie die bisherige Darstellung zeigt, gibt es im 20. Jahrhundert eine Vielzahl unterschiedlicher Projekte, die sich unter der Bewegung des Vocabulary Control Movements subsumieren lassen. Sie entstehen zu einer Zeit, in der beim Lehren und Lernen einer Fremdsprache kaum auf Materialien zurückgegriffen werden kann, die speziell auf Nichtmuttersprachler zugeschnitten sind. Durch die Arbeit der vorgestellten Forscher er- 105 Das Cambridge First Certificate in English bildet die dritte Stufe der Zertifikate, die von der Universität Cambridge für Nichtmuttersprachler angeboten werden (University of Cambridge ESOL Examinations 2010). 106 Zu diesem Abschnitt vgl. Hindmarsh ( 1980, S. Vff.), Stein (2002, S. 47f.). Theoretische Grundlagen 65 fährt dieser Bereich eine hohe Professionalisierung und Spezialisierung, etwa durch vielfältige Publikationen oder die Neugründung von Zeitschriften wie dem English Language Teaching Journal. Vieles von dem, was uns heute beim Lernen einer Fremdsprache selbstverständlich erscheint, geht auf die Tätigkeit dieser Wissenschaftler zurück - beispielsweise der modularisierte Aufbau von Lehrwerken und ihren Zusatzmaterialien oder die Struktur heutiger Lernerwörterbücher. Obwohl der Wettbewerb unter den einzelnen Projekten - auch unterschiedlicher Sprachen - zu dieser Zeit ziemlich stark ist, gibt es doch einige Forscher, die über viele Jahre zusammenarbeiten, wie die Gruppe um Palmer, West und Hornby. Abgesehen davon nutzen alle Wissenschaftler die Ergebnisse ihrer Vorgänger und machen sie oft zum Ausgangspunkt ihrer eigenen Forschungen. Als besonders positiv hervorzuheben ist die häufige und fruchtbare Kooperation zwischen Sprachwissenschaftlern und Sprachlehrern in dieser Zeit. Viele Forscher sammeln zudem selbst Erfahrungen in der Unterrichtspraxis, die ihnen beim Verfassen ihrer Werke zugute kommt. Die Arbeit dieser Jahrzehnte zeigt auch, wie stark die Auswahl des jeweiligen Vokabulars von der Zielgruppe abhängt, von ihrem Alter, ihrer Umgebung, ihren Bedürfnissen und Absichten. Alle Frequenzuntersuchungen führen zu dem Ergebnis, dass Synsemantika am häufigsten vorkommen, und zwar unabhängig von der untersuchten Sprache (Stein 2002, S. 49). 2.2.2 Die semantischen Primitiva Bei der Suche nach den semantischen Primitiva geht es ebenfalls um die Reduktion des Wortschatzes einer Sprache. Allerdings steht hier nicht der pädagogisch-didaktische Aspekt einer erleichterten Sprachvermittlung im Zentrum. Von Bedeutung ist vielmehr der Wunsch, im Rahmen der Sprachphilosophie eine übereinzelsprachliche lexikalische Basis und damit letztendlich auch eine mentale Grundstruktur des menschlichen Denkens zu finden. Durch diese Einteilung der Welt in hierarchisch geordnete Kategorien erhofft man sich letzten Endes eine Lösung einiger Probleme des logischen Denkens. 2.2.2.1 Denis Diderot und Jean Le Rond d'Alembert mit ihrer Encyclopédie 1746 wird Denis Diderot (1713-1784), der zu dieser Zeit noch völlig unbekannt ist, von einem Verleger damit beauftragt, Ephraim Chambers' Cyclopaedia ins Französische zu übertragen. Diderot empfindet Chambers' Artikel jedoch als zu zusammenhanglos und fasst den Plan, das gesamte Wissen der Zeit von Experten in zwar eigenständigen und für sich abgeschlossenen, aber Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 66 von der Weltanschauung her zusammengehörenden Artikeln zusammenstellen zu lassen. Unter den mehr als 150 Mitarbeitern ist neben Rousseau, Voltaire und Montesquieu als den führenden Köpfen der Aufklärung vor allem Diderots Freund und Mitherausgeber Jean Baptiste le Rond d'Alembert (1717- 1783) zu nennen. Von 1751 bis 1780 erscheint die mit Ergänzungs- und Registerbänden insgesamt 35 Bände umfassende Encyclopédie, ou Dictionnaire Raisonné des Sciences, des Arts et des Métiers, par une Société de Gens de Lettres mit rund 60 000 Artikeln. Bereits nach dem Erscheinen des zweiten Bandes kommt es 1752 zu Protesten vonseiten der Kirche, der Eklat folgt jedoch erst fünf Jahre später beim siebten Band, als das Pariser Parlament die Vernichtung der bereits erschienenen sowie ein Verbot weiterer Bände anordnet. 1759 legt sogar der Papst Clemens XIII. einen Bann auf die Encyclopédie. Diderot arbeitet im Verborgenen weiter, allerdings ohne d'Alembert, der sich als Mitherausgeber von dem Projekt zurückzieht. Die verbleibenden zehn Textbände dieses Monumentalwerkes der Aufklärung werden schließlich 1765 gedruckt und an die Subskribenten verteilt. 107 Im Artikel zum Lemma dictionnaire finden sich auch einige Ausführungen zur Definition, die laut der Encyclopédie (Diderot/ d'Alembert 1754, S. 959) folgende Eigenschaften erfüllen soll: „Les définitions doivent être claires, précises, & aussi courtes qu'il est possible; car la briéveté en ce genre aide à la clarté.“ Anschließend kommt die Sprache auf den lexikografischen Zirkel, der durch die Identität von Objekt- und Metasprache in einsprachigen Wörterbüchern automatisch entsteht (vgl. Kap. 2.3.1.1): Mais comme les définitions consistent à expliquer un mot par un ou plusieurs autres, il résulte nécessairement de-là qu'il est des mots qu'on ne doit jamais définir, puisqu'autrement toutes les définitions ne formeroient plus qu'une espece de cercle vicieux, dans lequel un mot seroit expliqué par un autre mot qu'il auroit servi à expliquer lui-même. (Diderot/ d'Alembert 1754, S. 959) Natürlich stellt sich auch in der Encyclopédie die Frage, nach welchen Gesichtspunkten diese nicht zu definierenden Wörter ausgewählt werden sollen. Für die Autoren steht fest: „Leur nombre est peut-être plus grand que l'on ne s'imagine“ (Diderot/ d'Alembert 1754, S. 959). Des Weiteren ist die Festlegung dieser so genannten „mots originaux & primitifs“ (ebd.) ziemlich subjektiv: „il y a des mots que certains auteurs regardent comme pouvant être définis, & que d'autres croyent au contraire ne pourvoir l'être“ (ebd.). Als Beispiele dafür werden âme, espace und courbe genannt, Beispiele für unzweifelhafte Primitiva sind „les mots qui désignent les propriétés générales des 107 Zu diesem Abschnitt vgl. Dörflinger (1976 , S. 8ff.) und d'Alembert (1997 , S. XIff.). Theoretische Grundlagen 67 êtres, comme existence, étendue, pensée, sensation, tems, & un grand nombre d'autres“ (Diderot/ d'Alembert 1754, S. 959; Hervorh. i. Orig.). Autoren von Wörterbüchern wird die Empfehlung gegeben, vor dem Schreiben ihrer Artikel eine Liste mit den „mots originaux & primitifs“ (ebd.) anzulegen, was sehr stark an die spätere Vorgehensweise einiger Wissenschaftler des Vocabulary Control Movements erinnert: „Ainsi le premier objet que doit se proposer l'auteur d'un dictionnaire de langue, c'est de former, autant qu'il lui sera possible, une liste exacte de ces sortes de mots, qui seront comme les racines philosophiques de la langue.“ (ebd.; Hervorh. i. Orig.). Es ist allerdings sehr schwierig, die genaue Anzahl dieser „racines philosophiques“ (ebd.) zu finden. Ist die Liste zu kurz, sind für die anderen Wörter zu viele Erklärungen nötig; ist sie jedoch zu lang, wird die gleiche Idee überflüssigerweise mit unterschiedlichen Wörtern wiedergegeben. Stehen für ein Konzept mehrere Lexeme zur Auswahl, „on cherchera parmi ces mots celui qui renferme ou paroît renfermer l'idée la plus simple; ce sera le mot radical“ (ebd.). Im Wörterbuchartikel sollen sie dann in „leur sens propre & primitif, & non suivant leur sens métaphorique ou figuré“ (ebd.) verwendet und „par un caractere particulier“ (ebd.) markiert werden. Beide Forderungen werden von der Lexikografie im 20. Jahrhundert wieder aufgegriffen, was die Innovativität des Encyclopédie- Ansatzes unter Beweis stellt. 2.2.2.2 Anna Wierzbicka und die Semantic Primitives Anna Wierzbicka (1938 geboren) ist die herausragende Person auf dem Gebiet der Forschung der semantischen Primitiva, als Schülerin Andrzej bicka 1994, S. 10) . Ihre Forschung steht in engem Zusammenhang mit der Komponentenanalyse. 108 Wierzbickas (1996, S. 9f.) Ausgangspunkt ist: One cannot define all words, because the very idea of ‘defining’ implies that there is not only something to be defined (a definiendum) but also something to define it with (a definiens, or rather, a set of „definienses“). The elements which can be used to define the meaning of words (or any other meanings) cannot be defined themselves; rather, they must be accepted as „indefinibilia“, that is, as semantic primes, in terms of which all complex meanings can be coherently represented. Semantische Primitiva sind „concepts which can be understood without any definitions, and in terms of which all other concepts can be defined“ (Wierzbicka 2003, S. 12). Durch diese Menge nicht definierter Wörter kann die „all- 108 Ziel der Komponentenanalyse ist es, die Bedeutung eines Lexems in elementare Merkmalsstrukturen zu zerlegen (vgl. Metzler Lexikon Sprache 2010, S. 347). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 68 pervasive circularity“ (Wierzbicka 2003, S. 12) verhindert werden. Die Notwendigkeit semantischer Primitiva betonen bereits die Philosophen des 17. Jahrhunderts, beispielsweise René Descartes, Blaise Pascal und Gottfried Wilhelm Leibniz. So verfolgt Leibniz die Idee eines universellen Alphabets menschlicher Gedanken, dem „alphabetum cogitationum humanarum“ (Couturat 1961 , S. 435). 109 Weder den Philosophen noch den Semantikern des 20. Jahrhunderts, die sich ebenfalls mit diesem Problem auseinandersetzen, unter ihnen Edward Sapir, Louis Hjelmslev, Uriel Weinreich, Manfred Bier- ! " # $ +# " < # = > Juri Derenikowitsch Apresjan, gelingt es jedoch, eine Liste mit Vorschlägen für semantische Primitiva aufzustellen (vgl. zuletzt Wierzbicka 2006, S. 134ff.). 110 1972 ist Wierzbicka mit ihrem Werk Semantic Primitives die Erste, die eine zwar vorläufige, aber nicht subjektiv-willkürliche Aufstellung semantischer Primitiva veröffentlicht. Die damalige Liste enthält die folgenden 14 Elemente: I, you, someone (being), something, world, this, want, don ' t want (diswant), think of, imagine, feel, say, become und be a part of. Mit ihnen soll es möglich sein, „to explicate all verbal utterances, and to account for all semantic relations existing between different expressions“ (Wierzbicka 1972, S. 16; Hervorh. i. Orig.). Der Weg zu diesen Primitiva führt allein über Versuch und Irrtum, da es sich nicht um etwas Feststehendes handelt, das nur noch entdeckt werden muss: „If we couldn't discover an ‘alphabet of human thoughts’, we would have to construct it“ (Wierzbicka 1992a, S. 18; Hervorh. i. Orig.). Ähnlich äußern sich auch Neubauer/ Petöfi (1981, S. 356): „The selection of primitives is not a task of finding an already existing set of units that is waiting to be discovered but it is rather a task of compiling a list of units best suited for a particular purpose or system.“ Sowohl die existierenden Definitionen als auch die angestrebte semantische Metasprache werden demzufolge immer wieder neu analysiert, abgeglichen und verändert, was die eigentliche Arbeit darstellt. So beschreibt es auch Wierzbicka (1992a, S. 11; Hervorh. i. Orig.): „The challenge consists not in proposing a list of canditates (although even this has been attempted very seldom, and by very few scholars) but in justifying it.“ 111 109 Die vollständige Textstelle lautet: „Alphabetum cogitationum humanarum est catalogus notionum primitivarum, seu earum quas nullis definitionibus clariores reddere possumus“ (Couturat 1961, S. 435; Hervorh. i. Orig.). Übersetzen lässt sich dieser Satz wie folgt: „Das Alphabet menschlicher Gedanken ist ein Katalog ursprünglicher Begriffe oder derer, die wir nicht mit Definitionen verständlicher wiedergeben können.“ 110 Zu diesem Abschnitt vgl. auch Wierzbicka (1972, S. 11; 1985, S. 336; 1992b, S. 215ff.; 1995, S. 150f.; 1996, S. 11ff.). 111 Zu diesem Abschnitt vgl. Wierzbicka (1972, S. 15f.; 1985, S. 337; 2006, S. 135ff.). Theoretische Grundlagen 69 Es verwundert demzufolge nicht, dass sich seit dieser ersten Liste einiges verändert hat, vor allem durch die breitere empirische Basis der Forschung und durch den Einbezug außerindoeuropäischer Sprachen in den Sprachvergleich. Trotzdem bestätigen sich mit zehn semantischen Primitiva die meisten der 14 ursprünglichen Kandidaten von 1972 über die Jahre: I, you, someone, something, this, want, think, feel, say und part of. Es kommt nur eine Vielzahl von Neuvorschlägen dazu, sodass die aktuelle Liste Wierzbickas von 2003 bereits 59 semantische Primitiva in 15 Kategorien enthält, die relativ problemlos in andere Sprachen übersetzbar sind: 112 Substantives: I, you, someone (person), something (thing), people, body Determiners: this, the same, other Quantifiers: one, two, some, many/ much, all Attributes: good, bad, big, small Mental predicates: think, know, want, feel, see, hear Speech: say, word, true Actions, events, movements: do, happen, move Existence and possession: there is, have Life and death: live, die Logical concepts: not, maybe, can, because, if Time: when (time), now, after, before, a long time, a short time, for some time Space: where (place), here, above, below, far, near, on (this) side, inside Intensifier, augmentor: very, more Taxonomy, partonomy: kind of, part of Similarity: like (Wierzbicka 2003, S. 12) Die Kandidaten erfüllen beide Kriterien, welche die Auswahl der semantischen Primitiva objektivieren. 113 Zum einen ist das Definitionskraft, also die Nützlichkeit beim Definieren anderer Wörter, zum anderen handelt es sich um die Universalität des Konzeptes, sprich das Vorhandensein des Konzeptes in anderen Sprachen. Wierzbicka (1992a, S. 11) führt als Beispiel say an, das zum Definieren anderer Wörter bestens geeignet ist, und gleichzeitig viel weniger sprachspezifisch ist als chase oder persuade. Bereits im 17. Jahrhundert stellen die Philosophen Kriterien auf, nach denen semantische Primitiva ge- 112 Wierzbickas Liste aus dem Jahr 1989 umfasst die folgenden 28 Kandidaten für semantische Primitiva: I, you, someone, something, this, the same (other), two, all, I want, I don't want, think, say, know, would (I imagine), do, happen, where, when, after, like, can (possible), good, bad, kind (of ), part, like, because und very (vgl. Wierzbicka 1989b, S. 309). 113 Zu den Kriterien für die Auswahl eines kontrollierten Definitionswortschatzes vgl. Kapitel 2.3.2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 70 funden werden sollen: intuitive Klarheit und Verständlichkeit, die Unmöglichkeit des Defininiert-Werdens sowie die Aktivität als Baustein für andere Konzepte. In jüngerer Zeit wird dem noch hinzugefügt, die Kandidaten sollen sich in umfangreichen sprachübergreifenden Untersuchungen als lexikalisch universal beweisen, was 1994 durch die Studie Semantic and Lexical Universals von Goddard/ Wierzbicka geschieht. Dort werden genetisch und typologisch unterschiedliche Sprachen, unter anderem das westafrikanische Kwa und das mittelamerikanische Miskito, auf das Vorhandensein gemeinsamer Konzepte untersucht. Als Ergebnis bestätigen die Forscher, „that there is indeed a universal ‘alphabet of human thoughts’“ (Goddard/ Wierzbicka 1994, S. 445). Die grundsätzlich mögliche Verständigung zwischen Sprechern unterschiedlicher Muttersprachen und mit unterschiedlichen kulturellen Hintergründen gilt ebenso als Beweis für die Existenz sprach- und kulturübergreifender Konzepte und damit der lexikalischen Universalia. Denn wenn die Bedeutung aller Wörter kulturspezifisch wäre, könnten kulturelle Differenzen überhaupt nicht erklärt werden. Der Unterschied zwischen semantischen Primitiva und lexikalischen Universalia liegt laut Wierzbicka (1992a, S. 17) in ihrer Funktion: „To explain any meanings we need a set of presumed indefinables; and to explain meanings across language and culture boundaries we need a set of presumed universals.“ Erstere sind also Elemente der Bedeutung, letztere dagegen Elemente der Gedanken. Semantische Primitiva müssen dabei nicht lexikalische Universalia sein und umgekehrt. Zum Beispiel ist das Wort Mutter vermutlich lexikalisch universal, um ein semantisches Primitivum handelt es sich jedoch nicht, da es semantisch viel zu komplex ist (Goddard 1989b, S. 304). 114 Trotz des enormen Zuwachses bei den vorgeschlagenen Primitiva ist ihre Anzahl immer noch relativ gering. Das liegt darin begründet, dass nach der kleinstmöglichen Menge gesucht wird, da nur auf diese Weise alle semantischen Beziehungen erkannt werden können. Denn wenn eine zu große Menge semantischer Primitiva angenommen wird, bleibt unnötig viel unerklärt. Außerdem sollen die Primitiva voneinander unabhängig sein: The idea behind this requirement was that two entities which have a common part cannot both be simple (that is, indivisible): if they have a common part this means that they have parts, and if they have parts then they are not indivisible. (Wierzbicka 1992b, S. 219) 114 Zu diesem Abschnitt vgl. Goddard (1989a, S. 51ff.), Wierzbicka (1989a, S. 107f.; 1992a, S. 10ff.; 1992b, S. 221), Goddard/ Wierzbicka (1994, S. 7ff.), Wierzbicka (1995, S. 154; 1996, S. 14f.; 1997, S. 22; 2003, S. 12f.; 2006, S. 135ff.). Theoretische Grundlagen 71 Diese Forderung wird über die Jahre hinweg jedoch gelockert, denn „it became absolutely clear that semantic indivisibility was one thing and ‘intuitive independence’ another“ (Wierzbicka 1992b, S. 221), wodurch sich auch die wachsende Anzahl der semantischen Primitiva erklären lässt (Wierzbicka 1992a, S. 16). Die lexikalischen Universalia bilden gemeinsam mit den Regeln ihrer universellen Grammatik eine Minisprache, die Natural Semantic Metalanguage (NSM), denn „it was assumed that while each language as a whole varies vastly from all the others in its structure, as well as its lexicon, the lexical and grammatical core of each language is isomorphic to those of all the others“ (Wierzbicka 1992b, S. 229). Die NSM, die der alten Vorstellung der lingua mentalis entspricht, ist so universell und selbsterklärend wie möglich: „the shared core of all languages can be seen as a set of isomorphic mini-languages, which can be used as language-specific versions of the same, universal Natural Semantic Metalanguage“ (Wierzbicka 1996, S. 22f.). Sie kann mittels der natürlichen Sprache verstanden werden, wenn auch nicht völlig ohne Anstrengung. 115 NSM is a technical, standardized metalanguage, quite different from a genuine, full-blown natural language. But unlike artificial languages of symbolic logic, or various ‘featurese’ or ‘markerese’ languages, it contains no lexical items or grammatical devices except those taken directly from natural language [...]. (Wierzbicka 1992b, S. 230) Die Entwicklungen in Wierzbickas Theorie können wie folgt zusammengefasst werden: Es gibt eine steigende Anzahl an vorgeschlagenen Primitiva, die Suche nach den Primitiva vereint sich mit der Suche nach den lexikalischen Universalia, diese wird mit der Suche nach universellen Satzmustern kombiniert. Alles gemeinsam fließt in der Konstruktion einer Natural Semantic Metalanguage zusammen, die immer stärker theoretisch untermauert und immer weitläufiger an den unterschiedlichsten Sprachen getestet wird (Wierzbicka 1996, S. 31). 2.2.2.3 Weitere Ansätze Im Folgenden werden zwei weitere Ansätze aus dem Bereich der Semantik vorgestellt - Jackendoff sowie die Moskauer Semantische Schule. Der amerikanische Linguist Ray Jackendoff (geboren 1945) aus der Schule Noam Chomskys verfolgt mit seinem dekompositionellen Ansatz der konzeptuellen Semantik ähnlich wie Wierzbicka das Ziel, eine semantische Meta- 115 Zu diesem Abschnitt vgl. Goddard (1989a, S. 51ff.), Wierzbicka (1992a, S. 17; 1992b, S. 230f.; 1997, S. 24f.; 2003, S. 13; 2006, S. 136f.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 72 sprache zu finden, um die unendliche Zahl an Wortbedeutungen in eine endliche Zahl einzelner Bestandteile zu zerlegen. Diese Metasprache, die hauptsächlich aus der Beschäftigung mit Verben entsteht, setzt sich aus „necessary and sufficient conditions built from primitives“ (Jackendoff 1983, S. 113) zusammen. Solche kognitiv repräsentierten Konzepte sind beispielsweise thing, amount, place oder path. Diese können durch konzeptuelle Funktionen wie go, from oder cause erweitert werden und so komplexere Strukturen bilden. Die elementaren Konzepte müssen jedoch einzelsprachlich nicht zwangsläufig lexikalisch realisiert sein, obwohl sie angeboren sind. Jackendoffs Metasprache ist - im Vergleich zu Wierzbicka - also viel abstrakter, erstens durch eine sehr formelhafte Schreibweise und zweitens vor allem in der weiteren Entwicklung, in der frühere Primitiva weiter zerlegt werden. Jackendoff selbst vergleicht diese Weiterentwicklung mit naturwissenschaftlichen Forschungen in der Chemie. Auf einer ersten Stufe werden die chemischen Elemente identifiziert, erst in einem nächsten Schritt kann ihre weitere Zusammensetzung beschrieben werden. 116 Auch die Moskauer Semantische Schule mit ihren Vertretern Aleksandr < # = > ! " # $ +# @ \ witsch Apresjan geht zu Beginn davon aus, dass sich Wortbedeutungen in einer speziellen formalen Metasprache mit eigenem Vokabular und eigener Grammatik erklären lassen, wobei das Vokabular aus Kunstwörtern sowie semantisch komplexeren Wörtern besteht. Diese logische Sprache habe universalen Charakter, sowohl, was die einzelnen Sprachebenen anbelangt, als auch in sprachübergreifender Hinsicht. Später konzentriert sich Apresjan jedoch auf die Semantik der russischen Sprache und bevorzugt dafür „not an artificial language but a somewhat simplified and unified sub-language of the object language, that is, existing words and syntactic structures in their accepted senses“ (Apresjan 2000 , S. 217). Der Universalitätsanspruch und die starke Orientierung am Abstrakten treten in den Hintergrund. Für die Metasprache werden sowohl stilistisch neutrale semantische Primitiva als auch komplexere Wörter ausgewählt, die sich in einigen Schritten in Primitiva zerlegen lassen. Vermieden werden Wörter, die beim Definieren anderer Wörter nicht hilfreich sind, sowie Synonyme und Homonyme. Im Unterschied zu Wierzbicka werden die Erklärungen jedoch in einer hierarchischen Struktur verfasst, also immer „in the form of the largest possible semantic blocks“ (ebd., S. 219). Außerdem müssen Apresjans Primitiva nicht unbedingt über eine einfache semantische Struktur verfügen, wichtig ist allein, dass sie sich nicht weiter 116 Zu diesem Abschnitt vgl. Jackendoff (1983, S. 112ff., 158), Goddard (1998, S. 64ff.), Jackendoff (2002, S. 334ff.), Löbner (2003, S. 218ff.) und Wierzbicka (2006, S. 136). Theoretische Grundlagen 73 dekomponieren lassen (Apresjan 2000 ^_ `{|}}_~_ € $ +# Zusammenhang sogar die Suche nach den semantischen Primitiva selbst, also der Vorgang der semantischen Dekomposition, von größerer Wichtigkeit als  ‚ $ +# {ƒ„ƒ ^_ „†~_ 2.2.2.4 Zusammenfassung Die sprachphilosophischen Ansätze auf dem Gebiet der semantischen Primitiva vereint der Wunsch, über das Ermitteln von einer Art Kernwortschatz die grundlegenden Wörter einer Sprache herauszufinden und damit auch zu einer mentalen Basis des Menschen vorzustoßen. Die dabei entwickelten Metasprachen sind durch ihre häufig sehr formalistische Struktur (vor allem Jackendoff und Apresjan) für die praktische Lexikografie jedoch nicht von konkretem Nutzen. Für die Anwendung als kontrolliertes Definitionsvokabular ist der Umfang der semantischen Primitiva auch zu gering - wenn, wie zuerst bei Wierzbicka, überhaupt ein tatsächliches Inventar in Form einer Liste vorgeschlagen wird. Oft verfolgen die vorgestellten wissenschaftlichen Ansätze das Ziel, übereinzelsprachlich anwendbar zu sein (Wierzbicka, Jackendoff und die frühe Moskauer Semantische Schule). So steht die Forschung im Bereich der semantischen Primitiva einerseits in einem Zusammenhang mit der Idee, in einem Lernerwörterbuch von einem begrenzten Definitionswortschatz Gebrauch zu machen, und kann als deren wissenschaftlich-theoretischer Hintergrund betrachtet werden. Wilks et al. (1989, S. 200; Hervorh. i. Orig.) gehen aus diesem Grund für das Longman Dictionary of Contemporary English (LDOCE 1) 117 sogar so weit, „the words of the controlled vocabulary as primitives and all the other words in LDOCE [LDOCE 1, A.T.] as non-primitives“ zu bezeichnen. Trotzdem bestehen andererseits zwischen den semantischen Primitiva und einem kontrollierten Definitionswortschatz auch klare Unterschiede. Während in einem Wörterbuch, das mit einem beschränkten Definitionsvokabular arbeitet, auch der Definitionswortschatz selbst lemmatisiert ist und mithilfe anderer Wörter erklärt wird, bleiben die semantischen Primitiva grundsätzlich ohne Definition. Dies bemerkt auch Wilks (1977, S. 198): „This ‘defining sub-vocabulary’ [...] has all its members actually in the dictionary as well, whereas the primitives [...] are not, in general, defined in terms of the other primitives“ (Hervorh. i. Orig.). Allerdings relativiert sich diese Aussage dadurch, dass die Definitionen des Definitionsvokabulars zumindest bei Wilks (ebd.) einen „curiously unsatisfactory“ Eindruck hinterlassen: 117 Zum Longman Dictionary of Contemporary English (LDOCE 1) vgl. Kapitel 2.4.1.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 74 Looking up substance or object in a dictionary (provided you know the language, and are not a foreigner looking up an unknown lexeme) is unrevealing, precisely because hundreds of entries in the dictionary assume you already know the meaning of the word. In that sense, such words [of the defining vocabulary, A.T.] function in very much the way the vocabulary of an explicitly primitive language does. They have a merely organizing role in the dictionary as a whole. (Wilks 1977 , S. 198; Hervorh. i. Orig.) Ein zweiter großer Unterschied besteht in der Zusammensetzung von beschränkten Definitionswortschätzen und den Listen semantischer Primitiva, da durch bestimmte Traditionen in der Art, Definitionen in Wörterbüchern zu verfassen, einige Primitiva wie ich oder du dort niemals verwendet würden (Wierzbicka 1989a, S. 106). Des Weiteren findet in Wörterbuchdefinitionen mit einem begrenzten Definitionsvokabular keine vergleichbar starke Zerlegung statt, wie das bei semantischen Primitiva geschieht: „definitions offered by conventional dictionaries are seldom ‘deep’ enough to reach the level of primitives“ (ebd.). Aus diesem Grund wäre es für benutzerfreundliche Lernerwörterbücher auch vollkommen unpraktisch, in den Definitionen mit semantischen Primitiva zu arbeiten. Denn dies würde die Länge der Definitionen vervielfachen (ebd.). 2.3 Der Forschungsstand zum kontrollierten Definitionswortschatz Das folgende Kapitel widmet sich dem aktuellen wissenschaftlichen Forschungsstand zum kontrollierten Definitionswortschatz. Zum einen wird dafür die bestehende Diskussion um seine Verwendung in Wörterbüchern für Nichtmuttersprachler mit den exisitierenden Pro- und Kontra-Argumenten dargestellt. Zum anderen werden die Kriterien präsentiert, die bei der Zusammenstellung eines kontrollierten Definitionswortschatzes eine Rolle spielen. 2.3.1 Der kontrollierte Definitionswortschatz in der Diskussion 2.3.1.1 Argumente für den Einsatz eines kontrollierten Definitionswortschatzes in Lernerwörterbüchern Bereits vor dem Erscheinen des ersten Lernerwörterbuches mit kontrolliertem Definitionswortschatz, des LDOCE 1 im Jahr 1978, wird in der Forschung vereinzelt theoretisch über die Vorteile eines beschränkten Definitionsvokabulars nachgedacht. Danach geschieht dies aber in viel stärkerem Ausmaß und oft anhand konkreter Wörterbuchbeispiele. Im Folgenden werden die in der Wissenschaft vorgebrachten Pro-Argumente überblicksartig vorgestellt. Eine genaue Trennung und Zuordnung der einzelnen Argumente ist dabei nicht in allen Fällen möglich, weil sich zahlreiche Überschneidungen ergeben. Theoretische Grundlagen 75 Die zentralen Vorteile eines begrenzten Definitionswortschatzes lassen sich am übersichtlichsten nach den betroffenen Personengruppen ordnen - Lerner, Lehrer und Lexikografen. Aus Lernersicht liegt der Nutzen eines beschränkten Definitionsvokabulars erstens in der besseren Verständlichkeit der Definitionen sowie allgemein in einer höheren Benutzerfreundlichkeit der Wörterbücher. Aus der Perspektive der Lehrer bestehen zweitens pädagogisch-didaktische Vorteile, beispielsweise für die Strukturierung der Lexeme. Lexikografen argumentieren drittens, dass durch die Verwendung eines kontrollierten Definitionswortschatzes der lexikografische Zirkel vermieden werden kann. Nicht zuletzt kann sich die in den Definitionen verwendete Sprache trotz ihrer Eingeschränktheit durch Präzision, Korrektheit und eine hohe Ökonomie auszeichnen. Aus der Sicht der Lexikografen erhöht sich so die eigene Disziplin beim Verfassen der Wörterbuchartikel. Das erste und bedeutsamste Argument für die Verwendung eines kontrollierten Definitionswortschatzes aus der Sicht der Lerner ist das der besseren Verständlichkeit. Es taucht in zahlreichen Texten auf, die sich mit dem Thema auseinandersetzen. Laut West (1971, S. VII) wird der Benutzer seines Wörterbuchs An International Reader's Dictionary in der Lage sein, „to understand every explanation given in this dictionary“, wenn ihm die Wörter des kontrollierten Definitionswortschatzes bekannt sind. So weit wie West gehen die meisten Wissenschaftler nicht, aber sehr oft wird argumentiert, das eingeschränkte Vokabular vereinfache die Definitionen und erleichtere somit das Verstehen (vgl. zuletzt Herbst/ Klotz 2003, S. 49). 118 Als Grund dafür wird angegeben, dass unverständliche Definitionen vermieden werden, weil in den Erklärungen nur Wörter Verwendung finden, die einen einfachen und anschaulichen Zugang zur Semantik des Lemmas erlauben. So wird verhindert „[to use] words for the explanations of a headword which are more difficult than the words to be explained“ (Neubauer 1984, S. 117). 119 Zudem handelt es sich bei dem ausgewählten Definitionswortschatz um leichtes, heimisches 120 Vokabular, das dem Lerner vermutlich bekannt ist (Battenburg 1991, S. 55): 118 Das Argument der besseren Verständlichkeit wird von fast allen Forschern angeführt, vgl. auch Fries/ Traver (1950, S. 91), Jain (1978, S. 91), Hoffmann (1979, S. 11), Stein (1979, S. 6), Baxter (1980, S. 334), Jain (1981, S. 274, 276), MacFarquhar/ Richards (1983, S. 122), Kharma (1985, S. 88f.), Kirkpatrick (1985, S. 10), Zöfgen (1985b, S. 61), Herbst (1986, S. 104), Whitcut (1986, S. 118), Summers (1988, S. 11f.), Cowie (1989, S. 47), Neubauer (1989, S. 900), Tickoo (1989, S. 188), Cowie (1990, S. 689), Diab (1990, S. 215), Klein/ Randow (1990, S. 375, 381), Svensén (1993, S. 137), Barz/ Schröder (1994, S. 132), Nesi (2000, S. 73), Wellmann (2001, S. 195), Geeraerts (2003, S. 91). 119 Vgl. auch Stein (1989, S. 31), Herbst (1996, S. 324), Wingate (2002, S. 30). 120 Die Ausdrücke heimisch und nativ werden synonym verwendet (vgl. Kap. 3.3.2.2 und 3.4.2.2). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 76 The chief advantage claimed for a controlled defining vocabulary is that it facilitates understanding of the foreign vocabulary by ensuring that the more difficult words are defined in terms of words which the learner already knows. (Cowie 1990, S. 689) 121 Es kann auch durch Internationalismen ergänzt werden (Wellmann 2004, S. 99) und dient dazu, dass der Lerner eine Art Minisprache erhält (Whitcut 1988, S. 49). Dass der Benutzer aufgrund des beschränkten Definitionsvokabulars schnell an leichte und verständliche Informationen gelangt (Ayto 1984, S. 56) und die Bedeutung des Wortes im aktuellen Kontext versteht (Ellegård 1978 , S. 231), liegt an den Parallelen zwischen Definitionswortschatz und Grundwortschatz, die in der Literatur schon relativ früh festgestellt werden (Bredemeier/ Jansen/ Petöfi 1977 , S. 81). Außerdem werden für das kontrollierte Definitionsvokabular nur Wörter verwendet, die im jeweiligen Wörterbuch selbst lemmatisiert sind; weiterhin werden sie in nicht all ihren Bedeutungen, sondern meist nur in den zentralen angewendet (vgl. zuletzt Battenburg 1991 , S. 55). 122 Somit weiß der Lerner, welche Wörter er kennen muss, um die Wörterbuchdefinitionen verstehen zu können: „The reader knows exactly which words he is expected to know from the start“ (Ellegård 1978 , S. 232). Das ist wichtig, denn „die Bedeutungserklärungen [sind] für den fremdsprachigen Benutzer am schwersten zu verstehen, da ihm für die Rezeption oft Teile des Vokabulars fehlen“ (Kempcke 1992, S. 209). Die Vereinfachungen durch den kontrollierten Definitionswortschatz führen bei Standop für das LDOCE 1 zu dem euphorischen - wenn auch etwas pauschalisiert klingenden - Urteil: „Das Ergebnis ist bemerkenswert. An keiner Stelle hat man das Gefühl, dass Definitionen oder Beispiele simplifiziert oder unecht wirkten.“ (Standop 1981, S. 244). Im Zusammenhang mit der größeren Verständlichkeit gibt es noch einen weiteren Aspekt aus Lernersicht: In Wörterbüchern ohne begrenzten Definitionswortschatz wird ein nachgeschlagenes Lemma oft durch schwierigere Wörter erklärt, die zum Verständnis wiederum nachgeschlagen werden müssen. Dies führt dazu, „dass ein ausdauernder Benutzer in einer Art ‘kombinatorischer Explosion’ das ganze Wörterbuch konsultieren müsste“ (Köster/ Neubauer 1994, S. 226), wenn er alle Definitionen verstehen möchte. 123 Klein/ Randow (1990, S. 381) bezeichnen diesen Vorgang als „Querreferieren“. Mit dem 121 So bereits Cowie (1989, S. 47). 122 Vgl. auch Stein (1979, S. 6), Herbst (1986, S. 103). 123 Vgl. auch Baxter (1980 , S. 333f.). Zur Zirkeldefinition vgl. weiter unten im Kapitel. Theoretische Grundlagen 77 [...] berechtigten Wunsch des fremdsprachigen Wörterbuchbenutzers nach schneller und präziser Semantisierung [...], wie er ja auch in der z.T. massiven Kritik am unverständlichen oder zu hoch angesetzten Definitionsvokabular zum Ausdruck kommt (Zöfgen 1994a, S. 254), kann auch die Vorliebe der Nichtmuttersprachler für das zweisprachige Wörterbuch erklärt werden (vgl. Kap. 2.1.2). 124 Einige Forscher betonen jedoch, dass im Lernerwörterbuch die Verständlichkeit Vorrang vor der Genauigkeit und der Vollständigkeit haben sollte (Klein/ Randow 1990, S. 381). 125 Grundsätzlich gilt für Texte jeder Art - unabhängig davon, ob Wörterbuchdefinition oder nicht - als Richtwert, dass dem Rezipienten mindestens 95 Prozent der verwendeten Wortformen bekannt sein müssen, damit er einen Text verstehen kann. Für das selbstständige Erschließen von unbekanntem Vokabular aus dem Kontext erhöht sich diese Zahl sogar auf mindestens 97 Prozent (Tschirner 2006 , S. 1279). Wie stark unbekanntes Vokabular in Definitionen den Verstehensprozess beim Nachschlagen im Wörterbuch beeinträchtigen beziehungsweise ihn sogar verhindern kann, weisen inzwischen mehrere Untersuchungen nach. Eine Umfrage von Kharma (1985, S. 87) unter 284 Englisch lernenden Studierenden an der Kuwaiter Universität zeigt, dass schwieriges Definitionsvokabular mit 87 Prozent der am häufigsten genannte Grund für die Unzufriedenheit der Benutzer mit dem monolingualen Wörterbuch ist. Als Folge dessen schlagen dann auch 76 Prozent der Befragten vor, zur Verbesserung der einsprachigen Wörterbücher deren Definitionen zu vereinfachen (ebd.). Eine weitere Untersuchung dieser Art führt Müllich 1990 durch. Er lässt Englisch- und Französischschüler der Oberstufe eines bayerischen Gymnasiums während des Nachschlagens im Wörterbuch Benutzungsprotokolle führen. Aus dieser Konzipierung ergibt sich, dass es sich bei Müllichs Untersuchung „in keinem Fall um eine repräsentative Auswahl von ‘Testpersonen’ handelt; die erzielten Ergebnisse haben dementsprechend auch keine statistische Aussagekraft“ (Müllich 1990, S. 4). Die Arbeit kann dennoch „Aufschluss über gewisse Tendenzen geben“ (ebd.), sodass insgesamt „doch ein recht realistisches Bild über das Verhalten von Oberstufenschülern in den verschiedenen Klassenstufen bei der Wörterbuchbenutzung entsteht“ (ebd.). Als Wörterbücher stehen aus Gründen der Zulassung an Schulen für Englisch hauptsächlich das OALD 3 von 1974 und für Französisch der MR 1 (Micro-Robert 1) in der 124 Vgl. auch Baxter (1980, S. 333), Tomaszczyk (1983, S. 46). 125 Vgl. auch Heath/ Herbst (1988, S. 315f.), die mehrmals die Vorrangigkeit der Verständlichkeit betonen. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 78 Ausgabe von 1971 zur Verfügung. Teilweise wird für das Englische auch auf das LDOCE 2 von 1987 und das COBUILD 1 von 1987 sowie für das Französische auf den MR 2 (Micro-Robert 2) von 1988 und das DPF (Dictionnaire Pratique du Français) von 1987 eingegangen. Müllich (1990, S. 107) kommt in seiner Untersuchung zu dem Ergebnis, dass „unbekanntes Vokabular [...] innerhalb der Stichwortartikel nahezu omnipräsenter und omnipotenter Störfaktor ist“. 126 Der im MR 1-2 verwendete Definitionswortschatz ist „viel zu umfangreich und viel zu schwer“ (ebd., S. 145), „Bedeutungserklärungen, die tatsächlich völlig problemlos für die Schüler waren, blieben rühmliche Ausnahmen“ (ebd., S. 148). Die Schüler werden „durch jene ‘lexikografische Keule’ glatt niedergestreckt“ (ebd., S. 172). So urteilt Müllich (ebd., S. 178) abschließend: Hauptursache für die großen Schwierigkeiten der Schüler mit dem MR sind vor allem das zu hoch angesetzte Definitionsvokabular, das nicht als fest umrissener lexikalischer ‘Körper’ existiert, sondern aus der gesamten Lexik schöpft und einen unbekannten Begriff mit anderen solchen erklärt, und die esoterische Struktur des Wörterbuchs. [Hervorh. i. Orig.] Im Gegensatz dazu verursacht das OALD 3 kaum Probleme durch zu schwieriges Vokabular: „Im Vergleich zur Benutzung des MICRO-ROBERT ist die Anzahl der Fälle, in denen unverständliches Definitionsvokabular Fehlgriffe auslöste, verschwindend gering.“ (Müllich 1990, S. 220; Hervorh. i. Orig.). 1994 vergleicht Kostrzewa (1994, S. 4) selbst „konzipierte einsprachige, kontextuelle Bedeutungserklärungen für den Bereich des Englischen mit Wörterbuchbeispielen“. Als Wörterbücher werden das LDOCE 2 von 1987 und das COBUILD 1 von 1987 gewählt. Aufgrund der geringen Anzahl an Probanden (insgesamt 56) kann auch „diese Untersuchung lediglich Tendenzen aufzeigen, ohne repräsentativ zu sein“ (ebd ., S. 48). Die Versuchspersonen, fortgeschrittene erwachsene Fremdsprachenlerner, werden in einem ersten Durchgang gruppenweise auf Verstehens- und Behaltensleistungen der selbst konstruierten bzw. der Wörterbuchbeispiele getestet. Im zweiten Durchgang wird die Platzierung der zu vermittelnden Lexeme in den Texten verändert. Kostrzewas Tests ergeben ähnliche Verstehensleistungen für alle drei Gruppen, also unabhängig von den verwendeten Wörterbüchern oder den selbst verfassten Beispielen (ebd ., S. 49, 67): Die Gründe für die Ähnlichkeit der Verstehensleistungen in den drei untersuchten Gruppen sind möglicherweise darin zu sehen, dass sowohl meine eigenen Erklärungen als auch die aus den genannten Wörterbüchern entnommenen 126 Die Unterscheidung zwischen den Termini Lemma und Stichwort wird nicht in allen theoretischen und praktischen Arbeiten vorgenommen (Wolski 1989, S. 363ff.). Theoretische Grundlagen 79 Beispiele mit einem frequenten Grundwortschatz gebildet wurden [...]. Es zeigt sich bei der Auswertung der Testbögen deutlich, dass überall dort, wo sich die Erklärungen nicht eines frequenten Grundwortschatzes bedienen, die Verstehensleistungen erheblich niedriger liegen. (Kostrzewa 1994, S. 68) Unabhängig vom verwendeten Definitionsvokabular liegen die Behaltensleistungen bei den selbst konstruierten Beispielen jedoch deutlich höher. Kostrzewa führt das unter anderem auf deren größere Länge und die daraus resultierende höhere Zahl an Hinweisreizen sowie auf die häufiger vorkommenden und lernpsychologisch günstigen Redundanzen zurück (ebd . , S. 108ff.). Die umfangreichste und aktuellste Untersuchung führt Wingate 2002 unter nicht fortgeschrittenen Hongkonger Deutschlernern durch, in der das LWB 1 mit zweisprachigen Wörterbüchern verglichen wird. Zuerst wird „die Effektivität des zweisprachigen mit der des einsprachigen Wörterbuches verglichen“ (Wingate 2002, S. 292), anschließend „die Effektivität von zwei Arten von einsprachigen Worterklärungen, die unterschiedlichen Definitionsprinzipien folgen“ (ebd.). Obwohl die Lerner das zweisprachige Wörterbuch Deutsch- Englisch mit überwältigender Mehrheit favorisieren, zeigt die Studie, „that the preferred dictionary type is not significantly more effective for incidental word learning and reading comprehension than the monolingual dictionary“ (ebd., S. 121). Das Scheitern der Nachschlagehandlungen hat beim ein- und beim zweisprachigen Wörterbuch jedoch unterschiedliche Ursachen, wie anschließende Lautdenkstudien 127 unter den Probanden zeigen: The failures in the bilingual dictionary conditions were more attributable to learner-related reasons [...], i.e. lacking reference skills, while those in the monolingual condition were more attributable to dictionary-related reasons. The defining vocabulary was experienced as the main difficulty. (ebd.) Unbekanntes Definitionsvokabular im einsprachigen Wörterbuch als „the most common factor for unsuccessful look-ups“ (Wingate 2002, S. 114) führt in 41,7 Prozent der Fälle zum Misserfolg beim Nachschlagen. Insgesamt gibt es in 58,4 Prozent der Fälle Probleme aufgrund des Vokabulars, aufgrund der Definitionsstruktur oder aufgrund von Ableitungsdefinitionen. Als Ableitungsdefinition (derivational definition) wird eine Definition bezeichnet, die - meist aus Platzgründen - in der Erklärung auf ein morphologisch verwandtes Wort verweist, z.B. unwichtig auf ‘nicht wichtig’ (LTWDaF 2 2007, S. 466). Dies zwingt den Benutzer in den meisten Fällen zu einer weiteren Nachschla- 127 Lautdenkstudien stellen vor allem im Zusammenhang mit Benutzertests eine wichtige Methode dar. Die Probanden müssen dabei während der Ausübung bestimmter Handlungen genau aussprechen oder notieren, was sie sich gerade ansehen, was sie denken, fühlen und tun. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 80 gehandlung bei dem verwandten Lemma. 128 Hingegen sind die Probleme mit der Definitionsstruktur meist auf zu komplexe grammatische oder syntaktische Konstruktionen zurückzuführen. Wingate (2002, S. 120) schließt aus den Ergebnissen dieses Teils ihrer Untersuchung: „Even in the limited scale of this study, it became obvious that the LGDaF [LWB 1, A.T.] has characteristics which are unsuitable for intermediate learners, the most obvious one being the unrestricted defining vocabulary.“ Für den zweiten Teil der Studie konzipiert Wingate selbst 61 Definitionen, die sie als Neue Definitionen bezeichnet. Diese beruhen auf einem beschränkten Definitionswortschatz von weniger als 2 300 Wörtern und orientieren sich am satzartigen Definitionsstil der COBUILD-Wörterbücher. Im Vergleich mit den Definitionen des LWB 1 schneiden Wingates eigene Definitionen wesentlich besser ab. Die beiden Hauptmerkmale der NDefs [Neuen Definitionen, A.T.], nämlich das eingeschränkte Definitionsvokabular und die Ganzsatzerklärungen[,] konnten nicht als Testfaktoren isoliert werden, da sie allen Definitionen zugrunde liegen. Weil aber die Probanden, die die NDefs benutzten, signifikant besser abschnitten als die LGDaF-Gruppe [LWB 1-Gruppe, A.T.], ist davon auszugehen, dass diese Merkmale das Verständnis fördern. Besonders für die Effektivität des eingeschränkten Definitionsvokabulars gab es klare Nachweise in den Lautdenkstudien, in denen die NDef-Benutzer im Gegensatz zu den LGDaF-Benutzern [LWB 1-Benutzern, A.T.] nicht an unbekannten Definitionswörtern scheiterten. (Wingate 2002, S. 295) Aufgrund dieses empirischen Nachweises kann Wingate (ebd., S. 226) ein klares Plädoyer für die Verwendung eines beschränkten Definitionswortschatzes ableiten, denn es sei offenkundig, „that a monolingual dictionary or intermediate learners must have some kind of controlled defining vocabulary“. 129 Aber nicht nur im Rahmen dieser teilweise empirischen Studien, sondern auch aus der subjektiven Sicht der Lerner weist ein kontrolliertes Definitionsvokabular eindeutige Vorteile auf. Das zweite zentrale Pro-Argument für die Ver- 128 Weber bezeichnet diese Art von Definitionen als morpho-semantische Synonym- oder Paraphrasenexplikationen - je nachdem, ob die Definition aus einem morphologisch verwandten Synonym besteht oder ob dies in einer Paraphrase enthalten ist (Weber 1999, S. 214ff., 252ff.). 129 Ähnlich äußert sich bereits Jain (1981, S. 276). Vgl. jedoch die Studie von Nesi (2000, S. 92), in der durch die Verwendung eines kontrollierten Definitionsvokabulars keine Auswirkungen auf den Erfolg der Nachschlagehandlungen festgestellt werden (vgl. Kap. 2.3.1.2). Theoretische Grundlagen 81 wendung eines beschränkten Definitionswortschatzes besteht deshalb darin, dass dieser besser auf die Bedürfnisse der Lerner eingeht und so zur Erhöhung der Benutzerfreundlichkeit beiträgt (vgl. zuletzt Herbst/ Klotz 2003 , S. 49). 130 So ist es nicht verwunderlich, dass sich auch die Lerner für die Verwendung eines beschränkten Definitionswortschatzes einsetzen und diesen klar bevorzugen, wie MacFarquhar/ Richards bei einem Vergleichstest von 60 Definitionen dreier unterschiedlicher Wörterbücher feststellen (MacFarquhar/ Richards 1983, S. 119). Dabei handelt es sich mit Webster's New World Dictionary (1972) um ein Wörterbuch für Muttersprachler, mit dem LDOCE 1 (1978) um ein Lernerwörterbuch mit begrenztem Definitionswortschatz und mit dem OALD 3 (1974) um ein Lernerwörterbuch ohne kontrolliertes Definitionsvokabular, das sich jedoch um einfache Definitionen bemüht (OALD 3 1974, S. VIII). 131 Von den 180 Teilnehmern bevorzugen - relativ unabhängig vom Sprachniveau - 51,5 Prozent die LDOCE 1-Definitionen. Das OALD 3 erreicht 28,5 Prozent, das Webster's New World Dictionary 20 Prozent (Mac- Farquhar/ Richards 1983, S. 121). Damit liegt das Lernerwörterbuch mit dem kontrollierten Definitionswortschatz klar vor dem Lernerwörterbuch ohne kontrolliertes Definitionsvokabular und dem Wörterbuch für Muttersprachler. Neubauer stellt fest, das begrenzte Definitionsvokabular vermeide durch seine Vereinfachung Frustration beim Benutzer (Neubauer 1989, S. 900) und auch Antor (1994, S. 78f.) merkt an: Dies [die möglichst einfache Beschreibung des Lemmas im Lernerwörterbuch, A.T.] ist allein schon aus motivationspsychologischen Gründen von Bedeutung. Es muss unter allen Umständen vermieden werden, dass beim Konsultieren eines Eintrages eine Art derridascher différance-Effekt entsteht und die gegebene Definition eine schier unendliche Kette weiterer Nachschlagevorgänge erfordert, bevor die gesuchte Wortbedeutung endlich klar wird. [Hervorh. i. Orig.] 132 Wellmann (2002, S. 130) sieht im kontrollierten Definitionswortschatz die Lösung für das so genannte Benutzerparadox. Darunter versteht er das Problem, dass bei Lernerwörterbüchern der Benutzer die Sprache erst lernt, deren Wörterbuch er benutzt, um ein Wort zu verstehen, das er nicht kennt und deshalb nachschlägt. [...] Es [das Benutzerparadox, A.T.] besteht in der Schwierigkeit, dass etwas klar, deutlich und sachgerecht beschrieben wird und doch zugleich auch leicht und lernerverständlich ist. 130 Vgl. auch Tickoo (1989, S. 188), Herbst (1996, S. 322). 131 Vgl. auch MacFarquhar/ Richards (1983, S. 119). 132 Der Bezug zur différance besteht in der Verweisfunktion der Zeichen (vgl. Derrida 1990, S. 106ff.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 82 Die zweite Gruppe an Vorzügen des begrenzten Definitionsvokabulars betrifft die pädagogisch-didaktische Perspektive, die auch die Lehrer umfasst. Wenn der kontrollierte Definitionswortschatz auf vernünftigen pädagogischen Überlegungen basiert, erhöht sich der Lerneffekt beim Benutzer, denn „it [the controlled defining vocabulary, A.T.] serves as firm foundation for the necessary further building-up of his [the reader's, A.T.] vocabulary“ (Ellegård 1978 , S. 231). Der kontrollierte Definitionswortschatz dient dabei vor allem der Strukturierung der Lexeme, weil durch die regelmäßige Konsultation des Wörterbuchs beim Lerner „a knowledge of genus or superordinate terms“ (Baxter 1980 , S. 334) aufgebaut wird. Auch als Grundlage für die Unterrichtssprache ist er von Bedeutung, denn sowohl im gesteuerten, [sic] als auch im ungesteuerten Fremdsprachenerwerb benötigen die daran Beteiligten einen gewissen Definitionswortschatz, beispielsweise um Bedeutungen zu erklären oder zu erfragen, um unbekannte Vokabeln durch bekannte oder durch Paraphrasen zu ersetzen etc. (Scherfer 1985 , S. 417) Mithilfe des beschränkten Definitionsvokabulars können weiterhin Texte für den Fremdsprachenunterricht vereinfacht werden (Neubauer 1987, S. 54), wobei es sich „zweifelsohne [um] ein lohnendes und besonders dem anvisierten foreign learner willkommenes Unterfangen“ (Jehle 1990b, S. 502; Hervorh. i. Orig.) handelt. Dabei ermöglicht der kontrollierte Definitionswortschatz dem Lerner einerseits „access to the dictionary at an earlier stage of language learning“ (Wingate 2002 , S. 30), andererseits ist dieser jedoch nicht nur für das Anfängerwörterbuch geeignet (Herbst 1986, S. 112). Die dritte Gruppe von Argumenten, die für die Begrenzung des Vokabulars in Definitionen sprechen, wird vor allem aus der Sicht der Lexikografen angeführt. Sehr häufig erwähnt wird die mögliche Vermeidung des lexikografischen Zirkels (vgl. zuletzt Kiefer/ Sterkenburg 2003, S. 357). 133 Der so genannte lexikografische Zirkel, oft auch als Zirkeldefinition bezeichnet, umschreibt in seiner kürzesten Form die Definition eines Lemmas A durch das Lemma B und die gleichzeitige Definition des Lemmas B durch das Lemma A, sodass in einem Wörterbuch ein Eintrag auf den anderen verweist und um- 133 Zum lexikografischen Zirkel vgl. auch Weinreich (1967, S. 30), Henne (1976, S. 106), Bredemeier/ Jansen/ Petöfi (1977, S. 81), Neubauer (1980, S. 2ff.), Kempcke (1982, S. 54f.), Werner (1982, S. 66), Kempcke (1983, S. 161), Hausmann (1984, S. 54), Müller (1984, S. 399f.), Neubauer (1984, S. 117), Hausmann (1985, S. 374), Zöfgen (1985b, S. 39), Hurk/ Meijs (1986, S. 100), Knowles (1987, S. 21), Neubauer (1989, S. 900), Piotrowski (1989, S. 78), Wiegand (1989c, S. 547), Wierzbicka (1989a, S. 104), Klein/ Randow (1990, S. 381), Battenburg (1991, S. 55), Zöfgen (1994a, S. 132), Wierzbicka (1996, S. 11), Schnelle (1997, S. 140f.). Theoretische Grundlagen 83 gekehrt. Dabei muss der Zirkel nicht in dieser kürzesten Form bestehen, es können auch weitere Definitionen zwischengeschaltet sein. Letzten Endes sind jedoch alle Definitionen im monolingualen Wörterbuch mehr oder weniger in diesem Zirkel gefangen. Denn die definierende Sprache und die Sprache des Definierten unterscheiden sich nicht voneinander, Metasprache und Objektsprache sind identisch (vgl. zuletzt Kempcke 1992, S. 209). 134 Zirkularität muss aber nicht unbedingt als Nachteil angesehen werden: „The circularity which results [from the terms with similar meanings, A.T.] should be frankly admitted, not as a vice, but as a guiding principle of lexicography“ (Weinreich 1967 , S. 30). 135 So auch Wiegand (1977, S. 64) : 136 Einsprachige Wörterbücher müssen, wenn es um die Wortbedeutung geht, in derjenigen Sprache bleiben, die sie kodifizieren. [...] Der lexikografische Zirkel ist nicht ihre Crux, sondern Ausdruck einer ihrer wichtigsten Voraussetzungen. Er ist es, der sie benutzbar macht! Man muss nur sinnvoll mit ihm umgehen. Trotz der grundsätzlichen Unvermeidbarkeit des lexikografischen Zirkels in monolingualen Wörterbüchern sollte ein zu kurzer Zirkel in der Art von A = B und B = A jedoch auf jeden Fall verhindert werden (vgl. zuletzt Wellmann 2004, S. 94). 137 Als Lösung schlägt Neubauer (1980, S. 9) vor: Die vorgeschlagene Strategie zur Vermeidung von Zirkularität innerhalb des Wörterbuchs [besteht] darin, eine bestimmte Menge von in den Explikationen vorkommenden Einheiten zu nicht weiter zu explizierenden primitiven Einheiten zu erklären. 138 134 Vgl. auch Zgusta (1971, S. 257), Kempcke (1982, S. 54f.), Werner (1982, S. 66), Kempcke (1983, S. 161) sowie Hernández (1989, S. 53, 86). An dieser Stelle sei dahingestellt, ob es sich im Dictionary of Lexicography von Hartmann/ James bei dem Verweis des Lemmas circular reference auf reference circularity und umgekehrt (ohne Erklärung) um einen Fehler, eine besonders treffende Beschreibung des Phänomens oder um einen kleinen Scherz unter Lexikografen handelt. 135 Vgl. auch Hernández (1989, S. 86), Svensén (1993, S. 136). 136 Wiegand (1977, S. 64) spricht sich allerdings gegen den Gebrauch der Bezeichnung Metasprache in der Lexikografie aus und möchte stattdessen Kommentarsprache verwenden: „Wir benutzen [...] den Ausdruck Kommentarsprache für diejenige Sprache (oder Sprachen), die die kodifizierte Sprache - auf den verschiedenen Ebenen - kommentiert.“ (Hervorh. i. Orig.). 137 Vgl. auch Wiegand (1977, S. 64), Ellegård (1978, S. 233), Viehweger (1982, S. 148), Klare (1988, S. 23), Vossen/ Meijs/ Broeder (1989, S. 190), Hausmann (1990, S. 225), Béjoint (1994/ 2000, S. 202f.). 138 Vgl. auch Henne (1976, S. 106): „Dieser Zirkularität könnte man partiell ausweichen, indem man einen elementaren semantischen Wortschatz, also einen semantischen Grundwortschatz G konstituiert, der als definierender (oder erklärender) Bestandteil nicht, zirkulär oder durch eine ‘fremde’ Sprache erklärt wird.“ (Hervorh. i. Orig.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 84 Einerseits entspricht dieses Vorgehen also der Zusammenstellung eines begrenzten Definitionswortschatzes in den englischsprachigen Wörterbüchern, wenn dieser beim Benutzer als bekannt vorausgesetzt wird (vgl. Kap. 2.4.1). In diesem Fall verwendet der Benutzer das Definitionsvokabular in der Funktion eines elementaren Wortschatzes, der nicht nachgeschlagen wird. Damit steht dieses Vorgehen andererseits in einem engen Zusammenhang zu der Suche nach semantischen Primitiva im Rahmen der Sprachphilosophie (vgl. Kap. 2.2.2). Für Landau wird das Prinzip der Vermeidung von Zirkeldefinitionen, das für ihn das wichtigste lexikografische Prinzip darstellt, jedoch gerade in den englischsprachigen Lernerwörterbüchern mit einem kontrollierten Definitionswortschatz häufig verletzt, weil dieser ja auch bei der Definition von Wörtern aus dem beschränkten Definitionsvokabular selbst genutzt wird. Zu Zirkeldefinitionen kommt es ebenfalls besonders oft bei der Definition einfacher Lemmata, um dort nicht auf seltene und dem Lerner unverständliche Formulierungen zurückgreifen zu müssen (Landau 2001, S. 157f.). Der nächste entscheidende Vorteil eines kontrollierten Definitionsvokabulars besteht aus der Perspektive der Lexikografen in der Art der Definitionssprache, die trotz der Vereinfachungen durch Präzision und Korrektheit gekennzeichnet sein kann. 139 Somit können die Definitionen sowohl den an sie gestellten Korrektheitsals auch den Verständlichkeitsanspruch erfüllen (Herbst 1986, S. 112). In dieser Weise urteilen auch Friederich (1980, S. 31), der speziell dem LDOCE 1 „einfache, klare Definitionen“ bescheinigt, und Battenburg (1991, S. 55): „In theory, using a controlled defining vocabulary allows dictionary definitions to be written in plain, simple English.“ In diesem Zusammenhang äußert Neubauer den Gedanken der Ökonomie. West erklärt mit 1 490 Wörtern rund 24 000 Lemmata, im LDOCE 1 können mit einem Definitionsvokabular von 2 280 Wörtern bereits mehr als doppelt so viele Lemmata beschrieben werden. Die Menge des Definitionswortschatzes und die der definierten Lemmata verhalten sich also nicht proportional zueinander, sodass „der geringeren Steigung der Zahl der Einheiten im Explikationsvokabular eine größere Steigung der Zahl der Lemmata entspricht“ (Neubauer 1980, S. 51). Ist erst einmal eine bestimmte Anzahl von Elementen im Definitionsvokabular erreicht, sind bei der Ausweitung der Anzahl der zu definierenden Wörter nur noch kleinere Ergänzungen im Definitionswortschatz notwendig. 140 Einen ebenfalls zentralen, jedoch ganz anderen positiven Aspekt des beschränkten Definitionsvokabulars spricht Herbst an. Hier kommt erstmals der 139 Vgl. Herbst (1986, S. 110), Klein/ Randow (1990, S. 375, 381), Rundell (1998, S. 319). 140 Zu diesem Abschnitt vgl. Neubauer (1980, S. 51f.; 1984, S. 118). Theoretische Grundlagen 85 Lexikograf ins Blickfeld, den der begrenzte Definitionswortschatz beim Verfassen der Wörterbuchartikel zur Disziplin zwingt: „The main function of such a rigorous approach is perhaps one of ensuring lexicographical discipline by forcing the lexicographer to check all alternatives before using a difficult word.“ (Herbst 1990, S. 1382). Später führt Herbst (1998, S. 23) aus: Der Gewinn [besteht] in einer gewissen Disziplinierung der Lexikografen, die vom Computer auf alle nicht in der kontrollierten Liste enthaltenen Wörter, die sie in den Definitionen verwenden, aufmerksam gemacht werden, um möglicherweise nach einer einfacheren Lösung zu suchen. Damit stellt das kontrollierte Definitionsvokabular gleichzeitig eine Möglichkeit der Sprachkontrolle dar (Wingate 2002 , S. 30), durch die in den Definitionen innerhalb eines Wörterbuchs höhere Konsistenz durchgesetzt wird. 141 Die dadurch erreichte Einheitlichkeit in der Definitionssprache spielt vor allem in größeren Wörterbuchredaktionen eine Rolle, da so die individuellen Definitionsstile der einzelnen Artikelschreiber zumindest in Fragen zum Vokabular auf Redaktionsebene relativ leicht in Übereinstimmung gebracht werden können. Dafür ist allerdings auch eine hohe Disziplin vonseiten der Lexikografen nötig, wenn eine eindeutige Grundbedeutung für die Lexeme des kontrollierten Definitionsvokabulars gesucht werden muss (Ayto 1984, S. 54) oder wenn entschieden werden soll, an welcher Stelle zusätzliche Wörter verwendet werden: „Where exactly this [the use of words outside the defining vocabulary, A.T.] seems appropriate or necessary is however a decision that requires ‘tact’ and ‘skill’ of the individual lexicographer.“ (Herbst 1986, S. 112). Bis in die Achtzigerjahre glaubt die Forschung noch an die mögliche Übertragbarkeit des für eine Sprache erstellten beschränkten Definitionswortschatzes auf andere Sprachen (Bredemeier et al. 1977 , S. 81) in der Art einer übereinzelsprachlichen Minisprache aus semantischen Primitiva, auf deren Suche sich Wierzbicka begeben hat (vgl. Kap. 2.2.2). So stellt Neubauer (1980, S. 49) eine erstaunliche Übereinstimmung zwischen dem Definitionsvokabular unterschiedlicher Sprachen fest und fordert auf längere Sicht mehrmals einen Abgleich des Definitionswortschatzes der verschiedenen Sprachen (Neubauer 1984, S. 122; 1987, S. 54). Von dem Glauben an die potenzielle Übersetzbarkeit des kontrollierten Definitionsvokabulars hat sich die Forschung inzwischen verabschiedet. Für Sprachen wie das Deutsche wird die Existenz eines begrenzten Definitionswortschatzes teilweise sogar vollständig infrage gestellt (vgl. Kap. 2.4.2). Insgesamt sind sich die meisten Wissenschaftler und Wörterbuchrezensenten einig, dass es sich bei dem beschränkten Definitionswortschatz um eine „we- 141 Vgl. Herbst (1986, S. 112), Svensén (1993, S. 137). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 86 sentliche und begrüßenswerte Neuerung“ (Standop 1981, S. 243) handelt, die „im Allgemeinen in wissenschaftlichen wie in populärwissenschaftlichen Rezensionen großen Anklang [findet]“ (Jehle 1990a, S. 110). Die Verwendung des kontrollierten Definitionswortschatzes stellt „zweifelsohne ein lohnendes und besonders dem anvisierten foreign learner willkommenes Unterfangen“ (Jehle 1990b, S. 502; Hervorh. i. Orig.) dar, deren Vorteile klar überwiegen. 142 Das begrenzte Definitionsvokabular erfüllt seinen Anspruch, den in den Definitionen verwendeten Wortschatz einzuschränken, da nach einer Untersuchung von Herbst am LDOCE 1 in weniger als sieben Prozent der analysierten Definitionen Wörter außerhalb des beschränkten Definitionswortschatzes vorkommen (Herbst 1986, S. 108). 143 Dieser Grundsatz „has been a success“ (Herbst 1996, S. 324) und so „lässt sich für die englische Lernerlexikografie heute mit Sicherheit sagen, dass sich dieser Ansatz bewährt hat“ (Herbst 1998, S. 23). Denn „mittlerweile [behaupten] alle englischen Lernerwörterbücher dieser Größe [...], von einem begrenzten Definitionswortschatz dieser Art auszugehen“ (Herbst/ Klotz 2003 , S. 49). 144 Man kann für die englischsprachige Lexikografie von einer „well established practice“ (Bogaards 2002, S. 650) sprechen. Das kontrollierte Definitionsvokabular kann demzufolge als ein „Charakteristikum moderner Learner's Dictionaries“ (Carstensen 1988 , S. 45; Hervorh. i. Orig.) gelten. 145 „The result of using the vocabulary is the fulfilment of one of the most basic lexicographic principles - that is that the definitions are always written using simpler terms than the words they describe.“ (LDOCE 1 1978, S. IX; Hervorh. i. Orig.). Die Kontrolle des in den Definitionen verwendeten Vokabulars macht aus monolingualen Wörterbüchern Lernerwörterbücher (Neubauer 1987, S. 50), denn „learners' dictionaries and native speaker dictionaries require different kinds of definition“ (Herbst 1996, S. 324). 146 Dies lässt Bald (2002, S. 189) schlussfolgern: „For learners' dictionaries now a defining vocabulary seems to have become obligatory.“ 147 Ein solches Vorgehen wird zunehmend auch für Lernerwörterbücher anderer Sprachen, beispielsweise des Deutschen, gefordert (Barz/ Schröder 1996, S. IV). Inwieweit dies sinnvoll ist, zeigt nicht zuletzt diese Arbeit. 142 Vgl. Carter/ McCarthy ( 1988 , S. 54), Carter (1998, S. 153). 143 Für die Ergebnisse der eigenen Untersuchung vgl. Kapitel 3.3.1 und 3.4.1. Dort geht es jedoch um den computerkontrollierten Definitionswortschatz, nicht um die Einhaltung des kontrollierten Definitionswortschatzes, wodurch sich zum Teil andere Ansprüche ergeben. 144 Ähnlich äußern sich Herbst (1990, S. 1381) und später Herbst/ Klotz (2003 , S. 49). 145 Vgl. auch Rundell (1998, S. 332), Cowie (1999b, S. 175). 146 Vgl. auch MacFarquhar/ Richards (1983, S. 114), Kirkpatrick (1985, S. 10), Neubauer (1989, S. 900), Wingate (2002, S. 30). 147 Vgl. auch Wingate ( 2002 , S. 226). Theoretische Grundlagen 87 2.3.1.2 Argumente gegen den Einsatz eines kontrollierten Definitionswortschatzes in Lernerwörterbüchern So umfangreich die Gründe sind, die für die Verwendung eines kontrollierten Definitionsvokabulars sprechen, es gibt ebenfalls eine große Zahl an Gegenargumenten. Wie die Pro-Argumente gehen auch die Kontra-Argumente oft ineinander über und können deshalb teilweise schlecht voneinander abgegrenzt werden. Gegen den Gebrauch eines begrenzten Definitionsvokabulars spricht erstens das Missverhältnis zwischen der angegebenen und der tatsächlichen Größe des verwendeten Definitionswortschatzes, das sich in dessen nicht festgeschriebener Bedeutung, der Verwendung des kontrollierten Definitionswortschatzes in Wortbildungsprodukten oder Mehrwortlexemen sowie der Verwendung zusätzlicher Wörter in den Definitionen zeigt (vgl. Kap. 2.4.1.2). Zweitens geht es um eine grundsätzliche Ungeeignetheit des kontrollierten Definitionsvokabulars, wenn es in seltenen Bedeutungen gebraucht wird oder nicht frequente Lexeme beinhaltet, weil typische Kollokationen unterdrückt werden oder weil z.B. Abstrakta oder Fachtermini damit nicht definiert werden können. Die dritte Gruppe von Argumenten betrifft die Sprache der Definitionen. Sie umfasst zum einen Wertungen von Wissenschaftlern, die eher auf deren persönlichem Sprachempfinden beruhen und den Definitionen mit kontrolliertem Definitionsvokabular eine zu starke Vereinfachung, Unnatürlichkeit, Umständlichkeit oder Unverständlichkeit vorwerfen. Zum anderen gehören zu dieser Gruppe auch objektivere Argumente, wie der größere Umfang und die komplexere Syntax von Definitionen mit begrenztem Definitionswortschatz. Viertens erachten manche Wissenschaftler den gesamten Ansatz als nicht notwendig und bemängeln die Zufälligkeit des ausgewählten Vokabulars. Im Folgenden werden die Argumente im Einzelnen ausführlicher dargestellt. Das in der Literatur am häufigsten genannte Argument gegen die Verwendung eines kontrollierten Definitionswortschatzes betrifft die nicht festgeschriebene Bedeutung des Definitionswortschatzes: The conscientious user of the dictionary perhaps not sure of the meanings of the words in the explanation would run into difficulties if he/ she would try to look up what these words from the defining vocabulary are really supposed to mean. (Neubauer 1984, S. 118) 148 Denn durch die Aufnahme eines Lexems in die Liste des beschränkten Definitionsvokabulars wird in den Definitionen meist nur die Verwendung seiner for- 148 Wilks et al. (1989, S. 196ff.) problematisieren in ihrem Aufsatz ebenfalls das Thema der Bedeutungsunterscheidung in Wörterbüchern. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 88 malen Seite kontrolliert, nicht aber die Verwendung seiner Bedeutungsseite. Die in der Liste des Definitionswortschatzes enthaltenen Strukturen werden folglich nicht als lexikalische Einheiten von genau einer Wortform mit genau einer Bedeutung wahrgenommen, wie Cruse den Terminus versteht (vgl. Kap. 2.1.1, Anm. 7). Vielmehr wird ein Lexem in ganz unterschiedlichen Bedeutungen verwendet. Bei einer Untersuchung an den Definitionen des LDOCE 1 stellen Jansen/ Mergeai/ Vanandroye fest, dass lediglich 20,19 Prozent - also 632 Wörter - des Definitionswortschatzes monosem sind und nur 40 Prozent der Definitionen verständlich sind, wenn man jeweils die erste im LDOCE 1 verzeichnete Bedeutung der nicht monosemen Wörter zugrunde legt (Jansen/ Mergeai/ Vanandroye 1987, S. 84). 149 Würden alle 1 490 Lexeme der Liste von West (A General Service List of English Words) nach den unterschiedlichen Bedeutungen getrennt aufgelistet, in denen sie in den Definitionen in Erscheinung treten, ergäbe sich bereits mehr als die dreifache Anzahl, nämlich die Menge von 4 607 lexikalischen Einheiten (Neubauer 1984, S. 118). 150 Genau die Festschreibung der Bedeutung ist es jedoch, die dem Lerner das Verstehen der Wörterbuchdefinitionen erleichtert (Baxter 1980 , S. 334). Dass so viele polyseme Lexeme im Definitionsvokabular zu finden sind, hängt auch mit der Tatsache zusammen, dass bei seiner Erstellung das Frequenzkriterium sehr oft eine Rolle spielt und häufig vorkommende Wörter meist polysem sind (vgl. zuletzt Rundell 1998, S. 319). 151 Die eigentliche Schwierigkeit stellt dabei jedoch nicht die grundsätzlich existierende Polysemie der im Definitionswortschatz aufgelisteten Lexeme dar. Vielmehr liegt das Problem in der nicht immer vorhandenen Beschränkung der verwendeten Lesarten in den Definitionen, also die Verwendung des Definitionsvokabulars in mehr als einer Bedeutung (vgl. zuletzt Béjoint 1994/ 2000, S. 69). 152 So stellt Béjoint (ebd.) fest: „Of course, the dictionary does not say which of the senses are used, or wether they are all used, or how many. The notion of ‘word’, in that particular 149 Aus dem Aufsatz geht nicht hervor, um welche Auflage des LDOCE es sich handelt - die erste von 1978 oder die zweite von 1987. Da zum Wörterbuch keine näheren Angaben gemacht werden und aus dem LDOCE 1 zitiert wird, ist es wahrscheinlich die erste. 150 Neubauer spricht irrtümlicherweise von 1 480 Lexemen. 151 Vgl. auch Cowie (1983b, S. 136f.), Vossen/ Meijs/ Broeder (1989, S. 174), Battenburg (1991, S. 57), Zöfgen (1994a, S. 135f.). 152 Vgl. auch Fries/ Traver (1950, S. 89), Ellegård (1978, S. 231), Neubauer (1980, S. 13), Hausmann (1985, S. 374f.), Zöfgen (1985b, S. 41), Hurk/ Meijs (1986, S. 118), Hanks (1987, S. 119), Neubauer (1987, S. 52; 1989, S. 903), Hausmann (1990, S. 228), Jehle (1990a, S. 209; 1990b, S. 503), Battenburg (1991, S. 57), Svensén (1993, S. 136), Zöfgen (1994a, S. 135f.), Herbst (1996, S. 325; 1998, S. 23), Landau (2001, S. 160), Bald (2002, S. 197f.), Herbst/ Klotz (2003, S. 53). Theoretische Grundlagen 89 case, is misleading.“ Neubauer (1989, S. 903) will mit seiner folgenden Kritik keinesfalls die Verdienste der Wörterbuchredakteure schmälern, sondern nur auf die Vernachlässigung dieser Frage hinweisen: It is only meant to show that sense differences as part of vocabulary control are not really recognized as a potential problem by dictionary makers, although especially if the different senses constitute concrete and abstract meanings of the same word form, this is sometimes very difficult to understand for the dictionary user. Bei manchen der im kontrollierten Definitionsvokabular aufgelisteten Wörter handelt es sich nicht einmal um Polyseme, sondern um Homonyme, deren Bedeutungen folglich in keiner Weise miteinander verbunden sind, was von mehreren Forschern kritisiert wird. Jehle (1990b, S. 503) nennt als „Fälle grammatischer Homonymie“ die Beispiele right und well. 153 Hausmann (1990, S. 228) bemängelt, dass bisher noch kein Wörterbuch auf Semembasis existiert, wofür Zöfgen (1994a, S. 136) den Grund in der Polysemie und Homonymie des Definitionsvokabulars sieht: „Nicht zuletzt deshalb gibt es gegenwärtig auch kein einziges L 2-Wörterbuch, das den Definitionswortschatz auf der Ebene der Sememe wirklich kontrolliert.“ 154 Auch Bald (2002, S. 198) sieht an dieser Stelle Handlungsbedarf: „If the defining vocabularies are to play the role of a guiding principle to vocabulary study it would appear to be necessary to increase the consistency of the semantic definitions within the defining vocabulary.“ Herbst/ Klotz (2003, S. 53) sprechen sich ebenfalls für eine Bedeutungsbeschränkung des Definitionsvokabulars in den Definitionen aus: Im Hinblick auf die Zielsetzungen dieser Definitionspolitik wäre ja wenig gewonnen, wenn ein zwar hochfrequentes Wort in einer sehr seltenen Bedeutung in einer Definition vorkäme. Aus diesem Grund muss die Verwendung der Wörter eines begrenzten Definitionswortschatzes klaren Restriktionen hinsichtlich der in den Definitionen zulässigen Bedeutungen unterliegen. [...] Das Hauptproblem in diesem Zusammenhang ist [...,] dass die Überprüfung des in den Definitionen vorkommenden Wortschatzes durch Computer - im Augenblick jedenfalls - eben nur die formale, nicht aber die inhaltliche Seite erfasst, sodass ein wichtiger Kontrollmechanismus in dieser Hinsicht nicht greift. 153 Mit dieser Frage setzen sich auch andere Forscher auseinander, vgl. Jansen/ Mergeai/ Vanandroye (1987, S. 85), Jehle (1990a, S. 110), Battenburg (1991, S. 57), Zöfgen (1994a, S. 135f.). 154 Dass sich an dieser Einschätzung auch in den vergangenen Jahren nichts verändert hat, liegt vor allem am Fehlen semantisch aufbereiteter Korpora, aus denen semantisch kontrollierte Lernerwörterbücher erstellt werden könnten (Lenz 2000, S. 11f.; Lemnitzer/ Zinsmeister 2010, S. 85). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 90 Das nächste Argument der Gegner eines beschränkten Definitionswortschatzes hängt eng mit dem ersten zusammen und bezieht sich darauf, dass im kontrollierten Definitionswortschatz oft keine Trennung nach Wortarten erfolgt (vgl. zuletzt Bald 2002 , S. 191). 155 Auch hier spielt die Auswahl des Definitionsvokabulars nach der Häufigkeit wieder eine Rolle: „The CV [controlled vocabulary, A.T.] items are on the whole high-frequency words, and it is a well known problem that the most frequent words are also the most ambiguous ones with regard to their possible parts of speech.“ (Vossen/ Meijs/ Broeder 1989, S. 174). Neubauer bemängelt diese Tatsache bereits 1984 und führt später Beispiele dafür aus dem LDOCE 1 an. So wird bei nur einmaliger Nennung in der Liste des kontrollierten Definitionswortschatzes close in den Definitionen als Verb, Adjektiv und Adverb verwendet, clean oder clear als Verb und Adjektiv (Neubauer 1987, S. 52). 156 Ebenfalls in diese Richtung zielt die nächste Gruppe von Gegenargumenten, die sich auf die Behandlung lexikalischer Einheiten bezieht (vgl. Kap. 2.1.1, Anm. 7). Bereits 1934 auf der Carnegie-Konferenz machen sich die Teilnehmer Gedanken über dieses Problem (vgl. Kap. 2.2.1.3). Im zweiten Teil des Interim Reports, der eine Reihe möglicher Forschungsbereiche enthält, betrifft der erste Punkt beispielsweise das Verständnis von Komposita allein aus der Kenntnis ihrer Konstituenten heraus. 157 Der zweite Punkt regt an, das Verstehen von Derivaten zu untersuchen, der dritte Vorschlag zielt auf die Erforschung des Verstehens von festen Wortgruppen (Phraseologismen oder Kollokationen). Das LDOCE 1 verwendet nach eigenen Angaben nur semantisch transparente Komposita aus Bestandteilen des kontrollierten Definitionswortschatzes sowie „easily understood derivatives“ (LDOCE 1 1978, S. IX) mit Affixen aus einer Liste, die der Aufstellung des Definitionsvokabulars angegliedert ist (vgl. Kap. 2.4.1.1 und 2.4.1.4). Diese Wortbildungsprodukte, die mit Wortbildungsmitteln aus der festgeschriebenen Liste des Definitionswortschatzes gebildet werden, sind selbst nicht als Bestandteil des beschränkten Definitionsvokabulars verzeichnet. Trotzdem werden sie in den Definitionen verwendet, was in der Forschung reichlich Anlass zur Kritik gibt. 155 Vgl. auch Stein (1979, S. 5), Neubauer (1984, S. 118f.), Jansen/ Mergeai/ Vanandroye (1987, S. 83), Neubauer (1987, S. 52), Vossen/ Meijs/ Broeder (1989, S. 174). 156 Ähnliche Beispiele finden sich in Svensén (1993, S. 137) und Bald (2002, S. 191); vgl. auch Kapitel 2.4.1. 157 Mit diesen „internen Bedeutungsbeziehungen“ bei Komposita, die vor allem bei fremdsprachigen Lernern problematisch sind, beschäftigt sich beispielsweise der Aufsatz von Wellmann (1993, S. 155ff.). Zu den Schwierigkeiten von Nichtmuttersprachlern beim Verstehen von Wortbildungsprodukten vgl. auch Fandrych/ Thurmair (1994, S. 34f.) und Hallsteinsdóttir (2000). Theoretische Grundlagen 91 Schon Ellegård weist auf dieses Problem der nicht berücksichtigten Derivate und Komposita hin (Ellegård 1978, S. 231); die Ableitungen allein werden auch bei anderen Forschern problematisiert, beispielsweise von Stein, Herbst und Cowie. 158 Herbst macht darauf aufmerksam, dass die Restriktionen der Wörterbuchredaktionen in dieser Hinsicht nicht weit genug gehen und nennt als nicht erschließbare Beispiele im LDOCE 1 nonsense (verzeichnet sind non- und sense) und roller (in der Bedeutung ‘Walze’, aus roll und -er) (Herbst 1986, S. 104). 159 Bald (2002, S. 198) schließt daraus, wie wichtig und notwendig es für die Zukunft ist, „to control more precisely the morphological derivations and compounds“. Ein weiterer wichtiger Punkt wird erstmals von Jansen/ Mergeai/ Vanandroye angesprochen - die Bildung der mehrgliedrigen Verben ( phrasal verbs) aus Verben und Präpositionen, deren Gesamtbedeutung nicht aus der Semantik ihrer Bestandteile erschlossen werden kann. Aus diesem Grund sollte ihre Verwendung in den Definitionen vermieden werden; dessen ungeachtet werden sie dort gebraucht (Jansen/ Mergeai/ Vanandroye 1987, S. 88ff.). 160 Auch Herbst (1986, S. 104) - der diese Verben als „compound verbs“ bezeichnet - und Hanks führen hierfür Beispiele an: give up, wear away (ebd.) sowie stick out (Hanks 1987, S. 119). Neben den mehrgliedrigen Verben sind auch die Phraseologismen höchst problematisch, da auch deren Bedeutung für einen Nichtmuttersprachler nicht aus den Einzelbestandteilen erschließbar ist. Ihre Verwendung in den Definitionen eines Wörterbuchs sollte aus diesem Grund ebenfalls vermieden werden (vgl. zuletzt Cowie 1999b, S. 158). 161 Da Cowie jedoch argumentiert, idiomatische Ausdrücke „make an essential contribution to the naturalness of the defining language“ (ebd.), spricht dies grundsätzlich gegen die Verwendung eines kontrollierten Definitionsvokabulars. Die Untersuchung von Herbst aus dem Jahr 1986 zum beschränkten Definitionswortschatz des LDOCE 1 ergibt zunächst, dass beinahe in jedem zweiten Eintrag - nämlich in 222 von 500 zufällig ausgewählten und getesteten Wörterbuchartikeln - zusätzliche Wörter außerhalb des kontrollierten Definitionsvokabulars vorkommen. Dies erscheint auf den ersten Blick ziemlich viel, muss bei näherer Betrachtung jedoch unbedingt relativiert werden. Denn oft handelt es sich bei diesen Wörtern um Synonyme, die als Spezialisierungen 158 Für die genauen Quellen siehe Stein (1979, S. 5), Kirkpatrick (1985, S. 10), Jansen/ Mergeai/ Vanandroye (1987, S. 83), Svensén (1993, S. 137), Herbst (1996, S. 325), Cowie (1999b, S. 110). 159 Ähnlich auch Whitcut (1988, S. 52). 160 Vgl. auch Zöfgen (1985b, S. 41), Whitcut (1988, S. 52), Cowie (1999b, S. 157). 161 Vgl. auch Jansen/ Mergeai/ Vanandroye (1987, S. 91), Zöfgen (1985b, S. 41). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 92 und für die Bildung von Wortfeldern für Teile der Definition zusätzlich in Klammern angegeben werden. Diese sind laut Herbst für das Verständnis der Definition nicht notwendig. Gleiches gilt auch für Synonyme, die der gesamten Definition nachgestellt werden. In anderen Artikeln sind es in Form von Kreuzverweisen angegebene Synonyme für das Lemma, das nicht durch eine Definition erklärt wird oder Wörter, die mit dem Lemma morphologisch verwandt sind, was „common lexicographical practice“ (Herbst 1986, S. 106) ist. 162 Nach Abzug dieser Fälle verbleiben noch 96 Artikel mit Wörtern außerhalb des begrenzten Definitionswortschatzes, von denen die Mehrheit entweder Ziffern oder Namen enthält, die beide nicht Teil des beschränkten Definitionsvokabulars sind. Letzten Endes reicht lediglich bei weniger als sieben Prozent der untersuchten Definitionen das aufgelistete kontrollierte Definitionsvokabular nicht aus. Zusätzlich muss festgehalten werden, „that LDOCE [LDOCE 1, A.T.] has to exceed the framework of its controlled vocabulary for pure defining purposes almost exclusively in the case of rather specialized or technical vocabulary“ (ebd ., S . 107). Dies spricht auf keinen Fall grundsätzlich gegen diesen Ansatz. 163 Bisher wurden folgende Erscheinungen im kontrollierten Definitionswortschatz genannt und kritisiert: die Nichtberücksichtigung der Polysemie oder Homonymie, die nicht vorhandene Trennung nach Wortarten, die Verwendung von Derivaten, von Komposita, von mehrgliedrigen Verben, von Phraseologismen und von zusätzlichen Wörtern in den Definitionen. Alle führen dazu, dass der tatsächliche Definitionswortschatz um einiges größer ist als das Vokabular, was als begrenztes Definitionsvokabular aufgelistet wird. Einige Forscher begnügen sich mit der Nennung der Tatsache, „[that] there is a tendency on the part of their designers to conceal their actual size“ (Cowie 1999b, S. 110). 164 So urteilt auch Stein (1979, S. 6): I cannot see much sense in trying to play down the actual number of items included. It looks as if the compilers of these lists are trying to make the foreign student believe that there is less to learn than there actually is. I think that it is high time for scholars to free themselves from these magic or ideal figures and to be realistic. 162 Für die Ergebnisse der eigenen Untersuchung vgl. Kapitel 3.3.1 und 3.4.1. In der eigenen Untersuchung geht es jedoch nicht um die Einhaltung des kontrollierten Definitionswortschatzes, sondern um den computerkontrollierten Definitionswortschatz, wodurch sich zum Teil andere Ansprüche ergeben. Zum Terminus Ableitungsdefinition vgl. Kapitel 2.3.1.1. 163 Zu diesem Abschnitt vgl. Herbst (1986, S. 105ff.) und Herbst/ Klotz (2003, S. 5ff.). 164 Vgl. auch Ellegård (1978, S. 231), Hausmann (1985, S. 374f.), Hurk/ Meijs (1986, S. 116), Jansen/ Mergeai/ Vanandroye (1987, S. 83f.), Neubauer (1989, S. 903), Herbst (1990, S. 1381); implizit auch bei Neubauer (1980, S. 13f.; 1987, S. 52). Theoretische Grundlagen 93 Herbst (1986, S. 105) schätzt den tatsächlichen Umfang des Definitionswortschatzes von LDOCE 1 wie folgt ein: Even the list of the LDOCE [LDOCE 1, A.T.] defining vocabulary that was actually used by the lexicographers does not enable one to state how many derivates have been used, but even taking account of the restrictions given there, the number of words used in LDOCE [LDOCE 1, A.T.] definitions could be estimated to lie between 5,000 and 10,000. Für andere stellt dieser Fakt einen nicht zu akzeptierenden Kritikpunkt dar, wie für Jehle, für den beim LDOCE 2 „die Zahl 2 000 allmählich etwas peinlich [wirkt], wenn man bei näherer Betrachtung merkt, dass der wahre Definitionswortschatz zahlenmäßig mit denselben Tricks aufgebläht wird wie schon beim DCE 1 [LDOCE 1, A.T.]“ (Jehle 1990b, S. 502). 165 Auch Zöfgen (1994a, S. 134) bemängelt, dass das Definitionsvokabular des LDOCE 2 „de facto weit mehr Lemmata umfasst als die in der Einleitung erwähnte Zahl“, hält den Bearbeitern aber „fühlbare Fortschritte“ (ebd.) in der Neubearbeitung zugute. 166 Die folgende Gruppe an Gegenargumenten beschäftigt sich nicht mit der Größe des kontrollierten Definitionswortschatzes, sondern mit dessen Zusammensetzung. Für Zöfgen (1994a, S. 136) bestehen „erhebliche Zweifel“ daran, dass das kontrollierte Definitionsvokabular immer in den zentralen Bedeutungen verwendet wird. Teilweise sind diese sogar recht selten, denn bear, for example, has also been used in the sense of ‘tolerate’. There are also a few instances were LDOCE [LDOCE 1, A.T.] definitions go beyond the scope of permitted meanings: according to the lexicographers' list true to should not have been used, it can be found in the definition of aberrant, however. (Herbst 1986, S. 103f.; Hervorh. i. Orig.) 167 Stein nennt als Beispiele für ungeläufige Elemente des begrenzten Definitionswortschatzes im LDOCE 1 fro sowie das unproduktive Suffix -ure, deren Unverzichtbarkeit sie infrage stellt (Stein 1979, S. 6). 168 Das Hauptkriterium für die Selektion des eingeschränkten Definitionsvokabulars, das der Häufigkeit, muss aus verschiedenen Gründen ebenfalls kritisch betrachtet werden. So sind die häufigsten Wörter einer Sprache aufgrund ihrer semantischen Breite zumeist auch die schwierigsten (Piotrowski 1989 , 165 Ähnlich auch Jehle (1990a, S. 110). 166 Zur Entwicklung des kontrollierten Definitionswortschatzes in den englischsprachigen Lernerwörterbüchern vgl. Kapitel 2.4.1, speziell zum LDOCE vgl. Kapitel 2.4.1.1. 167 Vgl. auch Rundell (1998, S. 319). 168 Zu diesem Abschnitt vgl. Jansen/ Mergeai/ Vanandroye ( 1987, S. 118), Herbst (1990, S. 1381). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 94 S. 78). 169 Bei einem Wechsel der Blickrichtung stellt man jedoch fest, dass es auch semantisch breite Wörter gibt, die nicht sehr gebräuchlich bzw. frequent sind. Whitcut führt an dieser Stelle vessel und liquid als Beispiele an (Whitcut 1988, S. 51). Das erklärt, warum in den Definitionen neben den bereits erwähnten seltenen Bedeutungen auch niedrigfrequente Wörter vorkommen, was Neubauer an den Beispielen organ und vehicle veranschaulicht. Diese sind, absolut gesehen, nicht besonders häufig, werden in Wörterbuchdefinitionen aber vielfach verwendet (Neubauer 1984, S. 121). 170 Der Grund hierfür liegt in ihrer Nützlichkeit für lexikografische Definitionen (vgl. Kap. 2.4.2). Außerdem können für die Definition hochfrequenter Wörter nicht noch häufiger vorkommende Wörter gefunden werden: „Words of great frequency may not be definable using only words of greater frequency.“ (Benson/ Benson/ Ilson 1986 , S. 221). 171 Cowie nennt hierfür die Beispiele go, get und come (Cowie 1990, S. 689). Besonders bei der Definition häufiger Wörter im Rahmen eines kontrollierten Definitionsvokabulars ist es schwierig, Zirkeldefinitionen zu vermeiden (vgl. Landau 2001 , S. 157f. und Kap. 2.3.1.1). Wilks stellt fest, wie wenig aufschlussreich die Definitionen des begrenzten Definitionswortschatzes selbst sind, was mit dessen organisierender Rolle im Wörterbuch zusammenhängt (vgl. Kap. 2.2.2.4). Der nächste Einwand gegen den beschränkten Definitionswortschatz wiegt besonders schwer, wenn man bedenkt, dass er in Wörterbüchern für den Bereich Deutsch als Fremdsprache eingesetzt wird. Durch die Verwendung eines begrenzten Vokabulars in den Definitionen können typische Kollokationen oft nicht benutzt werden (Benson/ Benson/ Ilson 1986 , S. 221). 172 Dieses Problem wird in der Forschungsliteratur besonders häufig im Zusammenhang mit den Beispielsätzen erwähnt. Für die Definitionen gelten folgende Aussagen in gleichem Maß: „Words which collocate regularly with particular dictionary entries are not in all cases high-frequency words.“ (Cowie 1989, S. 47). Zöfgen resümiert, dass das kontrollierte Definitionsvokabular „als methodische Prämisse für die Bildung der Beispielsätze höchst unliebsame Konsequenzen hat, indem es das Fehlen einschlägiger Kollokationen/ Verwendungen geradezu vorprogrammiert“ (Zöfgen 1985b, S. 61). Wenn typische Kollokationen durch häufigere Wörter ersetzt werden, müssen diese vom Benutzer zwar nicht erneut nachgeschlagen werden, sein Wissen kann dadurch jedoch auch nicht erweitert werden: „A general problem is that the use of a restricted vocabulary 169 Vgl. auch Svensén (1993, S. 138). 170 Vgl. auch Ayto (1984, S. 53f.), Battenburg (1991 , S. 57). 171 Vgl. auch Fox (1989 , S. 156). 172 Vgl. auch Whitcut (1986, S. 120). Theoretische Grundlagen 95 blocks the chains of definition.“ (Béjoint 1994/ 2000, S. 69). Dieser Fakt kann allerdings auch positiv bewertet werden, da der Benutzer nicht zu weiteren Nachschlagehandlungen gezwungen wird, sondern seine Informationen sofort im ersten Artikel erhält. Mit dem Fehlen typischer Kollokationen ist die Ungeeignetheit des beschränkten Definitionswortschatzes für bestimmte Arten von Lexemen verbunden. In Anlehnung an West argumentieren Carter/ McCarthy (1988, S. 54): „defining vocabularies work rather better in the explanation of concrete rather than abstract terms“. 173 Martin hält für Konkreta wie puff pastry Übersetzungsäquivalente allerdings grundsätzlich für geeigneter als Paraphrasen, unabhängig davon, ob ein kontrollierter Definitionswortschatz verwendet wird oder nicht (vgl. Martin 1985, S. 172 und Kap. 2.1.2). Noch häufiger werden die Schwierigkeiten bei der Definition von Fachausdrücken genannt: „The lack of preciseness is particularly conspicuous for names of animals, plants, substances, and games.“ (Stein 1979, S. 7). Sie führt die Beispiele bass, quail, dahlia, marjoram, copper, iron, baccarat und backgammon an, „[which] belong to that area of the vocabulary which is most difficult to define“ (ebd.). Für Benson/ Benson/ Ilson (1986, S. 221) ist die Definition von Fachtermini mit einem kontrollierten Definitionswortschatz zwar kompliziert, liegt aber immer noch im Bereich des Möglichen, 174 wohingegen Kirkpatrick (1985, S. 11) dies unmöglich erscheint. Ähnlich sehen es auch Herbst und Cowie: A satisfactory definition of many such terms [of rather specialized or technical vocabulary, A.T.] clearly requires more elaborate vocabulary than could be contained in a controlled defining vocabulary (if it is to make sense at all). (Herbst 1986, S. 107) It may indeed be impossible to define some words adequately in terms of others of higher frequency. Satisfactory definitions of technical terms such as dahlia or copper, for instance, may only be possible by going outside the defining vocabulary altogether. (Cowie 1989, S. 47) 175 Mit diesem Problem steht auch die dritte Gruppe von Gegenargumenten in Zusammenhang, die hauptsächlich auf die Sprache der Definition zielen. Auf die Gefahr der zu starken Vereinfachung durch den kontrollierten Definitionswortschatz wird schon sehr früh durch Stein (1979, S. 6) hingewiesen: „By using only a very restricted basic vocabulary for the explanation of lexical items, the explanations can become oversimplified, the definitions imprecise 173 Vgl. auch MacFarquhar/ Richards (1983 , S. 115f.), Carter (1998, S. 153). 174 Vgl. auch Svensén (1993, S. 137f.). 175 Ähnlich auch Cowie (1990, S. 689; 1999b, S. 111f.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 96 and vague, with constituent meaning features missed.“ 176 Herbst diskutiert in diesem Kontext die Erklärung von syringe im LDOCE 1, in der zwar schwierige Wörter vermieden werden, der entscheidende Anhaltspunkt - „the rather important clue“ (Herbst 1986, S. 110) - für das Verstehen der Definition aber fehlt. Jain (1981, S. 176) diskutiert in ähnlicher Weise das Beispiel spite im LDOCE 1 und urteilt, „[that it] misses the essential nuance“. Auch andere Forscher besprechen die „Gefahr simplifizierender Definitionen“ (Herbst/ Klotz 2003 , S. 50), wobei einige dies direkt auf das begrenzte Definitionsvokabular zurückführen, wie z.B. Zöfgen (1994a, S. 136), für den im LDOCE 1 „viele der grob vereinfachenden ‘Definitionen’ [...] ihre Herkunft aus einem ‘controlled defining vocabulary’ in der Tat nicht leugnen“ können. Müllich (1990, S. 271) stellt für die entstehenden Übersetzungen fest: Allerdings muss eingeräumt werden, dass [...] ausgerechnet allzu ‘schlichte’ Definitionen nicht selten zu allzu ‘schlichten’, zu wenig spezifischen, mehr oder weniger direkten Übersetzungen verleiten, wobei die lexikalische Individualität auf der Strecke bleibt. Auf die Konzeption für das Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTWDaF 1) zurückblickend, erklärt Wellmann (2004, S. 95), viele der Vorschläge wären ihm „zu simpel erschienen“, sodass sie „dann doch lieber durch eine Definition aus dem LWB ersetzt wurden“ (ebd.). Als Resultat des Ansatzes des Definierens mit einem eingeschränkten Definitionswortschatz, den Jain (1981, S. 276) als „conflict between simplicity and accuracy“ beschreibt, sehen viele Wissenschaftler Schwächen in der Korrektheit und Akkuratheit der entstehenden Definitionen (vgl. zuletzt Wingate 2002 , S. 30): Mit der Beschränkung auf einen lediglich 2 000 Lemmata umfassenden Kernwortschatz stellt sich das Problem eindeutiger und präziser lexikalischer Paraphrasen in aller Schärfe. [...] Die Folge sind zahlreiche ungenaue oder vage Bedeutungserläuterungen (Zöfgen 1994a, S. 136), denen es „an der nötigen Präzision und Klarheit mangelt“ (Zöfgen 1985b, S. 41). 177 So stellt Béjoint (1994/ 2000, S. 70) auch fest: „[The controlled defining vocabulary, A.T.] sometimes forces the definers towards formulations that sound stilted, unnatural, or - worse - simply wrong.“ Einfachheit geht zulasten der Akkuratheit - „[it] can achieve simplicity at the expense of 176 Vgl. auch Carstensen (1980, S. 105), Herbst (1990, S. 1381), Jehle (1990a, S. 107). 177 Vgl. auch Stein (1979, S. 6), Jain (1981, S. 277), Neubauer (1989, S. 901), Tickoo (1989, S. 188), Svensén (1993, S. 137f.), Cowie (1999b, S. 111f.). Theoretische Grundlagen 97 accuracy“ (Carter/ McCarthy 1988 , S. 53). 178 Viel gelassener betrachtet dies Wellmann (2002, S. 131), dem es ganz selbstverständlich erscheint, dass eine einfache und anschauliche Wortwahl zu einer vageren Definition führt: „Einfachheit ist eben oft nur mit Unschärfen zu erkaufen. Aber sie stellt eine Voraussetzung für die Verständlichkeit dar.“ Auch Herbst/ Klotz (2003, S. 50) urteilen differenzierter: Der Konflikt zwischen den Lexikoparametern der Benutzerfreundlichkeit im Sinne der Verständlichkeit der Definitionen und der Akkuratheit gestaltet sich in Wörterbüchern, die einen begrenzten Definitionswortschatz zur Grundlage ihrer Definitionspolitik machen, nicht prinzipiell anders als in Wörterbüchern, die dies nicht tun, weil ja auch Wörter außerhalb des Definitionswortschatzes verwendet werden können. Ebenfalls sehr häufig wird den im Rahmen eines kontrollierten Definitionsvokabulars erstellten Definitionen der Vorwurf der Unnatürlichkeit bzw. Künstlichkeit sowie der fehlenden Authentizität gemacht (vgl. zuletzt Béjoint 1994/ 2000, S. 70). 179 Bereits Kirkpatrick (1985, S. 10) sieht die Gefahr „of producing definitions phrased in language which sounds most unnatural and so of encouraging the reader to emulate this“. Die Kritik an der „clumsy or unnaturally circumlocutory“ (Carter 1998, S. 153) begründet Carstensen (1988, S. 45) mit der sehr subjektiven Einschätzung, dass er „die so reduzierten Wortschätze als künstlich empfinde“. Auch Umständlichkeit und Schwerfälligkeit werden bemängelt: Die Definitionen werden „unübersichtlicher“ (Barz/ Schröder 1994 , S. 131) und „vermitteln den Eindruck des Unnatürlichen und Umständlichen“ (Zöfgen 1994a, S. 136). 180 Hurk/ Meijs (1986, S. 112) bezeichnen sie als „laboured“; für sie verstößt der beschränkte Definitionswortschatz gegen sprachökonomische Prinzipien. Das begrenzte Definitionsvokabular führt dazu, „[that] the lexicographer is sometimes obliged to create awkward paraphrases or circumlocutions“ (MacFarquhar/ Richards 1983 , S. 116). Einen weiteren Kritikpunkt bilden unverständliche Ausdrücke (Jehle 1990a, S. 110) oder stilistische Ungeschicktheiten, wie Wekker/ Hyams sie auflisten 178 Vgl. auch MacFarquhar/ Richards (1983 , S. 116), Jehle (1990a, S. 106), Carter (1998, S. 153). An dieser Stelle ist allerdings die Gewichtung dieser beiden Prinzipien zu bedenken, die im Lernerwörterbuch häufig zugunsten der Einfachheit und der Verständlichkeit ausfällt (vgl. Kap. 2.1.1). 179 Vgl. auch Zöfgen (1985b, S. 41), Tickoo (1989, S. 188), Svensén (1993, S. 137), Zöfgen (1994a, S. 136). 180 Vgl. auch Zöfgen (1985b, S. 41), Nesi (2000, S. 73). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 98 (vgl. Wekker/ Hyams 1979, S. 411). 181 Die lexikografische Metasprache, die bereits grundsätzlich eine verfremdende Wirkung besitzt (Kolde 2000, S. 88f.), verarme durch das Verwenden eines beschränkten Definitionswortschatzes einerseits (Benson/ Benson/ Ilson 1986 , S. 221). Andererseits werden diese Definitionswortschätze zu einer „potential source of distortion, especially if they are not accompanied by equally strict controls on the meanings of each word used and the syntactic structures in which they are used“ (Hanks 1987, S. 119). Alle Vereinfachungen durch das begrenzte Definitionsvokabular besitzen auch eine Wirkung auf das persönliche Sprachempfinden der Wissenschaftler. So verwundert es kaum, dass manchmal sehr subjektive Urteile gefällt werden, wie bei dem bereits erwähnten Zitat von Béjoint, der von gestelzten Formulierungen spricht (1994/ 2000, S. 70), oder bei Zöfgen (1994a, S. 136): „Die Folge sind zahlreiche ungenaue oder vage Bedeutungserläuterungen, die manchmal gezwungen, manchmal sogar lächerlich wirken und bei denen nicht selten konstitutive Merkmale fehlen.“ Vollkommen objektiv gesehen beeinflusst der kontrollierte Definitionswortschatz die Länge der Definition, wenn die gleiche Genauigkeit erreicht werden soll: „It takes more space to define something in simple terms than it does to define something in more difficult and succinct terms“ (Kirkpatrick 1985 , S. 10). Dies stellt in Printwörterbüchern aufgrund des daraus resultierenden erhöhten Platzbedarfs einen Nachteil dar. Werden diese längeren Definitionen hingegen lernpsychologisch betrachtet, sind sie kürzeren Definitionen vor allem im Bereich der Behaltensleistungen überlegen, was Kostrzewa in der oben beschriebenen Studie nachweist (vgl. 1994, S. 108ff. und Kap. 2.3.1.1). In der Literatur wird die größere Länge jedoch bis auf wenige Ausnahmen als negativ beurteilt (vgl. zuletzt Nesi 2000 , S. 73). 182 Mit der Länge der Definitionen ist auch ihre syntaktische Struktur verbunden. Wie bereits zitiert wurde, betont Hanks, wie wichtig es ist, neben dem Vokabular auch den Satzbau der Definitionen zu kontrollieren, da dieser ebenso zu einer Quelle der Verzerrung werden kann (Hanks 1987, S. 119). Hurk/ Meijs (1986, S. 112f.) stellen als erste einen direkten Zusammenhang zwischen der Verwendung eines beschränkten Definitionswortschatzes und der Syntax der 181 Vgl. auch Jehle (1990a, S. 110). 182 Vgl. auch MacFarquhar/ Richards (1983, S. 116), Kirkpatrick (1985, S. 10), Crystal (1986, S. 77), Hurk/ Meijs (1986, S. 112), Whitcut (1986, S. 121; 1988, S. 50), Tickoo (1989, S. 188), Barz/ Schröder (1994, S. 132), Cowie (1999a, S. 9) sowie die Diskussion in Neubauer (1989, S. 901). Theoretische Grundlagen 99 Definitionen fest: „In practice, the principle of controlled vocabulary, i.e. the use of simple words in definitions, is often in inverse relation to the simplicity of definition structures.“ Diese These wird von Wellmann (2001, S. 188) bestätigt, für den ein kleinerer Definitionswortschatz mehr Nebensätze und einen stärker gestaffelten Satzbau bzw. syntaktische Umständlichkeit nach sich zieht und der demzufolge zu dem Schluss kommt: „Die Einfachheit der Wortwahl und die Einfachheit der Syntax verhalten sich [...] umgekehrt proportional.“ 183 Andere Schwächen bestehender begrenzter Definitionsvokabulare werden seltener genannt. Jansen/ Mergeai/ Vanandroye (1987, S. 83) kritisieren, dass Wörter aus dem beschränkten Definitionswortschatz des LDOCE 1 teilweise selbst nicht im Wörterbuch lemmatisiert sind, wobei es sich aber nur um Einzelfälle handelt, die in den Neuausgaben nachgetragen sind. Herbst missfällt die Behandlung der Namen im kontrollierten Definitionsvokabular des LDOCE 1, das einerseits nur bestimmte Namen - wie English oder British - in der Liste des Definitionswortschatzes verzeichnet, andererseits nicht aufgelistete Namen in Definitionen nicht kapitalisiert. Allerdings sind dies lediglich „small inconsistencies“ (Herbst 1986, S. 103). „What may be of more importance, however, is that the list contains a few words foreign learners do not seem to be all that familiar with“ (ebd.). Dafür nennt er an dieser Stelle aus dem LDOCE 1 Beispiele wie bowel, coarse oder yield, deren Bedeutung bei einem Test mehr als der Hälfte der Englischstudenten in den ersten beiden Studienjahren unbekannt ist. Carter/ McCarthy (1988, S. 53) zählen ebenfalls Beispiele für weniger geläufige Wörter aus der Liste des LDOCE 1-Definitionswortschatzes auf. Außerdem gilt auch für den beschränkten Definitionswortschatz: „The learner may first have to learn a number of them [the words used in the definitions, A.T.]; there is no guarantee that they will be known by the learner“ (Carter/ McCarthy 1988, S. 53). 184 MacFarquhar/ Richards (1983, S. 115) argumentieren, die Bekanntheit des Definitionswortschatzes beim Wörterbuchbenutzer sei ohnehin nur „a matter of conjecture“, wodurch man nicht davon ausgehen könne, dass die Definitionen zwangsläufig einfacher oder semantisch präzise würden. Das gelte vor allem für nicht besonders häufige Wörter wie armour oder fasten (ebd.). Selbst wenn dem Lerner das kontrollierte Definitionsvokabular bekannt ist, heißt das zudem noch nicht, dass auch die Erklärun- 183 Vgl. auch Wellmann (2001, S 186ff.; 2002, S. 131), Wingate (2002 , S. 23) und Wellmann (2004, S. 94). Der zunehmend komplizierter werdende Satzbau wird auch bei Beuse thematisiert ( vgl. Kap. 1.1). 184 Vgl. auch Carter (1998, S. 153). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 100 gen verstanden werden (Neubauer 1980, S. 14). Zöfgen (1994a, S. 135) geht in seiner Kritik an der Auswahl des begrenzten Definitionsvokabulars am Beispiel des LDOCE 1-2 viel weiter als Herbst, denn für ihn ist es eine Tatsache, dass der insgesamt in den Definitionen verwendete Wortschatz nach unserer Schätzung die für selektive Lernwörterbücher bestimmte quantitative Grenze nach wie vor überschreitet und damit weit höhere Anforderungen an die L 2-Sprachkompetenz stellt, als es die Beschränkung auf ein Definitionsvokabular vermuten lässt. Die nächste Schwäche stellt für Zöfgen (1994a, S. 133) die Nichtkennzeichnung des Definitionswortschatzes im LDOCE 1-2 dar: „Dass es versäumt wurde, das ‘Explikationsvokabular’ [...] in der Makrostruktur typografisch zu kennzeichnen [...], dürfte allerdings mehr als ein Schönheitsfehler sein.“ 185 Aus didaktischer Sicht bemängelt Cowie (1990, S. 689), durch die Verwendung eines kontrollierten Definitionsvokabulars werde die Fertigkeit des Lerners, Bedeutungen aus dem Kontext zu erraten, eingeschränkt - und damit seine Unabhängigkeit vom Wörterbuch. Manche Wissenschaftler empfinden im Bereich der englischsprachigen Lexikografie kaum einen Unterschied zwischen Wörterbüchern mit kontrolliertem und ohne kontrolliertes Definitionsvokabular, was Struktur und Metasprache betrifft. Einige stellen den Nutzen eines begrenzten Definitionswortschatzes deshalb grundsätzlich infrage, da Englischwörterbücher auch ohne beschränktes Definitionsvokabular verständlich genug definieren und für nicht muttersprachliche Lerner geeignet sind (vgl. zuletzt Müllich 1990 , S. 270ff., 297): 186 Das als lexikografischer Ansatz verdienstvolle Verfahren des kontrollierten Definitionsvokabulars (mit gewissen Konzessionen) [macht, A.T.], wie es im DCE [LDOCE 2, A.T.] Anwendung findet, aufgrund ähnlich behutsamer Erklärungsweisen im ALD [OALD 3, A.T.] und (noch mehr) im COBUILD [COBULID 1, A.T.] realiter kaum einen effektiven Unterschied (Müllich 1990, S. 274; Hervorh. i. Orig.). Der kompromisshafte Definitionswortschatz des DCE [LDOCE 2, A.T.] (controlled vocabulary zusätzlich besonders ausgewiesener Vokabeln im Einzelfall) verspricht kaum spürbare Vorteile gegenüber ALD [OALD 3, A.T.] und CO- BUILD [COBULID 1, A.T.], welche in den Explikationen ein durchaus vergleichbares lexikalisches Niveau ansetzen, wie sich gezeigt hat. (ebd., S. 297; Hervorh. i. Orig.) Auch Zöfgen (1994a, S. 138) betrachtet die prinzipielle Überlegenheit von Wörterbüchern mit kontrolliertem Definitionsvokabular sehr skeptisch: 185 Ähnlich bereits Zöfgen (1985b, S. 39); vgl. auch Neubauer (1980, S. 62f.). 186 Vgl. auch Zöfgen (1985b, S. 40f.; 1994a, S. 137f.), Jehle (1990a, S. 110). Theoretische Grundlagen 101 Vieles deutet darauf hin, dass sich mit Definitionsvokabularen, die ein mittleres lexikalisches Niveau ansetzen, die gleichen Erfolge erzielen lassen wie mit streng kontrollierten und dass die von Longman favorisierte Linie nicht das Maß der Dinge für die L 2-Lexikografie ist. Allerdings urteilt er selbst nach der Veröffentlichung gegenteiliger Studien - wie der von Müllich - noch: Vorläufig gibt es keinerlei empirischen Beweis dafür, dass Bedeutungserklärungen automatisch leichter verstanden werden, wenn das zur Paraphrasierung bereitgestellte Vokabular drastisch reduziert und nur noch auf eine Art Kernwortschatz zurückgegriffen wird. (Zöfgen 1994a, S. 135) Man kann Zöfgen jedoch zugutehalten, dass es inzwischen auch Untersuchungen gibt, die keine Auswirkung auf den Erfolg einer Nachschlagehandlung feststellen konnten, der auf die Existenz eines beschränkten Definitionsvokabulars zurückführbar wäre. Nesi (2000, S. 92) kommt in ihrem Test mit 52 erwachsenen Englisch-als-Fremdsprache-Lernern zu folgendem Ergebnis: „Apparently neither the restricted LDOCE [LDOCE 2, A.T.] defining vocabulary nor the COBUILD [COBUILD 1, A.T.] folk definitions make dictionary reading quicker or more successful.“ Allerdings muss an dieser Stelle festgehalten werden, dass die Untersuchungen klar in der Überzahl sind, die einen positiven Effekt der Definitionen mit einem kontrollierten Definitionswortschatz feststellen (vgl. Kap. 2.3.1.1). Andere Forscher, wie beispielsweise Cowie (1989, S. 47), halten den Ansatz des Definierens mittels eines begrenzten Definitionswortschatzes unter bestimmten Umständen grundsätzlich für unmöglich. 187 Kempcke (1992, S. 210) sieht ebenfalls Schwierigkeiten bei der Umsetzung: Für den ausländischen Nutzer sind Paraphrasierungen mit einem kontrollierten Vokabular zwar notwendiger, als dies für einen muttersprachlichen Nutzer erforderlich wäre, doch ist dieses Prinzip umso schwerer zu verwirklichen, je kleiner der dargestellte Wortschatzausschnitt ist. 188 Für Wingate (2002, S. 44) besteht ein ganz anderer Grund, der das Verwenden eines beschränkten Definitionsvokabulars speziell im Deutschen bisher verhindert hat: „The major obstacle to a restricted defining vocabulary is certainly the fact that large corpora of general written and spoken language have not been compiled for German.“ Diese Einschätzung kann jedoch nicht mehr auf- 187 Vgl. auch Wingate (2002 , S. 30). 188 Auf die Frage nach der Geeignetheit des kontrollierten Definitionsvokabulars für andere Sprachen, speziell für das Deutsche, wird im Kapitel 2.4.2 näher eingegangen. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 102 rechterhalten werden, da beispielsweise mit den Korpora des IDS oder dem DWDS-Korpus umfangreiche Korpora zur Verfügung stehen. 189 Außerdem haben sich einige Verlage eigene Korpora aufgebaut. 190 Einige Wissenschaftler - unter ihnen auch überzeugte Befürworter des kontrollierten Definitionswortschatzes - bemerken zudem eine bestehende Theorielastigkeit des Ansatzes und eine Zufälligkeit der Listen. So stellt bereits Ellegård (1978, S. 231) fest: „Only philosophers (including lexicographers) can use it [the controlled defining vocabulary, A.T.] consistently, and even they only when they are in their philosophical mood.“ Kirkpatrick (1985, S. 10) urteilt ähnlich, denn „the defining vocabulary scheme is fine in theory, not so in practice“. Selbst für Herbst (1998, S. 23) besitzen „Listen dieser Art [...] zwangsläufig etwas Arbiträres“ und Zöfgen (1994a, S. 134) hat ebenfalls „genügend Anhaltspunkte dafür, dass sich in Listen dieser Art bis zu einem gewissen Grad auch zufällige und arbiträre Entscheidungen niederschlagen“. Er kommt zu dem Schluss, dass der Ansatz des kontrollierten Definitionswortschatzes in Wörterbüchern, der „in aller Welt auf breite Zustimmung [stieß], [...] auch dazu geführt hat, dass Definitionsvokabulare in ihrer Wirkung auf Verstehenszuwachs und Semantisierungserleichterung offensichtlich überschätzt werden“ (ebd., S. 133). 191 Für viele der hier diskutierten Argumente gegen die Anwendung eines beschränkten Definitionsvokabulars gilt Folgendes: „In reality, the problems that sometimes accompany this approach to defining arise not so much from the constraints of the DV [defining vocabulary, A.T.] itself as from its inexpert application.“ (Rundell 1998, S. 319). Von einem Ansatz wie der Arbeit mit einem kontrollierten Definitionswortschatz kann selbstverständlich nicht erwartet werden, alle Probleme im Kontext der Definitionen in Wörterbüchern zu lösen. Die bestehenden Nachteile des Ansatzes sind jedoch insgesamt nicht so gewichtig wie die Vorteile, die sich aufseiten der Lerner, der Lehrer und der Lexikografen ergeben. 2.3.2 Kriterien für die Selektion eines kontrollierten Definitionswortschatzes Für die Auswahl eines Definitionsvokabulars werden ganz unterschiedliche Kriterien zugrunde gelegt. Sie sind davon abhängig, ob vom Definitionswortschatz an sich oder einem kontrollierten Definitionsvokabular die Rede ist. 189 Zu den Korpora des IDS vgl. Institut für Deutsche Sprache (2008), zum DWDS vgl. Berlin- Brandenburgische Akademie der Wissenschaft (2010). 190 Ein Beispiel ist das Duden-Korpus, vgl. hierzu Rautmann (2010). 191 Ähnlich bereits Zöfgen (1985b, S. 61). Theoretische Grundlagen 103 Andererseits variieren die Kriterien in Abhängigkeit davon, ob es sich um einen bestimmten, gerade erstellten kontrollierten Definitionswortschatz eines einzelnen Wörterbuchs (also um eine Betrachtung aus einem eher praktischen Blickwinkel) oder um kontrollierte Definitionswortschätze im Allgemeinen (also um eine eher theoretische Perspektive) handelt. Im Folgenden werden wichtige Auswahlkriterien wie Frequenz, Vertrautheit, Allgemeingültigkeit, semantische Breite, Eindeutigkeit, Einfachheit, Nützlichkeit, Reichweite sowie kleinere Einzelbeobachtungen vorgestellt. Die Anwendung all dieser Einzelkriterien entscheidet darüber, ob ein zusammengestellter Definitionswortschatz für den entsprechenden Benutzer des Wörterbuches und seine Zwecke geeignet ist (Svensén 1993, S. 136). Die Eignung ist demzufolge allen anderen Kriterien übergeordnet. Vollkommen unabhängig von der jeweiligen Perspektive - praktisch oder eher theoretisch - spielt für das Definitionsvokabular das Selektionskriterium der Frequenz am häufigsten eine Rolle (vgl. zuletzt Herbst/ Klotz 2003 , S. 52). 192 Häufigkeit ist im gesamten Prozess des Spracherwerbs von großer Bedeutung (Tschirner 2006 , S. 1287). West (1971, S. VII ) wendet das Frequenzkriterium bereits für seine General Service List of English Words und später im International Reader's Dictionary an: „All explanations are written within a vocabulary of 1,490 words held to be the commonest words in English or the words first learnt by foreigners.“ 193 Aber wie bereits im Kapitel 2.2.1 dargestellt, nehmen auch die meisten anderen Projekte des Vocabulary Control Movements Frequenzuntersuchungen zur Grundlage ihrer Zusammenstellungen. 194 So unterstreicht Ellegård die Ähnlichkeiten und die Überlappungen, die zwischen den häufigsten Wörtern und dem kontrollierten Definitionsvokabular im LDOCE 1 bestehen: Von den 2 000 häufigsten englischen Wörtern finden sich 90 Prozent in der Liste des beschränkten Definitionswortschatzes des LDOCE 1 wieder (Ellegård 1978, S. 232). Neubauer hingegen betont stärker die Unterschiede zwischen dem frequenten Wortschatz und dem Definitionsvokabular (Neubauer 1980, S. 45). Jedoch bestreitet auch er nicht die Bedeutung der Verwendung hauptsächlich häufiger Wörter in den Definitionen, 192 Vgl. auch West (1960, S. IX ; 1971, S. VII ) , Ellegård (1978, S. 232), Neubauer (1980, S. 59), Werner (1982, S. 68), Benson/ Benson/ Ilson (1986, S. 221), Herbst (1986, S. 102), Whitcut (1986, S. 118), Neubauer (1987, S. 50), Whitcut (1988, S. 52), Neubauer (1989, S. 903), Vossen/ Meijs/ Broeder (1989, S. 174), Cowie (1990, S. 688), Herbst (1990, S. 1381), Jehle (1990a, S. 206ff.), Bald (2002, S. 192), Kiefer/ Sterkenburg (2003, S. 357). Zum frequenten Wortschatz sowie zu unterschiedlichen Frequenzwörterbüchern vgl. Kapitel 3.5.2.1. 193 Zu West vgl. Kapitel 2.2.1.3. 194 Vgl. beispielsweise die Kriterien des Interim Reports (vgl. Kap. 2.2.1.3). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 104 da durch die Streichung von Synonymen und von ungebräuchlichen Wörtern „schon eine bedeutende Schrumpfung der Explikationssprache“ (Neubauer 1980, S. 60) erzielt werden kann. 195 Herbst/ Klotz (2003, S. 52) unterteilen das Kriterium der Häufigkeit in zwei Untergruppen, in „lexikalische Einheiten mit generell hoher Frequenz“ und in „lexikalische Einheiten mit hoher Frequenz in Texten und Schulbüchern für die Zielgruppe des Wörterbuchs“ (ebd.). 196 Bei einem Vergleich der vier großen englischsprachigen Lernerwörterbücher (LDOCE 3, OALD 6, CIDE und COBUILD) stellt Bald (2002, S. 190) einen Unterschied in der Definitionspolitik fest: Die ersten drei Wörterbücher arbeiten mit einem kontrollierten Definitionswortschatz, den sie nach bestimmten Frequenzlisten vorher festlegen. Das Collins COBUILD Essential English Dictionary (1991, S. 938) erstellt erst nach dem Verfassen der Definitionen eine Liste mit den Wörtern, „that are used ten times or more in the dictionary explanations“. 197 Es überwiegt in der lexikografischen Praxis also die Herangehensweise, in einer Art Top-down- Prozess zuerst die Liste des zu verwendenden Vokabulars zusammenzustellen, obwohl es wahrscheinlich leichter wäre, genau umgekehrt vorzugehen. So könnten - ähnlich wie bei COBUILD - auch zuerst die Definitionen verfasst und dann das darin verwendete Vokabular nach Auftretenshäufigkeit sortiert werden. In einem zweiten Arbeitsgang müssten anschließend die Definitionen, die zu selten auftretendes Vokabular enthalten, umformuliert werden. Die auf diese Weise induktiv entstehende Liste eines beschränkten Definitionswortschatzes würde in viel höherem Maße den tatsächlichen Anforderungen gerecht, da sie allein aus den beim Definieren auftretenden Bedürfnissen heraus generiert würde. Neben der Auswahl des Definitionsvokabulars nach dem Häufigkeitsprinzip erwähnt Whitcut (1988, S. 49) auch die Möglichkeit, einen Definitionswortschatz „from scratch“, „from a tabula rasa“ (ebd.) zu erstellen: You begin by listing semantic concepts which are non-language-specific, and go on to consider what is the absolute economical minimum of lexis in a particular language that a learner must master in order to discuss these concepts. (ebd., S. 49f.) 195 Zur Deckung des Frequenzwortschatzes im Frequency Dictionary von Jones/ Tschirner mit dem analysierten Definitionswortschatz des LTWDaF 2 und des DHWDaF 2 siehe Kapitel 3.5.2. 196 Zum unterschiedlichen Verständnis des Terminus lexikalische Einheit siehe Kapitel 2.1.1, Anm. 7. 197 Zum Vorgehen bei Longman, Oxford University Press und Cambridge University Press siehe Kapitel 2.4.1. Theoretische Grundlagen 105 Mit dem Kriterium der Frequenz korrespondieren zwei weitere Kriterien, zum einen das der Vertrautheit und zum anderen das der Allgemeingültigkeit. Bereits 1971 stellt Rey-Debove - ausgehend von der Funktion der Definitionen - fest: „La définition naturelle ayant pour fonction d'expliciter, les mots qui la composent doivent être connus.“ (Rey-Debove 1971, S. 199). 198 Auch Herbst (1986, S. 113) führt das Prinzip der Vertrautheit als erstes an: „It is obvious that the defining vocabulary must only contain items the foreign user of the dictionary can reasonably be expected to be familiar with.“ Ähnlich äußern sich Herbst/ Klotz (2003, S. 52): Nachdem der vorrangige Zweck der Etablierung eines begrenzten Definitionswortschatzes darin besteht, dass man davon ausgehen kann, dass der in den Definitionen verwendete Wortschatz vor allem auch fremdsprachigen Benutzern vertraut ist, ist ein vorrangiges Kriterium im erwarteten Bekanntheitsgrad bei dieser Zielgruppe zu sehen. 199 Die Vertrautheit von Lexemen kann durch Tests ermittelt werden, bei denen Probanden die Elemente vorgelegter Wortlisten danach beurteilen, ob sie „das einzelne Wort in Schrift oder Rede gesehen, gehört oder gebraucht“ (Kühn 1979, S. 35) haben. Damit stehen diese Tests inhaltlich in engem Zusammenhang zur Nützlichkeitstheorie von Mackey/ Savard, die weiter unten in diesem Kapitel erläutert wird, und zur Befragung zu den mots disponibles durch Michéa (vgl. Kap. 2.2.1.5). Nur das Vorgehen ist genau umgekehrt, da die Versuchsteilnehmer bei den Tests von Michéa die Lexeme zu einem Thema nennen müssen, wohingegen bei den Tests zur Vertrautheit Lexeme vorliegender Wortlisten nach dem Grad ihrer Vertrautheit einzuschätzen sind. Das Prinzip der Allgemeingültigkeit in Form von „lists of basic vocabulary items for language teaching purposes (so-called Grundwortschätze)“ (Neubauer 1987, S. 50; Hervorh. i. Orig.) erwähnt Neubauer neben den Frequenzlisten als zweiten Ansatzpunkt für die Erstellung eines kontrollierten Definitionsvokabulars im Lernerwörterbuch. Gleichzeitig gibt er aber die unterschiedliche Funktion von Frequenzlisten, Grundwortschätzen und beschränkten Definitionswortschätzen zu bedenken: 200 A word included in a basic vocabulary list for the purpose of language teaching may have been included because a tourist would encounter the word at first sight. This does not mean that passport would also have to be an item in a Defining Vocabulary, while its introduction in a course in adult education naturally makes a lot of sense. (Neubauer 1987, S. 50; Hervorh. i. Orig.) 198 Vgl. auch Svensén (1993, S. 136). 199 Vgl. auch Neubauer (1989, S. 903). 200 Zur Deckung des Grundwortschatzes Langenscheidt Basic German Vocabulary mit dem analysierten Definitionswortschatz des LTWDaF 2 und des DHWDaF 2 vgl. Kapitel 3.5.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 106 Jehle (1990a, S. 206) benutzt anstelle des Terminus Grundwortschatz die Bezeichnung Basiswortschatz: Die Bedeutungserklärung sollte sich im Idealfall aus Wörtern zusammensetzen, die zu einem relativ frequenten allgemeinsprachlichen Wortschatz gehören und somit eine Art Basiswortschatz bilden, wie er innerhalb von ungefähr fünf Jahren gymnasialem Fremdsprachenunterricht durch die einschlägigen fremdsprachigen Lehrwerke vermittelt wird. Als Einziger nennt er zwar eine konkrete Zahl für den schulischen Rahmen, was die Anzahl der zugrunde gelegten Lernjahre betrifft; er führt jedoch nicht aus, auf welchen Überlegungen dies basiert. Man kann nur die Vermutung anstellen, dass sowohl bei der ersten erlernten Fremdsprache (Beginn 5. Schuljahr) als auch bei der zweiten (Beginn 7. Schuljahr) die Schüler nach fünfjährigem Unterricht in der Oberstufe in der Lage sein müssten, die Definitionen im einsprachigen Wörterbuch zu verstehen, also genau zu dem Zeitpunkt, an dem die meisten Lehrpläne dies fordern. Neben der Orientierung am Grundwortschatz verlangt Neubauer auch, dass obsolete oder ungebräuchliche Wörter entfernt werden sollen (Neubauer 1980, S. 60). 201 Ein weiteres ebenfalls sehr häufig erwähntes Kriterium für die Auswahl eines begrenzten Definitionsvokabulars ist dessen semantische Breite. Die auf diese Weise für den kontrollierten Definitionswortschatz selegierten Lexeme bilden nach Scherfer (1985, S. 416) „eine Klasse von Wörtern mit großem Bedeutungsumfang [...], mit denen die Bedeutung aller anderen Wörter ausgedrückt werden kann.“ Sie zeichnen sich durch eine „Vielfalt der Verwendungsmöglichkeiten“ (ebd., S. 417) aus und tragen so dazu bei, „dass die Menge entsprechend sprachintern und möglicherweise auch intersprachlich repräsentativ ist“ (Neubauer 1980, S. 57). Dabei handelt es sich häufig um Wörter mit einem hohen Grad an Allgemeinheit und Abstraktheit. Viele davon sind Oberbegriffe: „Interestingly, several of these items [...] are superordinate terms of some generality thought essential for defining many specific objects, substances, animals and plants.“ (Cowie 1999a, S. 10). 202 Whitcut nennt hierfür unter anderem item, unit, process, situation und structure als Beispiele (Whitcut 1988, S. 52). Eine andere Art von Wörtern mit hohem Allgemeinheitsgrad - nämlich die Funktionswörter - hat Rey-Debove im Blick, wenn sie von „inhaltsarmen“ Wörtern spricht, die in geschlossenen Systemen vor- 201 Auch für die Zusammenstellung eines Grundwortschatzes spielt das Kriterium der Allgemeingültigkeit eine wichtige Rolle, vgl. Kapitel 3.5.1.1. 202 Vgl. auch Whitcut (1988, S. 52). Theoretische Grundlagen 107 kommen und dort nicht definiert werden. Als „geschlossene Systeme“ bezeichnet sie Wörterbücher, in denen alle in den Erklärungen verwendeten Wörter selbst lemmatisiert sind. 203 Dort gibt es entrées qui ne sont pas des ‘définis’; ce sont les mots des très haute fréquence dont le contenu est si pauvre qu'il n'existe pas de définissants à contenu plus pauvre pour les analyser. Cets mots, dits primitifs ont une fonction de définissant importante. (Rey-Debove 1971, S. 200) Das nächste Kriterium steht dazu in gewisser Weise in Opposition. Die semantische Breite eines Wortes widerspricht zumindest teilweise der Forderung Aytos (1984, S. 54) nach einer eindeutigen Grundbedeutung des Definitionswortschatzes, deren Festschreibung durch Kreuzverweise auch von Jansen/ Mergeai/ Vanandroye (1987, S. 90) gewünscht wird. 204 Neubauer (1987, S. 53) lehnt semantisch zu komplexe Wörter im Definitionsvokabular ebenfalls ab. Werner (1982, S. 68), in der Tradition des Holismus 205 stehend, verlangt nicht näher erläuterte Kriterien semantischer, begrifflicher und psychologischer Art, die eine weitere Bedeutungsaufspaltung des Definitionsvokabulars unmöglich machen. 206 Auch Herbst (1986, S. 113) kann einer Aufteilung nach semantischen Merkmalen nichts abgewinnen und spricht sich für die Verwendung von Lexemen aus: „The units of a defining vocabulary of a dictionary for foreign learners should be words of the language and not abstract semantic components.“ Dabei muss die Bedeutung der verwendeten Wörter jedoch klar sein: „it is absolutely necessary to prescribe in which meanings the words of the defining vocabulary may be used“ (ebd., S. 114), was partiell durch eine Beschränkung der Bedeutung erreicht werden kann (Whitcut 1988, S. 52). Die Forderung nach der Eindeutigkeit des Definitionsvokabulars lässt sich mit dem Prinzip der Einfachheit verbinden, was bei West (1960, S. IX ) als Schwierigkeit bzw. Leichtigkeit des Lernens eines seiner Auswahlkriterien darstellt. 207 203 Dies wird in der vorliegenden Arbeit als computerkontrollierter Definitionswortschatz bezeichnet, vgl. Kapitel 2.1.3. 204 Vgl. auch Svensén (1993, S. 137). 205 Der Holismus ist eine Analysemethode, beispielsweise in der Semantik, die von einer ganzheitlichen Speicherung von Bedeutungen ausgeht. Als Gegenpol gilt die Kompositionalität, die eine Zerlegung in die einzelnen Bestandteile annimmt (vgl. Lexikon der Sprachwissenschaft 2008, S. 267). 206 Mit dieser Argumentation rückt Werner die Diskussion in die Nähe der semantischen Primitiva (vgl. Kap. 2.2.2). 207 Zu West vgl. Kapitel 2.2.1.3. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 108 Auch Cowie (1990, S. 688) wählt „learnability“ als eines seiner Kriterien aus, Herbst (1996, S. 324) spricht ex negativo von der Vermeidung weniger zugänglicher Wörter. Im CIDE bildet die leichte Verständlichkeit des Definitionswortschatzes ebenfalls ein Auswahlkriterium: „[The defining vocabulary, A.T.] is easy for learners to understand“ (CIDE 1995, S. 1702). 208 Um die Einfachheit des verwendeten Vokabulars zu gewährleisten, schlägt Béjoint (1994/ 2000, S. 69) eine Einteilung der Lexeme in Schichten vor: The use of a restricted defining vocabulary is based on the idea that a monolingual dictionary can only work if the vocabulary is organized in ‘strata’, so that each stratum can be used to define the words belonging to the next one, and so on [...]. This makes it possible for the lexicographer to define words by means of words that are ‘easier’ than the word being defined. Die Verwendung einfacher Lexeme in den Definitionen stellt für Herbst/ Klotz (2003, S. 49) einerseits ein Problem, andererseits aber auch einen grundsätzlichen Anspruch eines Lernerwörterbuchs dar. Diese Politik dient dazu, „schwierige Wörter in Definitionen dann (und auch nur dann) zu vermeiden, wenn sie durch einfachere, aber semantisch äquivalente ersetzbar sind“: Im Falle von Lernerwörterbüchern besteht bei der Abfassung von Definitionen die zusätzliche Schwierigkeit, dass die Wörter, die zur Erklärung eines Lemmas herangezogen werden, nicht anspruchsvoller und für den Benutzer schwerer verständlich sein dürfen als das zu erklärende Wort. (ebd., S. 48) Das „Leitbild der Einfachheit“ (Wellmann 2004, S. 97) soll dazu führen, dass im Wörterbuch Abstand genommen wird „von den begriffslogisch geprägten Definitionen, die ihren Platz im enzyklopädischen Lexikon wie dem Brockhaus haben, aber nicht in einem Sprachwörterbuch“ (ebd., S. 98), das sich nach Wellmann näher an der Alltagssprache befinden soll. Er schlussfolgert - ähnlich wie Herbst/ Klotz : „‘Soweit es geht’ [durch einfache und verständliche Lexeme definieren, A.T.] - das ist der entscheidende Punkt, wenn es um den Definitionswortschatz geht.“ (Wellmann 2004, S. 102). 209 Von großer Bedeutung ist auch das Kriterium der Nützlichkeit bzw. Brauchbarkeit des ausgewählten Definitionsvokabulars. West (1960, S. IX) verwen- 208 Vgl. auch Kiefer/ Sterkenburg (2003, S. 357). 209 Genau zu bestimmen, was in diesem Zusammenhang einfach bedeutet, ist schwierig. Dies hängt vom jeweiligen Lerner und seinen Erfahrungen ab, beispielsweise werden erwachsene Lerner Internationalismen im Durchschnitt für einfacher halten als Kinder oder Jugendliche. Theoretische Grundlagen 109 det hierfür den Ausdruck „Notwendigkeit“ beziehungsweise „necessity“, was Neubauer (1989, S. 903) als „lexicographic necessity“ aufgreift. 210 Als ein Indiz für „die funktionsgerechte Selektion des Explikationsvokabulars“ (Neubauer 1977, S. 48) gilt für ihn dabei die Tatsache, dass ein Wort in mehreren Sprachen als Explicans verwendet wird. Diese These bekräftigt er später noch einmal, weil „die häufige Verwendung einer Einheit in bereits existierenden Wörterbüchern sicher als ein Indiz für die Brauchbarkeit gelten kann“ (Neubauer 1980, S. 20). Auch Werner (1982, S. 68) erwähnt das Kriterium der Brauchbarkeit in der lexikografischen Praxis für die Auswahl eines Definitionswortschatzes. Damit spricht er bereits eine Gruppe von Wörtern an, auf die Ayto (1984, S. 53f.) später explizit eingeht - „those lexicographically very useful words of high generality that traditionally often form the basic superstructure of a definition: process, situation, problem, and the noun act, for example“ (Hervorh. i. Orig.). Diese „words of particular lexicographic usefulness“ (ebd., S. 53), „that are essential for the definition of others“ (Herbst 1986, S. 102) werden in der Diskussion von vielen Forschern aufgegriffen, beispielsweise von Herbst, Whitcut, Neubauer oder Herbst/ Klotz. 211 Als ein Beispiel für ein solches Wort mit lexikografischem Nutzen nennt Ellegård atom, weil es die Definition vieler anderer Wörter erleichtert (Ellegård 1978, S. 232), Neubauer erwähnt „organ“ und „vehicle“ (Neubauer 1984, S. 121). 212 Wilks (1977, S. 198) merkt jedoch an, dass die Definition dieser Wörter, die in vielen anderen Definitionen verwendet werden, dann selbst „unrevealing“ (‘verschleiert’) wird. An den lexikografisch nützlichen Wörtern wird die unterschiedliche Funktion von Grundwortschatz und Definitionsvokabular besonders deutlich. Sie sind es vor allem, die den Unterschied zwischen beiden Gruppen ausmachen, da sie ebenfalls nicht in Frequenzlisten auftauchen (vgl. Kap. 3.5.1 und 3.5.2). Herbst (1986, S. 116) spricht sich nicht nur für die Aufnahme lexikografisch nützlicher Wörter aus, sondern regt auch den Ausschluss von Wörtern an, die nicht über einen solchen Nutzen verfügen: „On the other hand words with a relatively high frequency ought nevertheless to be excluded from the defining vocabulary if they can serve no useful purpose in definitions.“ Dies betrifft vor allem Synonyme oder „words that 210 Zu West vgl. Kapitel 2.2.1.3. 211 Zu den genauen Quellen vgl. Herbst (1986, S. 102, 116), Whitcut (1986, S. 118f.), Neubauer (1989, S. 903), Herbst (1990, S. 1381), Herbst/ Klotz (2003, S. 52). Vgl. auch Richards (1939, S. 735) und Kapitel 2.2.1.2. 212 Dieses Beispiel wird auch bei Herbst (vgl. 1986, S. 102) und Neubauer (vgl. 1989, S. 903) diskutiert. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 110 can easily be defined through other words of the defining vocabulary“ (Herbst 1986, S. 116). Anstelle von ‘Nutzen’ bzw. „usefulness“ (Neubauer 1987, S. 51) wird auch von ‘Wert’ bzw. „value“ (Bald 2002 , S. 192) oder von ‘Reichweite’ bzw. „range“ (Cowie 1990, S. 688) gesprochen. Die Reichweite ist Teil einer Theorie über die Nützlichkeit von Wörtern, die von Mackey/ Savard stammt. 213 Wie nutzbringend ein Wort ist, hängt demnach von vier Faktoren ab. Der erste Faktor ist die Frequenz des Lexems bzw. seine „Anwendungshäufigkeit in gesprochener und geschriebener Sprache“ (Mackey/ Savard 1967, S. 71). Zweitens wird die „Verteilung, d.h. Anzahl der verschiedenen Texte, in denen das Wort vorkommt“ (ebd.), berücksichtigt. Die Verteilung oder Distribution gilt als „Maßstab für die Stabilität [der, A.T.] Häufigkeit“ (Kühn 1979, S. 34) eines Lexems. Drittens geht es um die Verfügbarkeit oder die „Anwendbarkeit innerhalb eines gegebenen semantischen Feldes“ (Mackey/ Savard 1967, S. 71), also darum, wie stark ein Wort an ein bestimmtes Thema gebunden und dem Sprecher präsent ist. 214 Viertens spielt die Reichweite oder „Mehrwertigkeit (coverage), d.h. Möglichkeit andere Wörter zu ersetzen“ (ebd.; Hervorh. i. Orig.), eine Rolle. Die Reichweite gibt die „Vielfalt der Verwendungsmöglichkeiten eines Wortes“ (Scherfer 1985 , S. 417) bzw. die „capacity of an item to take the place of others“ (Mackey/ Savard 1967, S. 72) wieder. Die Reichweite setzt sich ebenfalls aus vier Faktoren zusammen - dem Maß an Definition, an Inklusion, an Extension sowie an Kombination. Das Maß an Definition ist „the extent to which a word was needed to define another word“ (ebd., S. 73). Es entspricht der Eigenschaft, die Ayto (1984, S. 53f.) bei den lexikografisch nützlichen Wörtern ausmacht, nämlich die Nützlichkeit für die Definition anderer Wörter. Dieses Maß ist umso höher, je häufiger das Wort in den Definitionen anderer Wörter vorkommt. Die ersten zehn Plätze werden im Französischen von le/ l'/ la/ les, de/ d', un, qui, que/ qu', être (als Funktionswort), faire, on, des und en belegt (vgl. Mackey/ Savard 1967, S. 83). Als Maß der Inklusion wird das Vermögen verstanden, andere Wörter zu ersetzen, weil deren Bedeutung im untersuchten Wort bereits enthalten ist, z.B. seat, das chair mit dessen Bedeutungsumfang einschließt. Die Inklusion kann mit der Anzahl der Wörter angegeben werden, die in einem Synonymwörterbuch als (partielle) Entsprechungen verzeichnet sind. Hier werden die ersten zehn Rän- 213 Anders als bei den bisher besprochenen Kriterien handelt es sich bei der Nützlichkeit bzw. der Reichweite um umfangreichere Kriterien, die sich aus mehreren Teilaspekten zusammensetzen. Daher sollten sie mit Kriterien wie der Frequenz nicht auf eine Stufe gestellt werden. 214 Vgl. dazu Michéas mots disponibles, Kapitel 2.2.1.5. Theoretische Grundlagen 111 ge durch tromper, tuer, mourir, fatiguer, partir, homme, suite, railler, montrer und mélange besetzt (Mackey/ Savard 1967, S. 83). Die extensive Kraft „has to do with the power of a word to multiply its meanings“ (ebd., S. 74). Sie meint die Anzahl der möglichen Bedeutungen eines Wortes, also seinen Grad an Polysemie, der umso höher ist, je mehr Bedeutungsvarianten das Wort umfasst. Dieser Grad errechnet sich durch die Zahl der Bedeutungen, mit denen ein Wort im Wörterbuch verzeichnet ist. An erster Stelle stehen hier für die französische Sprache faire, passer, prendre, tirer, rouler, que/ qu', si/ s', tenir, mettre und perdre (ebd ., S. 83). Für das Maß an Kombination wird die Häufigkeit gemessen, mit der das Wort in Komposita und in festen Wortgruppen vorkommt: „[It] represents the power of words to form new lexical items by combining with other words.“ (ebd., S. 75). Auch dieses Maß steigt mit zunehmender Häufigkeit des Auftretens des untersuchten Wortes, angeführt wird die Tabelle von de/ d', le/ l'/ la/ les, à, se/ s', un, en, faire, être (als Funktionswort), avoir und au (ebd., S. 84). Diese vier unabhängig voneinander ermittelten Werte werden durch Korrelations- und Faktorenanalysen miteinander verknüpft, wodurch der Index der Reichweite ermittelt wird, der die Nützlichkeit des Wortes abbildet. 215 Der Reichweitenindex ergibt als die zehn nützlichsten Wörter des Französischen faire, prendre, homme, passer, mourir, mettre, tirer, tête, aller und partir (Mackey/ Savard 1967, S. 84). Dass die Reichweite unabhängig von der Frequenz ist, sieht man daran, dass diese zehn Wörter bei der Häufigkeit zwischen Rang 17 ( faire) und Rang 485 (tirer) liegen (ebd.). Mackey/ Savard (ebd., S. 76) 216 machen noch weitere Beobachtungen: There remained the possibility that coverage measured the same thing as frequency, range and availability. On the face of the evidence accumulated so far, however, this would seem unlikely since, as we have seen, a good portion of the basic vocabulary, established according to these criteria did not appear in one or more of the constituents of coverage. And those which did appear did not seem to have the same importance in coverage as they have in the lists of frequency, range and availability. 215 Starke Kritik an diesem Vorgehen übt Michéa, da die einzelnen Werte unterschiedlicher Natur seien und auf unterschiedliche Art ermittelt werden, sodass sie nicht miteinander verknüpft werden, sondern besser nebeneinander stehen bleiben sollten. Außerdem würden bei den niederfrequenten Wörtern in Abhängigkeit von der Thematik des zusammengestellten Textkorpus große Unterschiede auftreten (Michéa 1974, S. 12). Das letzte Argument findet sich auch bei Muller (1974, S. 17). Zur Ermittlung der Reichweite eines Wortes und zur Kritik an dieser Theorie vgl. auch Quemada ( 1974, S. 19f.). 216 Zu diesem Abschnitt vgl. Mackey/ Savard ( 1967, S. 71ff.), Michéa (1974, S. 12f.), Quemada (1974, S. 19f.), Scherfer (1985 , S. 417f.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 112 Viele Wissenschaftler nennen zudem eine Reihe von kleineren Einzelbeobachtungen, welche die Auswahl des Definitionsvokabulars betreffen. Herbst und Herbst/ Klotz sprechen sich - vor allem in deutschen Lernerwörterbüchern - für die Verwendung von Fremdwörtern aus, da sich hierbei oft um Internationalismen handelt: In the case of a defining vocabulary for a German dictionary, for example, it would seem sensible to include such words as akzeptieren, Prinzip oder [sic] Intention rather than the possibly more common abnehmen [sic], Grundsatz or Absicht on the grounds that foreign learners of German (especially if they know English or a Romance language) might be more familiar with the former than the latter. There is no reason why this potential of Fremdwörter should not be exploited to the full in lexicography. (Herbst 1986, S. 115f.; Hervorh. i. Orig.) 217 Auch die von Whitcut (1988, S. 52) befürwortete Einbeziehung grammatischer Termini fällt - trotz ihrer niedrigen Frequenz - in diesen Kontext: „We need a set of grammatical terms, not only for the definition of function words but also to be able to say, for instance, that alive is used predicatively and main is used attributively“ (Hervorh. i. Orig.). 218 Die oben bereits angesprochene anzustrebende Vermeidung von Synonymen und leicht zu definierenden Wörtern im Definitionsvokabular findet auch bei anderen Forschern Erwähnung. So bildet die mögliche Abdeckung durch Synonyme für West (1960, S. IX) eines seiner Auswahlkriterien. 219 Neubauer und Whitcut schlagen die Synonymenreduzierung als kurzfristige Möglichkeit zur Verkleinerung des Definitionswortschatzes vor. 220 Auf die leicht definierbaren Wörter, die nicht Teil eines beschränkten Definitionsvokabulars sein sollten, bezieht sich Neubauer (1989, S. 903) mehrmals: „It seems to be redundant, for example, to have born and birth [...] in the defining vocabulary, when birth can be defined by ‘when the baby is born’.“ (Hervorh. i. Orig.). 221 Ebenfalls nicht im kontrollierten Definitionswortschatz sollten nach West (1960, S. X) intensive und emotionale Wörter enthalten sein, da der Lerner für Emotionen seine Muttersprache besitzt. Außerdem bevorzugt West bei der Erstellung seiner Liste Wörter der mittleren Stilebene (ebd.). 222 Die Verwendung 217 Vgl. dazu auch Whitcut (1986, S. 121), Jehle (1990b, S. 504), Herbst/ Klotz (2003, S. 52), Wellmann (2004, S. 99f.) sowie Kapitel 3.1.1 und 3.4.2.2.2, Anm. 436. 218 Ähnlich bereits Whitcut (1986, S. 119). 219 Zu West vgl. Kapitel 2.2.1.3. 220 Vgl. Neubauer (1980, S. 60), Whitcut (1988, S. 49). 221 Vgl. hierzu auch Neubauer (1987, S. 53). 222 Zu West vgl. Kapitel 2.2.1.3. Theoretische Grundlagen 113 von faux amis, vor allem bei der Einbeziehung von Internationalismen, sollte selbstverständlich genauso vermieden werden (Herbst 1986, S. 116). 223 Gleiches gilt für veraltende Wörter (Kiefer/ Sterkenburg 2003, S. 357). Für englischsprachige Wörterbücher wird gefordert, dass die Elemente des kontrollierten Definitionswortschatzes im britischen und amerikanischen Englisch die gleiche Bedeutung haben sollten (ebd.). Werden aus den Bestandteilen des begrenzten Definitionsvokabulars Derivate oder Komposita gebildet, müssen diese in ihrer Bedeutung erschließbar sein: As far as derivates and compounds are concerned there are no objections to permitting these in definitions as long as the user can be expected to be able to deduce their meanings from the respective elements of the defining vocabulary. [...] Word formations whose meanings are not easily derivable ought to be listed as separate elements of the defining vocabulary. (Herbst 1986, S. 114) Zu diesem Sachverhalt äußert sich Jehle (1990a, S. 209) ganz ähnlich. Für ihn muss darauf geachtet werden, „dass keine relativ niederfrequenten, nicht transparenten Ableitungen, Komposita oder Mehrwortlexeme Bestandteil der Bedeutungserklärung sind“. 224 Auf den Gebrauch von Mehrwortlexemen beziehen sich Jansen/ Mergeai/ Vanandroye (1987, S. 91) ebenfalls mit ihrer Empfehlung, im Definitionswortschatz auf Phraseologismen und mehrteilige Verben zu verzichten. Sie befürworten auch das Ordnen der unterschiedlichen Bedeutungsvarianten eines Lemmas nach dem Abstraktionsgrad, um Übersichtlichkeit zu erreichen (ebd., S. 90). 225 Bei der Zusammenstellung eines kontrollierten Definitionsvokabulars berufen sich viele Lexikografen auf die Prinzipien von West, die er in seiner General Service List of English Words (West 1960) anwendet. 226 Neben der Frequenz nennt er „Ease or difficulty of learning“, „Necessity“, „Cover“ (ebd., S. IX), „Stylistic level“ (ebd., S. X) und „Intensive and emotional words“ (ebd.) als Kriterien. Mit zunehmendem zeitlichen Abstand wird es jedoch immer wichtiger, Wests Liste durch aktuelle Wörter - „more up-to-date terms“ (Ayto 1984, S. 53) - zu ergänzen. 227 Die folgende Aussage Zgustas (1971, S. 257) gilt als eines der wenigen allgemein anerkannten Prinzipien in der Lexikografie: „The lexicographic definition should consist exclusively of words which 223 Vgl. dazu auch Kiefer/ Sterkenburg (2003, S. 357). 224 Vgl. auch Whitcut (1986, S. 119). 225 Vgl. auch Whitcut (1986, S. 119). 226 Zu West vgl. Kapitel 2.2.1.3. 227 Vgl. auch Herbst (1986, S. 102), Whitcut (1986, S. 121). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 114 are explained in the dictionary.“ Wie oben dargestellt, bezeichnet Rey-Debove (1971, S. 200) dies als „geschlossenes System“. Es versteht sich folglich von selbst, dass dies auch für einen beschränkten Definitionswortschatz Gültigkeit besitzt, der genauso selbst im Wörterbuch lemmatisiert sein muss (Cowie 1999a, S. 9). Neben diesen Faktoren gibt es noch außersprachliche Kriterien, die bei der Erstellung eines begrenzten Definitionsvokabulars von Bedeutung sind. Scherfer (1985, S. 418ff.) geht, allerdings im Zusammenhang mit dem lexikalischen Lernen im Fremdsprachenunterricht allgemein, auf die Wichtigkeit pädagogisch-didaktischer Überlegungen ein, die vor allem die Orientierung an der jeweiligen Lernergruppe und Situation umfasst. 228 Pädagogische Kriterien spielten, wie bereits im Kapitel 2.2.1 dargestellt, im Rahmen des Vocabulary Control Movements ebenfalls häufig eine Rolle. Oft wird über die ideale Größe eines kontrollierten Definitionswortschatzes diskutiert. Weinreich (1967, S. 37) spricht sich noch dafür aus, „to use as few different words in definitions as possible, but to use each as often as possible“, allerdings auf Basis eines vollkommen unbeschränkten Wortschatzes, der in den Definitionen Verwendung findet und der teilweise sogar mehr Lexeme umfasst, als das Wörterbuch Lemmata hat. Spätere Arbeiten betonen, dass „die Frage, wie umfangreich der begrenzte Definitionswortschatz sein soll [... ,] vielleicht sekundär“ (Herbst/ Klotz 2003 , S. 52) ist, denn „solche Angaben sind sowieso wenig aussagekräftig“ (ebd.). So stellt Herbst (1986, S. 114) fest: „For the purpose of a general learners' dictionary the size of the defining vocabulary appears to be relatively irrelevant“, „it is far more important for the defining vocabulary to be sufficiently large to provide clear and semantically accurate definitions than to keep the number of items artificially low“ (ebd.). 229 Dies bringt Stein bereits 1979 mit einer ähnlichen Kritik zum Ausdruck: „For the setting up of a ‘core vocabulary’ of the English language (or any language) it is more important that this vocabulary be semantically selfsufficient than that it be restricted to an arbitrary fixed number of items.“ (Stein 1979, S. 6). Nach einer Untersuchung mehrerer Korpora, die aus wenig mehr als zehn semantischen Primitiva bestehen, äußert sich Neubauer in Bezug auf die Anwendbarkeit solcher Korpora skeptisch, da die daraus resultierende Beschreibungssprache oft nicht lesbar sei. Er bescheinigt ihnen deshalb „vermutlich auch [...] eine mangelnde Eignung für die Verwendung im natür- 228 Vgl. auch Svensén (1993, S. 136). 229 Vgl. auch Herbst (1996, S. 324). Theoretische Grundlagen 115 lich-sprachlichen Wörterbuch“ (Neubauer 1980, S. 16). Der Definitionswortschatz sollte demnach keinesfalls zu klein sein (Herbst 1996, S. 325). Außerdem sollte die Handhabung des kontrollierten Definitionsvokabulars nicht zu streng geschehen, sondern flexibel ausgeführt werden. 230 The defining vocabulary should not be applied too rigorously. Whenever semantic accuracy would suffer by keeping the definition within the framework of the controlled vocabulary, other words must be used in definitions as well. (Herbst 1986, S. 116) Denn auch die Wörter außerhalb des kontrollierten Definitionswortschatzes, die in den Definitionen verwendet werden, erfüllen eine wichtige Funktion als „cross-references and thus add a semasiological component to an onomasiological dictionary“ (ebd., S. 117). Somit kann festgehalten werden: „Wesentlich entscheidender als die Größe des Definitionswortschatzes ist [...] dessen Zusammensetzung.“ (Herbst/ Klotz 2003 , S. 52). Letztendlich sollten die Listen mit einem begrenzten Definitionswortschatz „be used as guides rather than followed slavishly“ (Whitcut 1986, S. 121), denn ihre Zusammenstellung ist zu einem gewissen Grad immer „determined by chance and by arbitrary decisions“ (Herbst 1986, S. 102), „some words on the list could certainly have been replaced by others which would have been equally suitable“ (ebd.). Bereits Ellegård (1978, S. 232) verweist darauf, dass eine solche Liste „nothing sacrosanct“ an sich habe - ein Bild, das später von Neubauer (1987, S. 51) aufgegriffen wird: Above all, it has to be pointed out that such items in a potential Defining Vocabulary are not words on a sacred list just waiting to be discovered, but are items to be chosen and designated as members of this set for their usefulness in describing meaning to a potential user of a dictionary. 2.4 Die Anwendung kontrollierter Definitionswortschätze in Lernerwörterbüchern In diesem Kapitel werden die Wörterbücher vorgestellt, die das Prinzip, mit einem kontrollierten Definitionswortschatz zu arbeiten, bereits anwenden. Da es sich dabei ausschließlich um vier englischsprachige Wörterbücher handelt, werden zudem die deutschen Lernerwörterbücher in ihrem Verhältnis zum Einsatz eines kontrollierten Definitionswortschatzes beschrieben. 230 Vgl. hierzu auch Herbst (1996, S. 324). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 116 2.4.1 Englischsprachige Lernerwörterbücher 2.4.1.1 Longman Dictionary of Contemporary English (LDOCE) 1978 ist das neu erscheinende Longman Dictionary of Contemporary English (LDOCE 1) das erste Wörterbuch, das von einem begrenzten Definitionswortschatz Gebrauch macht. 231 Dieses innovativen Charakters sind sich die Wörterbuchredakteure durchaus bewusst: „This very important feature marks this dictionary out from any but the smallest of its predecessors as a tool for the learner and student of language“ (LDOCE 1 1978, S. VIII ). Die Vorteile eines beschränkten Definitionsvokabulars beschreibt der Linguist Randolph Quirk, einer der Verfasser, im Vorwort: They have evolved a lucid defining vocabulary which will help the user in two respects: first, his knowing this small set of words (about 2,000) is the only prerequisite for understanding the definitions of every word in the dictionary; second, the strict use of the defining vocabulary has in many cases resulted in a fresh and revealing semantic analysis. (LDOCE 1 1978, S. VII) Zur Herkunft, Zusammenstellung und Verwendung des kontrollierten Definitionswortschatzes werden von Quirk folgende Angaben gemacht: All the definitions and examples in the dictionary are written in a controlled vocabulary of approximately 2,000 words which were selected by a thorough study of a number of frequency and pedagogic lists of English, particular reference having been made to A General Service List of English Words [...] by Michael West. Furthermore, a rigorous set of principles was established to ensure that only the most ‘central’ meanings of these 2,000 words, and only easily understood derivatives, were used. (LDOCE 1 1978, S. VIIIf.; Hervorh. i. Orig.) 232 Auf diese Weise soll eines der grundlegendsten lexikografischen Prinzipien erfüllt werden - „that is that the definitions are always written using simpler terms than the words they describe“ (ebd., S. IX; Hervorh. i. Orig.). Der beschränkte Definitionswortschatz wird dabei flexibel gehandhabt. Bei Bedarf finden Wörter von außerhalb des begrenzten Definitionsvokabulars Verwendung, die dann durch Kapitälchenschreibung typografisch hervorgehoben werden (ebd.). Beispielsweise ist harebell in der Definition von campanula - ‘any of various types of plant with bell-like flowers, such as the HAREBELL ’ (ebd., S. 145) - kein Bestandteil des kontrollierten Definitionswortschatzes. Außerdem erfolgt mittels 231 Die Aufnahme dieses neuen Vorgehens durch die Wörterbuchforschung und -kritik wird in den Kapiteln 2.3.1.1 und 2.3.1.2 ausführlich diskutiert. 232 Zur General Service List of English Words (West 1960) vgl. Kapitel 2.2.1.3. Theoretische Grundlagen 117 Computer eine Kontrolle, ob jedes Wort in den Definitionen und Beispielen Teil des kontrollierten Vokabulars ist (LDOCE 1 1978, S. IX). Damit setzt das LDO- CE 1 den Standard für alle nachfolgenden einsprachigen Lernerwörterbücher. Im Anhang des LDOCE 1 befindet sich die Liste mit den Elementen des kontrollierten Definitionsvokabulars (ebd., S. 1283ff.). Bei einer genaueren Betrachtung dieser Auflistung fällt auf, dass häufig Angaben zur Wortartenzugehörigkeit der Lexeme gemacht werden: Abb. 12: Ausschnitt aus dem kontrollierten Definitionswortschatz des LDOCE 1 (1978, S. 1286) In zahlreichen Fällen werden die Lexeme zwei oder mehr Wortarten zugerechnet, beispielsweise erhält after die Markierungen Adverb, Präposition und Konjunktion, welcome zählt als Substantiv, Verb und Adjektiv oder outside sogar als Substantiv, Adjektiv, Adverb und Präposition. 233 Außerdem gibt es Elemente wie alcohol(ic), scarce( ly) oder outdoor (s), die trotz dieser Klammerschreibung als nur ein Lexem gelten. Dadurch vergrößert sich natürlich das durch die Herausgeber werbestrategisch günstig auf 2 000 Elemente geschätzte Definitionsvokabular (vgl. Abb. 13). Selbst bei einer normalen Zählung ohne Berücksichtigung der Zugehörigkeit zu mehreren Wortarten und der Klammerschreibungen umfasst das aufgelistete Definitionsvokabular in Wirklichkeit bereits 2 128 Lexeme. 234 Rechnet man die 467 Fälle mit mehr als einer Wortartenangabe sowie die 49 Klammerschreibungen hinzu, beträgt der eigentliche Umfang des Definitionswortschatzes 2 644 Lexeme. In die Liste sind auch insgesamt 54 Wortbildungsaffixe wie -able, -hood oder unintegriert, was in den Definitionen die Verwendung einer Vielzahl von Wortbildungsprodukten ermöglicht, die an dieser Stelle noch nicht mitgezählt sind. Dieses Vorgehen ist - von der möglichen Kritik aufgrund entstehender undurchsichtiger und unverständlicher Derivate abgesehen - in sich nicht vollkommen schlüssig. Denn trotz der aufgelisteten Suffixe -y und -er werden Lexeme wie difficulty oder foreigner eigens genannt. Wahrscheinlich kann dies nur mit mangelnder Sorgfalt bei der Erstellung der Liste erklärt werden, 233 Zur Kritik an diesem Vorgehen vgl. Kapitel 2.3.1.2. 234 Diese Zahl erhöht sich um eins, wenn man die - wahrscheinlich irrtümliche - Doppelaufnahme von popular hinzurechnet. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 118 ebenso wie Fehler bei der alphabetischen Ordnung, beispielsweise bei modest, das nach moment(ary) eingeordnet ist, oder bei prick, das auf pride folgt. Dies wird in den nachfolgenden Auflagen allerdings behoben. 235 Aufschlussreicher als die Einzelbetrachtung des kontrollierten Definitionsvokabulars im LDOCE 1 ist eine Untersuchung zu dessen Entwicklung über die Jahre in den unterschiedlichen Auflagen, wie dies im Folgenden geschieht (vgl. Abb. 13 und Datensammlung B.1). 236 Für das LDOCE 2 von 1987 wird die Liste des begrenzten Definitionswortschatzes um zahlreiche Elemente erweitert, mit 2 222 Lexemen ist diese Fassung die auf den ersten Blick umfangreichste (vgl. Abb. 13). Diese Einschätzung relativiert sich jedoch, wenn man bedenkt, dass die Zahl der hinzukommenden Klammerschreibungen mit 22 wesentlich geringer ist als in der Vorgängerauflage. Ähnliches gilt auch für die Zählung der Elemente, die mehr als einer Wortart zugerechnet werden, was nur noch in 132 Fällen vorkommt. Insgesamt kann also von einem eigentlichen Umfang von mindestens 2 376 Lexemen im kontrollierten Definitionsvokabular ausgegangen werden, was im Vergleich zur Vorgängerversion eine deutliche Reduzierung bedeutet. Abb. 13: Die Entwicklung des Umfangs des kontrollierten Definitionswortschatzes im LDOCE 1-4 235 In einer umfangreichen Rezension zum LDOCE 2 loben Heath/ Herbst (1988, S. 315ff.) ausführlich die Veränderungen im Vergleich zum LDOCE 1. 236 Die Sammlung der Daten zum Definitionswortschatz in den englischsprachigen Wörterbüchern und zur empirischen Analyse des Definitionswortschatzes im LTWDaF 2 und im DHWDaF 2 befinden sich online unter www.ids-mannheim.de/ pub/ materialien/ sds56.pdf. Theoretische Grundlagen 119 Allerdings erhöht sich diese Zahl in einem unbekannten Ausmaß, da die Redakteure die Wortartenzugehörigkeit nur in den Fällen angeben, in denen die Verwendung um mindestens eine Wortart reduziert ist. Wird ein Element in den Definitionen in all seinen möglichen Wortarten verwendet, erfolgt keine Kennzeichnung. Neben einigen nun einzeln gezählten Lexemen, wie fashion und fashionable anstelle von fashion(able), kommen 174 Lexeme neu hinzu. Die meisten von ihnen sind Derivate oder - seltener - Komposita bereits aufgeführter Lexeme, beispielsweise approval, hopeless oder footpath. Wahrscheinlich geschieht das, um die Kritik an in den Definitionen verwendeten Wortbildungsprodukten, die semantisch nicht durchsichtig sind, zu entkräften (Cowie 1999b, S. 156f.). Außerdem werden die Kardinalzahlen von null bis zehn sowie die Ordinalzahlen von eins bis zehn aufgenommen, wobei two und ten mit ihren Ordnungszahlen vergessen werden. Es kommt jedoch auch zu Streichungen im Vergleich zur Liste von 1978. Alle Monatsnamen und Wochentage fehlen jetzt, ebenso Nationalitätenbezeichnungen (British), religiöse Ausdrücke (Christian, Buddhist, Bible, mosque), Anredewörter (Mr, Miss, Mrs) und zahlreiche Tierbezeichnungen (camel, donkey, mosquito). Cowie (1999b, S. 156) sieht als mögliche Gründe, „[that they] may have been thought too culturally specific to be useful outside a narrow range of definitions“, wohingegen ihm andere gestrichene Wörter, wie coarse oder conquer, als „formal or dated“ (ebd.) erscheinen. Die Wortbildungsaffixe (48 plus eine Klammerschreibung) sind jetzt nicht mehr in die Liste des kontrollierten Definitionsvokabulars integriert, sondern werden im Anschluss daran eigens aufgezählt. In der Ausgabe von 1987 wird außerdem bei homografen Formen die Aussprache angegeben, so zum Beispiel bei lead [ ] bzw. [ ]. Das LDOCE 3 von 1995 verzichtet wieder auf phonetische Angaben. Der Definitionswortschatz ist auf 2 075 Lexeme reduziert, zusammen mit nur noch 117 Fällen von Zuordnungen zu mehreren Wortarten und 17 Klammerschreibungen ergibt sich mit 2 209 Lexemen die bisher niedrigste Gesamtsumme (vgl. Abb. 13). Trotzdem werden auch 152 neue Lexeme aufgenommen, was allerdings die Streichung von 249 Lexemen des Definitionsvokabulars aus dem LDOCE 2 nicht ausgleicht. Unter den Neuaufnahmen finden sich erneut viele Wortbildungsprodukte wie improvement oder replace, am auffälligsten sind jedoch Mehrwortlexeme wie in spite of oder only just, die im Bereich der mehrteiligen Verben teilweise ganze Reihen bilden: look after, look for und look sth up. Die mit dem Definitionsvokabular kombinierbaren Wortbildungselemente werden auf 30 reduziert und finden sich weiterhin im Anschluss an die Liste. Selbst gesellschaftliche Entwicklungen und der Wortschatzwandel spiegeln sich im Definitionswortschatz wider. So werden im LDOCE 3 beispielsweise environment, communication, screen und relaxing aufgenommen. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 120 Diese Trends halten in LDOCE 4 von 2003 weiter an. Im Vergleich zur Vorgängerauflage ändert sich in der Auflistung des kontrollierten Definitionswortschatzes relativ wenig. Er besteht jetzt - wieder leicht erhöht - aus 2 095 Lexemen, hinzu kommen 16 Klammerschreibungen und 115 Fälle einer Zuordnung zu mehreren Wortarten (vgl. Abb. 13). Neu aufgenommen werden 39 Elemente. Dabei handelt es sich einerseits um Bezeichnungen für technische Neuerungen (z.B. email, software und website), andererseits um Lexeme zur Kategorisierung (z.B. horizontal, vertical und biology) oder auch um andere nützliche Ausdrücke (z.B. attitude, extra, herb und switch). Die unverändert 30 Affixe, die mit den Elementen der Liste zu Wortbildungsprodukten kombiniert werden können, werden jetzt in den Erklärungen zum beschränkten Definitionswortschatz aufgezählt. Abb. 14: Ausschnitt aus dem LDOCE 4 (2003, S. 781f.) (für den Zweck der Abbildung grafisch aufbereitet [Anm. d. Red.]) Theoretische Grundlagen 121 Betrachtet man die Entwicklung des kontrollierten Definitionsvokabulars im LDOCE 1-4 (vgl. Abb. 13), stellt man fest, dass dieses zwar jeweils mehr als die vom Herausgeber angegebenen 2 000 Lexeme umfasst, dass es sich aber - das LDOCE 4 ausgenommen - immer stärker dieser magischen Zahl annähert. 237 Neben der Reduktion der tatsächlich angegebenen Lexeme des Definitionswortschatzes erfolgt eine systematische Reduzierung der Klammerschreibungen und der Elemente, die mehr als einer Wortart zugerechnet werden. Insgesamt erwecken vor allem die beiden letzten Ausgaben den Eindruck großer Konsistenz und Stabilität, als sei der Prozess des Findens eines praktikablen Definitionsvokabulars im Wesentlichen abgeschlossen, wenn man einzelne Streichungen und Neuaufnahmen außer Acht lässt. 2.4.1.2 Oxford Advanced Learner's Dictionary of Current English (OALD) 1995 ist ein ganz besonderes Jahr in der englischsprachigen Wörterbuchgeschichte: Mit dem LDOCE 3, dem OALD 5 und dem COBUILD 2 erscheinen gleich drei Neuauflagen bestehender Lernerwörterbücher, mit dem CIDE außerdem ein völlig neues Werk. 238 Davon übernehmen zwei (das OALD 5 und das CIDE) das Konzept des LDOCE, in den Definitionen von einem kontrollierten Definitionsvokabular Gebrauch zu machen. Auch das COBUILD 2 verändert mit der Auflage von 1995 die Art seiner Definitionen und verfolgt seitdem den Ansatz, alle Wörter in ganzen Sätzen zu erklären. 239 Das OALD 5 setzt sich 1995 mit der Einführung eines kontrollierten Definitionsvokabulars ähnlich wie das LDOCE das Ziel, „to make the dictionary definitions easy to understand“ (OALD 5 1995, S. 1417). Die Auswahl des beschränkten Definitionswortschatzes erfolgt nach den Kriterien Frequenz sowie Zugehörigkeit zum Kernwortschatz des Englischen: The words in the list […] were chosen principally according to their frequency in the language, as revealed by the corpus, but also as a ‘core’ vocabulary of real value to students of English. The size of the list was determined by the minimum requirement for producing definitions in natural English that are both accurate and easy to understand. (OALD 5 1995, S. VI ) 237 Bereits Stein (1979, S. 5) spricht davon, „[that] a figure around or better still below 2,000 seems to have a certain magic spell for compilers of controlled vocabulary lists“. 238 In diesem Kapitel steht die Entwicklung ab dem OALD 5 im Mittelpunkt, da Oxford erst ab dieser Auflage einen kontrollierten Definitionswortschatz verwendet. Für die Vorgängerauflagen vgl. Kapitel 2.2.1.4. 239 Da das COBUILD 2 in seinen Definitionen keinen kontrollierten Definitionswortschatz benutzt, wird es an dieser Stelle nicht näher betrachtet. Mit dem COBUILD-Wörterbuch beschäftigen sich beispielsweise Hanks (1987), Carter (1989), Herbst (1996) und Schnelle (1997). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 122 In den Definitionen verwendete Wörter, die nicht zum begrenzten Definitionsvokabular gehören, werden - wie im LDOCE - durch die Setzung in Kapitälchen gekennzeichnet, beispielsweise donkey in der Definition von burro - ‘a small DONKEY used for carrying heavy loads’ (OALD 5 1995, S. 150). Die einzigen Ausnahmen sind Eigennamen wie Jesus oder America, abstufende Farbadjektive wie yellowish sowie primärer Wortschatz, der in Definitionen von aus ihm gebildeten Derivaten oder Komposita verwendet wird, wie bleary in der Definition von blearily (ebd., S. 1417). Der kontrollierte Definitionswortschatz des OALD 5 umfasst - bei einer alleinigen Zählung der im Anhang des Wörterbuchs aufgelisteten Wörter - 3 480 Lexeme (vgl. Abb. 16 und Datensammlung B.1). Damit bleibt er sogar unter der im Vorwort angegebenen Größe von 3 500 Wörtern (ebd., S. VI). Diese Zahl erhöht sich jedoch um 510, wenn man die Wörter hinzurechnet, die mehreren Wortarten zugeordnet werden (vgl. Abb. 15). Mit den drei Klammerschreibungen beträgt die Gesamtzahl des Definitionsvokabulars schließlich 3 993 Wörter. Wortbildungsaffixe sind weder extern noch in der Liste verzeichnet, wodurch sich in der Liste längere Reihen ergeben, wie mit dis- (z.B. disagree, disgust, dishonest und disorder). Auf diese Weise lässt sich auch der im Vergleich zum LDOCE fast doppelt so große Definitionswortschatz erklären. Abb. 15: Ausschnitt aus dem kontrollierten Definitionswortschatz des OALD 5 (1995, S. 1424) Dieses Vorgehen ist technisch natürlich sauberer als das von Longman, da im LDOCE zwar nominell weniger Vokabular verwendet wird, jedoch jedes beliebige Wort aus der Liste des begrenzten Definitionswortschatzes mit den verzeichneten Wortbildungsaffixen kombiniert werden kann. So ist trotz der Liste für den Benutzer des LDOCE letztendlich nicht klar, wie umfangreich das verwendete Definitionsvokabular tatsächlich ist und wie es sich genau zusammensetzt. Bei lead als homografer Form wird im OALD 5 die Aussprache verzeichnet - [ ] bzw. [ ], was sehr stark an LDOCE 2 erinnert. Insgesamt sind weniger kulturgebundene Lexeme verzeichnet als bei Longman, Ausdrücke wie kingdom, camel oder coconut fehlen. Auch dem ersten Versuch der Oxford University Press, ein kontrolliertes Definitionsvokabular zu Theoretische Grundlagen 123 erstellen, merkt man kleinere Unsicherheiten an, was sich in der Doppelverzeichnung von Lexemen (z.B. extreme, near oder square) oder in einer fehlerhaften alphabetischen Ordnung (z.B. fingernail vor finger oder full-time vor full) äußert. Im OALD 6 sind diese Fehler berichtigt. Auch für das OALD werden nachfolgend die Entwicklungen dargestellt, die der kontrollierte Definitionswortschatz in den einzelnen Auflagen erfahren hat (vgl. Datensammlung B.1 und Abb. 16). Abb. 16: Die Entwicklung des Umfangs des kontrollierten Definitionswortschatzes im OALD 5-7 Das OALD 6 von 2000 reduziert sein kontrolliertes Definitionsvokabular stark, um zirka 500 Lexeme, sodass es dann 2 918 Wörter umfasst (vgl. Abb. 16 und Datensammlung B.1). Mit den 467 Lexemen, die mehr als einer Wortart zugerechnet werden können, und den elf Klammerschreibungen ergibt sich eine Summe von 3 396 Lexemen. In einer klaren Anspielung auf die Praxis von Longman, eine zusätzliche Liste mit Wortbildungsaffixen zu verzeichnen, äußern sich die Autoren des OALD 6 (2000, S. VI) im Vorwort: This defining vocabulary [...] includes all the items used in the definitions and is not made artificially shorter by allowing prefixes and suffixes to be attached to the stem of a listed word. Learners can be sure that, if they are familiar with the words in this list, the definitions in the dictionary will pose no problems. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 124 Im Vergleich zur Vorgängerauflage bilden die Eigennamen jetzt die einzigen Ausnahmen, die nicht in Kapitälchen gesetzt werden, obwohl sie kein Bestandteil des kontrollierten Definitionswortschatzes sind. Eine weitere wichtige Neuerung stellt die grundsätzliche Angabe der Wortart bei den Elementen des beschränkten Definitionsvokabulars dar. Nach welchen Kriterien das vorher im OALD 5 geschehen ist, bleibt unklar. Betrachtet man die in der Liste verzeichneten Lexeme, fällt ebenfalls die zunehmende Aufnahme von Mehrwortlexemen oder festen Anschlüssen (z.B. care about, of course und precious stone) auf. Auch aktuelle Wörter wie CD, e-mail oder euro finden Eingang in das begrenzte Definitionsvokabular. Homonyme wie can als Substantiv bzw. als Modalverb werden getrennt aufgelistet, die Angabe der Aussprache bei homografen Formen wird verstärkt (z.B. close [ ] bzw. [ ] oder live [ ] bzw. [ ]). Bemerkenswert ist, dass bei britisch-amerikanischen Dubletten beide Varianten paarweise aufgelistet werden, z.B. autumn/ fall, cinema/ movie theatre oder mark/ grade. Das OALD 7, die aktuellste Auflage des OALD von 2005, zeigt sich gegenüber dem Ansatz des beschränkten Definitionsvokabulars noch überzeugter und selbstbewusster. Der eigene Definitionswortschatz wird als „Oxford 3 000“ (OALD 7 2005, S. R 99) bezeichnet und ist sogar als Warenzeichen eingetragen. Die Auswahl des kontrollierten Definitionsvokabulars erfolgt nach drei Kriterien - Frequenz, Reichweite und Vertrautheit. Die Wörter müssen also erstens in den genutzten Korpora (British National Corpus und Oxford Corpus Collection) ausreichend häufig vorkommen. 240 Zweitens müssen sie über eine große Reichweite verfügen, also in unterschiedlichen Textsorten und Kontexten auftreten. Außerdem werden auch Wörter in den beschränkten Definitionswortschatz aufgenommen, die zwar nicht besonders häufig, den Sprechern jedoch sehr vertraut sind, sowie die lexikografisch nützlichen Wörter im Sinn Aytos (vgl. Aytos 1984, S. 53f. und Kapitel 2.3.2): „These include, for example, words for parts of the body, words used in travel, and words which are useful for explaining what you mean when you do not know the exact word for something.“ (OALD 7 2005, S. R 99). „It is again usefulness that is the deciding factor“ (ebd., S. VIII). 240 Zum Terminus Korpus vgl. Kapitel 3.2.1. Das British National Corpus (BNC) besteht aus rund 100 Millionen laufenden Wörtern, die sich zu 90 Prozent aus schriftlichen und zu zehn Prozent aus mündlichen Texten zusammensetzen. Zu näheren Informationen vgl. Universität Oxford (2005). Zur Zusammenstellung der Oxford Corpus Collection lassen sich keine genaueren Angaben finden. Theoretische Grundlagen 125 Abb. 17: Ausschnitt aus dem OALD 7 (2005, S. 748f.) (für den Zweck der Abbildung grafisch aufbereitet [Anm. d. Red.]) Die Lexeme des kontrollierten Definitionsvokabulars werden im Wörterverzeichnis als Lemmata durch einen größeren Schriftgrad hervorgehoben und durch das Symbol eines Schlüssels als Schlüsselwörter gekennzeichnet (vgl. Abb. 17). Diese Schlüsselwörter erhalten in ihren Artikeln eine besonders umfangreiche Mikrostruktur mit „more examples of use, special notes explaining synonyms or related words, or helpful illustrations“ (OALD 7 2005, S. R 99). Der überdurchschnittlich ausgeprägten Polysemie der Schlüsselwörter sind sich die Wörterbuchredakteure bewusst, wie die Anmerkung „often these words [of the Oxford 3 000, A.T.] have many meanings“ (ebd.) zeigt. In der Liste des beschränkten Definitionsvokabulars des OALD 7 werden britische und amerikanische Wortäquivalente nicht mehr paarweise aufgelistet, stattdessen erhält jede spezielle Verwendung eines Lexems den Zusatz BrE (British English) oder NAmE (North American English). Die grundsätzliche Wortartenangabe bei jedem Schlüsselwort wird beibehalten. Um der Aussage Rechnung zu tragen, „that the keywords make an excellent starting point for Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 126 expanding your vocabulary“ (OALD 7 2005, S. 99), werden Schlüsselwörter aus einer Wortfamilie grundsätzlich gemeinsam aufgelistet, also beispielsweise auch Präfigierungen mit un-, wie unexpected und unexpectedly unter expect. Unter den Präfigierungen erfolgt dann jeweils ein Verweis auf das entsprechende Basiswort: unexpected, unexpectedly expect. In einer zweiten Fallgruppe gibt es sehr häufig Verweise von Kurzwörtern oder Abkürzungen auf die jeweilige Vollform, z.B. bei ad advertisment, c abbr. cent oder No. (also no.) abbr. number. Abkürzungen werden mit dem Kürzel abbr. für abbreviation gekennzeichnet. Der dritte Fall bei den Verweisen betrifft die Verben, bei denen von unregelmäßigen Stammformen auf die Infinitivgrundform verwiesen wird, beispielsweise bei spoken speak oder bei swollen swell. Viertens und letztens tauchen Verweise bei orthografischen Varianten auf, hier wird von der amerikanischen auf die britische Variante verwiesen, wie bei mom (NAmE) mum, gray (NAmE) grey oder inquiry enquiry. Die Entwicklung, auch Wortverbindungen in die Liste des begrenzten Definitionswortschatzes aufzunehmen, setzt sich weiter fort. Ganz besonders auffällig ist in diesem Zusammenhang die Aufnahme von Kollokationen in Form von Funktionsverbgefügen wie take advantage of oder make friends (with). Die Zahl der Klammerschreibungen im beschränkten Definitionsvokabular erhöht sich im Vergleich zu den Vorgängerauflagen stark. Meist handelt es sich dabei jedoch nicht um wirkliche Varianten wie bei among (also amongst), sondern um die Angabe grammatischer Anschlüsse, z.B. approve (of ), cope (with), depend (on), in exchange ( for), listen (to), take part (in) oder wake (up). Die zuletzt genannten Eigenschaften - die Zusätze BrE oder NAmE, die grundsätzliche Wortartenangabe, die stark ausgebaute Verweisstruktur, die Aufnahme von Mehrwortlexemen und Kollokationen sowie die Angabe grammatischer Anschlüsse in Klammern - sorgen für eine viel umfangreichere Mikrostruktur in der Liste des kontrollierten Definitionswortschatzes. So können Benutzer noch effektiver damit arbeiten. In der Liste sind erstmals für das OALD sieben Wortbildungsaffixe aufgeführt, deren Zuordnung allerdings nicht konsequent erfolgt. So werden anti-, ex-, non- und reals Präfixe ( prefix) sowie -ish als Suffix (suffix) bezeichnet, midsowie selfhingegen allgemeiner als Wortbildungselemente (combining form). Im Anschluss an die Liste des beschränkten Definitionsvokabulars finden sich noch weitere Vokabelzusammenstellungen. Den Anfang machen die 78 language study terms, „which are important for language study, but less important in everyday life“ (OALD 7 2005, S. R 99). Sie sollen die grammatischen und pragmatischen Informationen in den Wörterbucheinträgen für den Benutzer verständlicher machen. Danach folgen Listen mit weiterführendem Vokabular zu unter- Theoretische Grundlagen 127 schiedlichen Themen wie Nahrung, Kunst oder zur Beschreibung von Menschen. Sie enthalten die Lexeme, die nach dem Oxford 3 000 am wichtigsten sind. Erstmals im OALD sind in der Liste des kontrollierten Definitionsvokabulars mehr Lexeme aufgeführt, als offiziell angegeben werden. Ein Grund hierfür könnte - verglichen mit der tatsächlichen Anzahl von rund 3 500 Wörtern - in der höheren Werbewirksamkeit einer Zahl wie 3 000 liegen. Addiert man zu den 3 482 tatsächlich verzeichneten Lexemen des begrenzten Definitionswortschatzes noch die 629 Fälle der Zugehörigkeit zu mehreren Wortarten sowie die 32 Klammerschreibungen hinzu, kommt man auf eine Gesamtsumme von 4 143, den bisher insgesamt höchsten Wert für einen kontrollierten Definitionswortschatz (vgl. Abb. 16 und Datensammlung B.1). Bei einem Vergleich des beschränkten Definitionswortschatzes im OALD 5-7 über die drei unterschiedlichen Auflagen seit 1995 lässt sich keine so klare Entwicklungsrichtung feststellen wie beim LDOCE 1-4. Nach einer Reduktion des im OALD 5 verzeichneten Vokabulars (3 480 Wörter) um 562 Wörter im OALD 6 (2 918 Wörter) findet sich im OALD 7 mit 3 482 Wörtern fast genau die ursprüngliche Zahl. Ähnliches gilt auch für die Anzahl der Elemente, die in mehr als einer Wortart verwendet werden - von 510 im OALD 5 sinkt die Zahl zunächst auf 467 im OALD 6, im OALD 7 steigt sie auf 629. Allein die Zahl der Klammerschreibungen nimmt stetig zu - von drei im Jahr 1995 auf elf im Jahr 2000 und 32 im Jahr 2005. Über die drei Auflagen wächst jedoch nicht nur der Umfang des kontrollierten Definitionsvokabulars, auch die Angaben zu den einzelnen Elementen des begrenzten Definitionswortschatzes werden ausführlicher. Der Benutzer kann einem einzelnen Eintrag der Liste zum kontrollierten Definitionswortschatz im OALD 7 viel mehr Informationen zur Grammatik und Pragmatik des Wortes entnehmen als in den vorherigen Auflagen. Man kann schon beinahe von einem ‘Wörterbuch im Wörterbuch’ sprechen. 2.4.1.3 Cambridge International Dictionary of English (CIDE ) und Cambridge Advanced Learner's Dictionary (CALD) Neben der Oxford University Press mit dem OALD 5 übernimmt 1995 noch ein weiterer Verlag das Vorgehen von Longman, in englischsprachigen Lernerwörterbüchern mit einem kontrollierten Definitionswortschatz zu arbeiten - die Cambridge University Press mit dem Cambridge International Dictionary of English (CIDE). Im Unterschied zum OALD, das in seiner ersten Auflage bereits 1942 erschien (vgl. Kap. 2.2.1.4), stellt das CIDE 1995 eine völlige Neukonzeption dar. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 128 In Anlehnung an Longman wird der Umfang des beschränkten Definitionswortschatzes mit „under 2 000 words“ (CIDE 1995, S. 1702) angegeben. Als Kriterien der Zusammenstellung werden folgende sieben genannt: 1. das Definitionsvokabular ist für Lerner leicht verständlich, 2. es enthält Wörter mit hoher Frequenz, 3. es enthält Wörter, die für das Erklären anderer Wörter hilfreich sind, 4. es enthält Wörter mit der gleichen Bedeutung im britischen und amerikanischen Englisch, 5. es vermeidet veraltete Wörter, 6. es vermeidet Wörter, die oft mit Fremdwörtern verwechselt werden und 7. es vermeidet Wörter, die oft mit anderen englischen Wörtern verwechselt werden (ebd.). Mit diesen Kriterien legt das CIDE recht ausführlich offen, nach welchen Prinzipien die Erstellung des begrenzten Definitionswortschatzes erfolgt, und erfüllt gleichzeitig die an Lernerwörterbücher gestellten Anforderungen, was die Auswahl der Lexeme und ihre Beschreibung betrifft (vgl. Kap. 2.1.1). Wie im LDOCE werden Lexeme außerhalb des kontrollierten Definitionswortschatzes, die trotzdem in den Definitionen verwendet werden, durch Kapitälchenschreibung hervorgehoben, so zum Beispiel hawk in der Definition von kite - ‘a large HAWK ’ (CIDE 1995, S. 782). Das CIDE ist das Wörterbuch, bei dem der offiziell angegebene und der tatsächliche Umfang des kontrollierten Definitionsvokabulars im größten Missverhältnis zueinander stehen. Die wirkliche Anzahl der in der Liste aufgeführten Lexeme ist doppelt so hoch wie die, die dem Benutzer in den Wörterbuchaußentexten suggeriert wird. Zählt man allein die in der Liste verzeichneten Wörter, kommt man bereits auf 3 745 Lexeme. Unter Hinzurechnung der 247 Wörter, die in mehr als einer Bedeutung angesetzt werden, und der einen Klammerform ergibt sich eine Gesamtsumme von 3 993 Lexemen - gegenüber unter 2 000 in der offiziellen Zählung (vgl. Abb. 19 und Datensammlung B.1). Bei einer näheren Betrachtung der CIDE-Liste fällt als Erstes auf, dass die verzeichneten Wörter nicht in ihrer Verwendung als unterschiedliche Wortarten differenziert werden, sondern nach ihrer Semantik: Abb. 18: Ausschnitt aus dem kontrollierten Definitionswortschatz des CIDE (1995, S. 1424) Theoretische Grundlagen 129 Die einzelnen Bedeutungen sind in Versalien in Klammern hinter dem Element des kontrollierten Definitionswortschatzes aufgeführt. So steht nach bear beispielsweise ( ANIMAL ) und ( ACCEPT ), nach show ( MAKE SEEN ), ( DIRECT ), ( EXPLAIN ), ( PUBLIC EVENT ) und ( ENTERTAINMENT ) oder nach touch ( USE FINGERS ) und ( CLOSE TOGETHER ). Besonders offensichtlich wird das bei dem Beispiel close, das einmal als ( NOT OPEN ) angesetzt wird, zu dessen Eintrag dann closed gestellt wird, und danach in den Bedeutungen ( NEAR ) und ( RELATED ), die mit closeness und closely ergänzt werden (vgl. Abb. 18). Wortbildungsaffixe werden im CIDE nicht eigens verzeichnet, dafür sind die Wortfamilien stark ausgebaut, wie bei admire, admirable, admirably, admiration, admirer, admiring, admiringly oder help ( MAKE EASIER ), helper, helpful, helpfully, helpfulness, helpless, helplessly, helplessness ersichtlich wird. Wie die Beispiele zeigen, wird das Wortfamilienprinzip damit auch über die alphabetische Ordnung gestellt. Sehr auffällig ist die Aufnahme von Bestandteilen, die adjektivische Derivate aus syntaktischen Fügungen oder Komposita bilden. Die insgesamt 35 verzeichneten Elemente dienen in den Wörterbuchdefinitionen einer genaueren Umschreibung und stammen als Teile von Zusammenbildungen wie -haired, -toed oder -blooded häufig dem Themenbereich Körper. Darunter finden sich jedoch auch allgemeinere Elemente wie -based, -looking oder -covered, die häufig als Zweitglieder für Rektionskomposita dienen. Der Wunsch nach einer möglichst genauen Beschreibungssprache deckt sich mit der Feststellung, dass die im CIDE als Definitionsvokabular aufgelisteten Lexeme außerdem viele Fachausdrücke enthalten, beispielsweise auxiliary, cylinder oder mammal. Weiterhin finden sich zahlreiche Lexeme, die sich auf lokale Gegebenheiten oder auf die äußere Form von Objekten beziehen, z.B. diagonal, eastern, rectangle oder oval. Durch diese Vorgehensweise kann in den Wörterbuchartikeln eine genaue Definition der Lemmata erreicht werden. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 130 Abb. 19: Der Umfang des kontrollierten Definitionswortschatzes im CIDE Zehn Jahre später nutzt der Verlag das CIDE als Grundlage für die zweite Auflage des Wörterbuchs, die in Anlehnung an das OALD in Cambridge Advanced Learner's Dictionary (CALD) umbenannt wird. Das CALD basiert auf dem Cambridge International Corpus. 241 Als weitere Neuerung werden die häufigsten Bedeutungen durch eine Markierung und Blaudruck des Lemmas hervorgehoben. Die Information zur Frequenz erfolgt dabei in einem dreistufigen System von Essential (E) über Improver (I) zu Advanced (A). Die Markierung Essential für extrem verbreitete Lexeme oder Kernkonzepte erhalten rund 4 900 Bedeutungen. Das zweite Niveau Improver umfasst rund 3 300 weitere Bedeutungen, die ebenfalls verbreitet sind und nützliche Konzepte darstellen. Als Advanced werden schließlich die rund 3 700 zusätzlichen Bedeutungen bezeichnet, die für ein flüssiges und natürliches Englisch wichtig sind (CALD 2005, S. VII). 241 Das Cambridge International Corpus (CIC ) setzt sich aus mündlichen und schriftlichen Texten britischer und nordamerikanischer Sprecher zusammen und besteht laut Homepage aktuell aus über einer Milliarde laufenden Wörtern. Zu näheren Informationen vgl. Cambridge University Press (2010). Im Wörterbuch selbst wird die Größe des Korpus mit rund 600 Millionen Wörter angegeben (vgl. CALD 2005, S. VII). Theoretische Grundlagen 131 Abb. 20: Ausschnitt aus dem CALD (2005, S. 615) In den alphabetischen Teil sind rund 400 Kästen mit zirka 25 000 Kollokationen, eigens hervorgehobene Abschnitte mit typischen Lernerfehlern oder Gebrauchshinweisen sowie zahlreiche Illustrationen eingebettet. Zu den vorderen Wörterbuchaußentexten des CALD gehört neben den Informationen zur Benutzung des Wörterbuchs auch eine Übersicht mit wichtigen Zahlen, die wie Lexeme behandelt werden. In der Mitte des Wörterbuchs befinden sich 16 farbige Tafeln mit Abbildungen zu Früchten, Gemüse, Pflanzen, Tieren, zum menschlichen Körper, zu Kleidung, Frisuren und Kopfbedeckungen, mehrgliedrigen Verben, Sportarten, zum Auto, zu sonstigen Fahrzeugen, zum Büro und zur Küche. Gefolgt wer- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 132 den diese Abbildungen von einer so genannten Study Section, welche thematisch geordnete Übersichten zu bestimmten Bereichen der Lexik, Grammatik und Aussprache sowie Informationen zum Verfassen von Briefen, zur Flexion, zur Zeichensetzung und zu den einzelnen Varietäten des Englischen enthält. Zu den hinteren Wörterbuchaußentexten des CALD zählen neben einer Übersicht, die das Finden von Phraseologismen erleichtert, eine Liste mit wichtigen Wortfamilien, Verzeichnisse mit geografischen Namen, mit gebräuchlichen Vornamen, mit Prä- und Suffixen, mit den Stammformen der unregelmäßigen Verben, eine Übersicht zur Bildung der Zeitformen sowie eine Aufstellung von Symbolen. Die CD-ROM zum Wörterbuch ermöglicht eine komfortablere Suche, sie enthält zudem Tondokumente zur Aussprache, zusätzliche Beispielsätze, Informationen zu den Kollokationen, interaktive Übungen und einen Thesaurus (CALD 2005, S. VII). Zu den Definitionen und ihrem Wortschatz werden in den Benutzerhinweisen des CALD die folgenden Angaben gemacht: Definitions are written using only words from a list of common words that are easy to understand. Any word in the definition which does not come from that list is shown in SMALL CAPITALS . You can look for the meaning of that word at its own entry, although a short explanation is often given. (CALD 2005, S. VIII; Hervorh. i. Orig.) Dies klingt auf den ersten Blick so, als ob sich im Vergleich zum Vorgänger CIDE am Vorgehen des Definierens nichts geändert hätte - es existiert eine Liste mit gebräuchlichen, leicht verständlichen Wörtern, die als beschränkter Definitionswortschatz in den Definitionen des Wörterbuchs verwendet werden. Geht das in den Definitionen benutzte Vokabular über diese Liste hinaus, wird das durch Kapitälchenschreibung der betreffenden Lexeme deutlich gemacht. Im Unterschied zum CIDE gibt es im CALD jedoch keine weiteren Angaben zum Definitionswortschatz, beispielsweise hinsichtlich seiner Auswahl und Zusammensetzung. Auch die im CIDE vorhandene Auflistung des Definitionswortschatzes im Anhang fehlt im CALD völlig. Die Homepage des Verlages gibt dazu ebenfalls keine Auskunft, eine Anfrage beim Verlag blieb ergebnislos. Für den nicht muttersprachlichen Lerner ist das Fehlen dieser Übersicht von Nachteil. An dieser Stelle kann deshalb weder genauer auf den im CALD verwendeten Definitionswortschatz eingegangen noch die Entwicklung vom CIDE zum CALD dargestellt werden. Theoretische Grundlagen 133 2.4.1.4 Vergleich zwischen LDOCE, OALD und CIDE/ CALD Zusammenfassend werden im Folgenden die Herangehensweisen der britischen Verlage Longman, Oxford University Press und Cambridge University Press dargestellt, mit einem begrenzten Definitionswortschatz zu arbeiten. a b c a/ c b/ c Wörterbuch Jahr verzeichneter wortschatz inkl. Zuordnung zu mehreren Wortarten und Klammerschreibungen vom Verlag angegeben Quotient 1 (Spalte a/ c) Quotient 2 (Spalte b/ c) LDOCE 1 1978 2 128 2 644 ca. 2 000 1,06 1,32 LDOCE 2 1987 2 222 2 376 ca. 2 000 1,11 1,19 LDOCE 3 1995 2 075 2 209 ca. 2 000 1,04 1,10 LDOCE 4 2003 2 095 2 226 ca. 2 000 1,05 1,11 OALD 5 1995 3 480 3 993 3 500 0,99 1,14 OALD 6 2000 2 918 3 396 < 3 000 0,97 1,13 OALD 7 2005 3 482 4 143 3 000 1,16 1,38 CIDE 1995 3 745 3 993 < 2 000 1,87 2,00 CALD 2005 k.A. nicht zu ermitteln k.A. - - Tab. 1: Der offiziell angegebene und der im Anhang aufgelistete Definitionswortschatz in den englischsprachigen Lernerwörterbüchern Alle drei Verlage legen den kontrollierten Definitionswortschatz vor dem Verfassen der Definitionen fest. 242 In den Wörterbuchaußentexten geben sie den Umfang des kontrollierten Definitionsvokabulars in einer werbestrategisch günstigen, im Verhältnis zu den tatsächlich verzeichneten Wörtern jedoch viel zu niedrig angesetzten Höhe an. Bei Longman und im CIDE von Cambridge sind das 2 000, bei Oxford aktuell 3 000 Wörter. Das Missverhältnis zwischen dem wirklich verzeichneten und dem offiziell genannten Definitionswortschatz ist im CIDE mit 2 : 1 am größten, gefolgt vom OALD 7 mit einem Verhältnis von knapp 1,4 : 1. Bei Longman fällt auf, dass sich die tatsächliche Größe des Definitionswortschatzes über die Jahre hin zumindest der offiziell vom Verlag angegebenen Zahl annähert. 242 Das unterscheidet die drei Verlage vom COBUILD-Wörterbuch, vgl. Kapitel 2.3.2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 134 Um den Umfang des verwendeten Definitionswortschatzes aus Werbegründen nach außen hin so klein wie möglich erscheinen zu lassen, wenden die Verlage einige Kunstgriffe an. So werden zusätzlich zu den verzeichneten Lemmata Affixe in die Liste des kontrollierten Definitionswortschatzes integriert (LDOCE 1 und OALD 7) oder in einer eigenen Liste aufgeführt (LDOCE 2-4). Mit diesen Präfixen und Suffixen können die Lexeme der Liste Derivate bilden, was den in den Definitionen verwendeten Wortschatz beträchtlich vergrößert. Auch die Bildung von Komposita aus Lexemen der Liste ist teilweise gestattet (LDOCE 2), nach Angaben der Verfasser jedoch nur bei semantischer Transparenz. Das CIDE äußert sich nicht zu dieser Frage, verzeichnet allerdings Teile von Derivaten aus syntaktischen Fügungen als Strichlemmata (z.B. -blooded ). In den frühen Auflagen der Wörterbücher sind Elemente des kontrollierten Definitionsvokabulars noch miteinander kombinierbar. Die Bildung solcher Mehrwortlexeme, deren Bedeutung sich vor allem bei den mehrteiligen Verben nicht aus den einzelnen Bestandteilen erschließen lässt, wird ab dem LDOCE 2 durch die starke Kritik an diesem Vorgehen jedoch untersagt (vgl. Kap. 2.3.1.2). Eine weitere Möglichkeit zur Reduzierung des Umfangs des begrenzten Definitionswortschatzes ist das Arbeiten mit Klammerschreibungen wie fashion(able), die am stärksten im LDOCE 1 auftreten. In den späteren Auflagen und bei den anderen Verlagen handelt es sich bei den Klammerschreibungen meist um die zusätzliche Angabe präpositionaler Anschlüsse. Bei Longman und Oxford wird das beschränkte Definitionsvokabular außerdem in der Funktion unterschiedlicher Wortarten verwendet und dies nicht einmal angezeigt, solange eine Wortform nicht um mindestens eine mögliche Wortartenverwendung reduziert ist. Eine semantische Unterscheidung erfolgt nicht, sodass der kontrollierte Definitionswortschatz theoretisch in all seinen Sememen in den Definitionen verwendet werden kann. Jedoch verweisen sowohl das OALD 5 als auch das LDOCE 2-4 darauf, nur „[the] main and most common meaning“ (OALD 5 1995, S. 1417) zu verwenden. Allein das CIDE markiert sein begrenztes Definitionsvokabular nicht mittels der Wortarten, sondern semantisch. Dass Longman von allen drei Verlagen die längste Erfahrung mit der Verwendung eines beschränkten Definitionswortschatzes besitzt, bemerkt man an seiner Vorbildrolle für die anderen. So wird das Vorgehen, den in den Definitionen verwendeten Wortschatz, der nicht zum begrenzten Definitionswortschatz gehört, in Kapitälchen zu schreiben, vom OALD 5-7 und vom CIDE/ CALD übernommen. Oxford übernimmt außerdem noch die phonetischen Angaben bei homografen Formen von Longman. Verlagsübergreifend zeigt sich bei Theoretische Grundlagen 135 Longman und der Oxford University Press die Entwicklungstendenz, zunehmend häufiger Mehrwortlexeme in den begrenzten Definitionswortschatz aufzunehmen, die Wortfamilien auszubauen und die zusätzlichen Angaben zu den Elementen auszuweiten, was sich beim OALD 5 am deutlichsten äußert. Anfängliche Unsicherheiten und kleine Fehler der Erstauflagen, die sich in nicht alphabetischer Sortierung oder in der Doppelverzeichnung einzelner Elemente offenbaren, werden in den folgenden Neubearbeitungen berichtigt. Die Herangehensweise von CIDE sticht insgesamt am deutlichsten heraus, da sich Cambridge weniger stark als Oxford an Longman orientiert. Der Anteil der verlagsspezifischen Lexeme ist bei Longman am niedrigsten, was teilweise wieder auf die größte Erfahrung zurückgeführt werden kann, jedoch auch in der niedrigsten Gesamthöhe des kontrollierten Definitionsvokabular begründet liegt. So werden von Longman im begrenzten Definitionswortschatz nur rund 130 Wörter verwendet, die in den Listen der anderen beiden Verlage nicht auftauchen, bei Cambridge sind es immerhin zirka 1 100 und bei Oxford sogar 1 600 Wörter (vgl. Datensammlung B.1). Trotz all dieser Unterschiede verfolgen alle drei Verlage das gleiche Ziel - die Definitionen für den nicht muttersprachlichen Benutzer verständlicher zu machen. 2.4.2 Die deutschen Lernerwörterbücher und ihr Verhältnis zum kontrollierten Definitionswortschatz Bis in die Neunzigerjahre des vergangenen Jahrhunderts existiert kein Wörterbuch für Deutsch als Fremdsprache. Seither hat sich die deutsche Wörterbuchlandschaft stark gewandelt - mehrere Verlage publizieren entsprechende Nachschlagewerke, wie die Tabelle 2 zeigt: Titel/ Kurztitel Verlag Jahr Umfang Besonderheiten LWB 1 Langenscheidt 1993 k.A. LWB 2 Langenscheidt 1998 k.A. LWB 3 Langenscheidt 2003 66 000 Stichwörter und Wendungen LWB 4 Langenscheidt 2008 66 000 Stichwörter und Wendungen LTWBDaF 1 Langenscheidt 2003 rund 30 000 Stichwörter, Wendungen, Beispiele und Ableitungen computerkontrollierter Definitionswortschatz Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 136 Titel/ Kurztitel Verlag Jahr Umfang Besonderheiten LTWBDaF 2 Langenscheidt 2007 rund 30 000 Stichwörter, Wendungen, Beispiele und Ableitungen computerkontrollierter Definitionswortschatz DSWDaF Duden 2002 rund 18 500 Stichwörter DHWDaF 1 Duden/ Hueber 2003 11 200 Stichwörter computerkontrollierter Erklärungswortschatz DHWDaF 2 Duden/ Hueber 2007 11 200 Stichwörter computerkontrollierter Erklärungswortschatz Kempcke Walter de Gruyter 2000 ca. 20 000 Stichwörter Basiswörterbuch Deutsch als Fremdsprache Pons 1999 8 000 Stichwörter Großwörterbuch Deutsch als Fremdsprache Pons 2004 77 000 Stichwörter, Wendungen und Konstruktionsangaben Kompaktwörterbuch Deutsch als Fremdsprache Pons 2007 rund 42 000 Stichwörter und Wendungen Wahrig Großwörterbuch Deutsch als Fremdsprache Wissen Media 2008 rund 70 000 Stichwörter, Anwendungsbeispiele und Redensarten Tab. 2: Die deutschen Wörterbücher für Deutsch als Fremdsprache Im Jahr 1993 erscheint mit dem Langenscheidts Großwörterbuch Deutsch als Fremdsprache (LWB 1) das erste Wörterbuch für Deutsch als Fremdsprache. Seither ist es in mehreren Neubearbeitungen erschienen. Mit „rund 66 000 aktuellen Stichwörtern und Wendungen“ (LWB 4 2008, S. 4) gehört es zu den umfangreicheren Lernerwörterbüchern. In der Zahl der verzeichne- Theoretische Grundlagen 137 ten Lemmata wird es allein vom Pons Großwörterbuch Deutsch als Fremdsprache übertroffen. Dieses kommt 2004 auf den Markt und enthält „rund 77 000 Stichwörter, Wendungen und Konstruktionsangaben“ (Pons Großwörterbuch Deutsch als Fremdsprache 2004, hinterer Buchdeckel). Ähnlich umfangreich ist das Wahrig Großwörterbuch Deutsch als Fremdsprache, das 2008 erscheint. Das Kompaktwörterbuch Deutsch als Fremdsprache von Pons mit rund 42 000 Stichwörtern und Wendungen wird 2007 veröffentlicht. Das nächstkleinere Wörterbuch für Deutsch als Fremdsprache, das Kempcke 2000 bei de Gruyter publiziert, hat einen Umfang von „ca. 20 000 Stichwörtern“ (Kempcke 2000, S. IX). Ein weiteres Pons-Wörterbuch, das Basiswörterbuch Deutsch als Fremdsprache, besteht bereits seit 1999. Mit 8 000 Stichwörtern ist es das kleinste der existierenden DaF-Wörterbücher. 2003 erscheinen bei Langenscheidt und Duden/ Hueber mit dem Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTWDaF 1) und dem Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (DHWDaF 1) zwei weitere Wörterbücher für Deutsch als Fremdsprache, die für sich in Anspruch nehmen, ihre Definitionen mit einem computerkontrollierten Definitionswortschatz zu verfassen. 243 Die Frage, wie sich die deutschen Lernerwörterbücher zum kontrollierten Definitionsvokabular verhalten, stellt sich die lexikografische Forschung erst seit Ende der Neunzigerjahre in Ansätzen. Verbunden ist diese Fragestellung mit dem strittigen Punkt, ob der Einsatz eines begrenzten Definitionswortschatzes in Lernerwörterbüchern des Deutschen überhaupt sinnvoll ist. Bei der Suche nach den Ursachen lassen sich insgesamt zwei große Gruppen von Motiven unterscheiden - sprachexterne und sprachinterne Gründe. Der Bereich der sprachexternen Gründe setzt sich aus einer Vielzahl von Ursachen gesellschaftlich-politischer und forschungshistorischer Art zusammen. Der erste Grund besteht in dem unterschiedlich hohen Prestige, das Wörterbücher in den verschiedenen Ländern besitzen. Im englischsprachigen Raum genießen Wörterbücher ein ungleich höheres Ansehen als im deutschsprachigen, sie erfahren dort eine größere gesellschaftliche Aufmerksamkeit. Neuerungen auf dem Wörterbuchmarkt werden hierzulande hingegen kaum zur Kenntnis genommen: Wie viele Leute kaufen sich schon ohne zwingenden Grund die Neuauflage eines Wörterbuchs, von dem sie eine frühere besitzen, oder ein neu entwickeltes Wörterbuch, wenn sie ein ähnliches schon haben? Wer heute einen Wa- 243 Das LTWDaF 1-2 und das DHWDaF 1-2 werden in den Kapiteln 3.1.1 und 3.1.2 ausführlich vorgestellt. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 138 gen aus dem Jahr 1960 fährt, tut bewusst etwas Besonderes; wer heute ein Textverarbeitungsprogramm aus dem Jahr 1970 verwendet, spinnt; aber wer heute ein Wörterbuch vergleichbaren Alters benutzt, tut etwas weitgehend Selbstverständliches. (Herbst/ Klotz 2003 , S. 284) Einzig der Band 1 der Duden-Reihe, der Rechtschreibduden, verfügt in Deutschland über solch einen starken Autoritätscharakter, dass er „wohl in vielen Haushalten anzutreffen“ ist (Herbst/ Klotz 2003 , S. 285). 244 Die Situation lässt sich jedoch auf keinen Fall mit der in Großbritannien und den USA gleichsetzen, wo das Wörterbuch als „the most successful and significant book about language“ (Ilson 1985, S. 1) gilt und wo über 90 Prozent der Haushalte ein Wörterbuch besitzen, was bei Weitem die Verbreitung von Kochbüchern (70 Prozent), aber auch die der Bibel (80 Prozent) übertrifft (ebd.). Auch Algeo ( 1989 , S. 29) stellt fest: English speakers have adopted two great icons of culture: the Bible and the dictionary. As the Bible is the sacred Book, so the dictionary has become the secular Book, the source of authority, the model of behavior, and the symbol of unity in language. Ilson (1985, S. 1) kommentiert: „For us English-speakers, the contents of the dictionary are part of the normative social discourse that helps to constitute, maintain and give identity to our speech community.“ 245 Vergleicht man die beiden Sprachen Deutsch und Englisch hinsichtlich ihrer Bedeutung als Fremdsprache, wird der nächste Grund sehr deutlich: Deutsch als Fremdsprache wird weltweit von rund 15 bis 20 Millionen Menschen gelernt. Laut der StADaF (2005/ 2006, S. 5) umfasst die Zahl der DaF-Lerner im Jahr 2005 16,7 Millionen Personen. 246 Hingegen reichen die Schätzungen für Englisch als Fremdsprache von 500 Millionen bis zu einer Milliarde Lerner. „Englisch [ist] heutzutage praktisch überall in der Welt die häufigst gelernte 244 In näherer Zukunft wird sich zeigen, ob und wie sich der jahrelange Streit um die Neuregelung der Rechtschreibung und die damit verbundenen Änderungen, die in weiten Teilen der Bevölkerung zu enormen Unsicherheiten geführt haben, auf das Ansehen dieses Wörterbuchs auswirken werden. 245 Zu diesem Abschnitt vgl. Herbst/ Klotz (2003 , S. 284f.). Natürlich kann das Ansehen von Wörterbüchern nicht allein über deren Verbreitung gemessen werden, wenn beispielsweise Schüler zum Kauf eines Wörterbuchs verpflichtet sind. Allerdings zeugen die vor allem in den USA weit verbreiteten Buchstabierwettbewerbe von einem großen Interesse an der korrekten Schreibung von Wörtern. 246 Der Arbeitsgruppe StADaF (Ständige Arbeitsgruppe Deutsch als Fremdsprache) gehören das Auswärtige Amt, der Deutsche Akademische Austauschdienst, das Goethe-Institut sowie die Zentralstelle für das Auslandsschulwesen als ständige Mitglieder an. Theoretische Grundlagen 139 Fremdsprache“ (Ammon 1993 , S. 14). Der Unterschied liegt jedoch nicht nur in der zwischen 25bis fast 70-mal höheren Anzahl von Lernern im Bereich Englisch als Fremdsprache, sondern auch im Grad der Beherrschung. Deutsch wird wesentlich häufiger als dritte oder manchmal als zweite Fremdsprache gelernt, gilt also - nach dem Erlernen der Muttersprache und der ersten Fremdsprache - als „typische Tertiärsprache“ (Hufeisen 2001, S. 648). Englisch ist hingegen meist die erste Fremdsprache, wird also durch die längere Unterrichtszeit bis zu einer höheren Niveaustufe gelernt. 247 Sowohl durch das unterschiedlich starke Interesse an lexikografischen Produkten als auch durch den unterschiedlichen Status als Fremdsprache befinden sich die Verlage für Wörterbücher der Sparten Englisch und Deutsch als Fremdsprache in einer völlig „anders gearteten Marktsituation“ (Herbst 1998, S. 21). Für Englisch sind die Absatzzahlen wesentlich höher, denn „das ‘Geschäft’ mit Englisch als Fremdsprache gehört zu den wichtigsten Exportbereichen“ (Götz/ Haensch 1998 , S. 345). Das bewirkt „eine günstige Preiskalkulation und eine großzügige Gestaltung“ (ebd . ). „Daher sind diese Werke lohnende Objekte für eine langfristige Marktstrategie“ (ebd . ). 248 Weiterhin muss natürlich beachtet werden, dass auch die Tradition der Lernerlexikografie in beiden Sprachräumen eine vollkommen unterschiedliche ist. Wie im Kapitel 2.2.1.4 dargestellt, erscheint das erste englischsprachige Wörterbuch für Nichtmuttersprachler, das OALD 1, bereits 1942, damals noch unter dem Titel Idiomatic and Syntactic English Dictionary. Ein deutsches Lernerwörterbuch für Nichtmuttersprachler existiert mit dem LWB 1 (Langenscheidts Großwörterbuch Deutsch als Fremdsprache) hingegen erst seit 1993. Die englischsprachige Lexikografie kann also von einem 50 Jahre länger währenden „Zeitraum an Rückmeldungen und Erfahrungen“ (Götz/ Haensch 1998 , S. 345) profitieren. 249 Dabei begünstigt mit Sicherheit auch der starke Konkurrenzkampf der Wörterbücher untereinander bestimmte Entwicklungen sowie Neukonzeptionen und erweist sich „als fruchtbar für lexikografische Innovation und Qualität“ (Herbst 1998, S. 21). 250 Weitere günstige Voraussetzungen für englischsprachige Wörterbücher bieten „eine hohe Zahl lexikografischer Arbeitskräfte in den Verlagen selbst, [...] große Mengen 247 Zu diesem Abschnitt vgl. Finkenstaedt/ Schröder (1992, S. 19), Ammon (1993, S. 10ff.), Götz/ Haensch (1998, S. 345), Landau (2001, S. 17), Wingate (2002, S. 29) und Huneke/ Steinig (2005, S. 38ff.). 248 Zu diesem Abschnitt vgl. auch Finkenstaedt/ Schröder (1992, S. 31), Herbst (1998, S. 21), Wingate (2002, S. 29, 44) sowie Kernerman (2006, S. 1265). 249 Vgl. auch Wingate (2002 , S. 29, 44). 250 Vgl. auch Herbst (1996, S. 321), Wingate (2002 , S. 28). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 140 an bearbeitetem Textmaterial und eine hoch entwickelte Text verarbeitende Software“ (Götz/ Haensch 1998 , S. 345). Einen anderen Aspekt der unterschiedlichen Lexikografietradition betont Wellmann (2004, S. 95) mit der Feststellung, dass deutsche Muttersprachwörterbücher „lange eine kanzleisprachig geprägte Syntax gepflegt [...] und [...] auch lateinische Äquivalente verwendet“ haben, wodurch sie „stark vom Typ des zweisprachigen Wörterbuchs her bestimmt“ sind (ebd.). Bereits auf dem Gebiet der muttersprachlichen Lexikografie bestehen folglich große Unterschiede zwischen dem deutschsprachigen und dem englischsprachigen Raum. Diese Tatsachen führen zur weltweit führenden Stellung der englischsprachigen Wörterbücher: „It must be plainly stated that CIDE, COBUILD 2, LDOCE 3 and OALD 5 present their language - English - in a way other dictionaries of other languages can only dream of “ (Götz 1999 , S. 227). Ähnliches konstatiert Herbst (1996, S. 321) : „It is no exaggeration to say that lexicographically English is probably the best-described language in the world.“ 251 All dies bildet den Hintergrund, vor dem viele Mängel der deutschen Lernerwörterbücher und viele Forschungslücken betrachtet werden müssen. Aus diesem Blickwinkel stellt sich die Nichtexistenz eines kontrollierten Definitionsvokabulars in deutschen Lernerwörterbüchern als Desiderat der deutschen Lexikografieforschung dar. Götz/ Haensch (1998, S. 348) unterstützen diese Argumentation, wie bereits in der Einleitung erwähnt wird: „Die lexikografische Erläuterung eines Wortes birgt Probleme, die man derzeit bestenfalls abschätzen kann.“ Für sie könnte „auch hier [...] die lexikografische Forschung ansetzen“ (ebd., S. 349). Die zweite Ursachengruppe für die Frage, warum deutsche Lernerwörterbücher nicht von einem beschränkten Definitionswortschatz Gebrauch machen, bilden die sprachinternen Gründe, also die Vermutung, dass die deutsche Sprache aufgrund ihrer Struktur für ein solches Vorgehen nicht geeignet sei. Wie im Kapitel 2.3.1.1 dargestellt, weicht der anfängliche Optimismus in der Forschung, ein begrenztes Definitionsvokabular des Englischen lasse sich ohne Modifikationen problemlos auf andere Sprachen übertragen, später der Erkenntnis, dass eine solche Übertragung zumindest nicht eins zu eins möglich ist. Die umfangreichste Darstellung zu den strukturellen Unterschieden des Deutschen und Englischen stammt von Götz , der insgesamt vier Aspekte näher beleuchtet - den Aufbau des Lexikons bzw. des Wortschatzes, die Verwendung von Komposita oder Nominalphrasen, die Lexikalisierung und die Metalinguistik des Deutschen. 251 Vgl. auch Herbst (1998, S. 20), Landau (2001 , S. 2), Wingate (2002 , S. 28f.). Theoretische Grundlagen 141 Zum Wortschatz der beiden Sprachen bemerkt schon Herbst (1998, S. 23) : Möglicherweise legt aber die unterschiedliche Strukturierung des deutschen und des englischen Wortschatzes einen solchen Definitionsansatz [von einer begrenzten Wortschatzliste auszugehen, A.T.] im Deutschen weit weniger nahe als im Englischen. 252 Sowohl das englische als auch das deutsche Vokabular besteht zu einem Teil aus Wörtern lateinischen oder griechischen Ursprungs. Der Hauptunterschied liegt jedoch darin, „[that] words of Latin or Greek origin are well established in the vocabulary of English, much better established than in the vocabulary of German“ (Götz 1999 , S. 221). Diese Fremdwörter bilden im Englischen Polysemien und gehören zur Alltagssprache, werden also auch im Lernerwörterbuch lemmatisiert, wohingegen sie im Deutschen als Bestandteil des Fachwortschatzes zum Randvokabular zählen und deshalb nicht in Lernerwörterbüchern verzeichnet werden (ebd.). Als Beispiel führt Götz das Verb illuminate an, das im Englischen neben seiner fachsprachlichen Bedeutung auch ‘erklären’ heißen kann, das im Deutschen mit seinem Äquivalent illuminieren jedoch sehr selten und auf den fachsprachlichen Gebrauch reduziert ist (ebd.). Somit haben englischsprachige Lernerwörterbücher den Vorteil, „[to] cover (at least a large part of) technical language vocabulary“ (ebd.), während „German dictionaries will appear less complete or less useful“ (ebd.). Für Götz leitet sich dadurch aber nicht unbedingt ein Nachteil für die deutschen Lernerwörterbücher ab, sie müssen lediglich ihr Vorgehen den natürlichen Umständen der eigenen Sprache anpassen: „The real point of this may be that lexicographical strategies developed for English need not necessarily be suitable for other languages. Perhaps you are ill-advised when you follow British lexicography too closely.“ (ebd., S. 222). Der zweite Punkt betrifft die bevorzugte Verwendung von Komposita oder Nominalphrasen. Das Deutsche besitzt eine sehr viel stärkere Neigung zur Kompositabildung als das Englische, das eher von Nominalphrasen Gebrauch macht. Bei letzteren ist die Tendenz zur Lexikalisierung viel schwächer ausgeprägt. Selbst bei vollständiger semantischer Motiviertheit müssen die deutschen Komposita häufig im Lernerwörterbuch lemmatisiert werden, da für die Gestaltung der Kompositionsfuge nur Tendenzen bestehen und „sich die Verteilung der Fugenelemente nicht in strikte Regeln fassen lässt“ (Duden-Grammatik 2009, S. 714). Ein Beispiel, das ähnlich auch bei Götz (1999, S. 222) diskutiert wird, mag dies verdeutlichen: Komposita wie Apfel-, Orangen- und Himbeersaft besitzen völlig unterschiedlich gestaltete Fugen (Nullfuge bei 252 Für diesen und die folgenden Abschnitte vgl. die Darstellung von Götz (1999 , S. 221ff.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 142 Apfelsaft, Fugenelement -n bei Orangensaft, Subtraktionsfuge bei Himbeersaft). Alle drei sind beispielsweise sowohl im LWB 4 als auch im Großwörterbuch Deutsch als Fremdsprache von Pons verzeichnet, meist als Kompositum im Artikel zur ersten Konstituente, manchmal sogar mit einem eigenen Eintrag. Die kleinen Lernerwörterbücher, die in der vorliegenden Untersuchung analysiert werden, verzeichnen immerhin Apfelsaft und Orangensaft als eigene Lemmata (DHWDaF 2) bzw. als Komposita unter der ersten Konstituente (LTWDaF 2). Ganz anders stellt sich die Situation in den vier großen englischsprachigen Lernerwörterbüchern OALD 7, LDOCE 4, COBUILD 2 und CALD dar, in denen - bis auf die Ausnahme apple juice im CALD - keines der englischen Äquivalente (apple juice, orange juice, raspberry juice) selbst lemmatisiert ist, lediglich orange juice taucht in einigen der Beispielsätze auf. Im Englischen werden Konzepte häufiger auf Phrasenebene wiedergegeben und nicht auf Wortebene wie im Deutschen. Daher haben es englischsprachige Lernerwörterbücher zwangsläufig leichter, bestimmte Konzepte aus dem Lemmabestand auszuschließen: One may, however, argue that the business of a dictionary is to tell you what things are called in a language, no matter whether you use a phrase or a word. Lexicographically, confining yourself to word level is perhaps no good policy (even if it can be justified linguistically). At any rate, a German dictionary has to list a large number of compounds (if only for reasons of morphology) and thus has to deal with more words (and things) than its English counterpart. (Götz 1999 , S. 222) Mit der bevorzugten Verwendung von Komposita im Deutschen ist auch der im Vergleich zum Englischen allgemein höhere Lexikalisierungsgrad verbunden. Sehr deutlich zeigt sich das an der Struktur der Verben. So muss das englische Verb paint je nach Kontext mit malen, anmalen, bemalen oder aufmalen übersetzt werden, dem Ausdruck paint something on something stehen im Deutschen etwas auf etwas malen, etwas mit etwas bemalen und etwas auf etwas aufmalen gegenüber: „The word form paint is semantically and syntactically more flexible than malen.“ (Götz 1999 , S. 223); Hervorh. i. Orig.). Diese Beobachtung machen auch Götz/ Haensch (1998, S. 349): Verschiedenes deutet darauf hin, dass bei vielen englischen Verben eine geringere Spezifizität in Bezug auf Subjekt und Objekt vorliegt, dass mithin Wörter wie put on, break, discharge, miss, leave sich wesentlich einfacher in verständlichen Erläuterungen verwenden lassen. (Hervorh. i. Orig.) 253 253 Vgl. auch Wellmann (2004, S. 95). Theoretische Grundlagen 143 Sie führen das anhand des Verbs miss aus, das im Deutschen je nach Kontext als versäumen, verfehlen, verpassen, vermissen, fehlen oder mit den Paraphrasen nicht treffen, nicht erreichen, nicht erwischen, nicht fangen wiedergegeben wird (Götz/ Haensch 1998, S. 349), die als Entsprechungen teilweise „stilistisch markiert und relativ objektspezifisch“ (ebd.) sind. Bei seinen Bemühungen um die Definitionen im LWB geht Götz (1999, S. 225) anfangs von einer Übersetzbarkeit des kontrollierten Definitionsvokabulars des LDOCE 254 aus: When working at how to explain words in the GWDaF [LWB, A.T.] I thought I might simply translate the defining vocabulary of LDOCE. But I soon found that ask splits up into fragen, bitten, befehlen, or that miss splits up into fehlen, versäumen, verfehlen, verpassen, nicht treffen, nicht schaffen [...] zu, and that break splits up into brechen, zerbrechen, bersten, reißen, zerreißen, zerbersten. (Hervorh. i. Orig.) 255 Analysiert man das Verb ask jedoch genauer, stellt man fest, dass die unterschiedlichen Bedeutungen im Deutschen an unterschiedliche Strukturen im Englischen geknüpft sind, beispielsweise bitten an ask something. „It is the word form, or lemma, ask that is common, not the verb ask. Perhaps some explanations in English learners' dictionaries are ‘simple’ only when you disregard valency.“ (Götz 1999 , S. 225; Hervorh. i. Orig.). Durch die zahlreichen Präfixderivationen und Partikelverben, deren Trennbarkeit oder Nichttrennbarkeit außerdem immer angegeben werden muss, ist „a German dictionary [...] inherently more repetitive than an English one“ (ebd ., S. 223), da semantisch ähnliche Verben jeweils unter ihrem Präfix oder ihrer Partikel behandelt werden (vgl. auch Wellmann 2004, S. 95). Das wirkt sich natürlich auch auf den benötigten Platz aus: „In all, German word formation, being as it is, presents you with considerable problems of space, makes it necessary to be explicitly metalinguistic and leads to cumbersome problems of referencing.“ (Götz 1999 , S. 223). Das Platzproblem ist auch das offensichtlichste Merkmal, wenn als vierter und letzter Aspekt in Götz' Aufsatz die deutsche Sprache metalinguistisch betrachtet wird: „German as a metalanguage is a bit unwieldy and relatively long-winded. If you translate English into German, you need more letters.“ (ebd., S. 224). Götz rechnet vor, dass bei einem Mehrbedarf von nur zehn Buchstaben pro Wörterbucheintrag - was sicherlich sehr niedrig geschätzt 254 Aus dem Artikel geht nicht hervor, welche Auflage des LDOCE Götz meint, vermutlich handelt es sich um das LDOCE 3 von 1995. 255 Vgl. auch Götz/ Haensch (1998 , S. 348). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 144 ist - bei 40 000 Einträgen rund 50 Seiten mehr benötigt werden. Die Imitation des COBUILD-Stils, also das Definieren in ganzen Sätzen, erscheint somit für ein deutsches Printwörterbuch unmöglich. Götz/ Haensch (1998, S. 349) nehmen in diesem Fall sogar eine Ausweitung um bis zu 200 Seiten an, was auch durch das Problem um er/ sie verursacht wird. Sie beachten dabei jedoch nicht, dass sich den englischsprachigen Wörterbüchern - wie dem COBUILD - das gleiche Problem stellt (Wingate 2002 , S. 44). Die Langatmigkeit der deutschen Metasprache wirkt sich noch anders aus: „This longwindedness tempts German dictionaries into using abbreviations and other shortening devices even if that implies a lower degree of readerfriendliness.“ (Götz 1999 , S. 224). Eine der Ursachen für die Schwerfälligkeit liegt in den drei unterschiedlichen Genera des Deutschen, an welche die Artikelwörter, Pronomen und Adjektive angeglichen werden müssen. Dadurch ergeben sich bei fehlender Übereinstimmung partielle Wiederholungen (beispielsweise während eines Ereignisses oder einer Handlung im Vergleich zu during an event or activity). Götz schlägt vor: „You can solve these difficulties by sometimes using the plural, or by using still more abbreviations like etc., or by using very general nouns.“ (ebd ., S. 224; Hervorh. i. Orig.). Die letzte Möglichkeit, das Ausweichen auf allgemeine Substantive, birgt jedoch neue Gefahren in sich: Es verhält sich entweder so, dass die ‘allgemeinen’ Wörter im Englischen einen anderen Wert haben als im Deutschen, oder es verhält sich so, dass diese Art von Metasprache im Deutschen eine geringere Akzeptanz hat. Die Grenze zur Lächerlichkeit oder Pomposität scheint im Deutschen schneller überschritten zu werden. (Götz/ Haensch 1998 , S. 349) 256 So erscheint es im Deutschen standardsprachlich völlig inakzeptabel, nach englischem Vorbild für Tasse die Beschreibung ‘ein kleiner Behälter’ oder für Schuppen ‘ein kleines Gebäude’ zu verwenden (ebd ., S. 348). 257 Neben der Tatsache, „[that] many of these general nouns sound stilted or pompous and not natural in German“ (Götz 1999 , S. 224), existieren ganz deutlich „some pragmatic differences between German and English in the area of hyponymy and hyperonymy“ (ebd . ). Die deutsche Sprache verfügt offenbar nicht über eine standardsprachlich anerkannte Reihe von Substantiven mittleren Abstraktionsgrades, die als Oberbegriffe in Wörterbuchdefinitionen benutzt werden könnten. Götz erläutert dies am Beispiel spoon, für das in englischsprachigen Wörterbüchern die Oberbegriffe implement, tool oder utensil gebraucht 256 Vgl. auch Wellmann (2004, S. 95). 257 Vgl. auch Götz (1999 , S. 224). Theoretische Grundlagen 145 werden. Das Hyperonym zu Löffel lautet hingegen Besteck, was sehr viel spezieller ist. „There is nothing in between Besteck and the most general noun Gegenstand.“ (Götz 1999 , S. 224; Hervorh. i. Orig.). Ähnlich gelagert ist der Fall auch bei dem Verb break: Break is a kind of general verb, and hyperonymous to e.g. burst, snap, shatter, split, which are more subject-specific or object-specific than break is. But note that the German verbs into which break splits up (reißen, bersten), are not hyponymous to brechen. (Götz 1999, S. 225; Hervorh. i. Orig.) 258 Die „unterschiedliche Strukturierung der beiden Sprachen“ (Herbst 1998, S. 32) hat eher skeptische Äußerungen zur möglichen Arbeit mit einem kontrollierten Definitionsvokabular in deutschen Lernerwörterbüchern zur Folge. Einig sind sich die Forscher darüber, dass 2 000 Wörter im Deutschen dafür nicht genügen würden: Der Mindestwortschatz, mit dem bei einigen Wörterbüchern zur Erklärung gearbeitet wird, ist vielleicht nur für das Englische sinnvoll. [...] [Es] kann [...] sein, dass eine Grenze für das Definitionsvokabular des Deutschen bei 2 000 eine Grenze ist, die für eine Metasprache des Deutschen gar nicht ausreicht. (Götz/ Haensch 1998 , S. 349) 259 It [the different structure of both languages, A.T.] may, of course, also mean that even if a defining vocabulary of about 2,000 words makes sense for the lexicography of English, this is not necessarily the case for the lexicography of German. You might need more. (Götz 1999 , S. 226) Bei der Erklärung deutscher Wörter müssen die Germanisten einfach von anderen Verhältnissen ausgehen als die Anglisten bei der englischen Sprache. Das englische Vorbild ermöglicht unter den genannten Bedingungen jedenfalls einen kleineren Definitionswortschatz. (Wellmann 2004, S. 95) Wingate (2002, S. 44) stimmt dem zu, was die Größe eines möglichen begrenzten Definitionsvokabulars betrifft: „Perhaps a German defining vocabulary cannot be restricted as strictly as LDOCE's to 2 000 words.“ Allerdings weist sie die grundsätzlichen Bedenken gegen einen beschränkten Definitionswortschatz im Deutschen als rein spekulativ zurück: „A rather speculative claim is that the German language does not allow as easily as English the control of the defining vocabulary.“ (ebd.). 260 Der Umstand, dass die deutschen Verben subjekt- und objektspezifischer sind als die englischen, 258 Vgl. auch Götz/ Haensch (1998 , S. 349). 259 Vgl. auch Herbst (1998, S. 23). 260 Vgl. auch Wingate (2002, S. 30). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 146 only affects the size of a potential defining vocabulary. As long as no serious attempt has been made to create a defining vocabulary for German, apart from some sporadic examples, Herbst's and Götz & Haensch's claim has to be rejected. (Wingate 2002, S. 44) Wie bereits im Kapitel 2.3.1.1 beschrieben, konzipiert Wingate im Rahmen ihres Versuchs für 61 Wörter in 215 Bedeutungen Neue Definitionen mit einem Definitionsvokabular von 2 270 Wörtern. Als Grundlage für den begrenzten Definitionswortschatz dient das Vokabular des Zertifikats Deutsch als Fremdsprache des Deutschen Hochschulverbands/ Goethe-Instituts mit 2 227 Lexemen, die um 43 Wörter ergänzt werden - zumeist Internationalismen oder vom Zertifikatswortschatz abgeleitete Wörter (Wingate 2002, S. 128f.). 261 Wingates Neue Definitionen erweisen sich im Vergleich mit den Definitionen des LWB 1 als für den fortgeschrittenen Anfänger nützlicher (ebd., S. 217). Sie kommt zu folgendem Schluss: At this point, the issue must be taken up whether a controlled defining vocabulary is possible for a German learners' dictionary. [...] It was demonstrated in this thesis that restricting the defining vocabulary to not more than about 2 300 words was possible for the NDefs [New Definitions, A.T.] of the target words […]. Therefore, this research gave on the one hand a clear indication that the control of the defining vocabulary for German is possible, and on the other hand provided a starting point for research into corpora and their effectiveness for defining words for intermediate learners. (Wingate 2002, S. 226f.) 261 Zur Deckung des Wortschatzes für das Zertifikat Deutsch mit dem analysierten Definitionswortschatz des LTWDaF 2 und des DHWDaF 2 vgl. Kapitel 3.5.3. 3. Wörterbuchanalyse Der praktische Teil beschäftigt sich mit der Untersuchung zum Definitionswortschatz, die im Rahmen der vorliegenden Arbeit an zwei ausgewählten DaF-Wörterbüchern, dem Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTWDaF 2) und dem Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (DHWDaF 2), durchgeführt wird. Die beiden deutschen Wörterbücher gehen beim Verfassen der Definitionen anders vor als die englischsprachigen Wörterbücher: Das LTWDaF 2 und das DHWDaF 2 verwenden laut Eigenaussage einen computerkontrollierten Definitionswortschatz. Im LTWDaF 2 wird dieser als Liste im Anhang aufgeführt, allerdings nach einer pädagogischen Bewertung (vgl. Kap. 3.1.1). So fehlt eine Auflistung des gesamten verwendeten Definitionswortschatzes in den deutschen Wörterbüchern. In den englischsprachigen Wörterbüchern gibt es hingegen eine solche Auflistung, wenn auch dort gewisse Einschränkungen gelten (vgl. Kap. 2.4.1). Aus diesem Grund wird die Untersuchung unter einem jeweils anderen Blickwinkel durchgeführt: Bei den englischsprachigen Wörterbüchern steht die Anwendung des Konzepts, in einem Lernerwörterbuch mit einem kontrollierten Definitionswortschatz zu arbeiten, sowie der allgemeine Aufbau dieses begrenzten Definitionsvokabulars im Vordergrund. Die deutschen Wörterbücher werden hingegen nach konkreten Einzelmerkmalen ihres computerkontrollierten Definitionswortschatzes untersucht. In diesem Kapitel folgt auf die Vorstellung der beiden Wörterbücher (Kap. 3.1) die Darlegung des methodischen Vorgehens, auf dem die Untersuchung basiert (Kap. 3.2). Anschließend werden die einzelnen Untersuchungsparameter vorgestellt und am zusammengestellten Korpus für beide Wörterbücher analysiert, zunächst unabhängig vom untersuchten Lemmatyp (Kap. 3.3). Bei den erforschten Eigenschaften handelt es sich um den Umfang des Definitionswortschatzes sowie um seine Zusammensetzung in Bezug auf die Wortart, die Herkunft und die Wortbildung. Diese Größen werden danach auch für die einzelnen Lemmatypen getrennt untersucht (Kap. 3.4). Auf diesen Teil, der die internen Eigenschaften des Definitionswortschatzes analysiert, folgt die Öffnung der Untersuchung nach außen hin (Kap. 3.5). Dies geschieht, indem das Korpus mit dem analysierten Definitionswortschatz der beiden Wörterbücher zuerst dem Grundwortschatz Langenscheidt Basic German Vocabulary (Kap. 3.5.1), dem Frequenzwörterbuch Frequency Dictionary von Jones/ Tschirner (Kap. 3.5.2) und schließlich dem Zertifikatswortschatz für das Zer- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 148 tifikat Deutsch (Kap. 3.5.3) gegenübergestellt wird. Da bei der Untersuchung die einzelnen Inhalte und nicht die beiden Wörterbücher LTWDaF 2 und DHWDaF 2 im Mittelpunkt stehen, ist die Darstellung nach den analysierten Kriterien geordnet. Auf die Ausführungen zum LTWDaF 2 folgen die Aussagen zum DHWDaF 2. Um Wiederholungen zu vermeiden, wird auf ein eigenes Vergleichskapitel zu den beiden Wörterbüchern verzichtet, stattdessen erfolgt die Gegenüberstellung direkt bei der Beschreibung des DHWDaF 2. 3.1 Vorstellung der untersuchten Wörterbücher 3.1.1 Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTWDaF) 2003 wird die erste Auflage des vollkommen neu entwickelten Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTWDaF 1) publiziert. 262 Im Frühjahr 2007 folgt mit dem LTWDaF 2 eine Neubearbeitung. Damit ist es nach dem 1999 erschienenen Pons Basiswörterbuch Deutsch als Fremdsprache gleichzeitig mit dem Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (DHWDaF 1) das zweite kleinere DaF-Wörterbuch, das sich explizit an Lerner der Grund- und Mittelstufe richtet. 263 Die Zielgruppe des LTWDaF sind die DaF-Lerner, „die zum ersten Mal ein einsprachig deutsches Wörterbuch benutzen“ (LTWDaF 2 2007, S. 3). Es umfasst mit „rund 30.000 Stichwörtern, Wendungen, Beispielen und Ableitungen [...] einen wesentlichen Teil der modernen deutschen Alltagssprache [...], den die Lerner für das Verstehen und das Sprechen und Schreiben brauchen“ (ebd.). Durch diese Formulierung drängt sich allerdings der Verdacht auf, der Verlag fasse die verzeichneten Lemmata, Beispielsätze, Derivate und Wendungen zusammen, um dem Benutzer aus Werbegründen einen höheren Lemmabestand zu suggerieren. Die tatsächliche Anzahl der Lemmata bleibt für den Lerner unklar, da sie auch den Wörterbuchaußentexten des LTWDaF 2 nicht zu entnehmen ist. Unter anderem die folgenden Punkte werden von Langenscheidt in der Erstauflage als besonders wichtig erachtet und deshalb auf dem hinteren Buchdeckel hervorgehoben: „völlige Neuentwicklung: das einsprachig deutsche Lernerwörterbuch für Einsteiger“, „blaue Stichwörter und Markierung des Wortschatzes, der für das Zertifikat Deutsch relevant ist“, „moderne deutsche 262 Für eine sehr ausführliche detaillierte Beschreibung der Erstauflage des Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache sei an dieser Stelle auf Klosa (2004) verwiesen. 263 Eine Übersicht zu den deutschen Wörterbüchern für Deutsch als Fremdsprache findet sich im Kapitel 2.4.2. Wörterbuchanalyse 149 Alltagssprache inklusive österreichischem und schweizerischem Sprachgebrauch“, „einfache Definitionen mit computerkontrolliertem Wortschatz - keine Erklärung bleibt unverständlich“, 264 „Lernen im sprachlichen Zusammenhang mit tausenden von Beispielsätzen und typischen Wortverbindungen, aktive Wortschatzerweiterung durch die Angabe von Komposita in den Einträgen“, „zahlreiche Grammatikangaben und Hinweise, die helfen, das Deutsche korrekt anzuwenden“, „12 ganzseitige Farbillustrationen“. 265 An diesen Formulierungen wird die starke Orientierung des LTWDaF am nicht muttersprachlichen Benutzer deutlich, da sehr oft auf den Aspekt des Lernens, der Verständlichkeit und der Korrektheit hingewiesen wird. Auch in der Neubearbeitung von 2007 ändert sich daran nichts Wesentliches, lediglich auf den Anhang mit den Übungen, Sprachspielen, Rätseln und den landeskundlichen Informationen sowie auf die „neueste deutsche Rechtschreibung nach Duden- Empfehlungen“ (LTWDaF 2 2007, hinterer Buchdeckel) 266 wird gesondert verwiesen. Die Vorsatzblätter des LTWDaF 2 enthalten einen zweiseitigen Ausschnitt aus dem Wörterbuch, an dessen Beispiel der Aufbau der Artikel kurz gezeigt wird. Bestimmte Elemente, wie z.B. die Definition der Lemmata, finden hier jedoch keine Erwähnung, auch nicht in der Neubearbeitung des Wörterbuchs. Das Vorwort ist - wie die Formulierungen auf dem hinteren Buchdeckel - stark auf den DaF-Lerner ausgerichtet, immer wieder werden die leichte Verständlichkeit der Angaben, die sprachliche Korrektheit und die Funktion der Wortschatzerweiterung betont. An das Vorwort schließen sich im LTWDaF 2 nach dem Inhalts- und Abkürzungsverzeichnis die Benutzerhinweise an, in denen ausführlich auf den Umgang mit dem Wörterbuch eingegangen wird. Hier wird in einem ersten Punkt beschrieben, wie Wörter zu finden sind (alphabetische Ordnung, Komposita, Derivate, Homonyme, Wortbildungselemente, idiomatische Wendungen/ Redewendungen). Es folgen Abschnitte zur Schreibung der Wörter (Orthografie, Worttrennung, Komposita in Klammern), zum Zertifikat Deutsch, zum computerkontrollierten Definitionswortschatz, zur Aussprache (Angaben beim Lemma, Liste der Lautschrift-Symbole), zur Morphologie (nach Wortarten getrennt einzeln zu Substantiven, zu Verben, zu Adjektiven und Adverbien sowie zu weiteren Wortarten), zur Stilistik (Stilebene, Sprechereinstellung, Zeitbezug, Region), zu den Bedeutungsangaben 264 Der Definitionswortschatz des LTWDaF 2 wird weiter unten in diesem Kapitel ausführlich besprochen. 265 Alle diese Zitate stammen vom hinteren Buchdeckel des LTWDaF 1 (2003). Teile davon sind im Original durch Fettdruck hervorgehoben. 266 Teile des Zitates sind im Original durch Fettdruck hervorgehoben. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 150 (Synonyme, Antonyme, Kollokationen, Beispiele, sonstige Angaben), zu den Hilfsverben sowie zu den Strukturformeln (Einführung, Kasus). Insgesamt orientieren sich diese Hinweise an der anvisierten Zielgruppe, da viele Beispiele gegeben werden und auf Fachausdrücke zumeist verzichtet wird. Im LTWDaF 1 werden Fachtermini teilweise zusätzlich in Klammern erwähnt, wie bei „notwendig (obligatorisch)“ (LTWDaF 1 2003, S. 15). Für die Neubearbeitung von 2007 werden die Benutzerhinweise vor allem sprachlich überarbeitet und im Ausdruck vereinfacht. Zum Beispiel wird auf Formulierungen wie „um einen Einblick in die Mechanismen der Wortbildung in der deutschen Sprache zu gewähren“ (LTWDaF 1 2003, S. 6) verzichtet, die Phrase „Kasus regieren“ (ebd., S. 16) wird durch „Kasus haben“ (LTWDaF 2 2007, S. 18) ersetzt. Die Benutzerhinweise machen vom Satz her einen sehr gedrängten Eindruck und könnten übersichtlicher gestaltet sein (Klosa 2004, S. 274). Die Anordnung erschließt sich nicht vollständig, die Erläuterungen zum computerkontrollierten Definitionswortschatz wären beispielsweise unter dem Punkt Bedeutungsangaben viel besser aufgehoben (ebd., S. 273). Für die Neubearbeitung von 2007 wird dies nicht geändert. Der Teil, der sich im LTWDaF 2 am stärksten verändert, ist der Anhang. Im Anschluss an das Wörterverzeichnis stehen im LTWDaF 1 folgende Anhänge: eine Auflistung geografischer Namen (Land/ Gebiet, Einwohner, Adjektiv), eine Aufstellung zu den Zahlen (Grund- und Ordnungszahlen), Übersichten zur Deklination der Artikel, der Personal-, Possessiv- und Reflexivpronomen, eine Liste der wichtigsten unregelmäßigen Verben mit ihren Stammformen sowie ein tabellarischer Lebenslauf. Auf den hinteren inneren Umschlagseiten werden die im Wörterbuch verwendeten Abkürzungen und Symbole aufgelistet. Diese Anhänge des LTWDaF 1 enthalten zweifelsohne viele nützliche Informationen für den Benutzer, allerdings könnten sie noch benutzerfreundlicher in die Abschnitte vor dem Wörterverzeichnis integriert werden. Außerdem wird teilweise aus Platzgründen auf eine logische Anordnung verzichtet - die Tabelle zu den Reflexivpronomen steht beispielsweise nicht im Anschluss an die Personal- und Possessivpronomen, sondern folgt auf die Übersicht zu den unregelmäßigen Verben und auf den Lebenslauf. Für den Benutzer wäre es ebenfalls vorteilhaft, die verwendeten Abkürzungen und Symbole nicht ganz hinten im Wörterbuch zu platzieren. Die Aufstellung ist ‹ Ž  ‹ ^‘ ‚ ’ “ } katswortschatz), < > (Kollokationen) und || (Hinweise) fehlen. Gleiches trifft auch für den Anhang mit Kardinal- und Ordinalzahlen zu, hier fehlt die Null, die Bruchzahlen fehlen ebenso. Flexionsparadigmen zu den restlichen Prono- Wörterbuchanalyse 151 men sowie zu Substantiven, Adjektiven und Verben sind nicht vorhanden. Zudem werden zahlreiche Abkürzungen, beispielsweise bzw oder Adj ohne Punkt verwendet, was nicht den gültigen Orthografieregeln entspricht und in einem Lernerwörterbuch vermieden werden sollte. Im Vergleich zur ersten Auflage wirken die Anhänge der Neubearbeitung des LTWDaF 2 viel großzügiger, übersichtlicher und sinnvoller geordnet. So erhält der Anhang ein eigenes Inhaltsverzeichnis, auf das Erklärungen zum verwendeten Definitionswortschatz und dessen Auflistung folgen. Im Anschluss daran finden sich auf knapp 40 Seiten Übungsaufgaben zum Wörterbuch, Sprachspiele und Rätsel - jeweils mit den entsprechenden Lösungen (LTWDaF 2 2007, S. 565ff.). Vollkommen neu ist auch der darauf folgende Teil zu Deutschland, Österreich und die Schweiz: Was man wissen sollte, der auf 16 Seiten Informationen zum politischen System, zum Schulsystem, zu Versicherungen und Steuern, zu Institutionen und Behörden, zur Arbeit, zur Wohnung, zum Auto, zu Gesundheit und Familie sowie weitere praktische Tipps zusammenfasst (ebd., S. 604ff.). Der tabellarische Lebenslauf und die Auflistung der geografischen Namen (Land/ Gebiet, Einwohner, Adjektiv) schließen sich an diesen Teil viel logischer an als im LTWDaF 1. Auch der nachfolgende grammatische Abschnitt mit den Übersichten zur Deklination der Artikel, der Personal-, Possessiv-, Reflexiv- und Fragepronomen, mit der Liste der Stammformen der wichtigsten unregelmäßigen Verben und der Aufstellung zu den Zahlen (Grund- und Ordnungszahlen) ist wesentlich sinnvoller angeordnet als in der Erstausgabe. 267 Die im Wörterbuch verwendeten Abkürzungen und Hinweise, die nun am Anfang des Wörterbuchs direkt vor den Benutzerhinweisen stehen, erscheinen an ihrer alten Stelle von 2003 - den hinteren inneren Umschlagseiten - erneut. Ob es sich hierbei um ein Versehen oder um eine absichtliche Doppelverzeichnung handelt, ist unbekannt. Die nötigen Ergänzungen bei den Zahlen und beim Abkürzungsverzeichnis werden nicht gemacht. Die Anhänge sind lediglich neu geordnet und durch neue Anhänge aufgefüllt, eine Überarbeitung der alten Anhänge erfolgt jedoch nicht. Das Wörterverzeichnis des LTWDaF ist zweispaltig im Blocksatz gesetzt. Die Seiten machen einen recht vollen Eindruck, die äußere Gestaltung wirkt sehr dicht und gedrängt. Innerhalb der einzelnen Artikel ist eine Orientierung allerdings möglich, da die Lemmata im Wörterbuch selbst blau hervorgehoben sind und weitere Möglichkeiten der Gestaltung genutzt werden: 267 Allerdings ist der Terminus Fragepronomen bei der Deklinationsübersicht etwas unglücklich gewählt, da im restlichen Wörterbuch als Bezeichnung der Wortart Interrogativpronomen verwendet wird. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 152 Abb. 21: Ausschnitt aus dem LTWDaF 2 (2007, S. 121) Wie die Abbildung 21 zeigt, werden neben dem Lemma die grammatischen und pragmatischen Informationen zum Lemma (kursiv), die Ziffern zu den Einzelbedeutungen der Lemmata (arabisch, fett), die Beispiele (kursiv) und die Redewendungen (fett, kursiv) hervorgehoben. Die Muster zur Satzbildung (fett, kursiv), die Komposita (fett, kursiv) und Derivate (fett) sowie die Verweise auf andere Lemmata oder auf Abbildungen (fett, kursiv) heben sich ebenfalls vom übrigen Schriftbild ab. Auf diese Weise wird sichergestellt, dass die Benutzer in dem jeweiligen Artikel schnell an die gewünschte Information gelangen (vgl. jedoch Klosa 2004, S. 272). Die Lexeme, die zum Zer- } – ‚ — ’~ ˜ zusätzlich gekennzeichnet, diese ist aber nicht vor die Textspalte herausgerückt. In den A-Z-Teil sind ebenfalls 46 einfarbige Abbildungen eingebunden, die wesentlich zur Auflockerung des Layouts beitragen. Eine Aufstellung dazu befindet sich in der Datensammlung A.1.1.1. Die Abbildungen erfüllen ganz unterschiedliche Funktionen. Lediglich in zwei Fällen (Fachwerk, Winkelmesser) beziehen sie sich ausschließlich auf ein Lemma und dienen allein dessen Illustration. Alle anderen Abbildungen illustrieren größere Zusammenhänge, indem entweder Homonyme gegenübergestellt werden (z.B. Feder, Kamm), ähnliche Bezeichnungen oder Konzepte gegeneinander abgegrenzt werden (z.B. Erdbeere, Schaufel ), ein umfangreicheres Konzept dargestellt wird (z.B. Flugzeug, Pferd) oder verschiedene Hyponyme unter einem Hyperonym illustriert werden (z.B. Bürsten, Schalentiere). Wenn allerdings auf der Abbildung Schalentiere von sieben dargestellten Schalentieren nur zwei selbst im Wörterbuch lemmatisiert sind (Krabbe und Muschel), stellt sich die Frage, zu welchen Wörtern oder Konzepten im LTWDaF 2 Illustrationen eingebunden werden. Diese Beobachtung deckt sich mit der Vermutung Klosas (2004, Wörterbuchanalyse 153 S. 281), die Abbildungen seien aus anderen, bereits bestehenden Werken übernommen. Die Illustrationen werden für die Neubearbeitung nicht geändert oder ergänzt. Neben diesen Zeichnungen gibt es im LTWDaF 2 zwölf ganzseitige Farbillustrationen mit den Titeln Am Schreibtisch, Die Bundesrepublik Deutschland, Die Schweiz und die Republik Österreich, Verben der Bewegung und der Ruhe, Das Fahrrad, Das Auto, Obst und Gemüse, Die Familie, Farben, Präpositionen (2) und Die Zeit. Diese sind relativ gleichmäßig über das gesamte Wörterverzeichnis verteilt. Im LTWDaF 1 wirken sie zum Teil etwas unübersichtlich (z.B. Am Schreibtisch oder Obst und Gemüse) und wenig zeitgemäß (z.B. Am Schreibtisch), manche Farben sind schlecht zu erkennen (orange) bzw. zu unterscheiden (hellblau - türkis) (Klosa 2004, S. 280). Im Unterschied zu den Abbildungen sind die Bildtafeln für die Neubearbeitung des LTWDaF 1 neu gestaltet. Im LTWDaF 2 erscheinen sie viel frischer, moderner und auch übersichtlicher. Die Verlinkung der Bildtafeln mit den einzelnen Wörterbuchartikeln überzeugt jedoch immer noch nicht vollständig (vgl. ebd., S. 279). Trotz dieses Mangels fallen die Farbtafeln sofort auf und laden dazu ein, sich näher mit den dargestellten Themen auseinanderzusetzen. Auf welche Weise die im Wörterbuch enthaltenen 30 000 Lemmata, Wendungen, Beispiele und Derivate ermittelt und zusammengestellt sind, wird an keiner Stelle transparent gemacht. Aufgrund einer stichprobenartigen Auszählung schätzt Klosa (2004, S. 284) den Lemmabestand für das LTWDaF 1 auf rund 8 700 Lemmata. Im LTWDaF 2 sind tatsächlich 8 646 Lemmata verzeichnet, wie diese Arbeit aufgrund der vollständig vorliegenden digitalen Version des Wörterbuchs ermittelt hat. Doppellemmata mit Schreibvarianten wie mithilfe, mit Hilfe werden hierbei nur einfach gezählt. Die Hochrechnung, die Klosa für das LTWDaF 1 anstellt, erweist sich damit als sehr genau. Das LTW- DaF 2 befindet sich folglich in etwa derselben Größenordnung wie das DHW- DaF 2_ ™ ‚ ‚ — ’~ “ } schatz werden im LTWDaF 2 auch Wortbildungselemente wie bio-/ Bio-, an- oder superverzeichnet, die genaue Zahl wird ebenfalls nirgendwo genannt. Mithilfe der digitalen Version zeigt sich für das LTWDaF 2, dass es sich um insgesamt 72 Wortbildungselemente handelt. Sie sind in der Datensammlung A.1.1.2 aufgeführt. Die Mehrzahl von ihnen sind trennbare Verbpartikeln, wie hindurch- oder vorwärts-. Verzeichnet sind jedoch auch nicht trennbare verbale Präfixe wie ver- oder wider-, außerdem Wortbildungselemente zur Bildung von Adjektiven, wie super- oder über-, oder zur Bildung von Substantiven, beispielsweise Lieblings- oder Spezial-. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 154 Die Artikel selbst sind im LTWDaF 2 klassisch aufgebaut. Auf das Lemma folgen die grammatischen Angaben. Beim Substantiv sind das der Artikel, der Genitiv Singular und der Nominativ Plural. Beim Verb handelt es sich dabei um die Stammformen (3. Person Singular Imperfekt und Perfekt), bei den unregelmäßigen Verben zusätzlich um die 3. Person Singular Präsens. Bei den Adjektiven folgen Angaben zur Flexion (auch Komparation) und Verwendung (attributiv, adverbiell, prädikativ). Außer bei den Substantiven und den Verben wird die Wortart genannt. Nach den grammatischen Angaben \ } ˜ } ^‘ ‘ š~ " - ‘ ›~ < œ ~ ‹ ~ < posita (|| K- und || -K), von Redewendungen (|| ID), von Hinweisen (|| Hinweis), 268 ž } ! ŸŸ -~ \ ŸŸ hierzu) und von Verweisen auf die Wortfamilie (|| ¡ ). Transparente Komposita, also Zusammensetzungen, deren Gesamtbedeutung sich aus den Bedeutungen der einzelnen Bestandteile erschließen lässt, werden ohne Definition „unter der entsprechenden Bedeutung des Stichworts“ (LTWDaF 2 2007, S. 7) angeführt. Da es jedoch sowohl || -K (Lemma als Grundwort, z.B. Garten-, Küchenmöbel beim Lemma Möbel) als auch || K- (Lemma als Bestimmungswort, z.B. Möbelgeschäft beim Lemma Möbel ) gibt, bleibt für den Benutzer unklar, bei welchem Element er entsprechende Komposita suchen muss. Eine Doppelverzeichnung ist nicht die Regel, beispielsweise fehlen bei den Lemmata Garten und Küche die unter Möbel aufgeführten Komposita Gartenbzw. Küchenmöbel, beim Lemma Geschäft die Zusammensetzung Möbelgeschäft. Neben den Kriterien dafür, an welcher Stelle die Komposita verzeichnet werden, fehlen die Prinzipien, die der Auswahl der Zusammensetzungen zugrunde gelegt werden. Die Aussprache der Lemmata wird in den meisten Fällen durch die Kennzeichnung der Vokallänge (Strich oder Punkt) der betonten Silbe direkt am Lemma angegeben, nur bei Entlehnungen (z.B. T-Shirt, Chance), bei Fremdwortbildungen (z.B. Handy), bei Kurzwörtern (z.B. Pkw) und bei einigen, für Lerner schwierigen Wörtern (z.B. Ehe, euer, früh, Lachs) folgt die vollständige Lautschriftangabe. Die verzeichneten Lemmata werden meist mithilfe einer Wortgruppe definiert, beispielsweise Oberschenkel ‘der Teil des Beins zwischen Knie und Hüfte’ oder bevorzugen ‘j-n/ etwas lieber mögen’. 269 Manchmal werden auch 268 Hinweise finden sich beispielsweise bei Elisionen, wie bei dunkel ¢ dunkler. 269 Bis zum Ende des Kapitels folgen Beispiele aus dem gesamten Lemmabestand, nicht nur aus den untersuchten Abschnitten. Wörterbuchanalyse 155 satzähnliche Strukturen oder ganze Sätze verwendet: Kartoffel ‘eine runde Knolle mit brauner Schale, die unter der Erde wächst. Man isst sie gekocht oder gebraten’ oder Satellit ‘ein technisches Gerät, das sich im Kreis um die Erde bewegt. Satelliten beobachten das Wetter, geben Nachrichten weiter’. Es gibt im LTWDaF 2 aber auch Lemmata, bei denen unmittelbar auf die grammatischen Angaben Synonyme folgen, beispielsweise bei Violine š ge oder eben 1 š } _ 270 In diesen Fällen, in denen die Synonyme nicht nur zusätzlich zum Verständnis des Lemmas beitragen, sondern die Funktion der Definition vollständig übernehmen, werden diese für die Analyse des Definitionswortschatzes wie die üblichen Definitionen behandelt (vgl. Kap. 3.2.2.1). 271 Die anderen Elemente des Wörterbuchartikels, wie Beispielsätze oder Synonyme, die neben der Definition bestehen, die das Lemma in einen größeren Kontext einbetten und so sein Verstehen unterstützen, werden sowohl im Wörterbuch als auch in der vorliegenden Arbeit hingegen nicht als Teil der Definition verstanden. Hier werden sie als semantischer Kommentar bezeichnet (vgl. Kap. 2.1.3). Viele Definitionen im LTWDaF 2 enthalten Wörter aus der Wortfamilie des Lemmas, es handelt sich also um so genannte Ableitungsdefinitionen (vgl. Kap. 2.3.1.1), durch die der Benutzer eine zweite Nachschlagehandlung durchführen muss. Diese Lemmata sind zumeist derivierte Adjektive wie bei ironisch ‘voller Ironie’ oder moralisch ‘in Bezug auf die Moral’. In diesen Fällen stehen die zugrunde liegenden Substantive als Lemmata in der Nähe und können ohne erheblichen Mehraufwand nachgeschlagen werden. Bei den Partikelverben und den derivierten Präfixverben ist dies schon nicht mehr so einfach möglich. So muss bei durchschneiden ‘etwas in zwei Teile schneiden’ bei Nichtverstehen unter schneiden nachgeschlagen werden. Bei verschmutzen 1 ‘etwas schmutzig machen’ und 2 ‘etwas wird schmutzig’ muss der Benutzer unter schmutzig erneut nachschlagen. Dabei sind häufig große Teile der Alphabetstrecke zu überwinden, wie in den oben genannten Fällen die Strecke von D zu S (durchschneiden - schneiden) und von V zu S (verschmutzen - schmutzig). Als für ein Lernerwörterbuch besonders vorteilhaft hervorzuheben ist im LTWDaF 2 hingegen der weitgehende Verzicht auf „klassische Bedeutungserläuterungen, die klassifizierend und mit enzyklopädischen Details arbeiten“ (Klosa 2004, S. 292). 270 Kursive Hochziffern gehören zum aufgeführten Beispiel (als Homonymziffern), nicht kursive sind Fußnotenziffern. 271 Kempcke (1996, S. 118) lehnt dieses Vorgehen, bei dem „Synonyme stellvertretend für die Mikrostruktur eines ganzen Wortes stehen“, in Lernerwörterbüchern für Nichtmuttersprachler entschieden ab. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 156 „Alle Stichwörter sind auf einfache, leicht verständliche Weise mithilfe eines computerkontrollierten Definitionswortschatzes erklärt, d.h. die in den Definitionen verwendeten Wörter sind selbst als Einträge vorhanden“ (LTWDaF 2 2007, S. 3), versprechen die Verfasser des LTWDaF 2 im Vorwort über den Wortschatz, der in den Definitionen verwendet wird. Der Zusatz „keine Erklärung bleibt unverständlich“ (LTWDaF 1 2003, S. 3), der in der Erstauflage steht, wird in der Neubearbeitung allerdings entfernt. In den Benutzerhinweisen finden sich dann allerdings weitere Ausführungen, welche die oben getroffene Aussage relativieren. So dürfen die Definitionen neben den im Wörterbuch selbst lemmatisierten Wörtern auch Lexeme enthalten, die „im Eintrag zum dazugehörigen Grundwort unter || hierzu“ (LTW- DaF 2 2007, S. 9) stehen. Antike ist beispielsweise lediglich als Derivat unter dem Lemma antik verzeichnet, wird aber in folgenden Definitionen verwendet: Klassik 2 ‘die griechische und römische Antike’; klassisch 1 ‘die griechische und römische Antike betreffend’ und Mittelalter ‘(in der europäischen Geschichte) der Zeitraum zwischen Antike und Renaissance, den man meist vom 4./ 5. bis zum 15. Jahrhundert rechnet’. 272 Ein ähnlicher Fall ist Gewinner (nur als Derivat zu gewinnen aufgeführt), das Bestandteil der Definitionen von Tipp 2 ‘der Versuch, bei Wetten und Gewinnspielen den Gewinner bzw die Gewinnzahlen zu erraten’ 273 und ziehen 8 ‘aus einer Menge von Zahlen, Karten o.Ä. eine (oder mehrere) herausnehmen und so einen Gewinner feststellen’ 274 ist. Als letztes Beispiel soll hier das zu herrschen angeführte Derivat Herrscher dienen, das in folgenden vier Definitionen Verwendung findet: Burg ‘ein großes Gebäude, das im Mittelalter als Wohnsitz von Herrschern und zur Verteidigung diente’, Kaiser 1 ‘der oberste Herrscher in einer Monarchie (über einem König)’, König 1 ‘der männliche Herrscher eines Landes mit einer Monarchie’ und Tyrann 2 ‘ein (meist grausamer) Herrscher, der nach seinem Willen regiert’. 275 Neben den unter dem Grundwort verzeichneten Derivaten wird in den Benutzerhinweisen noch auf zwei weitere Ausnahmen eingegangen. Dabei handelt es sich zum einen um „einige Ergänzungen in Klammern“ (LTWDaF 2 2007, S. 9) wie in den Beispielen Elefant ‘ein mächtiges Tier mit großen Ohren und einer sehr langen Nase (Rüssel)’ oder Zwiebel 2 ‘eine Art Zwiebel, die man in die Erde steckt und aus der dann Blumen (wie Tulpen, Narzissen) wachsen’. 272 Im LTWDaF 2 ist meist kursiv hervorgehoben. 273 Im LTWDaF 2 ist bzw kursiv hervorgehoben. 274 Im LTWDaF 2 ist o.Ä. kursiv hervorgehoben. 275 Im LTWDaF 2 ist meist kursiv hervorgehoben. Wörterbuchanalyse 157 Die Ergänzungen Rüssel, Tulpe und Narzisse sind im LTWDaF 2 nicht lemmatisiert, laut Benutzerhinweisen sind „die Erklärungen [...] aber auch ohne diesen Zusatz verständlich“ (LTWDaF 2 2007, S. 9). Zum anderen betreffen die Ausnahmen „Wörter, die man aus ihren Teilen (z.B. Vorsilben wie un-, verusw.) erschließen kann“ (ebd.), also beispielsweise in der Definition von Unfug 2 ‘unpassendes Benehmen, durch das andere gestört werden’, denn unpassend selbst ist nicht lemmatisiert. Die Bedeutung von unpassend ist jedoch transparent, der Benutzer kann sie sich aus un- und passend ableiten. In diese Gruppe fallen aber wohl auch Komposita, die nicht als Lemmata, sondern nur als Zusammensetzungen bei einem ihrer Bestandteile verzeichnet sind, vgl. die folgenden Beispiele: Weißbrot ‘ein helles Brot, das aus Weizenmehl gemacht wird’ (Weizenmehl wird nur als Kompositum unter Weizen genannt) oder Weißwurst ‘eine aus Kalbfleisch hergestellte Wurst, die in Wasser heiß gemacht wird’ (Kalbfleisch ist lediglich als Kompositum zu Kalb verzeichnet). Es gibt auch Fälle, in denen in den Definitionen Komposita verwendet werden, die bei keinem ihrer Bestandteile genannt werden, z.B. Weizen ‘eine Getreideart, aus deren Körnern weißes Brot gemacht wird’ (Getreideart ist weder ein selbstständiges Lemma noch als Kompositum unter Getreide oder Art verzeichnet). Die stärkste Relativierung erfährt die Verwendung eines computerkontrollierten Definitionswortschatzes durch folgende Aussage, die der Neubearbeitung 2007 hinzugefügt ist: „Manchmal werden Wörter verwendet, die nicht im kontrollierten Wortschatz sind: die Erklärungen sollen auch einer normalen Sprache gleich oder ähnlich sein“ (LTWDaF 2 2007, S. 9). Auf diese Weise schafft sich der Verlag eine Möglichkeit, jedes Wort in den Definitionen außerhalb des computerkontrollierten Definitionswortschatzes zu rechtfertigen. So könnte auch ein eventueller Vorwurf an die Redakteure, ungenau zu arbeiten, zurückgewiesen werden. Mit einem computerkontrollierten Definitionswortschatz hat eine solche Arbeitsweise zudem nichts gemein. Im Rahmen der vorliegenden Untersuchung wird diese Anmerkung außer Acht gelassen, weil sie eine genaue Analyse des vorkommenden Definitionsvokabulars insofern verhindert, als jede Art von Abweichung mit dem Wunsch nach einer natürlich klingenden Definitionssprache begründet werden kann. Im LTWDaF 2 wird der im Wörterbuch verwendete Definitionswortschatz nach dem Vorbild der englischsprachigen Wörterbücher auch erstmals im Anhang in Form einer alphabetischen Liste aufgeführt (vgl. LTWDaF 2 2007, S. 546ff. und Datensammlung A.1.1.3). Auch hier werden jedoch im Vorfeld einige Einschränkungen gemacht, denn die Wörter werden „analysiert und Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 158 pädagogisch bewertet“ (LTWDaF 2 2007, S. 545), sodass „nicht jedes Wort, das in einer der Erklärungen im Wörterbuch vorkommt, [...] auch in dieser Liste enthalten [ist]“ (ebd.). So finden sich folgende Gruppen von Wörtern nicht in der Aufstellung: - „leicht verständliche Ableitungen (z.B. mit -er, -ung, un-, -heit) und Zusammensetzungen (z.B. Haustür)“, - „Wörter, die nur ein einziges Mal vorkamen und durch andere Formulierungen ersetzt werden können“, - „Begriffe, die international verbreitet sind, sich in den verschiedenen Sprachen stark ähneln und daher im Zusammenhang leicht erkennbar sind, wie z.B. Radius in der Erklärung von Durchmesser“ und - „Wörter, die miteinander verwandt sind und [...] aufeinanderfolgen“ (ebd.). Diese Aufstellung lässt sich insgesamt sehr kritisch beurteilen. Denn individuell unterscheidet sich beispielsweise sehr stark, was „leicht verständlich“ ist. Zudem besitzen fremdsprachige Lerner ein völlig anders geprägtes Verständnis für Wortbildungsprodukte als Muttersprachler. 276 Weiterhin kann argumentiert werden, dass Wörter, die in den Definitionen nur einmal verwendet werden, dort durch andere Formulierungen ersetzt werden können (und nicht erst in der Aufstellung des Definitionswortschatzes). Der Ausschluss von Internationalismen aus der Liste des kontrollierten Definitionsvokabulars überzeugt ebenfalls nicht. Erstens sollten gerade Internationalismen häufig in den Definitionen verwendet werden, da sie das Verstehen der Erklärungen erleichtern. 277 Zweitens können Internationalismen nicht mit der Begründung von der Liste des kontrollierten Definitionswortschatzes gestrichen werden, sie seien aufgrund ihrer Ähnlichkeit in den verschiedenen Sprachen „leicht erkennbar“ (LTWDaF 2 2007, S. 545). Zwar mag das für viele Beispiele stimmen, doch gibt es auch Sprachen, in denen bestimmte Internationalismen nicht verbreitet sind oder eine andere Bedeutung besitzen. Die letzte Gruppe von Wörtern - 276 So urteilt Hallsteinsdóttir (2000, S. 188): „Ein Muttersprachler des Deutschen kann bei der Motivierung der Bedeutung [...] auf ein ausgeprägtes intuitives Wortbildungswissen zurückgreifen [...], das sich ein Lerner der Fremdsprache Deutsch erst aneignen muss.“ Vgl. hierzu auch Wellmann (1993, S. 155ff.), Fandrych/ Thurmair (1994, S. 34f.) und Kapitel 2.3.1.2. 277 Vgl. hierzu Herbst (1986, S. 115f.), Whitcut (1986, S. 121), Jehle (1990b, S. 504), Herbst/ Klotz (2003, S. 52), Wellmann (2004, S. 99f.) sowie Kapitel 2.3.2 und 3.4.2.2.2, Anm. 436. Wörterbuchanalyse 159 miteinander verwandte und im Wörterverzeichnis alphabetisch aufeinanderfolgende Lemmata - wird im LTWDaF 2 (2007, S. 545) ebenfalls mit einer nicht stichhaltigen Begründung aus der Liste des kontrollierten Definitionswortschatzes im Anhang ausgeschlossen: Die „Erklärung des alphabetisch vorangehenden Wortes [kann] beim folgenden Stichwort als bekannt vorausgesetzt werden“ , so die Redakteure. Dieses Argument überzeugt jedoch nicht, da ein Wörterbuch nicht von vorn nach hinten gelesen wird. Insgesamt wird im LTWDaF 2 mit den gleichen Mitteln wie in den englischsprachigen Wörterbüchern versucht, die Aufstellung des Definitionswortschatzes möglichst klein zu halten (vgl. Kap. 2.4.1). So wird auch hier die Bildung von Derivaten und Komposita aus den Elementen des Definitionswortschatzes erlaubt. Im Deutschen ist es jedoch - im Gegensatz zur englischen Sprache - nur in Ausnahmefällen möglich, eine Wortform verschiedenen Wortarten zuzuordnen und sich auf diese Weise in Richtung einer werbestrategisch günstigen Anzahl von Wörtern im kontrollierten Definitionsvokabular zu bewegen. Ein weiterer Unterschied zu den englischsprachigen Wörterbüchern besteht darin, dass die magische Zahl des kontrollierten Definitionswortschatzes weit über 2 000 liegt. 278 Im Anhang des LTWDaF 2 sind insgesamt 3 868 Wörter verzeichnet, wodurch die Vermutung nahe liegt, dass weniger als 4 000 Elemente aufgelistet werden sollen. Wie konsequent der selbst auferlegte Anspruch, mit einem computerkontrollierten Definitionswortschatz zu arbeiten, im LTWDaF 2 umgesetzt wird, wird in diesem Kapitel dargestellt. Dabei bestehen folgende Arbeitshypothesen: 1) Das LTWDaF 2 verwendet die bestehende lexikografische Terminologie zum Definitionswortschatz nicht eindeutig und differenziert nicht zwischen zwei unterschiedlichen Erscheinungen. Im Vorwort und in den Benutzerhinweisen ist von einem computerkontrollierten Definitionswortschatz die Rede, also von der Tatsache, dass - mit den gemachten Einschränkungen - jedes in den Definitionen verwendete Wort selbst Lemma des Wörterbuchs ist (vgl. Kap. 2.1.3). Die Auflistung im Anhang des LTWDaF 2 nach dem Vorbild der englischsprachigen Wörterbücher, die eine „pädagogisch sinnvolle Auswahl“ (LTWDaF 2 2007, S. 545) des verwendeten Definitionswortschatzes darstellt, entspricht von ihrem Äußeren her dem Konzept des kontrollierten/ begrenzten/ beschränkten Definitionswortschatzes (vgl. Kap. 2.1.3). Dieser strenge Ansatz wird im LTWDaF 2 jedoch nicht umgesetzt. Die Aufstellung im Anhang bildet 278 Zum Begriff der magischen Zahl vgl. Kapitel 2.4.1.1, Anm. 237. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 160 deshalb weniger eine Analyse der Definitionen des Wörterbuchs als „ein praktisches Hilfsmittel für jeden, der etwas einfach, aber eindeutig erklären muss“ (LTWDaF 2 2007, S. 545). 279 2) Das LTWDaF 2 setzt jedoch die Eigenaussage, mit einem computerkontrollierten Definitionswortschatz zu arbeiten, nicht vollständig um. In den Definitionen werden folglich Lexeme verwendet, die nicht Teil der Makrostruktur des Wörterbuchs sind und welche selbst über die in den Benutzerhinweisen gemachten Einschränkungen (unter dem Grundwort verzeichnete Wortbildungsprodukte, Ergänzungen in Klammern sowie transparente Derivate und Komposita) hinausgehen. 280 2.1) Zum einen betrifft dies die formale Seite der Lexeme, also Fälle, in denen bereits die äußere Form eines sprachlichen Zeichens nicht im Wörterverzeichnis enthalten ist oder unter die Einschränkungen in den Benutzerhinweisen fällt. Wahrscheinlich sind davon vor allem Wortbildungsprodukte von verzeichneten Lemmata betroffen, wie Komposita, Derivate oder Konversionsprodukte. Da sich der verwendete Definitionswortschatz jedoch im Redaktionsprozess maschinell recht leicht mit dem Lemmabestand abgleichen lässt, werden diese Fälle vermutlich nicht allzu häufig vorkommen. 2.2) Zum anderen ist die inhaltliche Seite der Lexeme betroffen. Dabei handelt es sich um polyseme Wörter, die in den Definitionen in Bedeutungen verwendet werden, in denen sie im Wörterbuch nicht lemmatisiert sind. Eine Überprüfung müsste beim zugrunde liegenden Korpus ansetzen, sie lässt sich maschinell nur recht aufwendig und manuell nur unter enormem Zeit- und Personalaufwand umsetzen. 281 Es ist daher davon auszugehen, dass bei der Wörterbucherstellung keine Kontrolle auf Sememebene stattgefunden hat und dass diese Fälle dadurch recht häufig auftreten werden. Durch den extrem hohen Arbeitsaufwand kann eine solche Überprüfung im Rahmen der vorliegenden Arbeit nur stichpro- 279 Der Sinn einer solchen Auflistung ergibt sich demzufolge lediglich in einer eher untypischen Wörterbuchbenutzungssituation. Denn Benutzer schlagen in einem Wörterbuch hauptsächlich nach, um Lexeme erklärt zu bekommen, und nicht, um selbst Definitionen zu formulieren. 280 Diese Einschränkungen werden in dieser Untersuchung jedoch aus mehreren Gründen nicht berücksichtigt - zum einen wird so der tatsächlich verwendete Definitionswortschatz analysiert, zum anderen wird die Vergleichbarkeit mit dem DHWDaF 2 gewährleistet. 281 Eine solche semantische Aufbereitung linguistischer Korpora „steckt zu diesem Zeitpunkt noch in den Kinderschuhen“ (Lenz 2000, S. 11). Vgl. auch Lemnitzer/ Zinsmeister (2010, S. 85) sowie Kapitel 2.3.1.2 und 3.1.2. Wörterbuchanalyse 161 benartig erfolgen. Mit einer erhöhten Wahrscheinlichkeit ist mit nicht verzeichneten Bedeutungen bei Partikelverben zu rechnen, deren übertragene Bedeutungen oft stark idiomatisiert sind. Vorhanden ist zu diesem Thema für das LTWDaF 1 bereits eine Untersuchung von Klosa aus dem Jahr 2004, die an „12 willkürlich ausgewählten Stichproben aus der L-Strecke“ (Klosa 2004, S. 295) überprüft, ob alle in den Definitionen verwendeten Wörter selbst im Wörterbuch lemmatisiert sind oder unter die in den Benutzerhinweisen genannten Ausnahmen fallen. Klosa (ebd., S. 296) kommt dabei zu folgenden Ergebnissen: „Von den hier untersuchten zwölf Artikeln waren nur drei (d.h. 25 Prozent) in Hinblick auf die für den Definitionswortschatz aufgestellten Kriterien völlig in Ordnung.“ In den anderen neun Artikeln finden sich insgesamt zwölf nicht lemmatisierte Wörter, von denen eines (unkompliziert in der Definition des Lemmas locker) als transparentes Derivat gelten kann, dessen Bedeutung sich aus den Bestandteilen un- und kompliziert ableiten lässt. Wie vermutet, handelt es sich in den meisten anderen Fällen um nicht lemmatisierte oder bei der Wortfamilie aufgeführte Wortbildungsprodukte. Im Einzelnen sind dies sechs Konversionen (Laufen in der Definition von Läufer, Antrieb in der Definition von Laufwerk, der Betreffende in der Definition von leichtsinnig, ausgeprägt in der Definition von leise, Sprechen in der Definition von lispeln und das Süße in der Definition von lutschen), zwei Derivate (verbreiten in der Definition von leuchten und zergehen in der Definition von lutschen) sowie zwei Komposita (rotbraun in der Definition von Leber und Luftloch in der Definition von locker). Die Verwendung des Adjektivs vorhanden in der Definition des Lemmas leise ist besonders nachteilig, weil es aufgrund seiner Demotivation nicht auf ein anderes Lemma zurückgeführt werden kann. Neben Klosas Untersuchung bestätigen sich die Arbeitshypothesen weitgehend durch erste eigene Stichproben. Für alle oben beschriebenen Fälle, in denen das Prinzip des computerkontrollierten Definitionsvokabulars verletzt wird, lassen sich im LTWDaF 2 auf den ersten Blick Beispiele finden. Bei den Lexemen, die selbst nicht im Wörterbuch verzeichnet sind und die auch nicht bei anderen Elementen ihrer Wortfamilie aufgeführt werden, die jedoch trotzdem in den Definitionen verwendet werden, handelt es sich fast ausschließlich um Wortbildungsprodukte. Es dominieren substantivische Konversionsprodukte in Form des substantivierten Infinitivs, beispielsweise das Lachen in der Definition von Komiker ‘ein Künstler, der die Menschen zum Lachen bringt’ oder das Kochen in der Definition von anbrennen ‘etwas bekommt beim Kochen zu viel Hitze und setzt sich am Boden des Topfes fest’. Beispiele für Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 162 nicht verzeichnete Derivate sind rötlich in der Definition von Mahagoni ‘ein sehr hartes Holz von rötlicher Farbe’ und felsig im Artikel zu Wand 2 ‘ein sehr steiler felsiger Abhang’. In der Definition von Moll ‘verwendet als Bezeichnung für Tonarten, die vom zweiten zum dritten Ton Halbtöne haben’ tauchen mit Tonart und Halbton zwei Komposita auf, die weder als eigenständige Lemmata noch unter ihrem Grund- oder Bestimmungswort verzeichnet sind. Beim unsystematischen Durchblättern des Wörterbuchs finden sich allerdings nur wenige Beispiele dafür, dass der in den Definitionen verwendete Wortschatz zwar im Wörterbuch lemmatisiert ist, nicht jedoch in der entsprechenden Bedeutung. Als Beispiel aus dem LTWDaF 2 muss hier abspeichern ‘etwas im Computer festhalten, speichern’ genügen - im Wörterbuch ist festhalten nicht im Sinn von ‘etwas notieren, aufzeichnen, fixieren’ verzeichnet. Hinsichtlich der Nichtlemmatisierung bestimmter Einzelbedeutungen des verwendeten Definitionswortschatzes bemerken Herbst/ Klotz (2003, S. 53) : Das Hauptproblem in diesem Zusammenhang ist [, ...] dass die Überprüfung des in den Definitionen vorkommenden Wortschatzes durch Computer - im Augenblick jedenfalls - eben nur die formale, nicht aber die inhaltliche Seite erfasst, so dass ein wichtiger Kontrollmechanismus in dieser Hinsicht nicht greift. 282 3.1.2 Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (DHWDaF ) Wie das Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTW- DaF 2) erscheint das Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (DHWDaF 2) in seiner ersten Auflage 2003. 283 Im Jahr 2007 kommt bei Hueber die zweite Auflage auf den Markt. 284 Das in Kooperation entstandene Werk wird 2003 von den beiden Verlagen in zwei verschiedenen Ausgaben veröffentlicht, wobei die vorderen Wörterbuchaußentexte und das Wörterverzeichnis vollkommen identisch sind. Hueber fügt lediglich im Anhang mit einem separaten Inhaltsverzeichnis noch Tipps zum Umgang mit dem Wörterbuch sowie zum Wörterlernen hinzu. Außerdem sind die Umschläge verlagsspezifisch gestaltet. Trotz der völlig identischen Zielgruppe - Lerner der Grund- und Mittelstufe - wird das Wörterbuch von den Verlagen unterschiedlich beworben, als ob potenzielle Käufer nicht den Eindruck gewinnen sollen, dass es sich bei den beiden Ausgaben prinzipiell um ein und dasselbe Werk handelt. 282 Auch Hausmann (1990, S. 228) und Zöfgen (1994a, S. 136) merken an, dass bisher kein Lernerwörterbuch seinen Definitionswortschatz wirklich auf der Sememebene kontrolliert. Vgl. auch Kapitel 2.3.1.2. 283 Sehr ausführlich und detailliert beschreibt Klosa (2004) die Erstauflage des DHWDaF 1. 284 Duden hat hingegen bisher noch keine zweite Auflage veröffentlicht. Trotz dieser Tatsache wird die zweite Auflage von 2007 hier als Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (DHWDaF) bezeichnet. Wörterbuchanalyse 163 Auf der hinteren Umschlagseite wirbt Duden z.B. mit den über 11 200 Lemmata sowie mit rund 30 000 Beispielen und Kollokationen, die das Wörterbuch enthält. Bei Hueber hingegen werden diese beiden Punkte werbestrategisch vorteilhaft zu 41 500 Stichwörtern, Beispielen und Wendungen zusammengefasst. Duden betont die bei jedem Lemma vorhandenen Ausspracheangaben sowie die in den Artikeln verzeichneten Synonyme und Zusammensetzungen. Selbst die Fakten, die von beiden Verlagen auf dem hinteren Buchdeckel erwähnt werden, sind unterschiedlich formuliert und akzentuiert. Bei Duden heißt es dort: „alle Stichwörter des ‘Zertifikats Deutsch’ (farbig hervorgehoben)“, „grammatische Merkmale zu allen Stichwörtern und Muster für den Satzbau“, „300 Illustrationen“ und „das Wörterbuch informiert umfassend über die deutsche Sprache und Kultur in Deutschland, Österreich und der Schweiz“. 285 Hueber bewirbt die gleichen Inhalte wie folgt: „lernerfreundlich: der komplette Lernwortschatz des Zertifikats Deutsch ist blau hervorgehoben“, „zahlreiche Grammatiktabellen“, „300 Abbildungen“ und „enthält die österreichischen und Schweizer Varianten der Alltagssprache“. 286 Dass Hueber seine Werbung stärker an den Bedürfnissen der DaF-Lerner und an dem Nutzen des Wörterbuchs für sie ausrichtet als Duden, ist außerdem vor allem an den bei Hueber zusätzlich enthaltenen Tipps zum Umgang mit dem Wörterbuch sowie den Tipps zum Wörterlernen sichtbar. Aber auch kleinere Formulierungen wie „lernerfreundlich“ (DHWDaF 2 2007, hinterer Buchdeckel) unterstützen dies, wo bei Duden der reine Inhalt im Mittelpunkt steht. Deutlich wird dieser Fakt ebenfalls bei den Wörterbuchdefinitionen. Duden hebt rein faktisch die „Bedeutungserläuterungen aller Stichwörter“ (DHWDaF 1 2003, Ausgabe des Dudenverlages: hinterer Buchdeckel) hervor. Hueber hingegen unterstreicht mit der Wortgruppe „computerkontrollierter Wortschatz hilft beim Verstehen“ (DHWDaF 2 2007, hinterer Buchdeckel) den Zweck für den Benutzer. 287 Auf den Vorsatzblättern enthält das DHWDaF 2 eine grafische Übersicht zum Artikelaufbau, welche die ausführliche verbale Beschreibung der Artikelstruktur in den Wörterbuchaußentexten teilweise ersetzt. Auf das Vorwort folgen Hinweise zur Benutzung des Wörterbuchs mit Angaben zur Anordnung der Lemmata sowie zur Darstellung der Wortarten, der Stilangaben, der Synonyme und der Wortbildungen. Weiterhin befinden sich vor dem Wörterverzeichnis umfangreiche zusätzliche Materialien: ein Verzeichnis der verwende- 285 Alle Zitate stammen vom hinteren Buchdeckel des DHWDaF 1 (2003), Ausgabe des Dudenverlages. 286 Alle Zitate stammen vom hinteren Buchdeckel des DHWDaF 1 (2003), Ausgabe des Max Hueber Verlages. Hervorhebung im Original. 287 Der Definitionswortschatz des DHWDaF 2 wird weiter unten ausführlich besprochen. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 164 ten Abkürzungen und Fachausdrücke (mit Verweisen), ein Kapitel zur Lautschrift, Grammatiktabellen zur Deklination der Artikelwörter, Pronomen, Adjektive und Substantive und zur Konjugation der Verben, eine Liste der Modalverben und der unregelmäßigen Verben, Tipps zur deutschen Rechtschreibung, eine Aufstellung kommunikativer Einheiten, Karten der deutschsprachigen Länder, Grafiken zu deren Schulsystemen, Übersichten zur Angabe der Uhrzeit, zu Zahlen, zu geläufigen Abkürzungen und ein Verzeichnis der Ländernamen, der Einwohnerbezeichnungen und der dazugehörigen Adjektive. Diese zusätzlichen Materialien und vor allem die enthaltenen Texte wirken weniger technisch, als es in den meisten anderen Wörterbüchern üblich ist, sodass sie als für die Benutzergruppe der Deutschlerner geeignet erscheinen. Allerdings wirkt ihre Zusammenstellung schlecht geordnet und wenig strukturiert. Klosa (2004, S. 274) merkt außerdem an, „dass sprachwissenschaftliche Fachtermini zwar in den Benutzerhinweisen verwendet werden, nicht aber im Wörterverzeichnis lemmatisiert sind (z.B. steigern in der grammatischen Lesart, Umlaut, Zeitform)“ (Hervorh. i. Orig.). Zudem sind die Benutzerhinweise unvollständig, es fehlen beispielsweise Bemerkungen zu den Ausspracheangaben, zur Auswahl der Lemmata oder Flexionsparadigmen einiger Pronomen. Zwischen den Wörterbuchaußentexten und dem Wörterverzeichnis könnte noch stärker verwiesen werden, beispielsweise vom Lemma Schule auf die Grafik zum Schulsystem (ebd., S. 278). Von der ersten zur zweiten Auflage gibt es hier einige Änderungen - die Angaben zur Lautschrift und die Karten der deutschsprachigen Länder sind überarbeitet. Auch die Darstellung der Rechtschreibregeln ist aktualisiert, allerdings nicht korrekt. So ist die Einzelvokalabtrennung laut DHWDaF 2 (2007, S. 55) nur am Wortende regelwidrig, laut amtlicher Regelung ist sie jedoch weder am Wortanfang noch am Wortende gestattet (Institut für Deutsche Sprache 2006, S. 101). Ins Inhaltsverzeichnis des DHWDaF 2 ist nun auch der Teil aufgenommen, der sich 2003 allein in der Hueber-Version nach dem Wörterverzeichnis befindet. Die größte Änderung in Vergleich zur ersten Auflage besteht darin, dass hinter dem Wörterverzeichnis ein Lernwortschatz zu finden ist, der das Vokabular der Niveaustufen A 1, A 2 und B 1 aus dem Gemeinsamen europäischen Referenzrahmen für Sprachen enthält. Dadurch wird das Wörterbuch in seiner Seitenzahl jedoch nicht umfangreicher, da der Lernwortschatz nur die Notizseiten der ersten Auflage ersetzt. Der Eindruck, das DHWDaF 2 sei ein umfangreicheres Werk als das DHWDaF 1, gründet sich allein auf die Tatsache, dass für die Neuauflage schwereres Papier verwendet wird. 288 288 Durch die Verwendung von Papier mit einer höheren Grammatur steigt die Dicke des Wörterbuchs immerhin um einen Zentimeter - von 3,5 Zentimeter (DHWDaF 1) auf 4,5 Zentimeter (DHWDaF 2). Wörterbuchanalyse 165 Die äußere Gestaltung des Wörterverzeichnisses des DHWDaF 1 wirkt sehr übersichtlich und großzügig (vgl. auch Klosa 2004, S. 272). Dazu tragen vor allem die Zweispaltigkeit und der blaue Trennstrich zwischen beiden Spalten bei, ebenso die Voranstellung des Artikels bei den substantivischen Lemmata. Letzteres bricht den verwendeten Flattersatz auch auf der linken Seite auf. Die teilweise blau abgesetzten Abbildungen und die blau unterlegten Kästchenartikel unterstützen die Auflockerung des Layouts. Blau hervorgehoben sind der Zertifikatswortschatz sowie die Abkürzungen Syn. und Zus., auf die Synonyme zum Lemma bzw. Zusammensetzungen folgen. Unter den Ausdruck Zusammensetzungen fallen hierbei Komposita mit dem Lemma als Grundwort sowie zusammengesetzte Partikelverben und derivierte Präfixverben. Das Lemma selbst (halbfett, andere Schriftart), die Definition des Lemmas (kursiv), die Ziffern für unterschiedliche Wortarten (römisch, fett) bzw. für die Einzelbedeutungen der Lemmata (arabisch, fett) sowie feste Wendungen (fett) werden in der Gestaltung ebenfalls hervorgehoben (vgl. Abb. 22). Dadurch kann der Benutzer schnell wichtige Elemente des Wörterbuchartikels (Lemma, Wortart, Einzelbedeutung, Definition, feste Wendungen, Synonyme und Zusammensetzungen) überblicken. Abb. 22: Ausschnitt aus dem DHWDaF 2 (2007, S. 216) In das Wörterverzeichnis des DHWDaF 2 von 2007 sind insgesamt 285 der erwähnten Abbildungen eingebettet (vgl. Datensammlung A.1.2.1), also mehr als sechsmal so viele wie im LTWDaF 2. Die Illustrationen in den beiden Wörterbüchern unterscheiden sich jedoch nicht nur in ihrer Zahl, sondern auch in ihrer Funktion voneinander. Im DHWDaF 2 dominieren die 239 Abbildungen, die der Illustration eines einzelnen Lemmas dienen. Fast immer handelt es sich dabei um Konkreta, sehr oft werden Tiere (z.B. Eichhörnchen, Igel), Pflanzen (z.B. Kastanie, Tulpe), Früchte (z.B. Erdbeere, Kirsche), Körperteile (z.B. Daumen, Lippe), Kleidung (z.B. Rock, Sandale), Musikinstrumente (z.B. Gitarre, Klavier), Fahrzeuge (z.B. Fahrrad, Zug) oder andere Alltagsgegenstände (z.B. Blumentopf, Wegweiser) dargestellt. Nur in den Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 166 seltensten Fällen, beispielsweise bei Vorwahl oder Unfall, erhält ein abstraktes Substantiv eine Abbildung. Am zweithäufigsten - bei 16 Lemmata - werden im DHWDaF 2 homonyme oder polyseme Lemmata durch Illustrationen gegenübergestellt, unter anderem bei Kiefer oder Fliege. 289 Abbildungen mit dem Zweck, ein umfangreicheres sprachliches Konzept zu visualisieren, spielen im LTWDaF 2 die Hauptrolle, im DHWDaF 2 gibt es lediglich 13 davon. Zudem ist diese Art der Abbildung im DHWDaF 2 weniger komplex. Neben dem Lemma, zu dem die Abbildung gehört, wird meist nur ein weiterer Teil der Illustration benannt. Lediglich bei Fenster und Herd sind es zwei, bei Brautpaar drei. Nur eine Abbildung im DHWDaF 2 - Wurst/ Würstchen - dient dazu, einander ähnelnde Konzepte voneinander abzugrenzen. Im Vergleich zum LTWDaF 2 verfügt das DHWDaF 2 also über viel mehr Abbildungen, die sich allerdings meist lediglich auf ein Lemma beziehen. Umfangreichere szenische Illustrationen oder solche, die unter einem Hyperonym mehrere Hyponyme darstellen, gibt es nicht. Einige der Anregungen von Klosa (2004, S. 282) werden bei den Abbildungen der Neuauflage berücksichtigt, was sich vorteilhaft auf die überarbeiteten Illustrationen auswirkt. Insgesamt 42 kulturspezifisch oder sprachlich-grammatisch bemerkenswerte Lemmata erhalten im DHWDaF 2 einen eigenen Kästchenartikel. 26 dieser Kästchen beziehen sich auf kulturelle Spezifika des deutschen Sprachraums und enthalten beispielsweise ausführlichere Informationen zum Bildungssystem, zu den Mahlzeiten oder zu allgemein üblichen Verhaltenskonventionen im zwischenmenschlichen Umgang. Grammatische Informationen finden sich in 13 Kästchen, zum Beispiel zur Deklination von Pronomen oder zum Genus von Flussnamen. Nur zwei Kästchen widmen sich mit der Getrennt- und Zusammenschreibung orthografischen Fragestellungen (auseinander, durcheinander). Das verbleibende Kästchen verweist unter dem Lemma Brief auf den ausformulierten offiziellen Brief im Wörterbuchaußentext. Sowohl die Abbildungen als auch die Kästchenartikel tragen wesentlich zur Benutzerfreundlichkeit des Wörterbuchs bei. Vor allem die Einbindung der Kästchen sollte in Zukunft noch stärker systematisiert und erweitert werden, um die von Lerchner (1996, S. 144) eingeforderte Kultursensitivität von Lernerwörterbüchern auch beim DHWDaF 2 zu erreichen. 289 Interessanterweise werden die Abbildungen zu den Homonymen und Polysemen räumlich voneinander getrennt, lediglich in einem einzigen Fall, Knopf, stehen beide Abbildungen auf einer Höhe direkt nebeneinander. Dieser Fall wird deshalb nur als eine Abbildung gewertet. Die getrennten Abbildungen (Bank, Fliege, Hahn, Kiefer, Maus, Nagel, Note, Ordner, Pass, Pflaster, Riegel, Schlange, Schloss und Urne) zählen jeweils als zwei. Zusammen mit dem Lemma Band, das als Dreifach-Homonym illustriert wird, ergeben sich so die insgesamt 16 Abbildungen. Wörterbuchanalyse 167 Unter den verzeichneten 11 200 Lemmata, die auch den Zertifikatswortschatz enthalten, befinden sich ebenfalls die eintausend häufigsten Wortformen des Deutschen. Viel Wert legt das Wörterbuch außerdem auf die Aufnahme von Wortbildungselementen wie -keit, -ieren oder ver-, von denen insgesamt 111 verzeichnet sind (vgl. Datensammlung A.1.2.2). Die Kriterien für die Zusammenstellung des Wörterverzeichnisses und die Anzahl der verzeichneten Lemmata werden jedoch an keiner Stelle transparent gemacht, sodass dem Benutzer unklar bleibt, warum diese Lemmaanzahl gewählt wird und nach welchen Prinzipien die Aufnahme der Lemmata erfolgt (Klosa 2004, S. 275). Das betrifft auch die Neuauflage von 2007, in der ebenso wenig erläutert wird, worin die Änderungen zur Erstauflage bestehen und ob im Wörterverzeichnis Korrekturen oder Ergänzungen vorgenommen werden. Die Artikel enthalten nach dem Lemma die Aussprache nach IPA-Lautschrift. Darauf folgen die grammatischen Angaben - Genus, Genitiv Singular und Plural beim Substantiv, Komparativ und Superlativ beim Adjektiv sowie die Stammformen mit der dritten Person Singular Indikativ Präsens, Angaben zur Valenz, zur Transitivität und zur Perfektbildung beim Verb. Wie bereits erwähnt, wird der Genusartikel dem Substantiv jedoch vorangestellt. Anschließend folgen die Wortart (außer beim Substantiv und beim Verb), Antonyme, pragmatische Angaben (Stilschicht, regionale Verwendung), die Definition, Beispiele und Kollokationen, feste Wendungen, Synonyme und Zusammensetzungen. Die verzeichneten Lemmata werden laut Vorwort des DHWDaF 2 (2007, S. 5) grundsätzlich definiert. Dies geschieht entweder durch Synonyme, wie bei heikel ‘schwierig, gefährlich’ oder kraxeln ‘klettern, steigen’, oder durch eine Wortgruppe, wie bei Traum 1. ‘Vorstellungen und Bilder, die während des Schlafens auftreten’ und 2. ‘unerfüllter Wunsch’ oder auswandern ‘seine Heimat verlassen, um in einem anderen Land eine neue Heimat zu finden’. In den Tipps zum Umgang mit dem Wörterbuch erhebt das DHWDaF 2 (2007, S. 729) noch den Anspruch, dass die Wörter „auf einfache Weise und trotzdem so präzise wie möglich erklärt“ werden. Wie dies geschieht, wird nicht erläutert. Die Definitionen werden im Schriftbild durch Kursivsetzung hervorgehoben. Auch im DHWDaF 2 tragen Beispielsätze, Synonyme und Zusammensetzungen zum besseren Verständnis des Lemmas bei, indem sie es in seine semantische Umgebung einbetten. Hier handelt es sich jedoch meist um semantische Kommentare - zumindest dann, wenn auf eine zusätzliche Definition nicht verzichtet wird (vgl. Kap. 2.1.3). In einigen Fällen erfüllt das DHWDaF 2 seinen selbst auferlegten Anspruch, alle Lemmata mit Bedeutungserläuterungen zu versehen, jedoch nicht. Dann ersetzen semantische Angaben in Form von Verwendungshinweisen die eigentlichen Definitionen (vgl. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 168 Kap. 3.2.2.2). 290 Auch im DHWDaF 2 enthalten viele Definitionen Wörter aus der Wortfamilie des Lemmas (Klosa 2004, S. 294). Lemmata, die mittels solcher Ableitungsdefinitionen (vgl. Kap. 2.3.1.1) erklärt werden, sind jedoch auch hier meist derivierte Adjektive, wie bei ironisch ‘Ironie enthaltend; voller Ironie’ oder bei riskant ‘mit einem Risiko, mit Gefahr verbunden und daher ziemlich gewagt’. Das Basissubstantiv kann aufgrund seiner lokalen Nähe also ohne erheblichen Mehraufwand nachgeschlagen werden. Anders ist es auch hier bei den Partikelverben und den derivierten Präfixverben. So muss der Benutzer bei ausleihen 1. ‘einem anderen etwas leihen’ und 2. ‘sich (von jmdm.) leihen’ bei Nichtverstehen jeweils unter dem Lemma leihen nachschlagen, bei verschmutzen 1. ‘ganz schmutzig machen’ und 2. ‘schmutzig werden’ muss unter schmutzig erneut nachgeschlagen werden. Wie im LTWDaF 2 ist es auch hier notwendig, in weit auseinanderliegenden Artikeln zu suchen. Klosas Urteil zu den Ableitungsdefinitionen kann deshalb zugestimmt werden: Besser wäre es in Hinblick auf die angedachten Benutzer, jedes Lemma aus sich zu erklären und nicht mehrfaches Nachschlagen zu erzwingen. Bei einer Überarbeitung [...] sollten solche Definitionen möglichst aufgegeben werden. (Klosa 2004, S. 294) Zum Definitionswortschatz des DHWDaF 1 findet sich auf der Homepage folgende Aussage: „Dabei garantiert der computerkontrollierte Erklärungswortschatz, dass jedes Wort, das in den Definitionen verwendet wird, selbst auch als Stichwort vorhanden ist“ (Bibliographisches Institut & F.A. Brockhaus AG 2008). Die Definitionen werden sogar als „Bedeutungserklärungen mit begrenztem Definitionswortschatz“ (Bibliographisches Institut & F.A. Brockhaus AG 2010) bezeichnet, was jedoch nichts mit dem Ansatz der englischen Wörterbücher zu tun hat, eine geschlossene Liste von Wörtern zu erstellen und in den Definitionen dann ausschließlich auf diese zurückzugreifen. Streng logisch ist zwar auch im DHWDaF 2 der Definitionswortschatz begrenzt, nämlich auf die im Wörterbuch selbst verzeichneten, also auf rund 11 200 Lemmata. Argumentiert man von diesem Standpunkt, gäbe es in Wörterbüchern jedoch grundsätzlich begrenzte Definitionswortschätze, weil alle in sich geschlossen und damit endlich sind. Auf diese Weise umfassen sie nie das vollständige Lexikon einer Sprache. In dieser Arbeit wird der Terminus begrenzter Definitionswortschatz jedoch - wie in der Metalexikografie üblich - anders verstanden (vgl. Kap. 2.1.3). Insofern kann in Bezug auf das DHW- DaF 2 zwar von einem computerkontrollierten, nicht jedoch von einem begrenzten Definitionswortschatz die Rede sein. 290 Da diese semantischen Angaben in diesen Fällen die Definition ersetzen, werden sie im Rahmen der Untersuchung als Definitionen gewertet (vgl. Kap. 3.2.2.2). Wörterbuchanalyse 169 Im gesamten DHWDaF 1-2 wird nicht darauf eingegangen, was der Ausdruck computerkontrollierter Definitionswortschatz bedeutet. Allein der Terminus computerkontrollierter Definitionswortschatz selbst wird auf dem hinteren Buchdeckel der Hueber-Version des Wörterbuchs sowie auf den Internetseiten der beiden Verlage verwendet. In der zweiten Auflage, dem DHWDaF 2 von 2007, findet sich im Anhang der Lernwortschatz mit dem Vokabular der Niveaustufen A 1, A 2 und B 1 aus dem Gemeinsamen europäischen Referenzrahmen für Sprachen. Es bleibt aber unklar, ob die Ähnlichkeit zu der Praxis in den großen englischsprachigen Lernerwörterbüchern, im Anhang den verwendeten Definitionswortschatz aufzulisten, durch die Art und den Ort der Platzierung des Lernwortschatzes im Wörterbuch beabsichtigt ist. Mit dem begrenzten Definitionswortschatz der englischsprachigen Lernerwörterbücher hat dieses Vokabular nichts gemein. Auch für das DHWDaF 2 wird im Folgenden dargestellt, wie konsequent der Anspruch, mit einem computerkontrollierten Definitionswortschatz zu arbeiten, im Wörterbuch umgesetzt wird. Es ergeben sich die gleichen Arbeitshypothesen wie für das LTWDaF 2: 1) Wie das LTWDaF 2 kann auch das DHWDaF 2 die Eigenaussage, mit einem computerkontrollierten Definitionswortschatz zu arbeiten, nicht vollständig umsetzen. In den Definitionen finden ebenfalls Lexeme Verwendung, die nicht Teil der Makrostruktur sind. 1.1) Im DHWDaF 2 betrifft dies wiederum einerseits die formale Seite der Lexeme, dass die äußere Form eines Elements des Definitionswortschatzes nicht im Wörterverzeichnis enthalten ist. Für das DHWDaF 2 wird ebenfalls davon ausgegangen, dass hier wahrscheinlich vor allem Wortbildungsprodukte aus verzeichneten Lemmata betroffen sind, wie Komposita, Derivate oder Konversionen. Durch die maschinell leicht durchzuführende Überprüfung dieser Fallgruppe während des Redaktionsprozesses gibt es vermutlich relativ wenige Beispiele. 1.2) Andererseits ist erneut die inhaltliche Seite der Lexeme betroffen, also die Verwendung lemmatisierter Wörter in nicht verzeichneten Bedeutungen. Die höchst aufwendige Überprüfung dieser Fälle legt auch hier die Vermutung nahe, dass im Redaktionsprozess keine Kontrolle auf Sememebene stattgefunden hat. 291 Der enorme Arbeitsaufwand ermöglicht im Rahmen der vorliegenden Arbeit lediglich eine auf Stichproben basie- 291 Zum Fehlen semantisch aufbereiteter Korpora vgl. Lenz (2000, S. 11) und Lemnitzer/ Zinsmeister (2010, S. 85) sowie Kapitel 2.3.1.2 und 3.1.1 . Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 170 rende Untersuchung. Wie beim LTWDaF 2 werden im DHWDaF 2 von dieser Tatsache aufgrund der häufig idiomatisierten Bedeutung hauptsächlich Partikelverben betroffen sein. Die Untersuchung von Klosa aus dem Jahr 2004 zu diesem Thema beschäftigt sich auch mit dem DHWDaF 1 und überprüft hier an elf 292 „willkürlich ausgewählten Stichproben aus der L-Strecke“ (Klosa 2004, S. 295), ob alle in den Definitionen verwendeten Wörter selbst im Wörterbuch lemmatisiert sind. Klosa kommt dabei zu folgenden Ergebnissen: In vier der untersuchten Artikeln - also in 36 Prozent - werden in den Definitionen Wörter verwendet, die nicht im Referenzwörterbuch verzeichnet sind. Bei den nicht verzeichneten Wörtern (insgesamt sieben) handelt es sich in zwei Fällen um Substantivierungen von Lemmata (Einzelne im Artikel liberal, Laufen im Artikel Läufer). Die restlichen fünf Wörter (betreiben im Artikel Läufer, wahrnehmbar im Artikel leise, weitgehend im Artikel liberal, Lebensgestaltung im Artikel liberal, ertönen im Artikel läuten) sind überhaupt nicht lemmatisiert. Aus der Sicht der Wortbildung sind die Konversion (Einzelne, Laufen, weitgehend) und die Derivation (betreiben, ertönen, wahrnehmbar) mit je drei Wortbildungsprodukten am stärksten vertreten, das siebte nicht lemmatisierte Lexem aus dem Definitionswortschatz ist ein Kompositum (Lebensgestaltung). Falls sich der aus Klosas Stichprobe gewonnene Eindruck in der durchgeführten Untersuchung bestätigt, wäre das für den Benutzer äußerst nachteilig, zumal sich eine (rein formale) Kontrolle der in den Definitionen verwendeten Lexeme zu ihrer Verzeichnung als Lemmata mit dem Computer relativ unaufwendig bewerkstelligen lässt. Aus der Tatsache, dass sich von den zwölf untersuchten Artikeln im LTWDaF 1 lediglich 25 Prozent in ihrem Definitionswortschatz vollständig auf die Lemmata beschränken, im DHWDaF 1 jedoch 64 Prozent der elf Probeartikel, schließt Klosa (2004, S. 301) , dass im DHWDaF 1 das Prinzip des computerkontrollierten Definitionswortschatzes „sorgfältiger umgesetzt“ ist als im LTWDaF 1. Diese These soll in der vorliegenden Untersuchung ebenfalls überprüft werden. 293 Bereits ein erster Blick legt den Schluss nahe, dass im DHWDaF 2 mindestens genauso viele Verstöße gegen das selbst auferlegte Prinzip des computerkontrollierten Definitionswortschatzes bestehen wie im LTWDaF 2. Denn auch im DHWDaF 2 lassen sich beim Aufschlagen des Wörterbuchs sofort Belege 292 Im Vergleichswörterbuch, dem LTWDaF 1, werden zwölf Artikel untersucht. Eines der gewählten Lemmata (lispeln) kann für das DHWDaF 2 jedoch nicht analysiert werden, da es dort nicht verzeichnet ist. 293 Zu den Ergebnissen vgl. Kapitel 3.3.1.2. Wörterbuchanalyse 171 für die oben aufgestellten Thesen finden. 294 Der weniger markante Fall ist der, dass zwar die äußere Form des im Definitionswortschatz verwendeten Lexems im Wörterverzeichnis enthalten ist, jedoch nicht in seiner verwendeten Bedeutung. Das Lemma Harn wird im DHWDaF 2 beispielsweise als ‘gelbliche, klare Flüssigkeit, die der Körper regelmäßig ausscheidet’ definiert. Das Partikelverb ausscheiden wird in dieser Definition in der Bedeutung ‘absondern, von sich geben’ verwendet, ist im DHWDaF 2 selbst jedoch nur mit der Bedeutung ‘nicht mehr weiter teilnehmen’ verzeichnet. Ähnliches ist bei der Definition des Lemmas essen 1. ‘als Nahrung aufnehmen’ und 2. ‘[feste] Nahrung aufnehmen’ zu beobachten. Hier tritt gleich zweimal das Lexem aufnehmen in der Bedeutung ‘zu sich nehmen’ auf. Das Partikelverb aufnehmen enthält als Lemma selbst zwar vier Sememe mit den Definitionen 1. ‘jmdm. eine Unterkunft bieten’, 2. ‘Teil einer Gemeinschaft werden lassen’, 3. ‘(mit einer Tätigkeit) beginnen’ und 4. ‘auf Film, Videoband, CD u.Ä. speichern’, seine im Definitionswortschatz auftretende Bedeutung ist jedoch nicht darunter. Ein drittes und letztes Beispiel soll an dieser Stelle genügen. Das Lemma anziehen wird im DHWDaF 2 als 1. ‘den Körper mit etwas bekleiden’, 2. ‘Kleidungsstücke überziehen’ und 3. ‘durch Ziehen fester machen’ definiert. Auch dieses Partikelverb taucht in den Definitionen weiterer Lemmata in völlig anderen Bedeutungen auf. So wird es in den ersten beiden Sememen des Lemmas hocken 1. ‘mit angezogenen Beinen sitzen’ und 2. ‘sich mit angezogenen Beinen hinsetzen’ in der Bedeutung ‘heranziehen, an sich ziehen’ verwendet. Durch seine Funktion als Attribut könnte es hier sogar als Adjektiv gewertet werden, das nicht einmal von der Form her im Wörterbuch lemmatisiert ist. Prädikativ wird anziehen in der Definition des Lemmas homosexuell verwendet - ‘sexuell vom gleichen Geschlecht angezogen’. Hier besitzt es die - ebenfalls nicht im DHWDaF 2 verzeichnete - Bedeutung ‘anlocken, erregen’. Diese Beispiele zeigen deutlich, dass die Verfasser der Definitionen im DHWDaF 2 nicht darauf geachtet haben, die verwendeten Lexeme daraufhin zu überprüfen, ob sie als Lemmata auch in der jeweiligen Bedeutung des Definitionswortschatzes verzeichnet sind. Trotzdem kann selbst dies noch als - auf der Ebene der äußeren Form - computerkontrollierter Definitionswortschatz gelten, da das DHWDaF 2 nicht behauptet, die Semantik des Definitionswortschatzes auf die der Lemmata zu beschränken. Was aber auf der Homepage des Duden-Verlages für das Wörterbuch garantiert wird, ist, „dass jedes Wort, das in den Definitionen verwendet wird, selbst auch als Stichwort vorhanden ist“ (Bibliographisches Institut & F.A. Brockhaus AG 2008). Doch auch dieses Versprechen kann das DHWDaF 2 nicht halten, wie ein kurzer Blick auf die 294 Es folgen Beispiele aus dem gesamten Wörterbuch, nicht nur aus der Stichprobe. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 172 Definitionen verrät. Das Lemma Bucht wird beispielsweise als ‘in das Festland ragender Teil eines Meeres oder Sees’ definiert, im DHWDaF 2 sind jedoch weder ragend noch ragen als Lemmata verzeichnet. Das ist für den Benutzer besonders nachteilig, da es sich nicht um ein Wortbildungsprodukt handelt, dessen Bedeutung zumindest teilweise aus seinen Bestandteilen ableitbar wäre. Die meisten Lexeme aus dem Definitionswortschatz, die nicht im DHWDaF 2 lemmatisiert sind, gehören zu den Wortbildungsprodukten. Am stärksten sind hier die Konversionen betroffen. Trotz ihrer systematischen Verwendung in den Definitionen sind vor allem Konversionen von Infinitiven oder von Adjektiven beziehungsweise Partizipien im DHWDaF 2 nicht als Lemmata verzeichnet. In der Definition des Lemmas Funk ‘Senden und Empfangen von Nachrichten durch elektrische Wellen’ sind mit Senden und Empfangen gleich zwei Infinitivkonversionen enthalten. Das Lemma seltsam dient mit seiner Definition ‘vom Üblichen abweichend und nicht leicht zu verstehen’ als Beispiel für eine nicht lemmatisierte Adjektivkonversion (das Übliche). Neben den Substantivierungen gibt es im Bereich der Adjektive und Partizipien zahlreiche nicht im DHWDaF 2 verzeichnete Konversionsprodukte, die in den Definitionen auftauchen, beispielsweise geartet beim Lemma derartig: ‘so (geartet)’. In diesem Fall ist die Nichtlemmatisierung noch nachteiliger, weil das Basisverb arten (‘nach jemandem kommen/ geraten’) kein Lemma des Wörterbuchs ist. 295 In den Definitionen verwendete Derivate sind ebenfalls häufig nicht als Lemmata verzeichnet, wie beispielsweise Bestrafung in der Definition von Sanktion ‘Maßnahme zur Bestrafung eines anderen Staates’ oder militärisch beim Lemma Offizier ‘Person mit hohem militärischen Rang’. Die Derivationsbasen bestrafen beziehungsweise Militär sind jedoch lemmatisiert. In den Definitionen von Stange ‘langer, relativ dünner Gegenstand aus Holz, Metall o.Ä. (mit rundem Querschnitt)’, liberal 2. ‘dem Einzelnen weitgehend die Möglichkeit uneingeschränkter, eigener Lebensgestaltung lassend’ und Lexikon ‘nach Stichwörtern alphabetisch geordnetes Nachschlagewerk’ sind die substantivischen Komposita Querschnitt, Lebensgestaltung und Stichwort weder vollständig noch teilweise unter ihrem Definiendum verzeichnet. Bei Lebensgestaltung ist auch das Grundwort Gestaltung nicht lemmatisiert. Vor allem teil- oder demotivierte Wortbildungsprodukte, die sich in ihrer Semantik nicht vollständig aus ihren einzelnen Bestandteilen erschließen lassen - wie dies bei Stichwort der Fall ist -, stellen für den nicht mutter- 295 In einem Lernerwörterbuch bietet sich - wenn überhaupt - die Verzeichnung des Partizips geartet an, weil dieses laut COSMAS-Recherchen häufiger vorkommt als der Infinitiv arten. Wörterbuchanalyse 173 sprachlichen Benutzer ein kaum überwindbares Hindernis beim Verstehen der Definitionen dar. Die vielen aufgeführten Beispiele für Definitionswortschatz, der entweder vollständig oder in den gebrauchten Bedeutungen nicht lemmatisiert ist, fanden sich zügig beim unsystematischen Durchblättern des Wörterbuchs. Sie lassen darauf schließen, dass die Wahl der Bezeichnung „computerkontrollierte[r] Erklärungswortschatz“ (Bibliographisches Institut & F.A. Brockhaus AG 2008) lediglich aus werbestrategischen Gründen erfolgt. Zur Verteidigung des DHWDaF 2 sei an dieser Stelle jedoch erneut auf die Äußerungen von Hausmann, Zöfgen sowie Herbst/ Klotz verwiesen, die bestätigen, dass Lernerwörterbücher ihren Definitionswortschatz bisher nicht auf der Ebene der Sememe kontrollieren (vgl. Kap. 3.1.1). 296 3.2 Methodisches Vorgehen 3.2.1 Auswahl der untersuchten Lemmata Der eigentlichen Analyse des in den Wörterbüchern LTWDaF 2 und DHW- DaF 2 verwendeten Definitionswortschatzes ist ein Pretest vorangestellt, in dem die Definitionen von 50 Lemmata mit insgesamt 115 Sememen aus dem LTWDaF 2 untersucht werden. 297 Auf diese Weise kann einerseits der Arbeitsaufwand der gesamten Untersuchung abschätzbar gemacht werden. Andererseits soll so sichergestellt werden, dass bei der endgültigen Analyse der Zusammensetzung des Definitionswortschatzes nur sinnvolle und aussagekräftige Größen untersucht werden. Dieser Pretest ergab, dass der ursprüngliche Plan fallen gelassen werden musste, für die Untersuchung sämtliche Definitionen des LTWDaF 2 und des DHWDaF 2 zu analysieren, also eine Vollerhebung durchzuführen. Eine Hochrechnung der Zeit, die für die Untersuchung der 50 Lemmata des Testlaufes benötigt wurde, auf die Gesamtzahl der 8 647 im LTWDaF 2 verzeichneten Lemmata ergab einen erforderlichen Zeitraum von knapp 90 Monaten. Dazu käme noch die Zeit für die Untersuchung der Definitionen im DHWDaF 2 und für den Vergleich beider Wörterbücher. Im Rahmen dieser Arbeit wäre eine solche Analyse aufgrund des enormen Arbeitsaufwandes folglich nicht zu leisten. 296 Die genauen Quellen lauten Hausmann (1990, S. 228), Zöfgen (1994a, S. 136) sowie Herbst/ Klotz (2003, S. 53). Zum Fehlen semantisch aufbereiteter Korpora vgl. Lenz (2000, S. 11) und Lemnitzer/ Zinsmeister (2010, S. 85) sowie Kapitel 2.3.1.2. 297 Zu den Grundlagen der empirischen Forschung vgl. Bamberg/ Baur (2002, S. 9), Hippmann (2003, S. 29f.), Schumann (2006, S. 82ff.), Schnell/ Hill/ Esser (2008, S. 265ff.) sowie Diekmann (2010, S. 390ff., 430f.). Zur Anwendung der empirischen Methoden in der Linguistik vgl. Schlobinski (1996, S. 25ff.) und Albert/ Koster (2002, S. 74ff.) Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 174 Der Hauptgrund für die extreme Langwierigkeit der Untersuchung liegt in der notwendigen Bearbeitung der Primärdaten. Für das Material des LTW- DaF 2 muss jede Definition einzeln aus dem gesamten Artikel extrahiert werden. Anschließend ist jedes Wort für sich auf seine Grundform zurückzuführen und nach der erfolgten Disambiguierung zum Teil mit den Ziffern der lemmatisierten Homonyme zu bezeichnen. Danach kann der gesamte verwendete Definitionswortschatz geordnet, mit den jeweiligen Angaben zu seiner Zusammensetzung versehen und ausgewertet werden. Diese Arbeit muss manuell erledigt werden, da die in den Definitionen verwendeten Lexeme nicht getaggt - also mit hinterlegten Annotationen versehen - sind. 298 Eine vollkommen automatisierte Bearbeitung berücksichtigt die Semantik der Lexeme nicht und könnte ohne Annotationen beispielsweise nicht zwischen verschlafen ‘zu spät erwachen’ und verschlafen ‘müde, schlaftrunken’ oder sein in der Verwendung als Vollverb, Hilfsverb oder Possessivpronomen unterscheiden. 299 Eine weitere Ursache ist der erforderliche Aufbau eines eigenen Korpus, da für diese Analyse nicht auf geeignete bereits bestehende Korpora zurückgegriffen werden kann. 300 Der Terminus Korpus wird mit Lemnitzer/ Zinsmeister (2010, S. 40) wie folgt verstanden: Ein Korpus ist eine Sammlung schriftlicher oder gesprochener Äußerungen in einer oder mehreren Sprachen. Die Daten des Korpus sind digitalisiert, d.h. auf Rechnern gespeichert und maschinenlesbar. Die Bestandteile des Korpus, die Texte oder Äußerungsfolgen, bestehen aus den Daten selber sowie möglicherweise aus Metadaten, die diese Daten beschreiben, und aus linguistischen Annotationen, die diesen Daten zugeordnet sind. „Korpora ermöglichen es dem Sprachwissenschaftler, vorhandene Theorien empirisch zu überprüfen und anhand von Korpusmaterial neue Hypothesen zu entwickeln.“ (Scherer 2006, S. 15). Die Beschreibung der Vorteile der 298 Zu den Termini Annotation und Tagging vgl. Kapitel 3.2.3. 299 Für das Deutsche hat sich für die Annotation von Wortarten inzwischen zwar das Stuttgart- Tübingen Tagset (STTS) als Standard etabliert, eine Arbeit mit diesem Annotationswerkzeug ist jedoch nicht unproblematisch, da beispielsweise Mehrwortlexeme, wie mehrgliedrige Verben, unabhängig in ihren Einzelteilen analysiert werden oder bei haben und sein nicht in der Verwendung als Voll- und Hilfsverben unterschieden wird. Daher wird in dieser Arbeit auf eine automatisierte Annotation der Wortarten verzichtet - auch, um die bearbeiteten Primärdaten besser kennenzulernen. Zu den Problemen bei automatischen Annotationswerkzeugen vgl. Lemnitzer/ Zinsmeister ( 2010, S. 65ff.), zum Stuttgart-Tübingen Tagset vgl. Universität Tübingen (2008). 300 Zur Zusammenstellung eigener Korpora vgl. McEnery/ Xiao/ Tono (2006, S. 71ff.). Wörterbuchanalyse 175 Arbeit mit Korpora in der Lexikografie beschränkt sich bei Lemnitzer/ Zinsmeister (2010, S. 139ff.) auf die Darstellung des praktischen lexikografischen Prozesses, metalexikografische Arbeiten werden hingegen ausgeklammert. 301 Die Tatsache, dass in dieser korpusbasierten 302 Arbeit nicht alle Definitionen der Wörterbücher analysiert werden, führt zu einer Teilerhebung und damit zu einer notwendigen Auswahl des Untersuchungsmaterials. Als Teil der Grundgesamtheit (Stichprobe) werden je 400 Lemmata pro Wörterbuch untersucht, was im LTWDaF 2 rund fünf Prozent des gesamten Lemmabestandes entspricht. Im DHWDaF 2 entsprechen den 400 Lemmata der Stichprobe im LTW- DaF 2 durch Unterschiede in der Lemmatisierungspolitik 382 Lemmata und damit 3,50 Prozent des Lemmabestandes (vgl. Kap. 3.2.2.2). Die untersuchten Definitionen werden nicht nach dem Zufallsprinzip ausgewählt, sondern regelgeleitet und bewusst nach der Technik der Quotenauswahl. Bei einer Quotenauswahl ist die Ausprägung der für die Analyse relevanten Merkmale in der Stichprobe und in der Grundgesamtheit des Materials idealerweise gleich verteilt, wodurch von der Stichprobe induktiv auf die Grundgesamtheit rückgeschlossen werden kann. 303 In diesem Sinn kann dann von einer repräsentativen Untersuchung gesprochen werden. 304 Die Repräsentativität einer Teilerhebung zeigt sich demzufolge, wenn die Eigenschaften 301 Zum Terminus Korpus vgl. auch McEnery/ Wilson (2001, S. 29ff.) und McEnery/ Xiao/ Tono (2006, S. 4f.). Zur Anwendung von Korpora in linguistischen Studien vgl. (ebd., S. 80ff.). 302 In Anlehnung an Lemnitzer/ Zinsmeister (2010, S. 19) stellt in der korpusbasierten Linguistik „das Korpus die primäre Quelle der Erkenntnis“ dar, wohingegen es in der korpusgestützten Linguistik nur für die „Überprüfung und Korrektur theoretischer Aussagen“ dient. Tognini-Bonelli (2001, S. 65ff., 84ff.) differenziert in gleicher Art zwischen corpus-based und corpus-driven. Vgl. auch McEnery/ Xiao/ Tono (2006, S. 8ff.). 303 Die Einwände, die vonseiten der Empirieforschung gegen das Quotenverfahren bestehen, sind für die vorliegende Untersuchung nicht von Relevanz, da nach der Bestimmung der Quotierung - also der Festlegung der Regeln für die Auswahl - und nach der Bestimmung des Vorgehens keine Einflussnahme durch die Untersuchende möglich ist. Weiterhin bezieht sich die Kritik in der empirischen Sozialforschung häufig auf die Auswahl von Interviewpartnern mittels eines Quotenverfahrens - ein Einwand, der bei einem rein sprachlichen Untersuchungsmaterial ebenfalls nicht greift. 304 Das Kriterium der Repräsentativität wird nicht nur im Bereich der Statistik, sondern auch in der Korpuslinguistik ausführlich diskutiert (vgl. Lemnitzer/ Zinsmeister 2010, S. 50ff.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 176 der Stichprobe mit den Eigenschaften der Grundgesamtheit verglichen werden können und sich Übereinstimmungen finden. Für die Untersuchung kann das Verhältnis zwischen Stichprobe und Grundgesamtheit eindeutig bestimmt werden, da die Grundgesamtheit aller Definitionen der beiden untersuchten Wörterbücher eine geschlossene Menge ist. Zudem beträgt der Anteil der synsemantischen Wortarten in allgemeinsprachlichen Texten ebenfalls rund 50 Prozent. 305 Dieser Wert deckt sich mit den Ergebnissen, die im Rahmen der vorliegenden Arbeit erzielt wurden, was für die Auswahl der Stichprobe spricht (vgl. Kap. 3.3.2.1.2). Auf die Tatsache, dass es sich bei Wörterbucheinträgen um Texte und beim Akt ihres Formulierens um eine sprachliche Handlung handelt, hat unter anderem Wiegand (1976, S. 120f.) bereits vor mehr als 30 Jahren hingewiesen. 306 Das Merkmal, nach dem die Definitionen für die Untersuchung ausgewählt werden, ist die Wortart des Lemmas (sein Lemmatyp). Für die Festlegung der Quote wird die prozentuale Häufigkeitsverteilung der Wortarten Substantiv, Verb, Adjektiv und der Gruppe Sonstiges in der deutschen Sprache analysiert (vgl. Tabelle 3). 307 Die Gruppe Sonstiges umfasst Adverbien, Pronomen, Junktionen, Präpositionen und Partikeln. 305 Es ist nicht einfach, für diese in der Sprachwissenschaft kursierende Zahl Belege zu finden. Krohn (1992, S. 120) spricht von „einem statistisch recht gut abgesicherten Anteil von mindestens 60 % Autosemantika in einem beliebigen Text“, gibt jedoch keinerlei Quellen für diesen Wert an. Nach Meier (1964, S. 53) bilden in Kädings Material die 207 häufigsten Wortformen, die 66 Lexemen entsprechen (fast ausschließlich Synsemantika), bereits 54,35 Prozent der laufenden Wörter. Der Anteil aller Synsemantika in einem Text liegt dementsprechend höher. Somit widersprechen sich die Angaben bei Krohn und Meier, da Ersterer den Autosemantika und Letzterer den Synsemantika einen höheren Anteil in Texten zuweist. Bei der Bildung eines Mittelwertes kommt man auf Werte von rund 50 Prozent für beide Wortartenklassen. 306 Vgl. auch Weinrich (1976, S. 347f.), Wiegand (1988b, S. 103f.). 307 Eine bereits im Kapitel 2. 2.1.7 erwähnte Zählung ist die Jay Alan Pfeffers, der in seinem Grunddeutsch zwischen den Wortarten Substantiv, Verb und Adjektiv ein Verhältnis von 5 : 3 : 2 zugrunde legt. Allerdings bezieht sich diese Verteilung allein auf die drei genannten Wortarten, alle anderen fehlen. Sie kann deshalb nur für einen relativen Vergleich zwischen Substantiv, Verb und Adjektiv herangezogen werden, nicht jedoch für prozentuale Angaben für alle Wortarten. Huneke/ Steinig (2005, S. 58) geben „circa 50 % Nomen, 25 % Verben, 25 % Adjektive und Adverbien, [sic] sowie 200 Präpositionen und Konjunktionen und knapp 100 Pronomen“ an. Die Duden-Grammatik (2009, S. 641) schätzt, dass „der Wortschatz des Deutschen aus etwa 60 % Substantiven, 25 % Verben und 15 % Adjektiven“ besteht. Wörterbuchanalyse 177 Ortmann 308 Duden 309 Pretest Types 310 Pretest Tokens 311 Mittelwert 312 Quote 313 Substantiv 46,9 % etwa 50 % 39,8 % 23,0 % 39,9 % 40 % Verb 19,3 % knapp 25 % 23,0 % 16,0 % 20,8 % 20 % Adjektiv 22,6 % gut 25 % 15,5 % 9,0 % 15,0 % 20 % Sonstiges 11,3 % 21,7 % 52,0 % 24,5 % 20 % 100, 1% 100 % 100,0 % 100,0 % 100,2 % 100 % Tab. 3: Die Verteilung der Wortarten in der deutschen Sprache Neben den Angaben bei Ortmann (1979, S. XXXI) in der zweiten Spalte der Tabelle und den Angaben in der 6. Auflage der Duden-Grammatik (1998, S. 89) in der dritten Tabellenspalte werden die eigenen Erkenntnisse aus dem 308 Zu den Substantiven (46 Prozent) werden hier noch die bei Ortmann eigens aufgeführten Eigennamen (0,9 Prozent) hinzugerechnet, da es sich dabei immer um Substantive handelt. Unter die Gruppe Sonstiges (11,3 Prozent) fallen Ortmanns Adverbien (6,7 Prozent), Konjunktionen (1,3 Prozent), Präpositionen (1,2 Prozent), Pronomen (0,8 Prozent), Zahlwörter (0,5 Prozent), Fragewörter (0,4 Prozent) und Interjektionen (0,4 Prozent). Die summierte relative Häufigkeit von 100,1 Prozent entsteht durch Rundungen (vgl. Ortmann 1979, S. XXXI). 309 Die genaue Angabe lautet: „Die Verben machen davon [vom deutschen Lexikon, A.T.] schätzungsweise knapp ein Viertel, die Substantive etwa zwei Viertel und das Adjektiv und das Adverb gut ein Viertel aus; die Zahl der Präpositionen und Konjunktionen beläuft sich auf etwa 200, die der Pronomen nicht einmal auf 100 Wörter.“ (Duden-Grammatik 1998, S. 89). 310 Der Pretest Types ist eine bestimmte Art der Auswertung des Pretests zu dieser Untersuchung, der sich auf die Types der Lexeme bezieht, die in den Definitionen verwendet werden. Jedes Wort wird nur einmal gezählt, egal, wie häufig und in wie vielen Wortformen es in den Definitionen vorkommt. Die Häufigkeit der Types spiegelt somit die Häufigkeit der Wortarten in einer Auflistung aller verwendeten Wörter wider. Diese Zählung der Types wirkt sich auf die relativen Häufigkeiten der Wortarten in der Art aus, dass vor allem Substantive, Adjektive und Verben, die in den untersuchten Definitionen oft nur einmal auftreten, stärker repräsentiert sind als im Pretest Tokens. Zum Begriff Type vgl. auch Kapitel 3.2.3. 311 Auch der Pretest Tokens bezieht sich auf die Auswertung des Pretests zur Untersuchung. Im Pretest Tokens werden allerdings die Tokens betrachtet. Die Häufigkeit der Verwendung der einzelnen Wörter wird also in die Berechnung der Wortartenhäufigkeit mit einbezogen, was den extrem hohen Wert der Adverbien und Funktionswörter in der Gruppe Sonstiges erklärt. Diese Art der Häufigkeit kann man folglich als die Häufigkeit der Wortarten in einem Text beschreiben. Zum Begriff Token vgl. auch Kapitel 3.2.3. 312 Der Mittelwert ergibt sich wortartenspezifisch aus den Werten der Spalten 2 bis 5. Für Adjektive und die Gruppe Sonstiges wird bei den Duden-Angaben jeweils mit 13 Prozent gerechnet. Da jeweils die Mittelwerte errechnet werden, summiert sich das Ganze nicht glatt auf 100 Prozent. 313 Hier befinden sich die Werte bzw. Quoten, mit denen in dieser Arbeit gerechnet wird. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 178 Pretest (Pretest Types und Pretest Tokens) genutzt, die sich hier in den Tabellenspalten 4 und 5 wiederfinden. Die rein mathematisch errechneten Durchschnittswerte (Spalte 6 der Tabelle) werden anschließend für die Quote der Untersuchung vereinheitlicht (Spalte 7 der Tabelle). Wie aus Tabelle 3 ersichtlich ist, verändern sich die Werte der Substantive und der Verben bei dieser Anpassung kaum. Lediglich die Anteile der Adjektive und der Gruppe Sonstiges werden etwas korrigiert und dabei aneinander angeglichen. Einerseits kann so das Gewicht stärker in Richtung der autosemantischen Adjektive verschoben werden, damit die Funktionswörter mit den Adverbien in der Untersuchung nicht überrepräsentiert sind (vgl. auch Kühn 1979, S. 32). Andererseits ist es für die Untersuchung praktikabler, mit Ausnahme der Substantive bei jedem Lemmatyp von einemAnteil von 20 Prozent an der Gesamtmenge der analysierten Lemmata ausgehen zu können. Bei dem gewählten Umfang der Stichprobe von n = 400 Lemmata (LTWDaF 2) ergibt sich demzufolge, dass 160 Substantive (40 Prozent) und jeweils 80 Verben, Adjektive und Lemmata der Gruppe Sonstiges (jeweils 20 Prozent) mit ihren Definitionen das Untersuchungsmaterial bilden. Diese Stichprobe soll sich in mehreren Abschnitten über große Teile der gesamten Alphabetstrecke erstrecken. Als Quotierungsregel gilt hier, die Stichprobe zu annähernd gleichen Teilen auf die Buchstaben A, M und V zu verteilen (vgl. Tab. 4). So erhöht sich die Chance darauf, dass die untersuchten Definitionen von unterschiedlichen Bearbeitern verfasst sind. Zum anderen können in der Untersuchung dadurch verschiedenartige Lexeme berücksichtigt werden, beispielsweise die Partikelverben mit anauf der Alphabetstrecke A oder die Präfixverben mit verunter V. 314 Substantiv Verb Adjektiv Sonstiges A 54 27 27 27 M/ N 53 27 27 27 V/ W 53 26 26 26 160 80 80 80 Tab. 4: Die Anzahl der untersuchten Lemmata pro Buchstabe 314 Da sich die 160 substantivischen Lemmata und die je 80 Lemmata der Gruppen Verb, Adjektiv und Sonstiges nicht ohne Rest auf die drei Alphabetstrecken aufteilen lassen, wird bei den Substantiven die Verteilung 54 - 53 - 53 und bei den anderen Gruppen die Verteilung 27 - 27 - 26 gewählt. Wörterbuchanalyse 179 Die Grundlage für die Festlegung der einzelnen Untersuchungslemmata bildet das LTWDaF 2, weil das Material des DHWDaF 2 zu diesem Zeitpunkt noch nicht vorlag. Für die Auswahl der untersuchten Lemmata wird in der Printausgabe des LTWDaF 2 beim jeweiligen Buchstabenbeginn zehn Seiten vorgeblättert, um eine eventuell sorgfältigere Arbeit der Redakteure am Anfang der Buchstabenstrecke zu überspringen. Die Auswahl der zu analysierenden Lemmata beginnt für A auf der Seite 29, für M auf der Seite 292 und für V auf der Seite 478 des DHWDaF 2. Dort wird jeweils links oben beim ersten Lemma angefangen und dem Wörterbuch so lange Untersuchungsmaterial entnommen, bis die Quote für die jeweilige Wortart erfüllt ist. In den Alphabetstrecken M und V sind allerdings nicht genügend Lemmata für die Gruppe Sonstiges verzeichnet, sodass die Auswahl hier bei den nachfolgenden Buchstaben N bzw. W fortgesetzt wird. Keine Berücksichtigung finden bei der Auswahl die insgesamt zwölf Verweislemmata, also diejenigen Lemmata, die entweder von einer flektierten Form (mich 1 , mich 2 , mied, mir 1 , mir 2 , misst und mochte), von einer Kurzform (VHS ), von einer Schreibvariante (aufwändig) oder von phrasenähnlichen Strukturen (muntermachen, nachhause und verlorengehen) 315 direkt auf den eigentlichen Artikel verweisen. Übersprungen werden auch die Lemmata, die im Vergleichswörterbuch (DHWDaF 2) nicht lemmatisiert sind. 316 In diesen Fällen - immerhin 80 (vgl. Datensammlung A.2.1) - wird das entsprechende Lemma im LTWDaF übergangen und durch das nächste, im DHWDaF lemmatisierte ersetzt. 317 Somit ergeben sich 400 Untersuchungslemmata, die in der folgenden Übersicht dargestellt werden: 315 Besonders bei diesen Strukturen wird deutlich, wie uneinheitlich das LTWDaF 2 mit der gültigen Rechtschreibung umgeht: Von muntermachen (zusammengeschrieben) wird auf munter verwiesen, dort findet der Benutzer die getrennt geschriebene Kollokation <j-n munter machen>. Ebenso liegt der Fall bei nachhause (von dort wird auf Haus und das Muster zur Satzbildung j-d geht/ kommt nach Hause verwiesen) und bei verlorengehen (mit Verweis auf verlieren und das Satzbildungsmuster j-d/ etwas geht verloren). 316 Die Auswahl der Lemmata musste zu Beginn der Untersuchung erfolgen, um mit der Analyse am LTWDaF 2 beginnen zu können. Zu diesem Zeitpunkt lagen die Daten des DHWDaF 2 noch nicht vor, weshalb das Wörterverzeichnis des DHWDaF 1 als Grundlage für die Überprüfung der Lemmaverzeichnung dient. Zwei potenzielle Untersuchungslemmata des DHWDaF 2 - aneinander- und versagen 1 - werden deshalb übersprungen, weil sie im DHW-DaF 1 noch nicht lemmatisiert sind. 317 Ein Lemma - Voraus - wird übersprungen, obwohl es in beiden Wörterbüchern verzeichnet ist. Das liegt an seiner unklaren Wortartenzugehörigkeit: Im LTWDaF 2 ist es mit Großschreibung als Substantiv lemmatisiert, allerdings ohne die typischen Grammatikangaben für Substantive. Im DHWDaF 2 wird es hingegen als Adverb verzeichnet. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 180 Buchstabe A: Substantiv: Altenheim, Alter, Altersheim, Altpapier, Altstadt, Ameise, Ammann, Ampel, Amt, Analyse, Anblick, Andenken, Anerkennung, Anfang, Anfänger, Anforderung, Anfrage, Angabe, Angebot, Angehörige, Angeklagte, Angel, Angelegenheit, Angestellte, Angewohnheit, Angriff, Angst, Anhang, Anhänger 1 , Anhänger 2 , Anker, Anklage, Ankunft, Anlage, Anlass, Anleitung, Anmeldung, Anmerkung, Annahme, Annonce, Anrede, Anregung, Anreise, Anruf, Anrufbeantworter, Ansage, Anschein, Anschluss, Anschrift, Ansehen, Ansicht, Anspruch, Anstrengung, Anteil Verb: amüsieren, analysieren, anbauen, anbieten, anbinden, anbrennen, anbringen, ändern, andauern, andeuten, anerkennen, anfahren, anfangen, anfassen, anfertigen, anfordern, anfragen, sich anfreunden, anführen, angeben, angehen, angehören, angeln, sich angewöhnen, angreifen, angurten, anhaben Adjektiv: alt, alternativ, altmodisch, ambulant, amtlich, anerkannt, angeblich, angenehm, angesehen, ängstlich, anonym, anständig, antik, anwesend, arbeitslos, ärgerlich, arm, arrogant, artig, attraktiv, aufdringlich, auffällig, aufmerksam, aufrecht, aufregend, aufwendig, augenblicklich Sonstiges: als 3 , also 1 , also 2 , am, an 1 , an 2 , an-, anbei, ander-, andererseits, anders, aneinander, anfangs, anhand, anlässlich, anscheinend, anschließend, anstatt 1 , anstatt 2 , anstelle/ an Stelle, auch 1 , auch 2 , auch 3 , auf 1 , auf 2 , auf-, aufeinander Buchstabe M/ N: Substantiv: Melodie, Melone, Memoiren, Menge, Mensch, Menschheit, Menstruation, Mentalität, Menü, Merkmal, Messe 1 , Messe 2 , Messer, Metall, Meter, Methode, Metropole, Metzger, Metzgerei, Miene, Miete, Migräne, Migrant, Mikrofon, Mikroskop, Milch, Militär 1 , Milliarde, Million, Millionär, Minderheit, Mine 1 , Mine 2 , Mine 3 , Mineral, Mineralwasser, Minimum, Minister, Ministerium, Ministerpräsident, Minute, Mischung, Missbrauch, Misserfolg, Mission, Misstrauen, Missverständnis, Mist, Mistkübel, Mitarbeiter, Mitbestimmung, Mitgefühl, Mitglied Verb: merken, messen, mieten, mischen, missbrauchen, misshandeln, missverstehen, mitarbeiten, mitbringen, mitfahren, mitmachen, Wörterbuchanalyse 181 mitnehmen, mitspielen, mitteilen, mobilisieren, moderieren, modernisieren, mogeln, mögen 1 , mögen 2 , montieren, motivieren, multiplizieren, münden, murmeln, müssen 1 , müssen 2 Adjektiv: menschlich, merklich, merkwürdig, mild/ milde, minderjährig, minderwertig, minimal, miserabel, misstrauisch, mittler-, mobil, möbliert, modern, modisch, möglich, mollig, momentan, monatlich, monoton, moralisch, morgig-, morsch, müde, muffig, mühsam, mündig, mündlich Sonstiges: mindestens, minus 1 , minus 2 , mit 1 , mit 2 , miteinander, mithilfe/ mit Hilfe, mittags, mitten, möglichst, morgen, morgens, na, nach, nach-, nachdem, nacheinander, nachher, nachmittags, nachts, nahe 2 , nämlich, natürlich 2 , neben, nebenan, nebenbei, nebeneinander Buchstabe V/ W: Substantiv: Verlust, Vermittlung, Vermögen, Vernunft, Verpackung, Versammlung, Verschluss, Versehen, Versichertenkarte, Versicherung, Verspätung, Verstand, Verständnis, Verstorbene, Versuch, Vertrag, Vertrauen, Vertreter, Verwaltung, Verwandte, Verzeichnis, Verzeihung, Verzweiflung, Video, Vieh, Viertel, Viertelstunde, Violine, Visum, Vitamin, Vogel, Vokabel, Vokal, Volk, Volksschule, Voraussage, Voraussetzung, Vorbild, Vordergrund, Vorfahrt, Vorgang, Vorgänger, Vorgesetzte, Vorhang, Vorliebe, Vormittag, Vorname, Vorort, Vorrang, Vorrat, Vorrichtung, Vorsatz, Vorschlag Verb: verlieren 2 , vermehren, vermeiden, vermieten, vermischen, vermissen, vermuten, vernachlässigen, verneinen, vernichten, veröffentlichen, verpacken, verpassen, verpflichten, verraten, sich verrechnen, verreisen, versammeln, versäumen, verschenken, verschieben, verschlafen 1 , verschlechtern, verschließen, verschmutzen, verschnaufen Adjektiv: vernünftig, verrückt, verschieden, verschlafen 2 , verständlich, verstimmt, vertraut, vertreten 2 , verwandt, verwitwet, verzweifelt, vielfach, vielseitig, vier, viert-, vierzig, violett, voll, völlig, volljährig, vollkommen 1 , vollkommen 2 , vollständig, vorder-, vorig-, vorläufig Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 182 Sonstiges: viel 1 , viel 2 , vielleicht 1 , vielleicht 2 , vielmehr, vis-à-vis, vom, von, voneinander, vor 1 , voraus, vorbei, vorgestern, vorher, vorhin, vormittags, vorn, vorüber, vorwärts, vorwiegend, während 1 , während 3 , wann, warum, was 1 , was 3 Im LTWDaF 2 enthalten diese 400 Lemmata 799 Sememe und ebenso viele Definitionen, die den LTWDaF 2-Teil des Korpus dieser Untersuchung bilden. Die Stichprobe hat demnach im LTWDaF 2 den Umfang von n = 799. In der Untersuchung wird jedoch darauf verzichtet, zu überprüfen, inwieweit der Semembestand bei den einzelnen Lemmata in beiden Wörterbüchern übereinstimmt. So wird beispielsweise nicht kontrolliert, ob in einem der beiden untersuchten Wörterbücher zu einem Lemma zusätzliche Sememe verzeichnet sind. In die Analyse werden auch Lemmata einbezogen, deren Definition lediglich aus einem Quasisynonym besteht, da diese aufgrund ihrer Funktion in dieser Arbeit wie Definitionen behandelt werden. Die Lemmata mit Quasisynonymen als Definitionen sind in der Datensammlung A.2.3 separat aufgelistet. Im LTWDaF 2 sind davon insgesamt 49 Lemmata betroffen, im DHW- DaF 2 werden 42 Lemmata allein durch ein Quasisynonym definiert. Selbstverständlich werden in der Untersuchung auch Strichlemmata berücksichtigt. Von den Elementen der Stichprobe sind das neun: an-, ander-, auf-, mittler-, morgig-, nach-, viert-, vorder- und vorig-. 318 Die drei Zahlwörter vier, viert- und vierzig werden als Adjektive gewertet. 3.2.2 Aufbereitung der Primärdaten 3.2.2.1 Primärdaten des LTWDaF 2 Die 400 Lemmata, aus denen sich die Stichprobe der Untersuchung im LTW- DaF 2 zusammensetzt, werden mit ihren kompletten Artikeln für die Analyse aus der digitalen Version des LTWDaF 2 extrahiert, die der Verlag Langenscheidt freundlicherweise zur Verfügung gestellt hat. Da die Daten des Wörterbuchs lediglich in vollständiger Form vorliegen, müssen anschließend für die Extrahierung des Definitionswortschatzes all die Teile der Wörterbuchartikel entfernt werden, die nicht zur Definition gehören. In vielen Fällen, die im Folgenden aufgeführt werden, fällt es recht leicht, diese Entscheidung zu treffen und die entsprechenden Angaben zu löschen: 319 318 Im LTWDaF 2 werden diese grundsätzlich mit Bindestrich geschrieben, das DHWDaF 2 unterscheidet hier zwischen mehreren Fällen, vgl. dazu Kapitel 2.4.1.2. 319 Bei den folgenden Beispielen werden alle Lemmata kursiv gesetzt. Unabhängig von der Setzung im Wörterbuch werden die Angaben zum Lemma normal gesetzt, die Schreibung wird jedoch beibehalten. Wörterbuchanalyse 183 1) phonetische Angaben, z.B. die Aussprache bei Annonce [ õ ] oder nahe 2 [ ] bzw. die Betonung der Partikeln bei vielleicht 2 (unbetont) 2) grammatische Angaben, im Einzelnen: a) feminine und neutrale Formen (bei Artikeln, Pronomen und Zahladjektiven) 320 b) Wortart, z.B. vollkommen 1 (Adj), miteinander (Adverb) oder auch 2 (Partikel) c) Flektierbarkeit 321 d) Verwendung (bei den Adjektiven), z.B. mündig (meist präd, nicht adv) e) Genus (bei den Substantiven), z.B. Angelegenheit (die) f) Deklination (Angabe von Genitiv Singular und Nominativ Plural bei den Substantiven), z.B. Verständnis (-ses, nur Sg) g) Konjugation (3. Person Singular Imperfekt und Perfekt, bei unregelmäßigen Verben zusätzlich 3. Person Singular Präsens), z.B. mögen 1 (mag, mochte, hat gemocht) h) Komparation (bei Bedarf bei den Adjektiven), z.B. alt (älter, ältest-) i) Rektion (bei den Präpositionen), z.B. anhand (mit Gen) 3) pragmatische Angaben: a) Stilebene, z.B. vorwiegend (geschr) oder anhaben (gespr) b) Sprechereinstellung, z.B. Vogel (2 meist hum) c) Zeitbezug, z.B. Volksschule (veraltend) d) regionale Markierung, z.B. Metzger (bes südd [A] [CH]) e) Fachgebiet, z.B. ambulant (Med) 4) Antonyme, z.B. ambulant › ‹ ~ anders › ~ 5) Beispiele, z.B. voneinander (Wir hatten lange nichts mehr voneinander gehört; Wir mussten uns bald wieder voneinander verabschieden; die Teile vorsichtig voneinander lösen) 6) Kollokationen, z.B. Amt (<ein hohes, verantwortungsvolles Amt; ein Amt antreten, ausüben, haben, übernehmen; sein Amt niederlegen; für ein Amt kandidieren; sich um ein Amt bewerben>) 320 Ein Beispiel ist das Lemma dieser mit den ergänzten Formen diese und dieses. Bei der Stichprobe spielt die Angabe femininer und neutraler Formen jedoch keine Rolle. 321 Hierfür können prima (indeklinabel) oder West (indeklinabel) als Beispiele genannt werden, bei den untersuchten Lemmata taucht diese Angabe allerdings nicht auf. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 184 7) Hinweise, z.B. nobel (|| Hinweis: miserabel ein miserabler Film) 8) Verweise, z.B. violett ŸŸ - !  ‚ ~ 9) Komposita, z.B. Vogel (1 || K-: Vogel-, -art, -gesang || -K: Sing-, Zug-) 10) Derivate, z.B. vermieten (|| hierzu Vermieter, Vermieterin, Vermietung) 11) Wortfamilie, z.B. anbieten || ¡ Angebot In anderen Fällen ist es schwerer zu entscheiden, ob bestimmte Elemente einen Teil der Datengrundlage bilden sollen oder nicht. Deshalb werden die Überlegungen, die zu den jeweiligen Entscheidungen geführt haben, nachfolgend etwas genauer dargestellt: 1) Synonyme: Bei den Synonymen, die im LTWDaF 2 ^‘ ‚ š gekennzeichnet sind, müssen zwei Möglichkeiten unterschieden werden. In den Fällen, in denen die Synonymangabe nur zusätzlich auf die eigentliche Definition des Lemmas folgt, um es in einen umfangreicheren sprachlichen Zusammenhang einzuordnen, wird die Synonymangabe - wie die Angabe von Antonymen - nicht als Teil der Definition verstanden und bildet somit auch keinen Teil der Datengrundlage, beispielsweise bei Anschrift £ ^ ¤ ¥ >¦ + š " _  Sachverhalt liegt bei den Lemmata vor, die nicht durch eine Definition paraphrasiert werden, sondern bei denen direkt hinter den grammatischen Angaben ein Synonym steht, z.B. Violine š miteinander š men oder vermischen š _ < _ §_{_{ §_`_{~_ ! Fällen erfüllt die Synonymangabe die Funktion der Definition und ersetzt diese, was am folgenden Beispiel - das nicht Teil des Untersuchungsmaterials ist - besonders deutlich wird: pummelig, pummlig š ~ dick, aber doch nett. Diese Angabe ist kaum mit dem üblichen Verständnis der Bezeichnung Synonym vereinbar, sondern sie entspricht viel stärker einer Definition. Im LTWDaF 2 gibt es insgesamt 891 Lemmata, die allein durch ein Synonym definiert werden, 49 davon sind Teil der Stichprobe (vgl. Datensammlung A.2.3.1). Diese Synonyme verbleiben in den Daten und werden zum Definitionswortschatz hinzugerechnet. Verweislemmata: 330 Artikel im LTWDaF 2 - zwölf davon in der Alphabetstrecke der Stichprobe - sind so genannte Verweislemmata, also Artikel, deren Mikrostruktur lediglich aus dem Lemma und dem Verweis auf ein anderes Lemma besteht. 322 Dabei handelt es sich meist um den Verweis von einer unregelmäßigen Verbform auf den Infinitiv, beispielswei- 322 Es folgen Beispiele aus dem gesamten Wörterbuch, nicht nur aus der Stichprobe. Wörterbuchanalyse 185 se bei sprang - springen oder wirbt - werben, oder von einem Kurzwort auf seine Vollform, beispielsweise bei Kanzler - Bundeskanzler, Kilo - Kilogramm oder Kfz - Kraftfahrzeug. Zahlreich sind auch Verweise von komplexen Lexemen auf einzelne Sememe des zugrunde liegenden Simplex, auf dortige Strukturformeln oder Redewendungen, wie bei blaufärben - blau, bereiterklären - bereit (2) oder blickenlassen - blicken (ID). Manchmal wird auch auf eine andere Rechtschreibvariante, wie bei aufwändig - aufwendig, chic- schick oder Kusine - Cousine, auf die Grundform einer deklinierten Form, beispielsweise bei dasselbe - derselbe, den - der oder Daten 1 - Datum, auf eine äquivalente Form, wie bei eur- - mein-, auf die Anhänge, beispielsweise bei euer 1 - Anhang: Personalpronomen oder euer 2 - Anhang: Possessivpronomen, oder auf die Vollform einer Abkürzung, wie bei bzw. - beziehungsweise oder ca. - circa, verwiesen. Diese Artikel werden - wie im Kapitel 3.2.1 dargestellt - in der Untersuchung übersprungen, da sie keine definitorischen Elemente enthalten. 323 Die Verweislemmata selbst zählen allerdings selbstverständlich als Lemmata. 2) Strukturformeln: Bei zahlreichen Lemmata wird die Verwendung des Lemmas oder einzelner Sememe durch Strukturformeln bzw. Muster zur Satzbildung verdeutlicht, welche einzelne Konstruktionen mit dem Lemma aufführen und so „den grammatikalisch richtigen Gebrauch des Stichworts […] erleichtern“ (LTWDaF 2 2007, S. 17). In vielen Fällen handelt es sich um Angaben wie bei amüsieren 1 etwas amüsiert j-n, 2 sich (irgendwie) amüsieren, 3 sich über j-n/ etwas amüsieren oder bei Anspruch 1 ein Anspruch (an j-n/ etwas), 2 (ein) Anspruch auf etwas. Grammatische Anschlüsse stehen hier im Vordergrund. Es gibt aber auch Lemmata, bei denen die Strukturformeln die Wortartengrenze überschreiten, also beispielsweise bei der Verzeichnung von Funktionsverbgefügen unter dem Substantiv wie bei Vernunft 2 Vernunft annehmen; (wieder) zur Vernunft kommen, 3 j-n zur Vernunft bringen. Hierunter fallen auch weitere Phrasen, bei denen die Definition nicht ohne die Strukturformel verständlich ist, wie beispielsweise bei Wortgruppen aus Adjektiv und Substantiv (Anlage 2 eine öffentliche Anlage), aus Präposition und Substantiv (Anschein 2 dem/ allem Anschein nach) oder aus Adjektiv und Verb (anwesend an- 323 Bei den Verweislemmata, die auf einen Anhang hinweisen (also Personal-, Possessiv- und Reflexivpronomen), enthält der Artikel zusätzlich zum Verweis noch eine Angabe zu Person, Numerus und Kasus des entsprechenden Pronomens. Durch die Kursivierung dieser Teile sind jedoch auch diese Angaben deutlich von den Elementen der Definition abgesetzt. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 186 wesend sein). Teilweise werden ganze Satzmuster vorgegeben: auch 3 2 so + Adj j-d/ etwas auch ist; so + Adv/ sooft/ sosehr/ soviel j-d/ etwas auch + Verb. Bei all diesen Beispielen wird die Definition des Lemmas erst in der Verwendung der jeweiligen Strukturformel verständlich. Die Definition richtet sich in ihrer Formulierung hauptsächlich nicht nach dem Lemma, sondern nach dem Kern der aufgeführten Strukturformel, wie im folgenden Beispiel deutlich wird: Angriff 3 etwas in Angriff nehmen ‘etwas anfangen, eine Aufgabe oder Arbeit beginnen’. Trotz dieser Tatsache wird entschieden, die Strukturformeln selbst nicht als Teil des Untersuchungsmaterials zu betrachten, da sie weder zum Lemma selbst noch zur Definition gehören. Sie bilden vielmehr eine Art Unter- oder Sublemma. Aus Gründen der Konsistenz und der Pragmatik werden alle Strukturformeln aus dem Datenmaterial entfernt und die dazugehörenden Definitionen als zum tatsächlichen Lemma gehörend betrachtet. Einen Sonderfall bilden die Strichlemmata an-, auf- und nach-, die in der gleichen Gestaltung wie die Strukturformeln Beispiele für einzelne Partikelverben mit Definition aufzählen, beispielsweise unter nach-: etwas nachbilden ‘etwas so machen, dass es dem Original ähnlich wird’. Hier werden die einzelnen Partikelverben mit ihrer Definition nicht in die Untersuchung mit einbezogen, da vor der Aufzählung eine allgemeine Definition zur Verwendung des Strichlemmas erfolgt. Dadurch erhalten die einzelnen Partikelverben eher eine beispielgebende Funktion. 4) Abkürzungen: In der Stichprobe stehen die Abkürzungen immer zwischen der Definition und den Beispielen, wie im Artikel Meter : ‘eine Einheit, mit der man messen kann, wie lang, breit, hoch etwas ist’; Abk m: Ein Meter hat hundert Zentimeter, ein Kilometer hat tausend Meter. Die Definition und die Angabe der Abkürzung werden durch ein Semikolon voneinander abgetrennt, wodurch impliziert wird, dass es sich dabei um zwei unterschiedliche Teile der Mikrostruktur des Wörterbuchartikels handelt. Aus diesem Grund wird in der vorliegenden Untersuchung die Angabe von Abkürzungen nicht mit zur Definition gezählt. In der Stichprobe betrifft das die vier Lemmata Meter, Milliarde, Million und Minute. 5) Redewendungen: Die Redewendungen werden im LTWDaF 2 mit dem Symbol || ID für idiomatische Wendung gekennzeichnet. Sie befinden sich am Ende des Artikels, direkt vor den angegebenen Derivaten und den Hinweisen auf die Wortfamilie. Mit ihren eigenen pragmatischen Angaben, der eigenen Definition, den eigenen Synonymen, Kollokationen und Beispielen bilden sie einen mikrostrukturell selbstständigen Teil des ge- Wörterbuchanalyse 187 samten Wörterbuchartikels. Da sie zudem meist auch semantisch sehr weit vom Lemma des übergeordneten Wörterbuchartikels entfernt sind, werden die Redewendungen im Rahmen der vorliegenden Arbeit nicht mit in das Untersuchungsmaterial aufgenommen, sondern vollständig aus der Datengrundlage entfernt. Nachdem diese Angaben, die weder zum Lemma noch zur Definition gehören, aus den vollständig vorliegenden Artikeln der Stichprobe gelöscht sind, bleibt genau der Teil der Wörterbuchartikel übrig, der die Materialgrundlage für die Untersuchung bildet. In der Datensammlung A.2.4.1 sind diese Teile der Wörterbuchartikel noch einmal aufgeführt. Im Anschluss werden die Primärdaten weiter bearbeitet, um eine Liste der verwendeten Lexeme zu erhalten. Die Definitionen in Textform werden dafür in ihre einzelnen Bestandteile zerlegt. 324 Jedes in den Definitionen der Stichprobe verwendete Wort wird auf seine Grundform zurückgeführt, in der es auch im Wörterbuch verzeichnet ist, so wie es in der Datensammlung A.2.5.1 dargestellt ist. 325 Das gilt für alle flektierbaren Wortarten, also für Verben, Substantive, Adjektive sowie für Pronomen und Artikelwörter. Aus den beiden Definitionen für Vorhang 1 ‘ein langes Stück Stoff, das meist neben einem Fenster hängt und das man vor das Fenster ziehen kann’ und 2 ‘eine Art Vorhang (1), vor der Bühne eines Theaters’ wird zum Beispiel Vorhang 1 ‘ein 1 lang Stück 1 Stoff 2 , der 2 meist neben ein 1 Fenster hängen 1 und der 2 man 1 vor 1 der 1 Fenster ziehen können 1 ’ und 2 ‘ ein 1 Art 1 Vorhang (1), vor 1 der 1 Bühne ein 1 Theater 1 ’. Konjugierte Verben werden demzufolge auf ihren Infinitiv zurückgeführt (im Beispiel hängt hängen, kann können). Der bei Partikelverben zusammengeschriebene Infinitiv mit zu wird getrennt, aus verschnaufen ‘eine Pause machen, um sich auszuruhen’ wird demzufolge verschnaufen ‘ein 1 Pause machen, um 3 sich 1 zu 3 ausruhen’. Bei Verben, die allein reflexiv lemmatisiert sind - wie beispielsweise sich fortpflanzen oder sich verhalten 1 - wird sich als Teil des Lemmas verstanden, am Verb belassen und nicht eigens als Reflexivpronomen gewertet. Bei den Verben, die hingegen auch in einer nicht reflexiven Lesart verzeichnet sind, wird sich vom Verb getrennt und als Reflexivpronomen gezählt. 324 Dies wird als Segmentierung bezeichnet; die Segmentierung auf Wortebene heißt Tokenisierung (Lemnitzer/ Zinsmeister 2010, S. 64). Zum Verständnis, dass es sich bei Wörterbuchdefinitionen um Texte handelt, vgl. Kapitel 3.2.1. 325 In der Korpuslinguistik wird dieser Vorgang als Lemmatisierung bezeichnet. In der Lexikografie wird unter Lemmatisierung daneben auch die Tatsache verstanden, dass ein Wort in einem Wörterbuch zu einem Lemma wird, also als Lemma verzeichnet ist (McEnery/ Wilson 2001, S. 53; McEnery/ Xiao/ Tono 2006, S. 35f.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 188 Am schwierigsten ist der Umgang mit den Partizipien, die in den Definitionen verwendet werden, denn eine „scharfe Trennlinie zwischen den eindeutig verbalen Partizipien und den voll lexikalisierten Partizipialadjektiven gibt es [...] nicht“ (Duden-Grammatik 2009, S. 566). In der Literatur werden zwar Kriterien aufgelistet, die für die Zuordnung der Partizipien zu den Verben oder zu den Adjektiven sprechen, eine klare Grenze zwischen beiden Wortarten kann jedoch nicht gezogen werden. Je mehr morphologische, syntaktische und semantische Merkmale des Adjektivs sich das Partizip aneignet, desto „eindeutiger ist sein Adjektivstatus ausgeprägt“ (ebd., S. 752). Über wie viele dieser Merkmale ein Partizip jedoch verfügen muss, um auf dem Kontinuum zwischen Verb und Adjektiv als Adjektiv zu gelten, und wie diese Merkmale gewichtet sind, wird jedoch nichts ausgesagt. Der Wortartenstatus der Partizipien ist insgesamt sehr umstritten. Im Einzelnen handelt es sich bei den morphologischen Merkmalen um die Präfigierbarkeit mit un- (z.B. unbestimmt) und die Komparierbarkeit (z.B. interessiert, -er, -est). Bei den syntaktischen Merkmalen werden der prädikative Gebrauch (z.B. befreundet sein) und die Graduierbarkeit mit sehr (z.B. sehr dringend) angeführt. Als semantische Merkmale des Adjektivs gelten die Bezeichnung einer Qualität (z.B. bekannt) - im Gegensatz zur Prozessualität bei den Verben - sowie der Verlust der semantischen Bindung an das Ursprungsverb (z.B. angemessen), was mit einer Änderung der Valenz und in letzter Konsequenz mit dem Untergang des Verbs einhergeht (z.B. anwesend). 326 In der vorliegenden Arbeit kann jedoch nicht für jedes verwendete Partizip eine solche Merkmalsmatrix ausgefüllt werden, bevor über den Wortartenstatus entschieden wird. Dies würde den vertretbaren Aufwand um ein Vielfaches überschreiten. An dieser Stelle muss nach einer pragmatischen Lösung gesucht werden. Die semantische Bindung des Partizips an das Ausgangsverb wird deshalb zum entscheidenden Merkmal erhoben, da dies auch für die nicht muttersprachlichen Benutzer des Wörterbuchs im Vordergrund steht. Denn die Lemmatisierung eines Partizips im Wörterbuch ist vor allem dann notwendig, wenn dieses sich in seiner Semantik vom Verb entfernt bzw. eine dominante eigenständige Bedeutung entwickelt oder wenn das Verb in der Bedeutung des Partizips nicht im Wörterbuch verzeichnet ist. Letzterer Fall liegt zum Beispiel beim Lemma anziehend im DHW- DaF 2 vor, dessen Ausgangsverb anziehen nicht in der Bedeutung ‘anlocken, das Interesse wecken’ verzeichnet ist. Zusätzlich hat sich die Semantik des polysemen Verbs anziehen beim Partizip anziehend stark verengt. Natürlich handelt es sich bei der Entscheidung, ob sich ein Partizip semantisch vom 326 Zu diesem Abschnitt vgl. Lenz (1993), Motsch (1999, S. 302ff.) und die Duden-Grammatik (2009, S. 753). Wörterbuchanalyse 189 zugrunde liegenden Verb entfernt und eine eigenständige Bedeutung entwickelt hat, immer um ein rein subjektives Empfinden. Andere Sprecher würden in einigen Fällen sicher abweichend entscheiden. Anders gelagert als die Partizipien sind die Fälle von substantivisch gebrauchten Adjektiven oder Infinitiven. Weil diese Konversionsprodukte „meist nicht über alle grammatischen Merkmale eines typischen Substantivs“ (Duden-Grammatik 2009, S. 726) verfügen, sie also eher untypische Vertreter der Kategorie Substantiv darstellen, ist ihr substantivischer Wortartenstatus in der wissenschaftlichen Diskussion zum Teil umstritten. Von den meisten Forschern - und so geschieht es auch hier - werden diese Konversionen aus verschiedenen Gründen als Substantive gewertet. 327 Bei den Lemmata ander- ‘verwendet, um die Übrigen (einer Gruppe) oder noch vorhandene Dinge zu bezeichnen’ und Voraussetzung 1 ‘etwas, das man als Grundlage für das weitere Tun, für seine Überlegungen usw nimmt’ werden (der) Übrige und (das) Tun als Substantive annotiert und wie prototypische Substantive auf den Nominativ Singular als Grundform zurückgeführt. Bei den Adjektiven und bei den Pronomen (zu Letzteren zählen auch die Artikelwörter) wird ebenfalls der Nominativ Singular als Grundform gewählt. Da diese Wortarten zusätzlich in ihrem Genus variabel sind, gilt die maskuline Form als Grundform. Feminine oder neutrale Artikelwörter oder Pronomen zählen also zur entsprechenden maskulinen Form. Das LTWDaF 2 verfolgt bei diesen Wortarten eine uneinheitliche Lemmatisierungspolitik. So sind die Artikelwörter und die Mehrzahl der Pronomen nur unter der maskulinen Form lemmatisiert, unter den femininen bzw. neutralen Formen finden sich dann lediglich Verweise auf die männliche Grundform. Die einzige Ausnahme bilden hier die Personalpronomen im Singular und Plural, bei denen sie 1 , sie 2 und es 1 sowie das unpersönliche es 2 eigene Artikel erhalten. Um an dieser Stelle konsequent zu arbeiten, werden auch die Personalpronomen sie 1 , sie 2 , es 1 und es 2 mit ihren Deklinationsformen auf er zurückgeführt. Aus einem anderen Grund werden die mit Artikelwörtern verschmolzenen Präpositionen am, 327 Fleischer (1997, S. 49f.) führt mehrere Gründe an, die substantivische Konversion des Adjektivs zum einen als Wortbildungsprodukt, zum anderen als der Wortart Substantiv zugehörig zu betrachten: die substantivische Nominationsfunktion, die Möglichkeit der Entwicklung zu einer selbstständigen, lexikalisierten Einheit ohne Bezug auf ein Substantiv, die damit verbundene Fixierung des Genus, das Verhalten bei der Bildung von Kompositionen. Für die substantivische Konversion des Infinitivs argumentiert er ähnlich und zählt folgende Gründe auf: die grammatischen Eigenschaften des Substantivs (substantivische Flexion, Genus/ Artikelfähigkeit, Kasus, teilweise Numerus) und das Verhalten bei der Wortbildung. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 190 beim, im, ins, vom, zum und zur aufgelöst und jeweils sowohl beim Artikelwort als auch bei der Präposition gezählt, was die Vorkommenshäufigkeit betrifft. Das vereinfacht die Analyse der Bestimmung der Wortart wesentlich (vgl. Kap. 3.3.2.1.1). Das Lexem Witwer (im Artikel zu verwitwet) ist eine Movierung und damit das Ergebnis eines Wortbildungsprozesses. Damit wird es nicht zu den Elementen gezählt, die auf eine Grundform rückführbar sind, sondern bleibt in seiner derivierten männlichen Form erhalten. Movierte weibliche Elemente des Definitionswortschatzes gibt es im Untersuchungsmaterial des LTWDaF 2 nicht. Weiterhin werden für die Untersuchung die in den Definitionen verwendeten Abkürzungen ( j-d, j-n, j-m, j-s, o.Ä., z.B., ca., bzw, bes, südd) aufgelöst, ebenso Formulierungen wie ‘die Grund- und Hauptschule’ beim Lemma Volksschule (aufgelöst in ‘die Grundschule und Hauptschule’). Rechtschreibfehler wie im Fall mit 1 3 ‘drückt aus, dass zwei Personen oder Sachen zusammen sind oder zusammen gehören’ werden berichtigt. Außerdem werden die Definitionen von nicht wortwertigen Elementen wie Ziffern (z.B. im Artikel vier oder Viertel), Zeichen (+, , / ) und Buchstaben (im Artikel Vokal) gesäubert. Mithilfe einer Liste der im LTWDaF 2 verzeichneten Homonyme erhalten alle Homonyme, die in den Definitionen auftauchen, die entsprechende Hochzahl. Durch die anschließend durchgeführte alphabetische Sortierung entsteht die Liste des Definitionswortschatzes der Stichprobe, die in der Datensammlung A.2.6.1 aufgeführt ist. Sie bildet die Grundlage für die Untersuchungen. 3.2.2.2 Primärdaten des DHWDaF 2 Für die Erstellung des Korpus aus den Definitionen des DHWDaF 2 konnte glücklicherweise ebenfalls auf die Mithilfe des Verlages gezählt werden. Für die Arbeit stellte das Bibliographische Institut & F.A. Brockhaus AG neben einer vollständigen Lemmaliste des DHWDaF 2 die Daten der betreffenden Alphabetstrecken A, M/ N und V/ W zur Verfügung, die dort eigens als Definitionen gekennzeichnet und folglich durch Kursivsetzung hervorgehoben sind. Auf eine Reduzierung der Mikrostruktur wie beim LTWDaF 2 (vgl. Kap. 3.2.2.1) kann so verzichtet werden. Allerdings reichen diese Daten für die Untersuchung nicht aus, da bei insgesamt 25 der analysierten Lemmata eine gekennzeichnete Definition vollkommen oder teilweise fehlt. So finden sich bei den acht Lemmata als, also, am, auch, Meter, müssen, na und vom nur semantische Angaben in Form von Verwendungshinweisen. Bei den rest- Wörterbuchanalyse 191 lichen 17 Lemmata - an, an-, auf, auf-, minus, mit, mögen, nach, nämlich, nebenbei, nebeneinander, viel, vielleicht, von, voneinander, vor und was - besitzen einige Sememe eine gekennzeichnete Definition und einige nicht. In all diesen Fällen werden die Verwendungshinweise als Ersatz für die Definition gewertet und als solche analysiert. Als Kriterium für die Aufnahme der Verwendungshinweise in das Korpus der Untersuchung gilt deren Ersatz oder wesentliche Ergänzung einer Definition. Dabei können diese Verwendungshinweise auch einen sememübergreifenden Charakter besitzen, wie es bei den Untersuchungslemmata als, am und vom der Fall ist (vgl. Datensammlung A.2.4.2). Auffällig ist die Zusammensetzung dieser 25 Lemmata, denn fast alle gehören zur Gruppe Sonstiges, die neben den typischen Synsemantika auch die Adverbien umfasst. Adverbien zählen zwar überwiegend zu den autosemantischen Wortarten (Duden-Grammatik 2009, S. 569), stehen aufgrund ihrer Eigenschaften den Synsemantika jedoch recht nahe. Die Modalverben, die hier mit müssen und mögen vertreten sind, werden sogar vollkommen den Funktionswörtern zugerechnet (Meibauer et al. 2007, S. 169f.). Als einzige echte Ausnahme kann somit das Substantiv Meter gelten, dessen Angaben zur Semantik - wie auch die aller anderen Bezeichnungen für Maße und Einheiten - im DHWDaF 2 nicht als Definition gekennzeichnet sind. Die Angaben zur Wortart des Lemmas werden hingegen nicht in das Datenmaterial einbezogen. Ebenfalls nicht berücksichtigt werden die Definitionen, die sich ausschließlich auf die Beispiele in den Artikeln der untersuchten Lemmata beziehen, wie das eingeklammerte anerkennenswert im Beispiel zum Lemma anständig „das war sehr anständig (anerkennenswert) von dir“ (DHWDaF 2 2007, S. 106). 328 Denn die Beispielsätze bilden keinen Teil der Definition und brauchen deshalb einschließlich ihrer inhärenten Erläuterungen nicht in das Untersuchungsmaterial einbezogen zu werden. Da die Lemmatisierungspolitik der beiden Wörterbücher in einigen Punkten voneinander abweicht, bestehen auch zwischen den beiden zusammengestellten Korpora des untersuchten Definitionswortschatzes einige Unterschiede, obwohl die gleichen Lemmata deren Grundlage bilden. Grundsätzlich ist festzuhalten, dass Lemmata im LTWDaF 2 häufiger eigenständig als Homonyme angesetzt werden, wohingegen im DHWDaF 2 die Lemmatisierung als Polyseme in einem Artikel dominiert. Insgesamt ist bei den homonymen Untersuchungslemmata zwischen folgenden Fällen zu differenzieren: 328 Definitionen werden im DHWDaF 2 durch Kursivierung hervorgehoben, das betrifft auch die Erläuterung anerkennenswert im genannten Beispiel. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 192 1) Die Lemmata werden in beiden Wörterbüchern als Homonyme behandelt und in zwei verschiedenen Artikeln beschrieben, wie bei verschlafen 1 (Verb) - verschlafen 2 (Adjektiv). 2) Die Lemmata unterscheiden sich in ihrer Wortart. Das LTWDaF 2 behandelt sie als Homonyme in zwei Artikeln. Im DHWDaF 2 werden beide in einem Artikel zusammengefasst und mit römischen Ziffern voneinander getrennt, wie bei also 1 (Adverb) - also 2 (Partikel), an 1 (Präposition) - an 2 (Adverb), anstatt 1 (Konjunktion) - anstatt 2 (Präposition), auch 1 (Adverb) - auch 2 (Partikel) - auch 3 , auf 1 (Präposition) - auf 2 (Adverb), minus 1 (Konjunktion) - minus 2 (Adverb), mit 1 (Präposition) - mit 2 (Adverb), nahe 1 (Adjektiv) - nahe 2 (Präposition), 329 natürlich 1 (Adjektiv) - natürlich 2 (Adverb), 330 viel 1 (Indefinitpronomen) - viel 2 (Adverb), vielleicht 1 (Adverb) - vielleicht 2 (Partikel), während 1 (Präposition) - während 2 (Konjunktion) sowie was 1 (Interrogativpronomen) - was 3 (Relativpronomen). Bei vor ist im DHWDaF 2 lediglich die Bedeutung als Präposition verzeichnet, diejenige als Adverb fehlt. Einen Sonderfall bildet in dieser Gruppe vertreten 2 , das im LTWDaF 2 als Adjektiv einen eigenen Artikel besitzt, im DHWDaF 2 als Teil der Fügung vertreten sein jedoch nur ein Semem des Verbs vertreten darstellt. 3) Die Homonyme erhalten im LTWDaF 2 zwei Artikel. Im DHWDaF 2 werden sie als einzelne Sememe in einem Artikel zusammengefasst, ohne dass sie sich im LTWDaF 2 in ihrer Wortart unterscheiden, so bei als 1 - als 2 - als 3 , 331 Anhänger 1 - Anhänger 2 , Militär 1 - Militär 2 , 332 Mine 1 - Mine 2 - Mine 3 , verlieren 1 - verlieren 2 333 sowie vollkommen 1 - vollkommen 2 . In der Mehrzahl der Fälle geschieht die Abgrenzung der einzelnen Sememe im DHWDaF 2 dabei durch arabische Ziffern. 329 Da die Quote für den Lemmatyp Adjektiv bereits erfüllt ist, wird nur die Präposition nahe mit ihrer Definition in das Untersuchungskorpus aufgenommen. 330 Ebenso liegt der Fall bei natürlich. Die Quote für die Adjektive ist bereits erfüllt, deshalb wird nur das Adverb natürlich mit seiner Definition in das Untersuchungskorpus aufgenommen. 331 Bei allen drei handelt es sich um Konjunktionen. In das Untersuchungskorpus wird jedoch nur als 3 aufgenommen, da die Auswahl der analysierten Lemmata erst auf dieser Seite der Printausgabe des LTWDaF 2 beginnt. 332 Im DHWDaF 2 fehlt die Bedeutung Militär 2 ‘ranghoher Offizier’ allerdings, sodass aus dem DHWDaF 2 nur Militär 1 ins Untersuchungskorpus aufgenommen werden kann. 333 Beides sind Verben, allerdings kann in das Untersuchungskorpus nur verlieren 2 aufgenommen werden, da die Auswahl der analysierten Lemmata erst auf dieser Seite der Printausgabe des LTWDaF 2 beginnt. Wörterbuchanalyse 193 4) Die letzte Gruppe besteht aus den beiden Verbpaaren mögen 1 (Modalverb) - mögen 2 (Vollverb) sowie müssen 1 (Modalverb) - müssen 2 (Vollverb), die unterschiedlich behandelt werden. Wie bei den anderen Modalverben wird im DHWDaF 2 bei müssen der Gebrauch als Modalverb und als Vollverb nicht durch römische Ziffern voneinander getrennt, sondern lediglich durch arabische. Die beiden Gebrauchsweisen werden im DHWDaF 2 also wie eine gewöhnliche Polysemie behandelt. Somit wird der Unterschied zwischen Modalverb und Vollverb als nicht so groß angesehen wie im LTWDaF 2, schon gar nicht wird hier zwischen zwei getrennten Wortarten unterschieden. Die einzige Ausnahme bei den Modalverben bildet mögen, in dessen Artikel im DHWDaF 2 aus unbekannten Gründen römische Ziffern zur Abgrenzung gebraucht werden. Die hier dargestellten Unterschiede in der Art der Lemmatisierung in den beiden untersuchten Wörterbüchern führen dazu, dass den 400 analysierten Lemmata des LTWDaF 2 im DHWDaF 2 lediglich 382 Lemmata entsprechen, da in folgenden 16 Fällen zwei oder drei Lemmata des LTWDaF 2 in einem Artikel des DHWDaF 2 zusammengefasst werden: also, an, Anhänger, anstatt, auch, auf, Mine, minus, mit, mögen, müssen, viel, vielleicht, vollkommen, während und was. 334 Werden für das DHWDaF 2 die gleichen Maßstäbe angelegt wie für das LTWDaF 2, ist der Lemmabestand noch etwas höher anzusetzen als die im Vorwort genannten 11 200 Lemmata, weil im Vergleich zum LTWDaF 2 mehr Lemmata in einem Artikel gebündelt werden. Im DHW- DaF 2 sind - ohne Berücksichtigung von Lemmavarianten - ganz genau 10 954 Lemmata verzeichnet, wie sich aus der vom Dudenverlag zur Verfügung gestellten Lemmaliste ergibt. Dieser Eindruck relativiert sich jedoch, wenn die Behandlung der weiblichen Formen in die Betrachtung einbezogen wird. Im LTWDaF 2 werden die femininen Entsprechungen am Ende des Artikels als Derivate angeführt und demzufolge nicht als Lemmata gezählt. Im DHWDaF 2 folgen die weiblichen Äquivalente hingegen direkt auf die männlichen Personenbezeichnungen am Anfang des Wörterbuchartikels als Lemmata. Von den analysierten Lemmata der Stichprobe betrifft das folgende neun: Anfänger, Metzger, Migrant, Millionär, Minister, Ministerpräsident, Mitarbeiter, Vertreter und Vorgänger. 334 In 14 Fällen handelt es sich dabei um Lemmata, die im LTWDaF 2 doppelt homonym sind, bei deren Beschreibung im DHWDaF 2 in einem Artikel also jeweils ein Lemma wegfällt. Die Lemmata auch und Mine sind im LTWDaF 2 sogar dreifach homonym verzeichnet, somit hat das DHWDaF 2 hier sogar zwei mal zwei Lemmata weniger. Aus der Mehrfachverzeichnung von 16 Lemmata im LTWDaF 2 ergibt sich für das DHWDaF 2 in der Stichprobe die Gesamtzahl von 18 Artikeln weniger. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 194 Hinzu kommt, dass im DHWDaF 2 mit Lemmavarianten anders umgegangen wird als im LTWDaF 2. Das DHWDaF 2 gibt zu mehr Lemmata Varianten an als das LTWDaF 2. Diese werden im DHWDaF 2 ebenfalls mit zur Lemmagesamtzahl hinzugerechnet. Dies betrifft zum einen Adjektive und Adverbien, die in einer Form mit -e- und in einer ohne existieren. Unter den Untersuchungslemmata sind das im DHWDaF 2 bei den Adjektiven mild/ milde und bei den Adverbien andererseits/ andrerseits, nah/ nahe sowie vorne/ vorn, von denen im LTWDaF 2 lediglich mild/ milde als Variante aufgeführt ist. 335 Zum anderen handelt es sich natürlich auch um die - oft durch die Neuregelung der Orthografie entstandenen - Schreibvarianten. Im LTWDaF 2 werden hier nur die beiden Präpositionen mithilfe und anstelle mit ihren Varianten mit Hilfe und an Stelle genannt. Neben diesen finden sich im DHWDaF 2 auch bei den Lemmata aufwendig und Mikrofon die orthografischen Varianten aufwändig und Mikrophon. Hier zeigt sich, dass im DHWDaF 2 insgesamt mehr Wert auf die Rechtschreibung gelegt wird, da die einzelnen Formen zusätzlich nach Haupt- und Nebenvariante gewichtet werden. Oft ist im DHWDaF 2 die Nebenvariante sogar noch zusätzlich als eigenes Verweislemma verzeichnet. Durch diese Variantenschreibung und die Lemmatisierung der weiblichen Personenbezeichnungen sinkt also die Zahl der tatsächlichen Artikel im DHW- DaF 2. Insgesamt werden sich die im Vergleich zum LTWDaF 2 seltenere Verwendung von Homonymen (also weniger Lemmata) und die häufigere Lemmatisierung von weiblichen Formen und Varianten (mehr Lemmata) in etwa aufheben. Zwischen den beiden untersuchten Wörterbüchern besteht ein weiterer Unterschied in der Art der Lemmatisierung der reflexiven Verben. So werden Verben, die allein reflexiv gebraucht werden, im LTWDaF 2 auch als reflexive Lemmata lemmatisiert, wobei sich das Reflexivpronomen mit Komma an das Verb anschließt, beispielsweise anfreunden, sich oder verrechnen, sich. Im DHWDaF 2 hingegen sind auch die Verben, die nur in ihrem reflexiven Gebrauch beschrieben werden, ohne Reflexivpronomen lemmatisiert, zum Beispiel bei anfreunden oder schämen. Weiterhin werden Strichlemmata im LTWDaF 2 grundsätzlich mit Bindestrich geschrieben. Das DHWDaF 2 unterscheidet hier zwischen Affixen, die wie an-, nach- und aufmit Bindestrich geschrieben werden, und Stämmen von Adjektiven und Pronomen. 336 Letztere 335 Unklar ist, warum das DHWDaF 2 in den einigen Fällen die Form ohne -ezuerst nennt (mild/ milde und nah/ nahe) und in einigen Fällen die mit -e- (andererseits/ andrerseits und vorne/ vorn). 336 Unter den untersuchten Strichlemmata finden sich nur Verbpartikeln, im DHWDaF 2 sind jedoch auch Suffixe verzeichnet, beispielsweise -bar oder -heit. Wörterbuchanalyse 195 werden nach dem Wortstamm mit drei Punkten lemmatisiert, wie bei ander…, mittler…, viert…, vorder… und vorig… 337 Das Adjektiv morgigist im DHW- DaF 2 im Gegensatz zum LTWDaF 2 nicht als Strichlemma angesetzt, obwohl es lediglich attributiv gebraucht werden kann. Alle hier beschriebenen Besonderheiten der beiden Wörterbücher in ihrer Art der Lemmatisierung finden sich als Überblick mit den jeweiligen Äquivalenten in Tabellenform in der Datensammlung A.2.2. Nach der Zusammenstellung des Korpus aus den gelieferten Definitionen und den ergänzten Verwendungshinweisen (vgl. Datensammlung A.2.4.2) werden auch für das DHWDaF 2 die in Textform vorhandenen Daten auf ihre Grundformen zurückgeführt, um so eine analysierbare Liste des verwendeten Definitionswortschatzes zu erhalten. Dabei werden die gleichen Regeln angewandt wie beim LTWDaF 2. Diese sind für alle flektierbaren Wortarten im Kapitel 3.2.2.1 ausführlich beschrieben, weshalb sie hier nur stichpunktartig ohne Beispiele zusammengefasst werden: Alle Verben werden auf ihren Infinitiv zurückgeführt, der bei den Partikelverben zusammengeschriebene Infinitiv mit zu wird getrennt. Obwohl selbst die ausschließlich reflexiv gebrauchten Verben im DHWDaF 2 ohne Reflexivpronomen lemmatisiert sind, wird dieses nicht einzeln gezählt, sondern - wie in der Untersuchung zum LTWDaF 2 - zum Verb gerechnet. Dieses Vorgehen erhöht die Vergleichbarkeit der Analyseergebnisse beider Wörterbücher. Partizipien in attributiver oder prädikativer Stellung werden in Abhängigkeit von ihrer semantischen Nähe zum Verb entweder auf das Verb zurückgeführt oder aber als Adjektiv gewertet. Substantivisch gebrauchte Infinitive oder Adjektive hingegen werden grundsätzlich zu den Substantiven gerechnet. Bei den deklinierbaren Wortarten stellt der Nominativ Singular die Grundform dar, bei den genusvariablen Wortarten die maskuline Form. In Analogie zum Vorgehen beim Definitionswortschatz im LTWDaF 2 werden auch beim DHWDaF 2 konsequent alle Adjektive, Pronomen und Artikelwörter auf die maskuline Form zurückgeführt, auch bei den Personalpronomen. So wird eine Vergleichbarkeit der Ergebnisse sichergestellt. Movierungen wie Bürgermeisterin oder Witwer zählen als Wortbildungsprodukte selbstverständlich nicht zu den rückführbaren Formen und bleiben deshalb in ihrer derivierten weiblichen oder männlichen Form erhalten. Die mit Artikelwörtern verschmolzenen Präpositionen am, beim, im, vom, zum und zur werden aufgelöst und sowohl beim Artikelwort als auch bei der Präposition gezählt. Ebenso aufgelöst werden die auftretenden Abkürzungen (bes., jmd., jmdn., jmdm., jmds., z.B., usw., o.Ä.) sowie durch Klammern oder Bindestriche er- 337 Aus Gründen der Einheitlichkeit wird in diesen Fällen trotzdem die Bezeichnung Strichlemma beibehalten. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 196 setzte Teile von Wörtern, wie in Ammann ‘Bürgermeister[in]’, Verwaltung 2. ‘verwaltende Stelle[n]’ oder auf I. 4. ‘bezeichnet den Gang zu einem/ in einen Raum, zu einem/ in ein [öffentliches] Gebäude, gibt die Richtung in einem Seins-, Geschehens-, Tätigkeitsbereich an’. Elemente ohne Wortwert wie Ziffern (z.B. im Artikel vier oder Minute), Zeichen (+, / ) und Buchstaben (im Artikel Meter) werden aus der Datengrundlage entfernt. Aus Gründen der besseren Vergleichbarkeit der Ergebnisse wird auch bei der Kennzeichnung der in den Definitionen des DHWDaF 2 verwendeten Homonyme die Zählung des LTWDaF 2 zugrunde gelegt, weil an diesem Wörterbuch die Untersuchung beginnt. In der Datensammlung A.2.5.2 finden sich die Definitionen, in denen die Wörter bereits auf ihre Grundformen zurückgeführt sind. Wie bereits beim LTWDaF 2 werden auch beim DHWDaF 2 die für die Analyse vorbereiteten Daten anschließend automatisch alphabetisch sortiert und in die Form einer Liste überführt. Diese beiden Listen - eine für jedes untersuchte Wörterbuch - sind in der Datensammlung A.2.6 zu finden. 3.2.3 Annotation und Auswertung der Primärdaten Nach der Extrahierung und der Aufbereitung der in den Definitionen der Stichprobe verwendeten Lexeme liegen diese in Form zweier alphabetischer Listen vor (vgl. Datensammlung A.2.6). Diese bilden das selbstständig und eigens für diese Untersuchung erstellte Korpus. Im weiteren Vorgehen werden alle Elemente dieser Listen in eigene Tabellenkalkulationen übertragen, um sie nach den für die Untersuchung relevanten Eigenschaften analysieren zu können. Dafür ist eine Annotation aller in den Definitionen der Stichprobe verwendeten Wörter erforderlich. In der Korpuslinguistik bezeichnet man „die linguistische Anreicherung der Primärdaten eines Korpus“ (Lemnitzer/ Zinsmeister 2010, S. 188) als Annotation. „Diese Annotationen machen Korpusuntersuchungen effizienter, indem präzisere Anfragen gestellt werden können und komplexere Phänomene überhaupt erst abfragbar gemacht werden.“ (ebd.). „Der Vorteil einer Annotation ist, dass sie implizite Information explizit macht und somit eine einfachere und schnellere Erhebung der benötigten Informationen ermöglicht.“ (Scherer 2006, S. 21). Korpora können auf unterschiedlichen Sprachebenen annotiert werden. Eine Annotation auf der Wortebene bezeichnet man als Tagging, eine auf der Satzebene als Parsing (ebd ., S. 58). Es gibt jedoch auch Forscher, die Tagging als ein etwas umgangssprachlicheres Synonym zu dem übergeordneten Fachausdruck Annotation verwenden (Baker/ Hardie/ McEnery 2006, S. 154). 338 338 Vgl. auch McEnery/ Wilson (2001, S. 32ff.), McEnery/ Xiao/ Tono (2006, S. 29ff.). Wörterbuchanalyse 197 Bei den hier untersuchten Parametern spielen sowohl quantitative als auch qualitative Aspekte des zusammengestellten Korpus eine Rolle. 339 Neben dem Umfang des verwendeten Definitionswortschatzes und seiner Lemmatisierung im Wörterbuch handelt es sich bei den untersuchten Eigenschaften um die Häufigkeit der Verwendung, um die Wortart, um die Wortartengruppe (Synsemantika und Autosemantika), um die Herkunft, um Angaben zur Wortbildung sowie um die Überprüfung, ob das betreffende Element zum Grundwortschatz, zum Frequenzwortschatz oder zum Zertifikatswortschatz des Deutschen gehört. Die Angabe, wie häufig die entsprechenden Elemente des Definitionswortschatzes im Korpus verwendet werden, kann dabei ohne Probleme ermittelt werden. Auch bei der Feststellung der Schnittmengen zwischen dem Definitionswortschatz und dem Grund-, dem Frequenz- und dem Zertifikatswortschatz gibt es kaum Zweifelsfälle. Anders sieht es bei den Entscheidungen zur Bestimmung der Wortart, der Wortartengruppe, der Herkunft und der Wortbildung aus. Auf diesen Gebieten existieren viele kontroverse Theorien und Ansichten. Da es sich bei der vorliegenden Arbeit nicht um ein Werk handelt, das sich vordergründig mit den genannten Themenbereichen auseinandersetzt, müssen vor allem praktikable Wege gefunden werden, um die Elemente des Definitionswortschatzes eindeutig den einzelnen Kategorien zuordnen zu können und sie mit der entsprechenden Zusatzinformation zu versehen. Hier kommt es nicht zuletzt darauf an, den Aufwand für die Annotation der jeweiligen Elemente nicht ins Unermessliche steigen zu lassen, sondern in einem vertretbaren Rahmen zu halten. Mit Sicherheit können also einige der folgenden Einzelfallentscheidungen aus einer abweichenden theoretischen Sichtweise anders gefällt werden. Die Korpusdaten werden statistisch rein deskriptiv ausgewertet. Ihre Betrachtung erfolgt dabei jeweils auf zwei verschiedenen Ebenen der Zählung - der Ebene der Types und der Tokens. Die erste Art der Zählung entspricht dem Pretest Types (vgl. Kap. 3.2.1). Hier werden die in den Definitionen auftretenden Types analysiert. Als Type bezeichnet man „die abstrakte sprachliche Einheit, die zusammengehörige Tokens wie Wortformen oder Lautvarianten zusammenfasst und dabei von konkreten Merkmalsausprägungen wie Flexions- oder Intonationsmerkmalen abstrahiert“ (Scherer 2006, S. 33). Die Untersuchungsstichprobe umfasst 1 342 Types aus dem LTWDaF 2 und 1 221 Types aus dem DHWDaF 2. 340 Die Häufigkeit des Auftretens spielt bei der Zählung 339 Zu den Unterschieden zwischen quantitativer und qualitativer Korpusanalyse vgl. McEnery/ Wilson (2001, S. 76), Scherer (2006, S. 35ff.). 340 Die zwei Zahlen können nicht zu einer Gesamttypesumme addiert werden, da zahlreiche Types in den Definitionen beider Wörterbücher verwendet werden. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 198 der Types keine Rolle, im Gegensatz zu Berechnungen, die auf den Tokens beruhen, wie der im Kapitel 3.2.1 vorgestellte Pretest Tokens. Ein Token ist „das konkrete Vorkommen einer sprachlichen Einheit im Korpus“ (Scherer 2006, S. 33). In der vorliegenden Untersuchung umfasst die Stichprobe des LTWDaF 2 insgesamt 6 572 Tokens, die des DHWDaF 2 enthält 3 795 Tokens. Daraus ergibt sich eine Gesamtsumme von 10 367 analysierten Tokens. 341 3.3 Lemmatypübergreifende Analyse des untersuchten Definitionswortschatzes Dieses Kapitel beinhaltet den Teil der Untersuchung, der sich auf die Gesamtmenge der analysierten Lemmata bezieht. Die Besonderheiten einzelner Gruppen von Lemmata spielen an dieser Stelle noch keine Rolle, diese werden im Kapitel 3.4 betrachtet. Die folgenden Unterkapitel beschäftigen sich mit der Länge der Definitionen, dem Umfang und der Verzeichnung des Definitionswortschatzes (Kap. 3.3.1) sowie mit seiner Zusammensetzung (Kap. 3.3.2), was die Wortarten und Wortartengruppen, die Herkunft und die Wortbildung des Definitionswortschatzes betrifft. 3.3.1 Länge der Definitionen, Umfang und Verzeichnung des Definitionswortschatzes 3.3.1.1 Analyse des LTWDaF 2 Im Folgenden werden die Ergebnisse der durchgeführten Untersuchung dargestellt, welche die Länge der Definitionen und den Umfang des Definitionswortschatzes betreffen, der in der Stichprobe verwendet wird. 342 Bei der Überprüfung, inwieweit diese Lexeme im Wörterbuch enthalten sind, liegt das Hauptaugenmerk auf der formalen Seite des Definitionswortschatzes, da eine vollständige Überprüfung der Bedeutungsseite der verwendeten Lexeme im Rahmen dieser Arbeit nicht zu leisten ist. Ebenfalls ausgeklammert werden die Einschränkungen, die das LTWDaF 2 in den Benutzerhinweisen und in der Liste mit dem Definitionswortschatz macht (vgl. Kap. 3.1.1). In der Stichprobe der Untersuchung des LTWDaF 2 werden insgesamt 799 Definitionen von 400 Lemmata analysiert (vgl. Kap. 2.2.1). Auf jedes Lemma entfallen im Mittelwert folglich zwei Sememe. Die Länge der untersuchten Definitionen im LTWDaF 2, die als Nächstes betrachtet wird, lässt sich aus 341 Die Zahl der laufenden Wortformen in den untersuchten Definitionen liegt um einiges höher, da beim Zurückführen auf die Grundformen beispielsweise trennbare Verben mit den einzelnen Bestandteilen im Infinitiv zusammengefasst werden (vgl. Kap. 3.2.2). 342 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Wörterbuchanalyse 199 der Division der Anzahl der verwendeten Tokens durch die Anzahl der Definitionen (Sememe) errechnen. Für die 799 Sememe der Untersuchung und die 6 572 Tokens ergibt sich somit eine Menge von durchschnittlich 8,23 Wörtern pro Definition. Weiterhin ist die Verwendungshäufigkeit der einzelnen Types von Interesse, den Wert hierfür gibt der Quotient aus Tokens und Types wieder. Die 1 342 Types der Untersuchung zum LTWDaF 2 werden im Mittelwert 4,90-mal verwendet (6 572 Tokens dividiert durch 1 342 Types). Merkmale LTWDaF 2 untersuchte Lemmata 400 Lemmata mit nicht verzeichneten Lexeme n 115 (28,75%) untersuchte Definitionen 799 Definitionen mit nicht verzeichneten Lexemen 166 (20,78%) Sememanzahl 2 Wörter pro Definition 8,23 Types Tokens Umfang 1 342 6 572 davon nicht verzeichnet 138 (10,28%) 193 (2,94%) Verwendungshäufigkeit 4,90 Tab. 5: Die Merkmale des LTWDaF 2 - Länge der Definitionen, Umfang des untersuchten Definitionswortschatzes und Anteil des nicht verzeichneten Definitionswortschatzes Von den 400 untersuchten Lemmata enthalten insgesamt 115 Lemmata in ihren Definitionen Lexeme, die selbst nicht im LTWDaF 2 als Lemmata verzeichnet sind. Das entspricht einer relativen Häufigkeit von 28,75 Prozent der Lemmata. Neben der Zahl der untersuchten Lemmata wird als Nächstes die Zahl der analysierten Definitionen betrachtet, die im LTWDaF 2 bei 799 liegt. Von diesen 799 Definitionen findet sich bei 166 Definitionen mindestens ein Wort, das nicht Teil der Makrostruktur des LTWDaF 2 ist, also 20,78 Prozent. Ein genauerer Blick auf den analysierten Definitionswortschatz, der nicht im LTWDaF 2 verzeichnet ist, verrät Einzelheiten über dessen Zusammensetzung. Rund jedes zehnte Type, das in den Definitionen der Untersuchung auftritt, gehört nicht zur Lemmaliste des LTWDaF 2 - ganz genau 10,28 Prozent beziehungsweise 138 der insgesamt 1 342 Types. Mit 86 Types beziehungsweise 62,32 Prozent ist die Mehrheit dieser 138 Types an keiner Stelle des LTWDaF 2 lemmatisiert. Die verbleibenden 37,68 Prozent (52 Types) sind unter einem Glied der Wortfamilie verzeichnet. Bei den Tokens ist mit 2,94 Prozent (193 der insgesamt 6 572 Tokens) ein viel niedrigerer Anteil als bei den entsprechenden Types nicht im Wörterbuch lemmatisiert. Von diesen 193 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 200 Tokens sind 133 Tokens (68,91 Prozent) nicht als Lemmata des LTWDaF 2 verzeichnet, die verbleibenden 60 Tokens (31,09 Prozent) werden als Wortbildungsprodukte unter der Wortfamilie aufgeführt. Als Ergebnis dieses Kapitels lässt sich festhalten, dass im LTWDaF 2 der selbst auferlegte Anspruch, mit einem computerkontrollierten Definitionswortschatz zu arbeiten, nicht erfüllt werden kann, wenn man eine strenge Auslegung dieses Konzepts voraussetzt. Knapp 30 Prozent der untersuchten Lemmata enthalten in mindestens einer ihrer Definitionen Lexeme, die selbst nicht im LTWDaF 2 verzeichnet sind. Das entspricht einem Anteil von mehr als 20 Prozent bei den einzelnen untersuchten Definitionen beziehungsweise bei jedem zehnten Type. Die Types des nicht lemmatisierten Definitionswortschatzes sind zu mehr als 60 Prozent an keiner Stelle im Wörterbuch aufgelistet, die restlichen knapp 40 Prozent werden zumindest als Wortbildungsprodukte in den Artikeln ihrer Wortfamilie genannt. Dieses Vorgehen entspricht nicht immer den Bedürfnissen des Benutzers. In Abhängigkeit von den einzelnen Fallgruppen bieten sich an dieser Stelle andere Möglichkeiten an (vgl. Kap. 3.3.2.3.3.1). 3.3.1.2 Analyse des DHWDaF 2 Der folgende Teil der Untersuchung stellt die Ergebnisse zur Länge der Definitionen, zum Umfang des verwendeten Definitionswortschatzes und die Anteile des nicht im Wörterbuch verzeichneten Definitionswortschatzes im DHW- DaF 2 dar. 343 Wie bereits beim LTWDaF 2 (vgl. Kap. 3.3.1.1) liegt der Schwerpunkt dabei auf der äußeren Form des Definitionswortschatzes und der Lemmata des DHWDaF 2, da eine Überprüfung des gesamten Definitionswortschatzes auf Sememebene im Rahmen dieser Arbeit nicht geleistet werden kann. Merkmale DHWDaF 2 untersuchte Lemmata 382 Lemmata mit nicht verzeichneten Lexemen 102 (26,70%) untersuchte Definitionen 645 Definitionen mit nicht verzeichneten Lexemen 143 (22,17%) Sememanzahl 1,69 Wörter pro Definition 5,88 Types Tokens Umfang 1 221 3 795 davon nicht verzeichnet 157 (12,86%) 193 (5,09%) Verwendungshäufigkeit 3,11 Tab. 6: Die Merkmale des DHWDaF 2 - Länge der Definitionen, Umfang des untersuchten Definitionswortschatzes und Anteil des nicht verzeichneten Definitionswortschatzes 343 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Wörterbuchanalyse 201 Für die Stichprobe des DHWDaF 2 werden insgesamt 382 Lemmata untersucht, also 18 weniger als beim LTWDaF 2. Das liegt an der unterschiedlichen Lemmatisierungspolitik der beiden Wörterbücher - im DHWDaF 2 werden viele Lexeme als polysem in einem Artikel behandelt, die das LTWDaF 2 als Homonyme betrachtet und auf mehrere Artikel aufteilt (vgl. Kap. 3.2.2.2). Zu den 382 Lemmata des DHWDaF 2 gehören insgesamt 645 Sememe beziehungsweise Definitionen, was einer durchschnittlichen Sememanzahl von 1,69 pro Lemma entspricht. Auf diese 645 Definitionen bzw. Sememe verteilen sich 3 795 Tokens, eine Definition ist also im Mittelwert 5,88 Wörter lang. Natürlich ist ebenfalls von Interesse, wie häufig die einzelnen Types gebraucht werden. Für die Gesamtmenge der untersuchten Definitionen des DHWDaF 2, in denen sich die 3 795 Tokens auf 1 221 Types verteilen, ergibt sich eine durchschnittliche Verwendungshäufigkeit von 3,11-mal pro Type. Von den 382 untersuchten Lemmata des DHWDaF 2 enthalten 102 (26,70 Prozent) in ihren Definitionen Lexeme, die im Wörterbuch selbst nicht verzeichnet sind. 143 der insgesamt 645 Definitionen gehen in ihren Lexemen über den computerkontrollierten Definitionswortschatz hinaus, also 22,17 Prozent. Auf der nächsten Ebene werden die Lexeme an sich betrachtet. Von den 1 221 Types, die in den Definitionen der Stichprobe zum DHWDaF 2 verwendet werden, gehören 157 Types - also 12,86 Prozent - nicht zum Lemmabestand des Wörterbuchs. Das sind zwei Prozentpunkte mehr als im LTW- DaF 2. Von diesen 157 Types sind zwei Types (1,27 Prozent) in einem Artikel des Grundworts verzeichnet, alle anderen werden nirgendwo im Wörterbuch aufgeführt. Bei den Tokens (zwei von 193) beträgt der Wert der unter der Wortfamilie verzeichneten Lexeme durch die geringe Verwendungshäufigkeit 1,04 Prozent. An dieser Stelle unterscheiden sich die beiden untersuchten Wörterbücher sehr stark voneinander, denn im LTWDaF 2 liegt dieser Wert zwischen 31,09 Prozent bei den Tokens und 37,68 Prozent bei den Types (vgl. Kap. 3.3.1.1). Die Ursache hierfür ist erneut in der Lemmatisierungspolitik der beiden Wörterbücher zu suchen, denn das LTWDaF 2 verzeichnet Wortbildungsprodukte, vor allem Derivate, systematisch unter der Wortfamilie. Mit 98,73 Prozent der Types (155 der 157 Types) beziehungsweise 98,96 Prozent der Tokens (191 der 193 Types) wird hingegen fast der gesamte Definitionswortschatz des DHWDaF 2, der über den Lemmabestand des Wörterbuchs hinausgeht, an keiner Stelle des Wörterbuchs aufgeführt. Alternative und benutzerfreundlichere Vorschläge zu diesem Vorgehen werden im Kap. 3.3.2.3.3.2 gemacht. Insgesamt gehen 193 der 3 795 Tokens (5,09 Prozent) im DHWDaF 2 über den Lemmabestand des Wörterbuchs hinaus. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 202 Resümierend muss auch für das DHWDaF 2 festgestellt werden, dass das Ziel, in den Definitionen einen computerkontrollierten Definitionswortschatz zu verwenden, nicht erreicht wird. In beiden Wörterbüchern enthalten 27 bis 29 Prozent der Lemmata und 21 bis 22 Prozent der Definitionen Wörter, die nicht im jeweiligen Wörterbuch verzeichnet sind. Das ist rund dreimal so viel, wie Herbst bei seiner Stichprobe zum LDOCE 1 findet, obwohl dieses mit einem kontrollierten Definitionswortschatz arbeitet. Dort gehören weniger als sieben Prozent der in den Definitionen verwendeten Wörter nicht zum kontrollierten Definitionswortschatz (vgl. Herbst 1986, Kap. 2.3.1.1 und 2.3.1.2). Auf der Ebene der Definitionen, der Types und der Tokens liegt das DHWDaF 2 jeweils zwei Prozentpunkte über den Werten des LTWDaF 2, bei der Betrachtung der Lemmata dreht sich dieses Verhältnis hingegen um. Somit muss Klosas Eindruck, im DHWDaF 1 sei das Prinzip des computerkontrollierten Definitionswortschatzes in den Artikeln „sorgfältiger umgesetzt“ (Klosa 2004, S. 301) als im LTWDaF 1, für die zweiten Auflagen der analysierten Wörterbücher zum Teil korrigiert werden. Zwar ergibt auch diese Untersuchung für das DHWDaF 2 niedrigere Werte als für das LTWDaF 2 in Bezug auf die Lemmata, die in ihrem Definitionswortschatz über den Lemmabestand des Wörterbuchs hinausgehen. Allerdings ist das Verhältnis genau umgekehrt, wenn man die Definitionen, die Types und die Tokens betrachtet. Darüber hinaus sind die Unterschiede zwischen den beiden Wörterbüchern an sich sehr gering - sie liegen bei jeweils rund zwei Prozent. Weiterhin zeigt diese Untersuchung, dass der Anteil der Wörterbuchartikel, die sich in ihrem Definitionswortschatz nicht auf den Lemmabestand beschränken, mit rund 27 bis 29 Prozent viel niedriger ist als die Daten von Klosa, die auf Werte von 36 Prozent (DHWDaF 1) bzw. 75 Prozent (LTWDaF 1) kommt (vgl. Kap.3.1.2). Sehr starke Unterschiede bestehen zwischen dem DHWDaF 2 und dem LTWDaF 2 in der Gruppierung nach dem gar nicht verzeichneten und nach dem unter der Wortbildungsbasis verzeichneten Definitionswortschatz. Zu letztgenannter Gruppe gehört im DHWDaF 2 lediglich ein Prozent des Definitionswortschatzes ohne eigenen Wörterbucheintrag, im LTWDaF 2 ist es hingegen rund ein Drittel. 3.3.2 Zusammensetzung des untersuchten Definitionswortschatzes 3.3.2.1 Wortart und Wortartengruppe 3.3.2.1.1 Bestimmung der Wortarten und Wortartengruppen Die nächste Eigenschaft, auf die der in den Definitionen der Stichprobe verwendete Definitionswortschatz untersucht wird, ist die Wortart. Hierfür werden alle Elemente der Liste des verwendeten Definitionswortschatzes mit ei- Wörterbuchanalyse 203 ner Wortartenannotation versehen (vgl. Datensammlung B.2.1). Als Grundlage hierfür dient das eher syntaktisch orientierte Wortartenkonzept, wie es im Kap. 3.2.2.1 beschrieben wird. In Anlehnung an die Duden-Grammatik wird zwischen den flektierbaren Wortarten Verb, Substantiv, Adjektiv und Pronomen (einschließlich der Artikelwörter) und den nicht flektierbaren Wortarten Adverb, Partikel, Präposition und Junktion (bestehend aus Konjunktion und Subjunktion) unterschieden. 344 Nach welchen Kriterien die Zuordnung zu den einzelnen Wortarten erfolgt, wird im Folgenden genauer beschrieben. Die Untersuchung der Definitionen nach den enthaltenen Wortarten verspricht besonders interessante Ergebnisse, da die Häufigkeit der Wortarten als „stilistisch relevantes Merkmal von Texten“ (Best 1998, S. 83) gilt. 345 Zudem werden die Elemente des Definitionswortschatzes der autosemantischen oder der synsemantischen Wortartengruppe zugeordnet. Auf die zum Teil kontrovers diskutierte Unterscheidung zwischen Autosemantika und Synsemantika (vgl. Lutzeier 1985, S. 21ff.) wird in der vorliegenden Arbeit also nicht verzichtet. Allerdings wird bei dieser Differenzierung deutlich, dass es gute und weniger gute Vertreter einer jeden Kategorie gibt, um mit Aitchinson und der Prototypentheorie zu sprechen (vgl. Aitchinson 1997, S. 65ff.). In Langackers (1987, S. 18) Sinn kann die Unterscheidung zwischen Autosemantika und Synsemantika wie folgt festgehalten werden: „All these differences are [...] matters of degree, and intermediate examples are easily found.“ Die Verben stellen aufgrund der Konjugierbarkeit, die sie von allen anderen Wortarten unterscheidet, eine problemlos zu klassifizierende Wortart dar. 346 Einzig bei der Zuordnung zu den Wortartengruppen der Autosemantika und Synsemantika ergibt sich das Problem der Notwendigkeit einer weiteren Differenzierung, da Vollverben als Autosemantika gezählt werden, Modal- und Hilfsverben hingegen als Synsemantika (Meibauer et al. 2007, S. 169f.). Das feste Genus ist das Alleinstellungsmerkmal der zu den Autosemantika gehörenden Substantive. 347 Die einzige Fallgruppe, die teilweise über ein variables Genus verfügt und die in der Untersuchung bei der Bestimmung der 344 Einzelheiten zur Bestimmung der Wortarten finden sich in der Duden-Grammatik (2009, S. 132ff.). 345 Best (1998, S. 91) kommt in seiner Untersuchung von 40 deutschen und 30 französischen Texten (Kurzprosa und Briefe), die er auf Interaktionen zwischen den Wortarten analysiert, zu folgenden Ergebnissen: Es bestehen relativ wenig signifikante Korrelationen zwischen den Wortarten, signifikante Korrelationen sind in der Mehrzahl negativ. Best schließt daraus, dass „es sich hauptsächlich um stilistische Variationen handelt und nicht um sprachtypische, schon gar nicht um übersprachliche Erscheinungen“. 346 Zur Wortart Verb vgl. Duden-Grammatik (2009, S. 389ff.). 347 Zur Wortart Substantiv vgl. Duden-Grammatik (2009, S. 145ff.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 204 Wortarten trotzdem unter die Substantive gerechnet wird, ist die Gruppe der deadjektivischen Konversionsprodukte, obwohl sich hier natürlich auch semantische Unterschiede mit den verschiedenen Genera verbinden (beispielsweise der/ die/ das Fremde). Bei der Wortartenbestimmung wird - wie bei der Rückführung der in den Definitionen verwendeten Wörter auf ihre Grundform - vor allem nach syntaktischen Kriterien entschieden. Aus diesem Grund werden sowohl substantivische Konversionen des Infinitivs als auch die Konversionen von Adjektiven mit der Annotation Substantiv versehen. 348 Mithilfe der Einsetzprobe (Stellung zwischen bestimmtem Artikelwort und Substantiv) werden die Adjektive bestimmt, die ebenfalls zu den autosemantischen Wortarten gerechnet werden. 349 Kardinal- und Ordinalzahlen werden als Adjektive gewertet - wie bei der Auswahl der Lemmata der Stichprobe (vgl. Kap. 3.2.1). Für die Zuordnung der Partizipien ist das semantische Kriterium entscheidend. Jedes Partizip, das bei der Aufbereitung des Datenmaterials aufgrund des Verlustes der semantischen Bindung an sein Ausgangsverb als eigenständig gilt, erhält hier die Annotation Adjektiv (vgl. Kap. 3.2.2.1). Die vierte und damit letzte flektierbare Wortart bildet die sehr heterogene Gruppe der Pronomen und Artikelwörter. 350 Von ihren grammatischen Eigenschaften - Flexion nach Kasus, Numerus und Genus - stehen sie den Adjektiven nahe. Im Gegensatz zu diesen gehören die Pronomen und Artikelwörter jedoch zu den Synsemantika. Außerdem bilden sie eine geschlossene Gruppe, die sich funktional und semantisch in viele Untergruppen aufteilt. Zur Unterscheidung von Indefinitpronomen und unbestimmten Zahladjektiven wird die Artikelprobe angewendet, da nur Adjektive nach dem bestimmten Artikel stehen können, zum Beispiel das andere Geschenk (vgl. Duden-Grammatik 2009, S. 382). Gerade hier gibt es jedoch auch viele Grenzfälle. Die Adverbien grenzen sich in der Gruppe der nicht flektierbaren Wortarten durch ihre Satzgliedfähigkeit und das Vermögen zur Besetzung des Vorfeldes von den Partikeln, den Präpositionen und den Junktionen ab. 351 Aufgrund dieser Merkmale lassen sie sich trotz ihrer Heterogenität recht leicht bestimmen. Adverbien werden in der Mehrzahl zu den Autosemantika gerechnet. In vorliegender Arbeit werden aus Gründen der Praktikabilität alle Adverbien als Autosemantika gewertet. 348 Zu den Gründen für die Wertung dieser Konversionsprodukte als Substantive vgl. Kapitel 3.2.2.1, Anm. 327. 349 Zur Wortart Adjektiv vgl. Duden-Grammatik (2009, S. 338ff.). 350 Zur Wortart Pronomen und Artikelwörter vgl. Duden-Grammatik (2009, S. 249ff.). 351 Zur Wortart Adverb vgl. Duden-Grammatik (2009, S. 569ff.). Wörterbuchanalyse 205 Bei den Partikeln handelt es sich ebenso um eine recht heterogene Wortart, die jedoch ausnahmslos zu den synsemantischen Wortarten gehört. 352 So können Partikeln die Intensität eines Sachverhaltes angeben, einen Satzteil betonen, eine Aussage verneinen, Sprechereinstellungen wiedergeben, ein Gespräch steuern, als Interjektionen Emotionen ausdrücken oder als Onomatopoetika Laute imitieren. Neben ihrer Kürze zeichnen sie sich dadurch aus, dass sie typischerweise Homonyme in anderen Wortarten besitzen. Präpositionen sind durch ihre Fähigkeit, einen Kasus zu regieren, relativ leicht von den anderen Nichtflektierbaren abzugrenzen. 353 Was die semantischen Wortartengruppen betrifft, bilden die Präpositionen einen Grenzfall zwischen Auto- und Synsemantika, hier werden sie zu letzteren gezählt. Wie bereits in den Kapiteln 3.2.2.1 und 3.2.2.2 erwähnt, werden die mit Artikelwörtern verschmolzenen Präpositionen am, beim, im, ins, vom, zum und zur aufgelöst und jeweils sowohl beim Artikelwort als auch bei der Präposition gezählt, um die Bestimmung der Wortarten zu erleichtern. So kann auf die Hilfskonstruktion Präposition + Artikelwort verzichtet werden. Die achte und letzte Wortart sind die Junktionen, ebenfalls eine synsemantische Wortart. 354 Unter dieser Bezeichnung werden Konjunktionen und Subjunktionen zusammengefasst, die Sätze, Satzglieder oder Gliedteile verbinden, selbst aber nicht satzgliedfähig sind. Bei der Untersuchung zur Zusammensetzung des Definitionswortschatzes in der gewählten Stichprobe sollte zudem beachtet werden, dass der Fokus der Analyse bei der Verteilung nach den Wortarten stärker auf allgemeinen Tendenzen liegt als auf absoluten Zahlenwerten. Denn trotz der transparenten Darstellung aller gewählten Kriterien würden andere Sprecher einige Entscheidungen sicherlich anders treffen, was bei einer tendenzorientierten Analyse weniger stark ins Gewicht fällt. 3.3.2.1.2 Analyse des LTWDaF 2 Bei der Zählung der Types, die in der Stichprobe der Untersuchung zum Definitionswortschatz im LTWDaF 2 verwendet werden, überwiegen selbstverständlich ganz eindeutig die Autosemantika. 355 Von den 1 342 Lexemen, die in den Definitionen der Stichprobe Verwendung finden, sind 1 246 autosemantisch, also 92,85 Prozent (vgl. Abb. 23a). 352 Zur Wortart Partikel vgl. Duden-Grammatik (2009, S. 588ff.). 353 Zur Wortart Präposition vgl. Duden-Grammatik (2009, S. 600ff.). 354 Zur Wortart Junktion vgl. Duden-Grammatik (2009, S. 619ff.). 355 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 206 a) Types b) Tokens Abb. 23: Die Verteilung der Wortartengruppen bei den Types (a) und bei den Tokens (b) im LTWDaF 2 Rechnet man die Auftretenshäufigkeit der Grundformen mit ein, wandelt sich das Ergebnis. Dann machen die Autosemantika mit 49,12 Prozent (3 228 Tokens) nur noch knapp die Hälfte der Tokens aus (vgl. Abb. 23b). Eine solche Verteilung ist völlig natürlich, da in den Definitionen zwar viele Autosemantika verwendet werden, die einzelnen Autosemantika jedoch nicht sehr häufig auftreten. Folgende Zahlen belegen dies sehr anschaulich: Die durchschnittliche Verwendungshäufigkeit eines Types in der Stichprobe zum LTWDaF 2 liegt bei 4,90. Die autosemantischen Wortarten liegen mit einer 2,59-maligen Verwendung deutlich darunter. Die Synsemantika werden im Gegensatz dazu viel häufiger verwendet - im Mittelwert 34,83-mal pro Type. Die Erklärung für die wesentlich frequentere Verwendung der synsemantischen Wörter liefert die Theorie der Markiertheit. 356 Teilt man sprachliche 356 An dieser Stelle muss klar zwischen den beiden Termini Markierung und Markiertheit (in der Wissenschaftstheorie) unterschieden werden. Wie im Kapitel 1.1.1 dargestellt, informieren Markierungen in Wörterbüchern über Einschränkungen des Gebrauchs von Lemmata in den einzelnen Diasystemen, beispielsweise in der Frequenz oder der Region der Verwendung. In der vorliegenden Arbeit steht die Markiertheit als sprachliche Erscheinung der Auffälligkeit im Vordergrund, nicht die Markiertheitstheorie in ihrer wissenschaftstheoretischen Dimension. Der Ansatz stammt ursprünglich aus der Prager Schule, er wird von Ro- @ ‚ }€ < ‘ ‹ ™ > ^ # Trubeckoj auf die Phonologie übertragen, um binäre Oppositionsglieder, beispielsweise ‘stimmhaft - stimmlos’, unterscheiden zu können. Zur Markiertheitstheorie vgl. Andersen (1989), Andrews (1990), Greenberg (2005) und Waugh/ Lafford (2006). In Zusammenhang damit steht auch die Natürlichkeitstheorie, vgl. Mayerthaler (1981). Wörterbuchanalyse 207 Erscheinungen „in Zonen einerseits der Normalität, des unauffälligen Durchschnitts und andererseits der auffälligen Abweichung von der Normalität“ (Hausmann 1989c, S. 649) ein, verfügen die auffälligen sprachlichen Elemente gegenüber den unauffälligen über ein zusätzliches Merkmal, sie sind markiert. Die unauffälligen sprachlichen Elemente sind hingegen unmarkiert. Die Auffälligkeit bezieht sich hierbei auf „die spontanen und intuitiven Reaktionen eines Durchschnittssprechers“ (ebd.), sie ergibt sich unmittelbar und nicht „erst nach eingehender linguistischer Analyse“ (ebd.). Die markierten Lexeme sind in ihrer Verwendung eingeschränkt, im Wörterbuch werden sie deshalb mit Markierungsetiketten bzw. Markern versehen. Je nach den einzelsprachlichen Normen können unterschiedlich viele Arten der Markiertheit unterschieden werden, bei Hausmann sind es z.B. die elf Diasysteme in Tabelle 7. Kriterium unmarkiertes Zentrum markierte Peripherie Art der Markierung 1 Zeitlichkeit (Temporalität) gegenwärtig alt - neu diachronisch 2 Räumlichkeit (Arealität) gesamtsprachlich regional/ dialektal diatopisch 3 Nationalität nationalsprachlich entlehnt/ fremd diaintegrativ 4 Medialität neutral gesprochen - geschrieben diamedial 5 sozio-kulturelle Gruppe neutral Oberschicht - Unterschicht Kinder/ Schüler Gruppe diastratisch 6 Formalität neutral formell - informell diaphasisch 7 Textsorte neutral bibl./ poet./ lit./ zeitungsspr./ administrativ diatextuell 8 Technizität gemeinsprachlich fachsprachlich diatechnisch 9 Frequenz häufig selten diafrequent 10 Attitüde neutral konnotiert diaevaluativ 11 Normativität korrekt unkorrekt dianormativ Tab. 7: Die Diasysteme der Markiertheit (adaptiert nach Hausmann 1989c, S. 651) Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 208 Die erwähnten Gebrauchseinschränkungen bei den markierten Lexemen lassen sich in der vorliegenden Untersuchung durch deren niedrige Verwendungshäufigkeiten nachweisen. Markierte Types des Definitionswortschatzes, die auf der formalen oder inhaltlichen Ebene auffällig sind, werden seltener verwendet als nicht markierte, unauffällige Types des Definitionswortschatzes. 357 In diesem Kapitel betrifft dies die autosemantischen Wortarten, die als semantisch auffällige Wörter seltener verwendet werden als die semantisch unauffälligen Synsemantika. Die Auffälligkeit kommt durch die bei den Autosemantika höhere semantische Dichte zustande (vgl. Thom 1975, S. 327). 358 In der Untersuchung zum Definitionswortschatz im LTWDaF 2 erreichen auch alle einzelnen Wortarten je nach Art der Zählung unterschiedliche Werte der Verwendungshäufigkeit (vgl. Abb. 24). Zuerst werden die Verben genauer betrachtet, bei denen es keine speziellen Zuordnungsprobleme bei der Bestimmung der Wortart gibt (vgl. Kap. 3.3.2.1.1). Werden die Types gezählt, erreichen die Verben eine relative Häufigkeit von 23,03 Prozent (vgl. Abb. 24a). Bei der Zählung der Tokens verringert sich ihre relative Häufigkeit und erreicht nur noch einen Wert von 16,31 Prozent (vgl. Abb. 24b). Diese Zahlen spiegeln sich auch in der Berechnung der durchschnittlichen Verwendungshäufigkeit der einzelnen Wortarten wider. Im Mittelwert wird jedes in den Definitionen des LTWDaF 2 gebrauchte Wort 4,90-mal verwendet. Schlüsselt man diese Zahl jedoch nach den einzelnen Wortarten auf, unterscheiden sich die jeweiligen Werte sehr stark voneinander. Die Verben liegen - wie alle anderen autosemantischen Wortarten auch - unter der wortartenübergreifenden Zahl. Sie werden durchschnittlich 3,47-mal gebraucht (vgl. Abb. 25). Zu den Substantiven werden - wie im Kapitel 3.3.2.1.1 dargestellt - die substantivischen Konversionen des Verbinfinitivs und der Adjektive gezählt, deren ausführliche Beschreibung im Kapitel 3.3.2.3 unter dem Aspekt der Wortbildung erfolgt. Bei den Substantiven fällt die Art des Vorgehens bei der Bestimmung der relativen Häufigkeit noch viel stärker ins Gewicht als 357 Dies stellt auch Andrews fest: „As a general tendency, the unmarked element of the marked/ unmarked opposition often does occur more frequently (both in statistical and distributional sense) than the marked element“ (1990, S. 138; Hervorh. im Original). Sie betont jedoch gleichzeitig, dass es sich bei der statistischen Frequenz um ein variables Merkmal handelt, das zudem bei komplexeren Oppositionen, die über das binäre System hinausgehen, als ungeeignet erscheint (vgl. Andrews 1990, S. 138f.). 358 Vgl. hierzu auch Andrews (1990, S. 144ff.). Wörterbuchanalyse 209 bei den Verben. Bei einer Zählung der Types machen die Substantive mit 47,54 Prozent fast die Hälfte aller Lexeme aus (vgl. Abb. 24a). Damit bilden sie unter den Types die häufigste Wortart. Unter Berücksichtigung der Häufigkeit der Verwendung der einzelnen Grundformen (Zählung der Tokens) reduziert sich diese Zahl auf eine relative Häufigkeit von 20,34 Prozent (vgl. Abb. 24b). Mit dieser Zahl fallen die Substantive hinter die Pronomen und Artikelwörter zurück. Diese Erkenntnis deckt sich mit den Zahlen zu den durchschnittlichen Verwendungshäufigkeiten. Hier besitzen die Substantive mit 2,10 den niedrigsten Wert aller Wortarten (vgl. Abb. 25). Die dominante Rolle der Substantive bei der Auflistung der in den Definitionen verwendeten Lexeme wird folglich stark geschwächt, wenn die Definitionen als Text betrachtet werden. a) Types b) Tokens Abb. 24: Die Verteilung der Wortarten bei den Types (a) und bei den Tokens (b) im LTWDaF 2 359 Unter den Adjektiven befinden sich im Untersuchungsmaterial des LTWDaF 2 insgesamt sieben Kardinal- und Ordinalzahlen - ein 2 , tausend, vier und zwei sowie erst- 1 , viert- und zweit-. Die Zahl der als Adjektive verwendeten Partizipien ist mit 27 um einiges höher. In der Stichprobe des LTWDaF 2 sind es folgende Lexeme, die sich zwar auf dem „Kontinuum zwischen Verbform, untypischem und typischem Adjektiv“ (Duden-Grammatik 2009, S. 752) 360 359 Durch Rundungen entstehen zum Teil Gesamtwerte von knapp unter oder über 100 Prozent. 360 Vgl. auch Lenz (1993, S. 70ff.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 210 befinden, die in der vorliegenden Arbeit aus semantischen Gründen jedoch zu der Wortart Adjektiv gezählt werden: 361 angemessen, angestellt, 362 anwesend, 363 befreundet, begeistert, bekannt, bestimmt 1 , betreffend, betrunken, 364 bewusst, 365 dringend, 366 entfernt, 367 erlaubt, geachtet, gebraucht, geeignet, 368 gelaunt, 369 genannt, genügend, 370 spannend, 371 überlegt, überwiegend, vergangen, verschieden, 372 verwandt, 373 vollkommen 2 , 374 vorübergehend. 375 Bei der Häufigkeit der Adjektive ergibt sich ein ähnliches Bild wie bei Substantiven und Verben. Auch hier liegt die relative Häufigkeit bei der Zählung der Types mit 16,99 361 Die beiden Bildungen unbedingt und unbestimmt gehören nicht in diese Reihe, da es sich hierbei um Präfixderivationen der zugrunde liegenden departizipialen Adjektive bedingt und bestimmt handelt. Bei vorhanden, das äußerlich ebenfalls einer departizipialen Konversion gleicht, ist hingegen von einer inzwischen demotivierten Bildung aus der Fügung vor den Händen auszugehen. Ähnliches gilt für stellvertretend, das sich - ebenfalls inzwischen leicht demotiviert - als Komposition aus der Fügung eine Stelle vertretend (< eine Stelle vertreten) herleitet. 362 Angemessen hat sich semantisch gegenüber dem Verb anmessen schon vollkommen verselbstständigt, angestellt ist in seiner Bedeutung gegenüber dem Verb anstellen stark verengt. 363 Das mhd. Verb an[e]wesen ist untergegangen. 364 Die Konversionen befreundet, begeistert, bestimmt 1 , betreffend und betrunken haben sich in ihrer Bedeutung gegenüber ihren verbalen Basen befreunden, begeistern, bestimmen, betreffen und betrinken verselbstständigt bzw. eigene Bedeutungskomponenten entwickelt. Auch bekannt ist von der heutigen Semantik des Verbs erkennen ‘gestehen’ (ursprünglich ‘[er]kennen’) weit entfernt. 365 Hier ist das fnhd. Verb bewissen ebenfalls untergegangen. 366 Dringend ist in seiner Semantik nicht mehr stark an dringen gebunden. 367 Die Semantik von entfernt ist mit ‘fern’ im Vergleich zum Verb stark verengt. 368 Die Semantik von erlaubt, geachtet, gebraucht und geeignet hat sich im Vergleich zu den Verben erlauben, achten, gebrauchen und eignen bereits verselbstständigt bzw. in ihrem Fokus verschoben. 369 Das Verb launen (mhd. lûnen) existiert nicht mehr. 370 Die beiden Konversionen genannt und genügend zeigen ebenfalls eine von den Basisverben nennen und genügen unabhängige Semantik. 371 Auch spannend hat im Vergleich zur Semantik von spannen eine Bedeutungsverengung erfahren. 372 Überlegt, überwiegend, vergangen und verschieden (in der Bedeutung ‘unterschiedlich’) sind im Vergleich mit der Semantik der Verben überlegen, überwiegen, vergehen und verscheiden inzwischen eigenständig. 373 Auch verwandt ist im Vergleich zu verwenden in seiner Bedeutung stark verengt. 374 Das mhd. Verb volkomen ist untergegangen. 375 Bei vorübergehend lässt sich ebenfalls eine semantische Verselbstständigung gegenüber dem zugrunde liegenden Verb vorübergehen beobachten. Wörterbuchanalyse 211 Prozent viel höher als bei einer Einbeziehung der Häufigkeit der Verwendung (vgl. Abb. 24a). Bei einer Zählung aller Tokens haben die Adjektive nur noch einen kleineren Anteil von 9,31 Prozent (vgl. Abb. 24b). Diese Abnahme korrespondiert mit der durchschnittlichen Verwendungshäufigkeit der Adjektive, die mit 2,68 hinter den Substantiven den zweitniedrigsten Wert einnimmt (vgl. Abb. 25). Die bereits oben angesprochenen Abgrenzungsprobleme der Pronomen und Artikelwörter zu den Adjektiven betreffen im LTWDaF 2 unter anderem solch-, viel 1 , wenig 1 , mehr 1 und ein 1 , die bei der Bestimmung der Wortarten als Pronomen (und Artikelwörter) annotiert werden. Pronomen und Artikelwörter sind bei einer Zählung der Types im Datenmaterial des LTWDaF 2 mit 2,16 Prozent relativ schwach vertreten (vgl. Abb. 24a). Dieses Bild ändert sich jedoch vollkommen, wenn die Häufigkeit der Verwendung mit in die Zählung einbezogen wird. Unter den Tokens verfügen die Pronomen und Artikelwörter über eine relative Häufigkeit von 26,14 Prozent (vgl. Abb. 24b). Damit liegen sie noch vor Substantiven, Verben, Junktionen sowie Präpositionen und bilden bei den Tokens die häufigste Wortart. Dieses Ergebnis stimmt mit dem Wert überein, der die durchschnittliche Verwendungshäufigkeit wiedergibt. Hier werden die Pronomen und Artikelwörter mit einem Wert von 59,24-mal mit Abstand am häufigsten verwendet. Auch im Vergleich zu den übrigen synsemantischen Wortarten ist das ein extrem hoher Wert (vgl. Abb. 25). Die Adverbien sind die einzige Wortart, die in der vorliegenden Untersuchung unabhängig von der Art der Zählung fast identische Werte erhält. So beträgt die relative Häufigkeit der Adverbien bei den Types 5,96 Prozent (vgl. Abb. 24a), bei den Tokens ist sie mit 5,01 Prozent nur geringfügig niedriger (vgl. Abb. 24b). Wie bei den anderen autosemantischen Wortarten verringert sich die relative Häufigkeit, wenn die Häufigkeit der Verwendung mit berücksichtigt wird. Im Vergleich zu Substantiven, Verben und Adjektiven fällt diese Abnahme jedoch kaum ins Gewicht. Ein Grund hierfür könnte darin liegen, dass zwar auch das Adverb als autosemantische Wortart grundsätzlich offen für Neubildungen ist, dass hier jedoch „nur wenige Typen, v.a. Derivationstypen, [...] produktiv“ (Duden-Grammatik 2009, S. 759) sind. So wird „der Bestand an Adverbien [...] in der Gegenwartssprache nicht massenhaft vermehrt“ (ebd.), ihr Bestand wird insgesamt auf rund 1 000 geschätzt (vgl. ebd., S. 569). Das führt zu einer - an den anderen autosemantischen Wortarten gemessenen - häufigeren Verwendung der einzelnen Adverbien, die eine noch stärkere Abnahme der relativen Häufigkeit bei den Tokens verhindert. Auch an der durchschnittlichen Verwendungshäufigkeit der Adjektive, die im LTW- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 212 DaF 2 mit 4,11 nur knapp unter dem wortartenübergreifenden Wert von 4,90 liegt, lässt sich diese These eindeutig bestätigen (vgl. Abb. 25). Von allen autosemantischen Wortarten ist dies der höchste Wert. In den Definitionen der Stichprobe des LTWDaF 2 werden nur vier Elemente als Partikeln bestimmt - besonders 2 , etwas 2 , nein und nicht 1 . Aufgrund dieser niedrigen Gesamtzahl liegt die relative Häufigkeit der Types bei lediglich 0,30 Prozent (vgl. Abb. 24a). Bei den Tokens vervielfacht sich der Anteil der Partikeln auf immerhin 1,03 Prozent, was vor allem auf die häufige Verwendung der Negationspartikel nicht zurückzuführen ist (vgl. Abb. 24b). Im Durchschnitt findet sich jede Partikel 17-mal in den Definitionen der Stichprobe, was zwar weit über dem wortartenübergreifenden Mittelwert von 4,90 liegt, von allen synsemantischen Werten jedoch am niedrigsten ist (vgl. Abb. 25). Die Präpositionen erreichen bei der Zählung der Types der Stichprobe des LTW- DaF 2 eine relative Häufigkeit von 2,53 Prozent (vgl. Abb. 24a). Wird die Auftretenshäufigkeit mit einberechnet, vervierfacht sich dieser Wert auf 10,03 Prozent (vgl. Abb. 24b). Mit einer durchschnittlichen Verwendungshäufigkeit von 19,38 liegen die Präpositionen - ähnlich wie die Partikeln - weit über dem wortartenübergreifenden Mittelwert (vgl. Abb. 25). Bei den synsemantischen Wortarten befinden sich die Präpositionen damit allerdings im unteren Bereich. Bei den Junktionen ergibt sich in Bezug auf die Häufigkeitsverteilung im LTW- DaF 2 dieses für die synsemantischen Wortarten sehr typische Bild. Ihr Anteil ist mit 1,49 Prozent bei den Types als sehr niedrig einzustufen (vgl. Abb. 24a). Diese Häufigkeit erhöht sich bei den Tokens allerdings auf 11,82 Prozent (vgl. Abb. 24b). Dieser starke Anstieg deckt sich mit der Verwendungshäufigkeit der Junktionen im Mittelwert, die bei 38,85 liegt (vgl. Abb. 25). Damit verfügen die Junktionen nach den Pronomen und Artikelwörtern über den zweithöchsten Wert. Zusammenfassend kann Folgendes festgehalten werden: An den Untersuchungen zur wortartenspezifischen Zusammensetzung der in den Definitionen verwendeten Lexeme lassen sich im LTWDaF 2 überzeugend die Unterschiede zwischen synsemantischen und autosemantischen Wortarten zeigen. Die Autosemantika verfügen unter den Types über viel höhere relative Häufigkeiten als die Synsemantika (vgl. Abb. 24a). Dieses Bild dreht sich jedoch um, wenn die Berechnung nach den Tokens erfolgt. Dies korrespondiert mit dem Ergebnis, dass die durchschnittliche Verwendungshäufigkeit bei den synsemantischen Wortarten viel höher ist als bei den autosemantischen. Mit abnehmender Markiertheit der einzelnen Wortarten - und damit zunehmender Verwendungshäufigkeit - sinkt auch die semantische Dichte der jeweiligen Wörterbuchanalyse 213 Wortart. Die Reihenfolge der „decreasing semantic density“ (Thom 1975, S. 327) vom Substantiv über das Adjektiv und das Verb hin zum Adverb entspricht dabei exakt der Reihenfolge, in der die Verwendungshäufigkeit der autosemantischen Wortarten zunimmt (vgl. Abb. 25). Abb. 25: Die wortartenspezifische Verwendungshäufigkeit im LTWDaF 2 3.3.2.1.3 Analyse des DHWDaF 2 Für das DHWDaF 2 werden die gleichen Zählungen und Berechnungen durchgeführt wie für das LTWDaF 2. Die Ergebnisse zum DHWDaF 2 in Bezug auf die Wortarten werden im Folgenden dargestellt und mit dem LTW- DaF 2 verglichen. Die Types, die in der Stichprobe der Untersuchung zum Definitionswortschatz im DHWDaF 2 verwendet werden, setzen sich zu einem großen Teil aus Autosemantika zusammen (vgl. Abb. 26a). 376 1 138 der insgesamt 1 221 auftretenden Types sind autosemantisch, was einem prozentualen Anteil von 93,20 Prozent entspricht (vgl. Abb. 26a). Auch hier ergibt sich jedoch ein vollkommen anderes Bild, wenn die Häufigkeit der Verwendung der einzelnen Types mit eingerechnet wird. Dann verschiebt sich das Verhältnis stark zugunsten der Synsemantika, die bei dieser Art der Zählung 1 671 von insgesamt 3 795 verwendeten Tokens ausmachen. Dementspre- 376 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Wortart Verwendungshäufigkeit Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 214 chend verteilt sich die restliche gute Hälfte (2 124 Tokens, 55,97 Prozent) der verwendeten Tokens auf die Autosemantika (vgl. Abb. 26b). Diese unterschiedlichen Anteile von autosemantischen und synsemantischen Wortarten bei den Types und bei den Tokens können wiederum sehr anschaulich mit den Zahlen zur Verwendungshäufigkeit untermalt werden. Die Types der analysierten Definitionen im DHWDaF 2 werden im Mittelwert 3,11-mal verwendet. Bei den Autosemantika liegt die durchschnittliche Verwendungshäufigkeit mit 1,87-mal jedoch klar darunter. Die Synsemantika werden hingegen im Durchschnitt 20,13-mal gebraucht, also fast siebenmal so häufig wie der Mittelwert aller Definitionen. Dieses Phänomen kann erneut mit der Markiertheitstheorie erklärt werden, laut der auffällige Wörter seltener verwendet werden (vgl. Kap. 3.3.2.1.2). In diesem Fall sind die autosemantischen Wortarten aufgrund ihrer lexikalisch-begrifflichen Bedeutung inhaltlich auffällig, sie sind semantisch dichter als die synsemantischen Wortarten (vgl. Thom 1975, S. 327). a) Types b) Tokens Abb. 26: Die Verteilung der Wortartengruppen bei den Types (a) und bei den Tokens (b) im DHWDaF 2 Ein Vergleich der beiden analysierten Wörterbücher in Bezug auf die Wortartengruppen bringt starke Übereinstimmungen zutage: Bei den Types decken sich die Ergebnisse zu den relativen Häufigkeiten der Autosemantika und der Synsemantika im LTWDaF 2 und im DHWDaF 2 bis auf weniger als einen halben Prozentpunkt. Bei den Tokens bestehen hingegen kleine Unterschiede in der Verteilung der Wortartengruppen. Im DHWDaF 2 werden in den Definitionen der Stichprobe rund sieben Prozent mehr autosemantische Tokens Wörterbuchanalyse 215 verwendet als im LTWDaF 2. Auch die Verwendungshäufigkeiten der Types sind wörterbuchspezifisch. Im DHWDaF 2 liegen die Werte dabei grundsätzlich unter denen des LTWDaF 2. Die letzten beiden Erkenntnisse hängen mit dem andersartigen Aufbau der Definitionen im DHWDaF 2 zusammen, auf den am Ende des Kapitels ausführlicher eingegangen wird. Als Nächstes werden die einzelnen Wortarten in ihrer Verteilung untersucht. Ähnlich wie beim LTWDaF 2 gibt es auch im DHWDaF 2 hier je nach der Art der Zählung große Unterschiede (vgl. Abb. 27). Der besseren Übersicht wegen wird auch hier einzeln nach den Wortarten vorgegangen. a) Types b) Tokens Abb. 27: Die Verteilung der Wortarten bei den Types (a) und bei den Tokens (b) im DHWDaF 2 Die Verben machen als leicht zu klassifizierende Wortart wiederum den Anfang. Bei der Zählung der Types verfügen die Verben über einen Anteil von 24,65 Prozent an dem in der Stichprobe zum DHWDaF 2 verwendeten Definitionswortschatz (vgl. Abb. 27a). Damit sind sie bei den Types nach den Substantiven die am zweithäufigsten verwendete Wortart. Wird die Gebrauchshäufigkeit bei der Zählung berücksichtigt, sind die Verben hinter den Substantiven und den Pronomen die dritthäufigste Wortart, was die Anteile an der Gesamtmenge der Tokens betrifft. Jedoch sinkt die relative Häufigkeit der verbalen Lexeme bei den Tokens auf 17,39 Prozent (vgl. Abb. 27b). Diese Erscheinung lässt sich bei allen autosemantischen Wortarten nachweisen und Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 216 mit den Daten zur Verwendungshäufigkeit illustrieren. Die verbalen Types der Untersuchungsstichprobe werden im Mittelwert 2,19-mal verwendet, was klar unter dem allgemeinen Gesamtwert von 3,11-mal liegt (vgl. Abb. 28). Im Vergleich beider Wörterbücher liegen die Werte für die Verben sowohl bei den Types als auch bei den Tokens sehr dicht beieinander, das LTWDaF 2 liegt jeweils nur etwas mehr als einen Prozentpunkt unter den Werten für das DHWDaF 2. Die durchschnittliche Verwendungshäufigkeit der Verben ist im LTWDaF 2 allerdings höher als im DHWDaF 2. Die zweite betrachtete Wortart sind die Substantive. Hierunter fallen auch die substantivischen Konversionsprodukte von Infinitiven, Adjektiven bzw. anderen Wortarten (vgl. Kap. 3.3.2.1.1). Sie werden im Kapitel 3.3.2.3 unter dem Aspekt der Wortbildung ausführlich beschrieben. Die Ergebnisse der Untersuchung fallen für die Substantive je nach der Art der Zählung extrem unterschiedlich aus. Bei den Types sind die Substantive mit einem Anteil von 45,13 Prozent eindeutig die häufigste Wortart (vgl. Abb. 27a). Werden allerdings die Tokens gezählt, reduziert sich die relative Häufigkeit der substantivischen Lemmata um fast die Hälfte auf 24,11 Prozent (vgl. Abb. 27b). Damit bilden die Substantive auch bei den Tokens die häufigste Wortart, der Abstand zu den Pronomen und Artikelwörtern ist jedoch äußerst gering. Dieser starke Abfall der substantivischen Anteile bei den Tokens gegenüber den Anteilen bei den Types kann wiederum anschaulich mit den Zahlen zur Verwendungshäufigkeit illustriert werden. Die 551 substantivischen Types werden als Tokens lediglich 915-mal verwendet, was einer Gebrauchshäufigkeit von 1,66-mal entspricht. Diese ist die niedrigste Verwendungshäufigkeit überhaupt (vgl. Abb. 28). Auch bei den Substantiven wird in der Gegenüberstellung beider untersuchter Wörterbücher deutlich, dass sich die Ergebnisse der Analyse sowohl bei den Types als auch bei den Tokens ähneln: Die relativen Häufigkeiten liegen im LTWDaF 2 und im DHWDaF 2 relativ dicht beieinander, der Anteil der Substantive dominiert bei den Types, im Vergleich dazu ist der Anteil der substantivischen Tokens geringer und die Verwendungshäufigkeit ist die niedrigste aller Wortarten. In den untersuchten Definitionen des DHWDaF 2 befinden sich insgesamt sieben Kardinal- und Ordinalzahlen, die - wie im Kapitel 3.3.2.1.1 dargestellt - zu den Adjektiven zählen: ein 2 , fünfzehn, null und zwei bzw. erst- 1 , viert- und zweit-. Die Zahl der departizipialen Konversionsprodukte, die eine eigenständige Semantik entwickelt haben und deshalb zu den Adjektiven gerechnet wer- Wörterbuchanalyse 217 den, ist mit 34 erheblich höher: 377 angesehen, angestellt, anhaltend, anmaßend, ansprechend, 378 anwesend, 379 anziehend, bedeutend, befreundet, 380 bekannt, 381 bemüht, berechtigt, 382 beschaffen 2 , 383 beschäftigt, bestimmt 1 , betreffend, betrunken, 384 bewusst, 385 dringend, entsprechend 1 , 386 erwachsen 2 , 387 , geachtet, gebraucht, geeignet, gegeben, gelegen, genannt, genügend, 388 gewohnt, 389 unterlegen 2 , vergangen, vergnügt, 390 verschieden 391 und verwandt. 392 Diese departizipialen Konversionsprodukte werden - wie im Kapitel 3.3.2.1.1 dargestellt - unter semantischen Kriterien als Adjektive gewertet, sie haben sich in ihrer 377 Die Bildungen unbeabsichtigt, undekliniert, unerkannt, unerlaubt, ungeordnet und unvermittelt gehören nicht in diese Reihe, da es sich hierbei um Präfixderivationen der zugrunde liegenden departizipialen Adjektive beabsichtigt, dekliniert, erkannt, erlaubt, geordnet und vermittelt (wobei dieses semantisch etwas entfernt ist) handelt. Vorhanden, das äußerlich ebenfalls einer departizipialen Konversion gleicht, ist hingegen eine inzwischen demotivierte Bildung aus der Fügung vor den Händen. Ebenfalls demotiviert und nicht als Konversionsprodukt einzustufen ist zugegen. 378 Bei angesehen, angestellt, anhaltend, anmaßend und ansprechend haben sich die Bedeutungen im Vergleich zu den zugrunde liegenden Verben verengt. 379 Das mhd. Verb an[e]wesen ist untergegangen. 380 Bei anziehend, bedeutend und befreundet hat sich die Semantik bereits verselbstständigt. 381 Bekannt ist von der heutigen Semantik des Verbs bekennen ‘gestehen’ (ursprünglich ‘[er]kennen’) weit entfernt. 382 Auch bei bemüht und bei berechtigt dominiert inzwischen eine von den zugrunde liegenden Verben unabhängige Bedeutung. 383 Das mhd. Verb beschaffen ‘(er-)schaffen’, von dem sich beschaffen 2 herleitet, existiert heute nicht mehr. 384 Auch bei beschäftigt, bestimmt 1 und betreffend kann von einer Bedeutungsverengung ausgegangen werden, betrunken verfügt über eine vom Basisverb unabhängige Semantik. 385 Hier ist das fnhd. Verb bewissen ebenfalls untergegangen. 386 Dringend und entsprechend 1 sind in ihrer Semantik nicht mehr stark an dringen bzw. entsprechen gebunden. 387 Die Bedeutung ‘heranwachsen’ des Verbs erwachsen, an die sich die Konversion erwachsen 2 anlehnt, ist veraltet. 388 Die zugrunde liegenden Verben achten, brauchen, eignen, geben, liegen, nennen und genügen sind bei den Konversionen geachtet, gebraucht, geeignet, gegeben, gelegen, genannt und genügend entweder nicht in ihrer zentralen Bedeutung umgesetzt oder die Konversionen haben sich semantisch inzwischen von den Verben entfernt. 389 Das Adjektiv gewohnt geht auf das Verb gewöhnen (mhd. gewenen) zurück. 390 Die drei Konversionen unterlegen 2 , vergangen und vergnügt zeigen ebenfalls eine von den Basisverben unterliegen, vergehen und vergnügen unabhängige Semantik. 391 Verschieden in der Bedeutung ‘unterschiedlich’ hat sich gegenüber dem Verb verscheiden inhaltlich verselbstständigt. 392 Auch verwandt ist im Vergleich zu verwenden in seiner Bedeutung stark verengt. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 218 Bedeutung zu stark von ihren verbalen Basen entfernt. Alle adjektivischen Types besitzen am Datenmaterial der Stichprobe des DHWDaF 2 insgesamt einen Anteil von 18,10 Prozent (absolut 221 Types), womit sie die dritthäufigste Wortart bilden (vgl. Abb. 27a). Ähnlich wie die Verben und die Substantive liegt ihr Anteil bei der Zählung der Tokens jedoch niedriger. Hier besitzen die Adjektive eine relative Häufigkeit von 12,23 Prozent (vgl. Abb. 27b). Diese hohen Verluste spiegeln sich in der Verwendungshäufigkeit der Adjektive wider, die mit 2,10 nach den Substantiven den zweitniedrigsten Wert aufweist (vgl. Abb. 28). Ein Vergleich zwischen den beiden untersuchten Wörterbüchern zeigt auch bei den Adjektiven starke Ähnlichkeiten - einen starken Rückgang der Anteile bei den Tokens (verglichen mit den Types) sowie eine sehr niedrige Gebrauchshäufigkeit. Die relativen Häufigkeiten liegen ebenfalls sehr dicht beieinander: Bei den Types verfügen die Definitionen des DHWDaF 2 über rund ein Prozent mehr Adjektive, bei den Tokens sind es rund drei Prozent. Bei der Bestimmung der Wortarten im Definitionswortschatz des DHWDaF 2 sind die Pronomen und Artikelwörter wegen der Abgrenzungsprobleme ebenfalls nicht unkompliziert. Das betrifft beispielsweise die Lexeme viel 1 , wenig 1 , mehr 1 und ein 1 , die wie bereits beim LTWDaF 2 zur Gruppe der Pronomen und Artikelwörter gerechnet werden. Diese Wortart verfügt bei den Types des Definitionswortschatzes mit ihren 24 Types über eine sehr niedrige relative Häufigkeit von 1,97 Prozent - lediglich die Junktionen und die Partikeln liegen noch darunter (vgl. Abb. 27a). Unter Einbeziehung der Gebrauchshäufigkeit ergibt sich jedoch ein vollkommen anderes Bild. Bei den Tokens steigen die Pronomen und Artikelwörter im DHWDaF 2 mit einem Anteil von 21,21 Prozent (insgesamt 805 Tokens) hinter den Substantiven zur Wortart mit dem zweithöchsten Wert auf (vgl. Abb. 27b). Dieser enorme Anstieg zeigt sich in den Zahlen zur Verwendungshäufigkeit. Am häufigsten werden die Pronomen und Artikelwörter mit einer im Mittelwert 33,54-maligen Verwendung jedes Types gebraucht, der wortartenübergreifende Durchschnittswert liegt bei weniger als einem Zehntel (vgl. Abb. 28). Auch bei dieser Wortart bestehen zwischen den beiden untersuchten Wörterbüchern große Parallelen. So liegen die Werte bei den Types mit rund zwei Prozent extrem niedrig. Bei den Tokens sind die Pronomen und Artikelwörter hingegen sehr stark vertreten und sind die häufigste (LTWDaF 2) bzw. zweithäufigste Wortart (DHWDaF 2). Der Unterschied zwischen den Werten beider Wörterbücher beträgt lediglich fünf Prozent. Pronomen und Artikelwörter besitzen zudem sowohl im LTWDaF 2 als auch im DHWDaF 2 die höchste Verwendungshäufigkeit. Die Adverbien erreichen bei den Types des untersuchten Definitionswortschatzes im DHWDaF 2 einen absoluten Wert von 74 Types, was einer rela- Wörterbuchanalyse 219 tiven Häufigkeit von 6,06 Prozent entspricht (vgl. Abb. 27a). Damit sind die Adverbien nach den anderen autosemantischen Wortarten die vierthäufigste Wortart. Obwohl sich ihr prozentualer Anteil bei Einberechnung der Gebrauchshäufigkeit kaum verändert - er sinkt nur geringfügig auf 4,32 Prozent bei den Tokens -, sind die Adverbien bei den Tokens damit lediglich die siebthäufigste Wortart (vgl. Abb. 27b). Diese Tatsache erscheint auf den ersten Blick ungewöhnlich, weil die durchschnittliche Gebrauchshäufigkeit der Adverbien mit 2,22-mal unter allen Autosemantika die höchste ist (vgl. Abb. 28). Da jedoch insgesamt recht wenige Adverbien verwendet werden, fällt die Häufigkeit der Verwendung nicht so stark ins Gewicht wie beispielsweise der extrem hohe Grundanteil der Substantive. Bei einer Gegenüberstellung von LTWDaF 2 und DHWDaF 2 zeigen sich auch beim Adverb große Übereinstimmungen: Die Werte sind bei den Types fast identisch und unterscheiden sich bei den Tokens um weniger als ein Prozent. Weiterhin machen die Adverbien jeweils rund sechs Prozent der Types aus, dieser Anteil sinkt bei den Tokens nur leicht. Zudem verfügen die Adverbien jeweils über eine leicht unterdurchschnittliche Verwendungshäufigkeit, die jedoch höher liegt als bei allen anderen autosemantischen Wortarten. Über die Partikeln lassen sich aufgrund ihrer geringen Gesamtmenge kaum statistisch signifikante Aussagen treffen. In der gesamten Datenmenge der untersuchten Stichprobe zum DHWDaF 2 können lediglich besonders 2 , etwas 2 und nicht 1 als Partikeln bestimmt werden. Mit diesen drei Types erreichen die Partikeln immerhin einen Anteil von 0,25 Prozent (vgl. Abb. 27a). Dieser steigt bei den Tokens auf einen Wert von 1,32 Prozent, was vor allem auf die häufige Verwendung der Negationspartikel nicht 1 zurückführbar ist (vgl. Abb. 27b). Demzufolge liegt die Verwendungshäufigkeit der Partikeln mit 16,67-mal weit über dem wortartenunabhängigen Durchschnitt (vgl. Abb. 28). Bei den Synsemantika liegen die Partikeln mit diesem Wert auf einem mittleren Platz. Ein Vergleich der beiden untersuchten Wörterbücher zeigt bei den Partikeln ebenfalls große Übereinstimmungen - die Werte liegen sowohl bei den Types als auch bei den Tokens extrem niedrig, sind in beiden Wörterbüchern aber fast identisch. Letzteres gilt auch für ihre Verwendungshäufigkeit. Wie alle anderen synsemantischen Wortarten verfügen die Präpositionen über einen recht niedrigen Anteil bei den Types der untersuchten Definitionen. Im DHWDaF 2 werden insgesamt 33 Präpositionen verwendet, was einer relativen Häufigkeit von 2,70 Prozent entspricht (vgl. Abb. 27a). Durch die weit überdurchschnittliche Verwendungshäufigkeit von 14,18-mal machen die Präpositionen im DHWDaF 2 bei den Tokens immerhin 12,33 Prozent der auftretenden Lexeme aus (vgl. Abb. 27b, 28). Dies entspricht fast dem Wert, Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 220 den die Adjektive erreichen. Für die Präpositionen kann somit ebenfalls festgehalten werden, dass die Stichproben beider Wörterbücher nicht nur in der Tendenz, sondern selbst in den Werten große Ähnlichkeiten aufweisen. Bei den Types stimmen die Anteile zwischen dem LTWDaF 2 und dem DHW- DaF 2 beinahe überein, bei den Tokens unterscheiden sie sich lediglich um zwei Prozent. Die Verwendungshäufigkeit liegt im LTWDaF 2 nur geringfügig höher als im DHWDaF 2. Die letzte der acht Wortarten ist die Junktion, die erneut das für die Synsemantika typische Verhalten zeigt. In den untersuchten Definitionen des DHW- DaF 2 finden nicht mehr als 14 Junktionen Verwendung, was den geringen Anteil von 1,15 Prozent an allen Types erklärt (vgl. Abb. 27a). Dieser Wert erhöht sich bei den Tokens auf 7,09 Prozent (vgl. Abb. 27b). Erneut kann zur Illustration dieses Phänomens die Verwendungshäufigkeit herangezogen werden, die bei den Junktionen 19,21 beträgt (vgl. Abb. 28). Damit nehmen die Junktionen hinter den Pronomen und Artikelwörtern den zweiten Platz ein. Eine Gegenüberstellung von LTWDaF 2 und DHWDaF 2 spiegelt ganz deutlich die unterschiedliche Struktur der Definitionen in beiden Wörterbüchern wider, die am Ende dieses Kapitels näher erläutert wird. Die Werte für die Junktionen bei den Types sind im LTWDaF 2 und im DHWDaF 2 fast identisch. Bei den Tokens - und damit verbunden bei der Verwendungshäufigkeit - ergeben sich allerdings wörterbuchspezifische Unterschiede, die zu einem höheren Anteil der Junktionen bei den Tokens des LTWDaF 2 führen. Abb. 28: Die wortartenspezifische Verwendungshäufigkeit im DHWDaF 2 Verwendungshäufigkeit Wortart Wörterbuchanalyse 221 Zusammenfassend fallen in Bezug auf die Wortarten am stärksten die Ähnlichkeiten im Definitionswortschatz zwischen dem LTWDaF 2 und dem DHWDaF 2 auf (vgl. Abb. 23, 26). So liegt der Anteil der synsemantischen Types bei rund sieben Prozent. Bei den Tokens erhöht er sich auf rund die Hälfte der verwendeten Tokens, was durch die extrem hohe Verwendungshäufigkeit der Synsemantika hervorgerufen wird. Vor allem die Übereinstimmungen in den Häufigkeiten der einzelnen Wortarten bei den Types sind überwältigend: Partikeln, Junktionen, Pronomen und Artikelwörter, Präpositionen sowie Adverbien unterscheiden sich in beiden Wörterbüchern in weniger als einem Prozentpunkt voneinander, Adjektive und Verben weisen eine Abweichung von unter zwei Prozent auf, bei den Substantiven schließlich beträgt die Differenz weniger als drei Prozentpunkte (vgl. Abb. 24a, 27a). Aber auch bei den Tokens überwiegen die Gemeinsamkeiten. Bei allen Wortarten liegen die Abweichungen unter fünf Prozent, bei fünf von acht Wortarten - Partikeln, Adverbien, Verben, Präpositionen und Adverbien - sogar unter drei Prozent (vgl. Abb. 24b, 27b). Immer dort, wo sich zwischen den beiden analysierten Wörterbüchern Unterschiede ergeben, liegen diese in der bereits angesprochenen andersartigen Definitionsstruktur begründet. Die Definitionen des DHWDaF 2 zeichnen sich durch ihre Knappheit und den eher synonymischen Charakter aus, sie sind syntaktisch nicht so stark gegliedert wie die Definitionen des LTWDaF 2. Dementsprechend sind die Definitionen des LTWDaF 2 umfangreicher. Außerdem besitzen sie im Vergleich zu den Definitionen des DHWDaF 2 eine stärker satzähnliche Struktur, die viel häufiger von Nebensätzen Gebrauch macht (vgl. Kap. 3.4.2.1.1). Folgende Beispiele aus der Stichprobe belegen dies anschaulich: Analyse wird im DHWDaF 2 als ‘Untersuchung des Aufbaus, der Zusammensetzung von etwas’ definiert, im LTWDaF 2 hingegen als ‘eine genaue Untersuchung, bei der etwas in seine kleinsten oder wichtigsten (Bestand-)Teile zerlegt wird’. Im DHWDaF 2 lautet die Definition von mollig ‘(von Personen) etwas dick, rund’, im LTWDaF 2 1. ‘ein bisschen dick, aber nicht so, dass es unangenehm wirkt’ und 2. ‘weich und warm’. Mithilfe der durchgeführten Untersuchung zur Verteilung der einzelnen Wortarten in den Definitionen der beiden Wörterbücher lassen sich die beschriebenen Besonderheiten nicht nur mit einzelnen Beispielen illustrieren, sondern empirisch nachweisen. Beim durchschnittlichen Umfang der Definitionen geht dies besonders leicht - im DHWDaF 2 umfasst eine Definition im Mittelwert 5,88 Wörter, wohingegen sie im LTWDaF 2 aus durchschnittlich 8,23 Wörtern besteht und damit fast um die Hälfte länger ist (vgl. Kap. 3.3.1.1 und Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 222 Kap. 3.3.1.2). Die erwähnte knappere Struktur der Definitionen im DHW- DaF 2 mit weniger Nebensätzen führt dazu, dass dort bei den Tokens die Autosemantika ein stärkeres Gewicht erhalten als im LTWDaF 2. So erklärt sich, warum im DHWDaF 2 knapp sieben Prozent mehr autosemantische Tokens vorhanden sind als im LTWDaF 2. Dies betrifft vor allem die Substantive und die Adjektive, in geringerem Maß auch die Verben. Im Gegenzug tauchen in den Definitionen des DHWDaF 2 viel weniger Pronomen und Artikelwörter sowie Junktionen auf. Auch dieses Phänomen ist ein Beweis für die nebensatzarme Struktur der Definitionen des DHWDaF 2, da Relativpronomen und Junktionen beispielsweise der Verknüpfung von Haupt- und Nebensätzen dienen. Ein weiteres Indiz für den knapperen und stärker synonymisch geprägten Definitionsstil des DHWDaF 2 sind dessen grundsätzlich niedrigere Verwendungshäufigkeiten. Im DHWDaF 2 wird jedes Type im Durchschnitt 3,11-mal verwendet, im LTWDaF 2 hingegen 4,90-mal (vgl. Abb. 25, 28). Bei den Synsemantika - hier sind die Unterschiede bei den Verwendungshäufigkeiten zwischen den beiden Wörterbüchern besonders groß - werden die Types im LTWDaF 2 im Mittelwert 34,83-mal verwendet, im DHWDaF 2 lediglich 20,13-mal. Auch dies kann als Indiz dafür gelten, dass die Definitionen des DHWDaF 2 weniger den Charakter von Texten besitzen als die Definitionen des LTWDaF 2. Denn die Synsemantika als weitgehend geschlossene Wortklassen wiederholen sich mit ihren wenigen Types in ihrer Verwendung umso häufiger, je stärker der Text syntaktisch gegliedert ist. Trotzdem gilt für beide Wörterbücher, dass die von Thom aufgestellte Reihenfolge der abnehmenden semantischen Dichte der autosemantischen Wortarten - vom Substantiv über das Adjektiv und das Verb zum Adverb - mit der zunehmenden Verwendungshäufigkeit korrespondiert (vgl. Thom 1975, S. 327 und Kap. 3.3.2.1.2). 3.3.2.2 Herkunft 3.3.2.2.1 Bestimmung der Herkunft Das Vokabular, das in den Definitionen der Stichprobe Verwendung findet, wird auch in Bezug auf seine Herkunft untersucht. Hier müssen ebenfalls zunächst geeignete Kriterien der Analyse festgelegt werden. Eine mögliche Differenzierung des Lexikons besteht in der Einteilung in Fremdwörter und Erbwörter, die sich durch ihre Herkunft und den Grad ihrer Anpassung an die sprachsystematischen Regularitäten des Deutschen unterscheiden. Der Lehnwortschatz befindet sich zwischen diesen beiden Polen - mit den Fremdwörtern verbindet ihn die Herkunft aus einer anderen Sprache, mit den Erbwörtern seine Angepasst- Wörterbuchanalyse 223 heit an die Regeln des deutschen Sprachsystems. So definiert das Metzler Lexikon Sprache den Terminus Lehnwort beispielsweise als „lexikalische Entlehnung, die (im Unterschied zum Fremdwort) weitgehend in das phonologische, morphologische und graphematische System der Nehmersprache integriert ist“ (Metzler Lexikon Sprache 2010, S. 392). Von ihrer Herkunft sind die Lehnwörter Fest und sportlich beispielsweise lateinischen bzw. englischen Ursprungs. Das lässt sich jedoch nur noch mit etymologischem Hintergrundwissen erkennen. Ein solches, rein sprachhistorisch-etymologisches Herangehen bietet sich in der vorliegenden Arbeit aufgrund der damit verbundenen diachronischen Sichtweise nicht an. Denn im Zentrum des Interesses steht vielmehr der synchrone Blick heutiger Sprecher und die Frage, wie stark das verwendete Definitionsvokabular in das Sprachsystem des Deutschen integriert ist. Aus diesen Gründen wird in der Untersuchung zwischen nativen und nicht nativen Lexemen unterschieden. In Anlehnung an Wurzel gilt an dieser Stelle: Native Wörter sind (völlig unabhängig von ihrer Herkunft) solche Wörter, die den generellen grammatischen Regularitäten des Deutschen entsprechen; nicht native Wörter sind (wiederum ungeachtet ihrer Herkunft) solche Wörter, die diesen Regularitäten nicht entsprechen. (Wurzel 1981, S. 909) 393 In diesem Sinn zählen zu den nativen Lexemen die meisten Erbwörter sowie der Lehnwortschatz. Von einer weiteren Differenzierung nach dem Grad der Integration und damit dem Ausmaß an Nativität wird hierbei abgesehen. Unter die nicht nativen Lexeme fallen somit all jene Wörter, die den sprachsystematischen Regularitäten des Deutschen nicht vollständig folgen, also beispielsweise auch Hybridbildungen. Huneke/ Steinig (2005, S. 58) schätzen für die deutsche Sprache: „Das Verhältnis von ursprünglich deutschen Wörtern zu Wörtern, die aus einer Fremdsprache übernommen wurden, beträgt heute circa 3: 1.“ Nach welchen Kriterien sie zu dieser Aussage kommen, wird nicht erläutert. Im Einzelnen handelt es sich bei den angesprochenen sprachsystematischen Regularitäten um Erscheinungen auf der phonologischen, der graphematischen und der morphologischen Ebene sowie auf der Ebene der Wortbildung. 394 Als phonologische Merkmale für Nichtnativität gelten nach Munske die fremden 395 Phoneme (z.B. [ - ] in engagieren), die gespannten Kurzvokale 393 Vgl. auch Duden-Grammatik (2009, S. 20). 394 Vgl. bes. Munske (1988, S. 52ff.) und Duden-Grammatik (2009, S. 19f.). Im Einzelnen vgl. Duden-Grammatik (2009, S. 19f., 42f., 56, 59f., 64f., 69, 89ff., 94, 187f.), außerdem Munske (1997, S. 76ff.), Altmann/ Ziegenhain (2002, S. 54ff., 135 sowie Fuhrhop (2006, S. 38ff.). Fremdheitsmerkmale auf der semantischen und der sprachsoziologischen Ebene werden an dieser Stelle ausgeklammert, vgl. dazu Polenz (2000, S. 42f.). 395 Die Ausdrücke fremd und nicht nativ werden synonym verwendet. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 224 (z.B. [e] in Metall), phonotaktisch spezifische Vokal- und Konsonantenverbindungen (z.B. [- ts © ª finanziell oder [st] in Stil), differenzierte Nebensilbenvokale im Auslaut (z.B. [-d io] in Radio) sowie der variable Fremdwortakzent (z.B. Familie [fa mi - familiär [fami ). Auf der graphematischen Ebene zeigen Sonderzeichen außerhalb des deutschen Alphabets (z.B. <ç> in Garçon), fremdwortspezifische Buchstaben (z.B. <y> in Baby) und spezielle Zeichenverbindungen (z.B. <rh> in rhetorisch) nicht native Lexeme an. Außerdem bestehen ungewöhnliche Phonem-Graphem-Beziehungen (z.B. [ - ]/ <en> engagieren). Im Bereich der Morphologie lässt sich fremdes Vokabular in der Morphemstruktur an der Alternierung von Konsonanten und Vokalen (z.B. Minimum) und an Morphemalternanzen (z.B. Subtraktion - subtrahieren) erkennen. Für die Flexionsmorphologie ist vor allem die Pluralbildung der Substantive auffällig. Hier kommt es bei nicht nativen Lexemen zu substituierender Pluralbildung (z.B. Zentrum - Zentren) oder verstärkt zum s-Plural (z.B. Baby - Babys). Diese Erscheinung besteht - hauptsächlich bei Kurzwörtern oder vokalisch auslautenden Wörtern - jedoch auch im deutschen Sprachsystem, als Beispiele seien hier Pkw - Pkws und Opa - Opas genannt. Zu diesen drei Bereichen (Phonologie, Graphematik und Morphologie), für deren Erscheinungen sich in der Literatur einige Auflistungen finden, wird an dieser Stelle noch die Wortbildung hinzugefügt. Denn Muttersprachler nehmen Lexeme auch dann als nicht heimisch wahr, wenn - bei Wortbildungsprodukten - charakteristische Affixe verwendet werden (z.B. inbei indirekt) oder wenn - beim primären Wortschatz - in der Wortfamilie solche Affixe dominieren (z.B. Text - textuell, Textur). Der Grund hierfür liegt in den bestehenden „Restriktionen in der Verbindbarkeit nativer und fremdsprachlicher Einheiten“ (Duden-Grammatik 2009, S. 685), solange die Fremdelemente nicht in das indigene System integriert sind. Nach diesen vier Kriterien werden alle Lexeme der Stichprobe untersucht und mit der Annotation nativ oder nicht nativ versehen. Auch hier besteht trotz der transparenten Aufzählung der Merkmale immer noch ein subjektives Moment bei der Beurteilung von Nativität. 3.3.2.2.2 Analyse des LTWDaF 2 Nach dem soeben beschriebenen Vorgehen erhalten von den insgesamt 1 342 Wörtern, die in der Stichprobe der Untersuchung im LTWDaF 2 verwendet werden, 189 aufgrund von Besonderheiten auf der phonologischen, graphematischen, morphologischen Ebene oder auf der Ebene der Wortbildung die Wörterbuchanalyse 225 Annotation nicht nativ. Das entspricht einem prozentualen Anteil von 14,08 Prozent bei den in den Definitionen der Stichprobe des LTWDaF 2 verwendeten Types. 396 In der Datensammlung A.2.7.1 sind diese Wörter aufgelistet und die Art ihrer Besonderheit hervorgehoben. Mehrfachzuordnungen sind selbstverständlich möglich: System besitzt auf der phonologischen, der morphologischen und auf der Wortbildungsebene nicht native Eigenschaften. Auf je mehr Ebenen ein Lexem über Besonderheiten verfügt, desto auffälliger ist es in Bezug auf seine Herkunft für den deutschen Muttersprachler. So wird Volumen beispielsweise in viel höherem Maß als fremd empfunden als Bus, von den heimischen Regularitäten weicht Ministerium viel stärker ab als Trick. A Anzahl der Lexeme Ebenen des Sprachsystems bb. 29: Die Abweichung der nicht nativen Lexeme auf den einzelnen Ebenen des Sprachsystems im LTWDaF 2 In Abbildung 29 wird deutlich, dass die Mehrzahl der nicht nativen Lexeme auf mehreren Ebenen von den Regularitäten des deutschen Sprachsystems abweicht. Von der Gesamtzahl der 189 als nicht nativ annotierten Elemente verfügen 183, also 96,83 Prozent, über Besonderheiten im Bereich der Phonologie. Auf der Ebene der Graphematik sind es 127 Elemente (67,20 Prozent). Am seltensten kommen mit 42 Fällen (22,22 Prozent) morphologische Irregularitäten vor. Auf der Wortbildungsebene dominiert bei fast allen Elementen die Kombination mit ebenfalls nicht heimischen Suffixen, insgesamt bei 175 von 189 Lexemen, also bei 92,59 Prozent. Offensichtlich verhalten sich die einzelnen Ebenen des Sprachsystems unterschiedlich strikt, wenn es um die Integration nicht nativer Lexeme geht. Der Bereich der Morphologie integriert 396 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 226 stark in das heimische System. Dagegen handelt es sich bei der Phonologie und bei der Wortbildung eher um offene Bereiche mit einer Tendenz, nicht heimische Erscheinungen eher zuzulassen. 397 a) Types b) Tokens Abb. 30: Die Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Types (a) und bei den Tokens (b) im LTWDaF 2 Auch beim Merkmal der Herkunft unterscheiden sich die Anteile des Definitionswortschatzes je nach Art der Zählung. Der recht hohe Anteil der nicht nativen Lexeme am verwendeten Definitionsvokabular von 14,08 Prozent betrifft die verwendeten Types in der Stichprobe im LTWDaF 2 (vgl. Abb. 30). Bei den Tokens erreichen die fremden Lexeme im LTWDaF 2 eine absolute Häufigkeit von 369, was bei einer Gesamtzahl von 6 572 Tokens in der Stichprobe einer relativen Häufigkeit von 5,61 Prozent entspricht (vgl. Abb. 30). Diese Erkenntnis bestätigt sich anschaulich, wenn man die Häufigkeit der Verwendung der einzelnen Lexeme betrachtet (vgl. Abb. 31). Die nativen Lexeme des LTWDaF 2 werden im Mittelwert 5,38-mal gebraucht. Für die nicht nativen Lexeme liegt die durchschnittliche Verwendungshäufigkeit mit 1,95-mal hingegen viel niedriger. Als Erklärungsmuster dient die im Kapitel 3.3.2.1.2 vorgestellte Markiertheitstheorie: Der nicht native Definitionswortschatz ist aufgrund seiner Herkunft auffällig und wird deshalb in den Definitionen seltener verwendet als der native Definitionswortschatz. 397 So kommt auch Heimbecher (2007) zu dem Schluss, Integration sei „kein Entweder-oder- Zustand, sondern ein Prozess, der auf verschiedenen Ebenen unterschiedlich verlaufen“ könne. Zur Rolle der Internationalismen in den Definitionen einsprachiger Lernerwörterbücher vgl. Herbst (1986, S. 115f.), Whitcut (1986, S. 121), Jehle (1990b, S. 504), Herbst/ Klotz (2003, S. 52), Wellmann (2004, S. 99f.) sowie Kapitel 2.3.2, 3.1.1 und 3.4.2.2.2, Anm. 436. Wörterbuchanalyse 227 Herkunft Verwendungshäufigkeit Abb. 31: Die Verwendungshäufigkeit nach Herkunft im LTWDaF 2 3.3.2.2.3 Analyse des DHWDaF 2 In Bezug auf die Herkunft der in den Definitionen der Stichprobe verwendeten Lexeme werden für das DHWDaF 2 wiederum die gleichen Untersuchungen angestellt wie für das LTWDaF 2. Die Ergebnisse werden nachfolgend vergleichend zum LTWDaF 2 präsentiert. Von den 1 221 Types der DHWDaF 2-Stichprobe werden 122 mit der Annotation nicht nativ versehen, was einem prozentualen Anteil von 9,99 Prozent entspricht. 398 Die Abweichungen zu den heimischen Lexemen treten auch hier auf der Ebene der Phonologie, der Graphematik, der Morphologie und der Wortbildung auf. In der Datensammlung A.2.7.2 ist aufgeführt, welche Types sich auf welcher Ebene des Sprachsystems von den nativen Lexemen abheben. Die Mehrheit der Types zeigt dabei Besonderheiten auf mehreren Ebenen. Je mehr Ebenen von den Abweichungen betroffen sind, umso mehr steigt beim Muttersprachler die empfundene Fremdheit. So sind Pass oder Masse, die sich lediglich auf der Ebene der Wortbildung fremd verhalten, hinsichtlich ihrer Herkunft viel weniger auffällig als beispielsweise Mineral oder explodieren, die auf allen vier Sprachebenen Abweichungen aufweisen. Von den insgesamt 122 nicht nativen Types zeigt der überwiegende Teil - nämlich jeweils 110 Types bzw. 89,43 Prozent - Besonderheiten auf der Ebene der Phonologie und/ oder der Wortbildung (vgl. Abb. 32). Auf den anderen beiden Sprachebenen sind die Abweichungen vom heimischen System seltener. So verfügen nur 56 der nicht 398 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 228 nativen Types (45,53 Prozent) über Auffälligkeiten auf der graphematischen Ebene. Im Bereich der Morphologie sind es 35,52 Prozent (40 Types). Wie bereits für das LTWDaF 2 beschrieben, sind die einzelnen sprachlichen Ebenen fremden Elementen gegenüber unterschiedlich offen (vgl. Kap. 3.3.2.1.2). Morphologie und Graphematik gehören dabei zu den stärker integrierenden und angleichenden Ebenen, Wortbildung und Phonologie hingegen lassen fremde Elemente eher zu. Zwischen den beiden analysierten Wörterbüchern bestehen dabei erstaunliche Ähnlichkeiten, was die Anteile auf den einzelnen sprachlichen Ebenen betrifft (vgl. Abb. 29, 32). So besitzen die phonologische Ebene und die der Wortbildung sowohl im DHWDaF 2 als auch im LTWDaF 2 sehr hohe Werte von rund 90 Prozent. Die graphematische und die morphologische Ebene folgen mit jeweils größerem Abstand. Anzahl der Lexeme Ebenen des Sprachsystems Abb. 32: Die Abweichung der nicht nativen Lexeme auf den einzelnen Ebenen des Sprachsystems im DHWDaF 2 Der Anteil der nicht nativen Lexeme am gesamten Definitionswortschatz der Stichprobe zum DHWDaF 2 unterscheidet sich sehr stark, je nachdem, ob die Häufigkeit des Gebrauchs der einzelnen Types mit berücksichtigt wird oder nicht (vgl. Abb. 33). Beim überwiegenden Teil der 1 221 Types, die in den DHWDaF 2-Definitionen verwendet werden, handelt es sich um heimische Lexeme. Lediglich 9,99 Prozent erhält dort die Annotation nicht nativ. Bei den Tokens fällt das Ergebnis noch deutlicher zugunsten der nativen Lexeme aus. Sie erreichen dort eine relative Häufigkeit von 94,91 Prozent. Die relative Wörterbuchanalyse 229 Häufigkeit der nicht nativen Lexeme halbiert sich von 9,99 Prozent bei den Types auf 5,09 Prozent bei den Tokens. a) Types b) Tokens Abb. 33: Die Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Types (a) und bei den Tokens (b) im DHWDaF 2 Die Unterschiede zwischen den Anteilen von nativen und nicht nativen Lexemen bei den Types und bei den Tokens spiegeln sich erneut in den Werten zur Gebrauchshäufigkeit wider (vgl. Abb. 34). Die Verwendungshäufigkeit der fremden Lexeme ist im DHWDaF 2 mit 1,58-mal nur halb so hoch wie der allgemeine Durchschnittswert von 3,11-mal. Die heimischen Lexeme werden im DHWDaF 2 im Mittelwert 3,28-mal verwendet, also leicht überdurchschnittlich oft. Diese Häufigkeitsverteilung lässt sich wiederum mit der Markiertheitstheorie begründen, nach der auffällige Wörter - hier die nicht nativen Lexeme - seltener verwendet werden als unauffällige (vgl. Kap. 3.3.2.1.2). Resümierend zeigen sich in Bezug auf die Herkunft des Definitionswortschatzes in beiden analysierten Wörterbüchern viele Gemeinsamkeiten. Der Anteil der fremden Lexeme liegt bei den Types zwischen zehn Prozent (DHW- DaF 2) und 14 Prozent (LTWDaF 2). Er halbiert sich bei den Tokens auf rund fünf bis sechs Prozent (vgl. Abb. 30, 33). Fast alle nicht nativen Lexeme verfügen auf der Ebene der Phonologie und der Wortbildung über Fremdheitsmerkmale, auf der graphematischen und der morphologischen Ebene sind die Werte hingegen viel geringer (vgl. Abb. 29, 32). Auch bei den Gebrauchshäu- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 230 figkeiten stimmen die Daten für die beiden Wörterbücher zu großen Teilen überein. In den absoluten Werten liegt das LTWDaF 2 zwar immer über den Werten des DHWDaF 2, betrachtet man jedoch die Relationen der einzelnen Werte zur Verwendungshäufigkeit untereinander, zeigen sich große Übereinstimmungen - die nicht nativen Lexeme werden nur rund halb so oft gebraucht wie der Durchschnitt, die heimischen Lexeme dagegen leicht überdurchschnittlich oft (vgl. Abb. 31, 34). Herkunft Verwendungshäufigkeit Abb. 34: Die Verwendungshäufigkeit nach Herkunft im DHWDaF 2 3.3.2.3 Wortbildung 3.3.2.3.1 Bestimmung der Wortbildungsarten Das nächste Merkmal, nach dem das in den Definitionen der Stichprobe verwendete Vokabular untersucht wird, ist die Wortbildung. Im Rahmen der vorliegenden Untersuchung interessiert in erster Linie die Frage der Wortgebildetheit, also ob es sich bei dem vorkommenden Definitionswortschatz um Ergebnisse von Wortbildungsprozessen handelt oder nicht. Von Wortbildung spricht man bei den autosemantischen Wortarten Substantiv, Verb, Adjektiv und Adverb (vgl. Duden-Grammatik 2009, S. 641). Der Prozess der Entstehung neuer Synsemantika wie mithilfe oder derselbe wird an dieser Stelle nicht betrachtet. Bei der Untersuchung der Wortbildung wird deshalb zuerst zwischen synsemantischen und autosemantischen Wortarten differenziert, wie aus der Abbildung 35 hervorgeht. Bei den Autosemantika wird Wörterbuchanalyse 231 auf einer ersten Ebene zwischen primären und sekundären Lexemen unterschieden. Bei den sekundären Lexemen wird weiter differenziert. Nur bei morphosemantischer Motivation, „wenn sich also die Bedeutung der Wortbildung noch aus den Ausgangseinheiten erschließen lässt“ (Duden-Grammatik 2009, S. 634), werden die Lexeme weiter nach den Wortbildungsarten unterteilt. Diese Entscheidungen erfolgen aus rein synchroner Perspektive. In den Fällen, in denen sich dieser Bezug synchron entweder semantisch und/ oder morphologisch nicht mehr herstellen lässt, werden die Lexeme als demotiviert bezeichnet. So ist Tatsache beispielsweise morphologisch als Kompositum aus Tat und Sache noch vollkommen durchsichtig, die Bedeutung ‘Fakt’ kann jedoch nicht aus den beiden unmittelbaren Konstituenten abgeleitet werden. Bei Behörde kann aufgrund der Struktur noch erahnt werden, dass es sich um ein sekundäres Wort handelt, der Untergang des Basisverbs behören mit der Bedeutung ‘zu etwas gehören’ führt allerdings zu einer morphosemantischen Isolation dieses Wortbildungsproduktes. Beide Fallgruppen erhalten die Annotation demotiviert. Abb. 35: Das Vorgehen bei der Bestimmung der Wortbildungsarten Auch bei der Abgrenzung von Entlehnungen und Fremdwortbildung wird synchron vorgegangen. Ist das nicht native Lexem morphosemantisch noch transparent, wird von einer Bildung im Deutschen ausgegangen und dementsprechend analysiert, beispielsweise indirekt als deadjektivische Präfixderivation Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 232 (und nicht als mögliche Entlehnung des lateinischen indirectus oder des englischen und französischen indirect) (vgl. Duden-Grammatik 2009, S. 637). Wortbildungsprodukte einer Fremdsprache, die im Deutschen nicht transparent sind, erhalten die Markierung primär. Beispielsweise empfindet der deutsche Durchschnittsprecher ohne Kenntnisse des Lateinischen das Wort Komparativ nicht als Wortbildungsprodukt. Selbstverständlich können Sprecher bei einer solchen Wortbildungsanalyse zu anderen Urteilen über die Motiviertheit einzelner Wörter kommen, da Sprecherurteile über den Motivationsgrad von Wortbildungen in Abhängigkeit nicht nur von sprachhistorischen Kenntnissen, sondern auch von der Ausprägung des individuellen Sprachvermögens und Sachwissens unterschiedlich ausfallen können. (Duden-Grammatik 2009, S. 637f.) Die Zuordnungen der einzelnen Elemente des analysierten Definitionswortschatzes, wie sie in der Datensammlung B.2 aufgeführt werden, sind aufgrund der nicht vollständig zu vermeidenden Subjektivität auch beim Merkmal der Wortbildung eher als Vorschlag zu verstehen denn als unverrückbare Gegebenheit. Das Ergebnis soll stärker eine grundsätzliche Richtung widerspiegeln. 3.3.2.3.2 Merkmale des untersuchten Definitionswortschatzes 3.3.2.3.2.1 Analyse des LTWDaF 2 Wie im Kapitel 3.3.2.3.1 beschrieben, werden bei der Analyse der Wortbildung allein die Autosemantika untersucht. Auch an dieser Stelle werden zwei Arten der Zählung unterschieden, die der Tokens und die der Types, je nachdem, ob die Verwendungshäufigkeit der einzelnen Lexeme mit eingerechnet wird oder nicht. Die Types der Untersuchung zum Definitionswortschatz im LTWDaF 2 enthalten insgesamt 1 246 Autosemantika (vgl. Kap. 3.3.2.1.2). 399 Von diesen Autosemantika können 417, also 33,47 Prozent, als primär bezeichnet werden (vgl. Abb. 36a). Die restlichen zwei Drittel des auftretenden Definitionswortschatzes sind Ergebnisse von Wortbildungsprozessen. Hier wird weiter zwischen den heute noch durchsichtigen und den demotivierten Lexemen differenziert. Bei Letzteren ist die morphosemantische Motivation verloren gegangen und synchron nicht mehr vorhanden. Das betrifft insgesamt 96 Types - immerhin 7,70 Prozent. Die verbleibenden 58,83 Prozent (733 Lexeme) sind synchron morphosemantisch motiviert. 399 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Wörterbuchanalyse 233 a) b) Abb. 36: Die Verteilung der autosemantischen Types nach Wortgebildetheit (a) und die Verteilung der Wortbildungsarten bei den motivierten autosemantischen Types (b) im LTWDaF 2 Sie können weiter nach ihrer Wortbildungsart untersucht werden (vgl. Abb. 36b). Mehr als die Hälfte dieser 733 Lexeme sind Derivate (54,43 Prozent, insgesamt 399 Lexeme). Die zweithäufigste Wortbildungsart beim autosemantischen Definitionswortschatz der Untersuchung am LTWDaF 2 ist die Konversion mit 171 Lexemen und einem Anteil von 23,33 Prozent. Die beiden Gruppen der substantivischen Konversion von Adjektiven und des Infinitivs werden hervorgehoben, da ihre Zugehörigkeit zur Wortart Substantiv nicht unumstritten ist (vgl. Kap. 3.3.2.1.1). Im Datenmaterial des LTWDaF 2 tauchen folgende 29 Infinitivkonversionen auf: das Anerkennen, das Angreifen, das Annehmen, das Benutzen, das Eintreffen, das Erstaunen, das Essen, das Fernsehen, das Kochen, das Leben, das Misstrauen, das Missverstehen, das Pokern, das Rechnen, das Schlafen, das Schneiden, das Schreiben, das Treffen, das Trennen, das Tun, das Unternehmen 2 , das Verhalten, das Verlieren 1 , das Vermitteln, das Versehen, das Verstehen, das Wegnehmen, das Weitergeben und das Zögern. 400 Schröder (1997, S. 141) beschreibt, dass die Infinitivkonversion in den Definitionen des LWB 1 häufig genutzt wird und führt dies 400 Bei dem Substantiv Schaden, das formal einer Infinitivkonversion entspricht, handelt es sich um das ahd. Simplex scado und nicht um eine Konversion des Verbs schaden. Sichtbar ist dies heute noch an der veralteten Form der Schade sowie am maskulinen Genus von Schaden. Die deverbalen Substantivkonversionen werden im Kapitel 3.3.2.3.3.1 noch einmal unter dem Aspekt der Lemmatisierung im LTWDaF 2 thematisiert. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 234 auf deren „Status als KVP [Konversionsprodukt, A.T.] zwischen Schon-Substantiv und Noch-Verb“ zurück. An deadjektivischen Konversionen sind für das LTWDaF 2 folgende 21 zu nennen, die Angabe des Genus richtet sich hier nach der Verwendung in den Definitionen der Stichprobe: das Angenehme, das Bestimmte, der/ die Betroffene, das Blau, der Erste, der Erwachsene, das Folgende, das Ganze, das Genannte, das Gesagte, das Gleiche, der Nächste, das Negative, das Neue, das Normale, das Nützliche, das Positive, das Rot, das Schlimme, das Technische und der Übrige. 401 Diese Konversionsprodukte haben sich semantisch in unterschiedlichem Maß von ihren Basen entfernt - das Essen beispielsweise stärker als das Schlafen, der Erwachsene stärker als das Positive. 402 Auf die Konversion folgt als nächste Wortbildungsart die Komposition mit einer relativen Häufigkeit von 14,19 Prozent (104 Types). Immerhin 55 Lexeme sind Produkte der Partikelverbbildung, was einem Anteil von 7,50 Prozent entspricht. Kurzwörter gibt es insgesamt vier, ihre relative Häufigkeit beträgt 0,55 Prozent. Die 1 246 autosemantischen Types der Untersuchung zum LTWDaF 2 werden insgesamt 3 228-mal verwendet. Bei der Betrachtung der Tokens ergeben sich im Vergleich zu den Types starke Verschiebungen (vgl. Abb. 37). So nehmen die primären Autosemantika mit 1 563 Tokens einen Anteil von 48,42 Prozent ein. Ist bei den Types nur ein Drittel der Autosemantika primär, erhöht sich ihr Anteil bei den Tokens damit auf knapp die Hälfte des verwendeten Definitionswortschatzes (vgl. Abb. 37a). Die andere Hälfte der verwendeten Tokens ist auf Wortbildungsprozesse zurückführbar. Der Anteil der demotivierten Lexeme bei den autosemantischen Tokens liegt mit 6,32 Prozent (204 Tokens) dabei nur unwesentlich niedriger als bei den Types. Die restlichen 1 461 Tokens der Autosemantika (45,26 Prozent) verfügen synchron über eine morphosemantische Motivation. Bei ihnen kann im Folgenden die Verteilung nach der Wortbildungsart untersucht werden (vgl. Abb. 37b). An der Häufigkeitsreihenfolge der einzelnen Wortbildungsarten ändert sich bei den Autosemantika im Vergleich zu den Types nichts - die Derivation kommt am häufigsten vor, gefolgt von Konversion, Komposition, Partikelverbbildung und Kurzwortbildung. Allerdings verschieben sich die relativen Häufigkeiten leicht zugunsten der häufigsten Wortbildungsart (Derivation) und der Partikelverbbildung. Die Derivation nimmt bei den autosemantischen Tokens mit 862 Elementen einen Anteil von 59,00 Prozent ein. Der Anteil der Konversion 401 Aus der Perspektive der Lemmatisierung im LTWDaF 2 werden die deadjektivischen Substantivkonversionen im Kapitel 3.3.2.3.3.1 vorgestellt. 402 Bei den semantisch eigenständigen Konversionen ist die Wahrscheinlichkeit höher, dass sie im LTWDaF 2 lemmatisiert sind, wie das Treffen oder der Erwachsene. Wörterbuchanalyse 235 sinkt hingegen auf 19,92 Prozent (291 Tokens). Auf die Komposition entfällt noch eine relative Häufigkeit von 10,68 Prozent (156 Tokens), fast genauso viel wie auf die Partikelverbbildung, deren Anteil auf 10,06 Prozent (147 Tokens) steigt. Die seltenste Wortbildungsart ist wiederum die Kurzwortbildung mit fünf Tokens, was einem Anteil von 0,34 Prozent entspricht. a) b ) Abb. 37: Die Verteilung der autosemantischen Tokens nach Wortgebildetheit (a) und die Verteilung der Wortbildungsarten bei den motivierten autosemantischen Tokens (b) im LTWDaF 2 Diese Zahlen lassen sich sehr anschaulich mit einer Analyse der Verwendungshäufigkeit der einzelnen autosemantischen Types des Definitionswortschatzes der Stichprobe zum LTWDaF 2 verdeutlichen (vgl. Abb. 38). Bei den Autosemantika liegt die durchschnittliche Verwendungshäufigkeit eines Types bei 2,59 (Synsemantika 34,83). Autosemantika, die Ergebnisse von Wortbildungsprozessen sind, werden im Mittelwert noch seltener verwendet, egal, ob sie bereits demotiviert sind oder ob die morphosemantische Motivation noch vorhanden ist. Die demotivierten Lexeme werden dabei allerdings mit durchschnittlich 2,13-mal noch häufiger gebraucht als die morphosemantisch motivierten Lexeme, die im Mittelwert lediglich 1,99-mal verwendet werden. Über dem Durchschnitt liegen wiederum die nach der Markiertheitstheorie unauffälligen Lexeme, in dem Fall die morphologisch unauffälligen primären Lexeme, die bei den Autosemantika im Mittelwert 3,75-mal gebraucht werden (vgl. Kap. 3.3.2.1.2). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 236 Wortgebildetheit Verwendungshäufigkeit Abb. 38: Die Verwendungshäufigkeit der Autosemantika nach Wortgebildetheit im LTWDaF 2 Wortbildungsart Verwendungshäufigkeit Abb. 39: Die Verwendungshäufigkeit der motivierten Autosemantika nach Wortbildungsarten im LTWDaF 2 Auch für die einzelnen Wortbildungsarten lassen sich die Anteile mit den Verwendungshäufigkeiten illustrieren (vgl. Abb. 39). Drei Wortbildungsarten liegen unter dem Durchschnittswert der motivierten Autosemantika: Die Verwendungshäufigkeit der Kurzwörter liegt mit 1,25-mal am niedrigsten, gefolgt von der Komposition (1,50-mal) und der Konversion (1,70-mal). Überdurch- Wörterbuchanalyse 237 schnittlich häufig werden Derivate (2,16-mal) und Partikelverben (2,67-mal) gebraucht. Die Derivation und die Partikelverbbildung sind demzufolge formal oder semantisch weniger auffällige Wortbildungsarten als Kurzwortbildung, Komposition und Konversion, wenn man die Markiertheitstheorie aufgreift (vgl. Kap. 3.3.2.1.2). 3.3.2.3.2.2 Analyse des DHWDaF 2 Für die Analyse des Definitionswortschatzes der Stichprobe des DHWDaF 2 hinsichtlich der Wortbildung werden für die Autosemantika zuerst die Ergebnisse zum DHWDaF 2 präsentiert, bevor sie anschließend den Daten des LTW- DaF 2 gegenübergestellt werden. Unter den Types des Definitionswortschatzes im DHWDaF 2 befinden sich 322 primäre Autosemantika, die damit über eine relative Häufigkeit von 28,30 Prozent verfügen (vgl. Abb. 40). 403 Den größten Teil der Autosemantika machen mit 64,50 Prozent bzw. 734 Types die motivierten autosemantischen Types aus. Die restlichen 82 Types (7,21 Prozent) können als demotiviert betrachtet werden. Bei den Autosemantika sind somit knapp drei Viertel aller Types Ergebnisse von Wortbildungsprozessen, ein großer Teil davon kann durch seine Motiviertheit genauer analysiert werden. a) b) Abb. 40: Die Verteilung der autosemantischen Types nach Wortgebildetheit (a) und die Verteilung der Wortbildungsarten bei den motivierten autosemantischen Types (b) im DHWDaF 2 403 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 238 Die motivierten Wortbildungsprodukte sind im rechten Teil der Abbildung 40 nach ihrer jeweiligen Wortbildungsart aufgeschlüsselt. Bei gut der Hälfte der motivierten autosemantischen Types handelt es sich um Derivationen - 381 der 734 Types sind abgeleitet, das entspricht einer relativen Häufigkeit von 51,91 Prozent. Ein knappes Viertel, genauer gesagt 23,02 Prozent (169 Types), entfällt auf die Konversion, die damit die zweithäufigste Wortbildungsart ist. Im Untersuchungsmaterial zum DHWDaF 2 gibt es insgesamt folgende 49 Infinitivkonversionen: das Angreifen, das Ankommen, das Anliegen, das Anmelden, das Annehmen, das Ausbleiben, das Besorgen, das Bestehen, das Billigen, das Einsetzen, das Eintreffen, das Empfinden, das Fangen, das Fehlen, das Fernsehen, das Geschehen, das Handeln, das Kochen, das Kommen, das Leben, das Mieten, das Mischen, das Missbrauchen, das Misstrauen, das Mitteilen, das Rechnen, das Schneiden, das Schreiben, das Sichbemühen, das Sicheinsetzen, das Sprechen, das Stattfinden, das Staunen, das Tätigsein, das Treffen, das Unternehmen 1 , das Unternehmen 2 , das Verfahren, das Verlieren, das Vermischen, das Verschwinden, das Verstehen, das Verwalten, das Verzeihen, das Verzweifeltsein, das Vorhandensein, das Zusammensein, das Zusammenwirken und das Zutreffen. 404 Substantivische Konversionsprodukte, die von Adjektiven stammen, finden sich in den Definitionen der Stichprobe insgesamt 22-mal. Die Angabe des Genus erfolgt hier nach der Verwendung in den Definitionen: der/ die Angehörige, der/ die Anrufende, das Äußere, das Bestimmte, das Blau, der/ die/ das Folgende, das Ganze, das Geheime, das Genannte, das Gesagte, das Gleiche, das Herkömmliche, das Lange, das Leid, der/ die/ das Nächste, das Neue, das Rot, das Schwierige, das Unbekannte, der Verwandte, das Weitere und das Wichtigste. 405 Mit der Morgen und das Nein tauchen im Datenmaterial sogar je eine Konversion eines Adverbs und einer Partikel auf. Wie bereits beim LTWDaF 2 gilt auch für die Konversionspro- 404 Das ebenfalls in den Definitionen verwendete Lexem der Braten, das vom Äußeren her einer Infinitivkonversion gleicht, stammt vom ahd. brâto, das vom Verb braten zunächst völlig unabhängig war. Auch bei der Glauben handelt es sich nicht um eine Konversion des Infinitivs, sondern um eine Derivation, was an der häufigeren Variante der Glaube deutlich wird. Ebenso ist der Haken (ahd. hâko) nicht als Konversionsprodukt einzuordnen. Bei allen drei Lexemen ist bereits auch das maskuline Genus ein Indiz dafür, dass keine Konversionen vorliegen, da diese in der Regel ein neutrales Genus besitzen. Die deverbalen Substantivkonversionen werden im Kapitel 3.3.2.3.3.2 noch einmal unter dem Aspekt der Lemmatisierung im DHWDaF 2 thematisiert. Die semantisch selbstständigen Konversionsprodukte besitzen dabei eine stärker ausgeprägte Lexikalisierungstendenz, was Fleischer (1997, S. 53) in Bezug auf die Konstituenten von Komposita als deren „semantische Qualität“ beschreibt und als einen Faktor für Lexikalisierung heraushebt. 405 Aus der Perspektive der Lemmatisierung im DHWDaF 2 werden die deadjektivischen Substantivkonversionen im Kapitel 3.3.2.3.3.2 vorgestellt. Wörterbuchanalyse 239 dukte des DHWDaF 2, dass sie sich in ihrer Semantik unterschiedlich stark von ihren Basen entfernt haben. So sind das Unternehmen 2 oder der/ die Angehörige Beispiele für Konversionen mit einer recht eigenständigen Semantik; das Staunen oder der/ die Anrufende befinden sich hingegen semantisch noch sehr nah an ihren Basen. An dritter Stelle bei den Wortbildungsarten folgen die Komposita, die mit ihren 93 Types 12,67 Prozent der motivierten Autosemantika ausmachen. Einen fast ebenso hohen Anteil nimmt mit 11,85 Prozent (87 Types) die Partikelverbbildung ein. Die Kurzwortbildung kommt am seltensten vor, für ihre vier Types verbleiben die restlichen 0,54 Prozent. a) b) Abb. 41: Die Verteilung der autosemantischen Tokens nach Wortgebildetheit (a) und die Verteilung der Wortbildungsarten bei den motivierten autosemantischen Tokens (b) im DHWDaF 2 Bezieht man die Häufigkeit der Verwendung der einzelnen Types des DHW- DaF 2 in die Analyse ein, verschiebt sich das Bild ein wenig (vgl. Abb. 41). Der Anteil der motivierten Wortbildungsprodukte beträgt bei den autosemantischen Tokens 51,65 Prozent. 1 097 der insgesamt 2 124 in den Definitionen des DHWDaF 2 verwendeten Tokens gehören zu dieser Gruppe. Leicht ausbauen können die demotivierten Bildungen ihren Anteil, die mit 187 Tokens einen Wert von 8,80 Prozent erreichen. Die primären Autosemantika besitzen mit ihren 840 Tokens eine relative Häufigkeit von 39,55 Prozent, über zehn Prozentpunkte mehr als bei den Types. Die motivierten Tokens werden auch hier nach ihren einzelnen Wortbildungsarten aufgeschlüsselt (vgl. Abb. 41b). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 240 Die Ergebnisse dieser Sortierung bei den Tokens unterscheiden sich kaum von denen der Types. Die häufigste Wortbildungsart ist die Derivation, die ihren Anteil mit 584 von 1 097 Tokens auf 53,24 Prozent erhöhen kann. Wie bei den Types hat die Konversion den zweithöchsten Wert. Ihre relative Häufigkeit sinkt mit den 230 Tokens auf 20,97 Prozent. Die höchsten Zuwächse gibt es bei der Partikelverbbildung, deren Wert bei der Tokenzählung auf 14,04 Prozent steigt (154 Tokens). Damit ist die Partikelverbbildung die dritthäufigste Wortbildungsart bei den Tokens, die Komposition die vierthäufigste. Ähnlich wie die Konversion verliert die Komposition bei den Tokens einige Anteile gegenüber der Zählung der Types. In den Definitionen der Stichprobe gibt es 124 zusammengesetzte Tokens. Dies entspricht einer relativen Häufigkeit von 11,30 Prozent. Unverändert ist die Kurzwortbildung am seltensten. Ihre fünf Tokens erreichen einen Anteil von 0,46 Prozent an der Gesamtmenge der motivierten Wortbildungsprodukte bei den Autosemantika des untersuchten Definitionswortschatzes im DHWDaF 2. Wortgebildetheit Verwendungshäufigkeit Abb. 42: Die Verwendungshäufigkeit der Autosemantika nach Wortgebildetheit im DHWDaF 2 Die eben beschriebenen Relationen zwischen den autosemantischen Types und den Tokens hinsichtlich der Wortbildung gehen aus der Abbildung 42 und der Abbildung 43 zur Verwendungshäufigkeit deutlich hervor. Der Durchschnittswert für den Gebrauch autosemantischer Types im DHWDaF 2 liegt bei 1,87. Die motivierten Wortbildungsprodukte werden seltener verwendet (1,49-mal), was den Rückgang ihrer relativen Häufigkeit von den Types zu den Tokens veranschaulicht. Die beiden Gruppen, deren Anteile sich von den Wörterbuchanalyse 241 Types zu den Tokens erhöhen, verfügen hingegen über eine über dem Durchschnitt liegende Verwendungshäufigkeit. So werden demotivierte Bildungen im DHWDaF 2 im Mittelwert 2,28-mal verwendet. Der Wert der primären Lexeme liegt mit 2,61-mal sogar noch höher, was sich - um mit der Markiertheitstheorie zu argumentieren - aus deren geringerer Auffälligkeit erklären lässt (vgl. Kap. 3.3.2.1.2). Wortbildungsart Verwendungshäufigkeit Abb. 43: Die Verwendungshäufigkeit der motivierten Autosemantika nach Wortbildungsarten im DHWDaF 2 Die Abbildung 43 unterstützt - nach den Wortbildungsarten aufgeschlüsselt - die oben gemachten Aussagen zum Verhältnis zwischen den durch Wortbildung motivierten Types zu ihren entsprechenden Tokens im DHWDaF 2. Der durchschnittliche Wert ergibt hier eine 1,49-malige Verwendung jedes motivierten autosemantischen Types in den Definitionen der Stichprobe. Die Wortbildungsarten, deren Anteile sich von der Zählung der Types zu der der Tokens verringern, liegen unter dem Durchschnittswert. Das gilt für die Kurzwortbildung mit einem Wert von 1,25-mal, für die Komposition (1,33-malige Verwendung eines jeden Types) und für die Konversion (1,36-mal). Die beiden anderen Wortbildungsarten verfügen bei den Tokens des DHWDaF 2 über eine höhere relative Häufigkeit als bei den Types und erreichen demzufolge bei der Verwendungshäufigkeit überdurchschnittliche Werte. Die Derivation liegt mit der 1,53-maligen Verwendung ihrer Types nur leicht über dem wortbildungsartübergreifenden Mittelwert. Bei der Partikelverbbildung verdeut- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 242 licht die höchste Verwendungshäufigkeit von 1,77-mal, dass auch der Anstieg der relativen Häufigkeit von den Types zu den Tokens bei dieser Wortbildungsart am größten ist. Im Sinn der Markiertheitstheorie sind Derivation und Partikelverbbildung weniger auffällige Wortbildungsarten als Kurzwortbildung, Komposition und Konversion (vgl. Kap. 3.3.2.1.2). Hinsichtlich der Wortbildung bei den Autosemantika ergeben sich zwischen den untersuchten Wörterbüchern wiederum zahlreiche Parallelen. Die Verteilung von motivierten, demotivierten und primären Types ist im LTWDaF 2 und im DHWDaF 2 sehr ähnlich (vgl. Abb. 36a, 40a). Das LTWDaF 2 verfügt bei den autosemantischen Types lediglich über rund fünf Prozent mehr primäre Lexeme als das DHWDaF 2, die dafür bei den motivierten Types fehlen. 406 Auch in der Verteilung der Wortbildungsarten bei den Types sind sich die beiden Wörterbücher sehr ähnlich (vgl. Abb. 36b, 40b). Dies betrifft vor allem die Kurzwortbildung sowie die Konversion, deren Anteile im LTWDaF 2 und im DHWDaF 2 fast genau übereinstimmen. Die Unterschiede bei der Komposition liegen unter zwei Prozentpunkten. Allein bei den verbleibenden Wortbildungsarten gibt es kleinere Unterschiede - die Partikelverbbildung besitzt im DHWDaF 2 einen um rund vier Prozentpunkte höheren Anteil als im LTW- DaF 2. Dieser Anteil fehlt dann dementsprechend im DHWDaF 2 bei den Derivaten und bei den Komposita. Bei den Tokens verschieben sich die Anteile der primären, demotivierten und motivierten Lexeme zwischen dem LTW- DaF 2 und dem DHWDaF 2 hingegen etwas (vgl. Abb. 37a, 41a): Im LTW- DaF 2 sind beinahe zehn Prozent mehr primäre Lexeme vorhanden als im DHWDaF 2. Dafür verfügt das DHWDaF 2 über rund sechs Prozent mehr motivierte sowie über rund drei Prozent mehr demotivierte Lexeme. Die motivierten Tokens sind in den beiden Wörterbüchern bei den einzelnen Wortbildungsarten wieder fast identisch verteilt (vgl. Abb. 37b, 41b). So bestehen in den Anteilen der Tokens bei der Komposition und der Kurzwortbildung zwischen dem LTWDaF 2 und dem DHWDaF 2 Unterschiede von weniger als einem Prozentpunkt, bei der Konversion ist es fast genau ein Prozentpunkt. Die relative Häufigkeit der Partikelverben liegt im DHWDaF 2 erneut um vier Prozent höher als im LTWDaF 2, was letzteres durch einen umfangreicheren Wert bei den Derivaten ausgleicht. Die Verwendungshäufigkeiten sind zwar im LTWDaF 2 auch bei den Autosemantika nominal grundsätzlich höher als im DHWDaF 2, trotzdem bestehen in beiden Wörterbüchern bei der Wortbildung die gleichen Reihenfolgen (vgl. Abb. 38, 42). So werden die motivierten Lexeme am seltensten verwendet, gefolgt von den demotivierten. Die größte Verwendungshäufigkeit findet sich beim primären Wortschatz. Gleiches gilt 406 Zum Zusammenhang zwischen dem Anteil an Wortbildungsprodukten im Definitionswortschatz und der Deckung mit dem Grundwortschatz vgl. Kapitel 3.5.1.3. Wörterbuchanalyse 243 auch für die Aufschlüsselung nach den einzelnen Wortbildungsarten - Kurzwörter besitzen bei der Verwendungshäufigkeit den niedrigsten Wert, es folgen die Komposita, die Konversionen, die Derivate und zum Schluss die Partikelverben (vgl. Abb. 39, 43). Dies hängt mit ihrer formalen und/ oder semantischen Auffälligkeit zusammen (vgl. Kap. 3.3.2.1.2). Zusammenfassend sind im Bereich der Wortbildung vor allem die hohen Verwendungshäufigkeiten des primären Wortschatzes auffällig. Daneben bestehen in Bezug auf die Wortbildung beinahe überall Übereinstimmungen zwischen dem LTWDaF 2 und dem DHWDaF 2. 3.3.2.3.3 Merkmale des nicht verzeichneten Definitionswortschatzes 3.3.2.3.3.1 Analyse des LTWDaF 2 Jedes zehnte Type, das in den untersuchten Definitionen des LTWDaF 2 enthalten ist, geht über den Lemmabestand des Wörterbuchs hinaus, insgesamt 138 Types (vgl. Kap. 3.3.1.1). 407 Die Mehrheit dieser Types (62,32 Prozent) ist dabei an keiner Stelle im Lemmabestand enthalten, die verbleibenden 37,68 Prozent sind unter einem Glied der Wortfamilie verzeichnet. Vor allem hinsichtlich der Wortbildung weisen diese nicht verzeichneten Types einige Besonderheiten auf. a) b) Abb. 44: Die Verteilung der Wortbildungsarten im LTWDaF 2 - nicht verzeichnete Types (a) und bei der Wortfamilie verzeichnete Types (b) Wie aus der Abbildung 44a hervorgeht, setzen sich diese 86 Types zu 93 Prozent aus Wortbildungsprodukten zusammen. Lediglich bei jeweils einem Type 407 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 244 (1,16 Prozent) handelt es sich um ein primäres Lexem bzw. bei fünf Types (5,81 Prozent) um demotivierte Lexeme. Mehr als die Hälfte der Types sind Konversionen (48 Types, also 55,81 Prozent). Mit 20,93 Prozent (18 Types) nehmen die Derivate ebenfalls noch einen recht großen Anteil ein. Die Komposita verfügen über eine relative Häufigkeit von 12,79 Prozent (elf Types), auf die drei Types der Partikelverben entfallen 3,49 Prozent. Mit diesem Resultat bestätigen sich die im Kapitel 3.1.1 aufgestellten Thesen 2 und 2.1. Die These 2 geht davon aus, dass die in den Definitionen des LTW- DaF 2 verwendeten Lexeme bereits von ihrer äußeren Form über den im Anhang aufgelisteten Definitionswortschatz hinausgehen. Wie in These 2.1 vermutet, spielen Wortbildungsprodukte dabei eine besonders wichtige Rolle. Dabei muss der Prozess der Wortbildung ganz klar von dem Prozess der Lexikalisierung unterschieden werden. Es bestehen große Unterschiede in den Anteilen der einzelnen Wortbildungsarten an der Gesamtmenge der Wortbildungsprodukte und an der Gesamtmenge der nicht verzeichneten Lexeme. Das liegt an den völlig verschiedenen Gründen für die jeweiligen Anteile: Eine bestimmte Wortbildungsart besitzt dann einen hohen Anteil an der Gesamtmenge aller Wortbildungsprodukte, wenn ihre Wortbildungsmodelle besonders vielfältig ausgebaut und hochproduktiv sind. Der Anteil einer Wortbildungsart an der Gesamtmenge der nicht verzeichneten Lexeme ist hingegen dann besonders hoch, wenn diese Wortbildungsart eine niedrige Lexikalisierungsaffinität aufweist. Die einzelnen Wortbildungsarten und -modelle verfügen über sehr unterschiedliche Tendenzen zur Lexikalisierung. Wortbildungsprodukte, die hauptsächlich den Zweck der syntaktischen Rekategorisierung erfüllen, entwickeln nur eine schwache Neigung zur Lexikalisierung. 408 Hierzu zählt beispielsweise die Substantivkonversion des Infinitivs, was auch mit deren einheitlicher Wortbildungsbedeutung - der „Dominanz der vergegenständlichten Prozessbedeutung“ (Fleischer 1997, S. 50) zusammenhängt. 409 Dass die Lexikalisierungsaffinität der Konversionen grundsätzlich niedriger ist als die anderer Wortbildungsarten, zeigt sich bei einem Vergleich der Abbildung 36b mit der Abbildung 44a sehr deutlich: Obwohl im untersuchten Definitionswortschatz des LTWDaF 2 bei den Types insgesamt nur 23,33 Prozent aller Wortbildungsprodukte auf die Konversion entfallen, verfügt diese Wortbildungsart über einen Anteil von 55,81 Prozent am gesamten nicht verzeichneten Definitionswortschatz. 408 Vgl. hierzu Motsch (1988, S. 16) und Fleischer (1997, S. 51). Als weitere Faktoren, die eine Lexikalisierung von Wortbildungsprodukten verhindern, gelten der fehlende Bedarf der Sprachgemeinschaft (Duden-Grammatik 2009, S. 642), „eine starke Kontextgebundenheit, ein hoher Komplexitätsgrad oder eine nicht regelgerechte und daher besonders auffällige Bildung“ (ebd.). 409 Vgl. hierzu auch Schröder (1997, S. 141). Wörterbuchanalyse 245 Ebenfalls von Interesse ist die Analyse des Definitionswortschatzes, der im LTWDaF 2 zumindest unter einem Mitglied der Wortfamilie verzeichnet ist (vgl. Abb. 44b). Von den 138 nicht verzeichneten Types betrifft dies 37,68 Prozent beziehungsweise 52 Types. Diese 52 Types sind ausschließlich das Ergebnis von Wortbildungsprozessen. Mit 48,08 Prozent (25 Types) dominiert hier die Derivation, gefolgt von der Komposition, die einen Anteil von 34,62 Prozent (18 Types) einnimmt. Die Partikelverbbildung kommt auf einen Anteil von 9,62 Prozent (fünf Types), die Konversion auf 7,69 Prozent (vier Types). Auch an dieser Stelle zeigt sich die im Vergleich zu anderen Wortbildungsarten niedrigere Tendenz zur Lexikalisierung bei bestimmten Wortbildungsprodukten (vgl. Fleischer 1997, S. 50f.). a) b) Abb. 45: Die Verteilung der Wortbildungsarten im LTWDaF 2 - nicht verzeichnete Tokens (a) und bei der Wortfamilie verzeichneten Tokens (b) Bei einer Gegenüberstellung von Abbildung 44a und Abbildung 45a zeigt sich, dass zwischen den nicht verzeichneten Types und Tokens kaum Unterschiede in Bezug auf die Wortbildungsarten bestehen. Allein der Anteil der nicht verzeichneten Tokens an der Gesamtmenge liegt mit 2,94 Prozent (193 der insgesamt 6 572 Tokens) viel niedriger als der entsprechende Type-Wert. 133 Tokens werden nicht als Lemmata des LTWDaF 2 aufgeführt, die verbleibenden 60 Tokens werden als Wortbildungsprodukte unter der Wortfamilie genannt (vgl. Abb. 45). Die 133 nicht verzeichneten Tokens bestehen zu rund 93 Prozent aus Wortbildungsprodukten - mit 59,40 Prozent (79 Tokens) nehmen die Konversionen dabei den größten Anteil ein. 21,05 Prozent (28 Tokens) sind Derivate, 9,77 Prozent (13 Tokens) Komposita. Lediglich 2,26 Prozent (drei Tokens) gehören der Partikelverbbildung an. Die restlichen Anteile verteilen Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 246 sich zu 6,02 Prozent auf die demotivierten Lexeme (acht Tokens) und zu 1,50 Prozent (zwei Tokens) auf den primären Wortschatz. Auch für die Tokens bestätigen sich damit die im Kapitel 3.1.1 aufgestellten Thesen 2 und 2.1 - das LTWDaF 2 geht über den computerkontrollierten Definitionswortschatz hinaus und macht dabei vor allem von Wortbildungsprodukten Gebrauch. Verglichen mit den Types sinken die Anteile der Komposition, der Partikelverbbildung und der primären Lexeme, wohingegen sich die Anteile der Konversion, der Derivation und der demotivierten Lexeme etwas vergrößern. Noch geringer sind die Änderungen, die sich bei den Lexemen ergeben, die allein unter der Wortfamilie verzeichnet sind. Die Werte von Types und Tokens differieren hier kaum (vgl. Abb. 44b, 45b). Die Derivation erhöht ihren Anteil bei den Tokens leicht auf 50,00 Prozent (30 Tokens), ebenso wie die Partikelverbbildung (zehn Prozent, zehn Tokens). Auf die Komposition entfallen 31,67 Prozent (19 Tokens), auf die Konversion 8,33 Prozent (fünf Tokens). Neben der Analyse dazu, wie sich der nicht im LTWDaF 2 verzeichnete Definitionswortschatz hinsichtlich der Wortbildung verhält, ist natürlich noch von Interesse, um welche Lexeme es sich im Einzelnen handelt. 410 Im Mittelpunkt steht hierbei zunächst der Definitionswortschatz, der nirgendwo lemmatisiert ist, auch nicht bei einem Element seiner Wortfamilie. Wie beschrieben, verfügen dort die Konversionen mit 55,81 Prozent bei den Types und 59,40 Prozent der Tokens über den größten Anteil. Die Konversionsprodukte lassen sich nach ihrer Basis und nach ihrer Zielwortart weiter unterteilen - in deverbale (z.B. das Pokern) und in deadjektivische Substantivkonversionen (z.B. das Folgende), in departizipiale (z.B. vergangen) und in desubstantivische Verbkonversionen (urteilen). Die größte Gruppe bilden die 20 deverbalen Substantivkonversionen, bei denen der Infinitiv des Verbs in die Wortart Substantiv umgesetzt wird: das Anerkennen, das Angreifen, das Annehmen, das Benutzen, das Eintreffen, das Erstaunen, das Kochen, das Missverstehen, das Pokern, das Rechnen, das Schlafen, das Schneiden, das Trennen, das Tun, das Verlieren 1 , das Vermitteln, das Verstehen, das Wegnehmen, das Weitergeben und das Zögern. 411 Die hohe Anzahl an Belegen lässt darauf schließen, dass dies keine zufälligen Ausnahmen sind. Weder bei den Benutzerhinweisen noch bei den Erläuterungen zum Definitionswortschatz im Anhang weist das 410 Eine tabellarische Übersicht dazu findet sich in der Datensammlung B.2.1. 411 Im Kapitel 3.3.2.1.1 werden die Substantivkonversionen unter dem Aspekt der Wortartenzugehörigkeit thematisiert, im Kapitel 3.3.2.3.2.1 stehen die substantivischen Konversionen des Infinitivs und des Adjektivs im LTWDaF 2 unter Wortbildungsgesichtspunkten im Mittelpunkt. Wörterbuchanalyse 247 LTWDaF 2 darauf hin, dass in den Definitionen systematisch substantivierte Infinitive verwendet werden. Zumindest dies wäre bei einem Wörterbuch für Nichtmuttersprachler zu erwarten. In den meisten Fällen (17) sind die verbalen Basen - also anerkennen, angreifen usw. - als Lemmata vorhanden. Der Benutzer kann demzufolge von der Bedeutung des Verbs auf die der Substantivierung schließen, was die meist übereinstimmende Wortbildungsbedeutung der „vergegenständlichten Prozessbedeutung“ (Fleischer 1997, S. 50) unterstützt. Bei drei Konversionen ist der Infinitiv jedoch nicht verzeichnet: Das Verb erstaunen wird lediglich unter erstaunlich aufgeführt, bei vermitteln fehlt unter dem lemmatisierten Vermittlung sogar dieser Hinweis. Der auffälligste und benutzerunfreundlichste Fall ist das Lexem Pokern, das als Element des Definitionswortschatzes und der Beispielsätze verwendet wird, selbst jedoch in keiner Form lemmatisiert ist. 412 Die Bedeutung solcher Lexeme kann der Benutzer mithilfe des LTWDaF 2 nicht herausfinden. Ebenfalls sehr häufig finden sich deadjektivische Substantivkonversionen in den Definitionen des LTWDaF 2. In der Stichprobe umfasst diese Gruppe 18 Fälle: das Angenehme, das Bestimmte, der/ die Betroffene, das Blau, das Folgende, das Ganze, das Genannte, das Gesagte, das Gleiche, der Nächste, das Negative, das Neue, das Normale, das Nützliche, das Positive, das Schlimme, das Technische und der Übrige. 413 Bei fünf Konversionen - Bestimmte, Betroffene, Folgende, Genannte und Gesagte - liegt dem Basisadjektiv ein Partizip zugrunde. Auch bei den deadjektivischen Substantivkonversionen sind die Basisadjektive zumeist verzeichnet. Bei drei Konversionen - Betroffene, Genannte und Gesagte - muss der Benutzer jedoch vom Substantiv (z.B. Betroffene) über das Adjektiv/ Partizip (z.B. betroffen) auf das Verb (z.B. betreffen) schließen, was für einen Nichtmuttersprachler eine fortgeschrittene Leistung darstellt. Auf die Verwendung dieser Art von Substantivkonversionen wird ebenfalls nirgendwo im LTWDaF 2 hingewiesen, dies wäre für Benutzer jedoch sehr wünschenswert. Die dritte Gruppe bilden die neun Adjektivkonversionen, deren Basen Partizipien sind: angestellt, befreundet, begeistert, betreffend, erlaubt, geachtet, genannt, überlegt und vergangen. Auch auf ihren systematischen Gebrauch in den Definitionen macht das LTWDaF 2 an keiner Stelle aufmerksam. Der Benutzer ist vielmehr gezwungen, das adjektivisch 412 Zwar handelt es sich bei Pokern um einen Internationalismus, trotz dieser Tatsache sollte er jedoch im verwendeten Definitionswortschatz aufgeführt werden. Denn für die Benutzer ist Vollständigkeit in diesem Zusammenhang wichtiger als eine künstliche Reduzierung (vgl. Stein 1979, S. 6; Herbst 1986, S. 114; 1996, S. 324f.; Herbst/ Klotz 2003 , S. 52 sowie Kapitel 2.3.2). 413 Im Kapitel 3.3.2.1.2 werden die deadjektivischen Substantivkonversionen unter dem Aspekt der Wortartenzugehörigkeit thematisiert. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 248 gebrauchte Partizip auf den Infinitiv zurückzuführen, beispielsweise geachtet auf achten. Selbst wenn ihm dies gelingt, wird seine Mühe in zwei Fällen erfolglos bleiben - im LTWDaF 2 sind nämlich weder befreunden noch vergehen lemmatisiert, sondern nur sich anfreunden, Freund, freundlich, Freundschaft, freundschaftlich, Gastfreundschaft, unfreundlich beziehungsweise Vergangenheit sowie diverse Lexeme aus der Wortfamilie gehen. An dieser Stelle wäre eine Nachbearbeitung des LTWDaF 2 leicht zu bewerkstelligen und zudem dringend zu empfehlen. Für die letzte Art der Konversion, die desubstantivische Verbkonversion, findet sich in den Definitionen der vorliegenden Untersuchung nur das Beispiel urteilen, auf dessen Bedeutung der Benutzer vom lemmatisierten Urteil schließen muss. Auch hier wäre es ein Leichtes, das Verb zumindest als Wortbildungsprodukt beim Basislemma zu verzeichnen, wenn es keinen eigenen Artikel erhalten kann. Außer den Konversionen tauchen in den Definitionen insgesamt 18 Derivate auf, die nicht im LTWDaF 2 verzeichnet sind: Beschuldigung, Gegensätzlichkeit, intensivieren, räumlich, saftig, Schwäche, Sprecher, tätig, telefonisch, Unterstützung, verärgern, Verbreitung, Vermutung, Verwendung, Vorbereitung, vorne, wahrnehmbar und Weitergabe. Zwar weist das LTWDaF 2 (2007, S. 545) darauf hin, dass „leicht verständliche Ableitungen (z.B. mit -er, -ung, un-, -heit)“ vom computerkontrollierten Definitionswortschatz ausgenommen sind. Es erscheint allerdings fraglich, ob alle oben aufgezählten Derivate für den fremdsprachigen Benutzer transparent sind, beispielsweise verärgern. In diesen Fällen sollte folglich eine Verwendung als Definitionswortschatz vermieden werden, wenn die Lexeme keinen eigenen Wörterbuchartikel erhalten können. Eine ganz einfache Lösung bietet sich beim Lexem vorne an, das als Lemmavariante zu vorn ergänzt werden kann. Sehr benutzerunfreundlich ist momentan das Vorgehen beim Lexem Gegensätzlichkeit, das auf die Basis gegensätzlich zurückgeführt werden muss, die allerdings nur als Derivat unter dem Lemma Gegensatz verzeichnet ist. Da nicht muttersprachliche Benutzer über ein weniger ausgeprägtes Wortbildungswissen verfügen als Muttersprachler und beim Kreieren von Wortbildungsprodukten demzufolge unsicherer sind, ist es vorteilhaft, so viele Wortbildungsprodukte wie möglich im Wörterbuch zu verzeichnen. Die drittgrößte Gruppe nach den Konversionen und den Derivaten bilden die Komposita, die am nicht verzeichneten Definitionswortschatz einen Anteil von 12,79 Prozent bei den Types beziehungsweise 9,77 Prozent bei den Tokens ausmachen. Folgende elf Komposita sind nicht im LTWDaF 2 verzeichnet, werden aber in den Definitionen der Stichprobe verwendet: Anfangspunkt, Magnetband, Nutztier, Relativsatz, Signalanlage, stellvertretend, süddeutsch, Wörterbuchanalyse 249 Tätigkeitsverb, Telefonzentrale, Versicherungsfirma und wünschenswert. An dieser Stelle muss jedoch erwähnt werden, dass mit Magnetband, Nutztier, Signalanlage, stellvertretend und Versicherungsfirma fünf dieser Komposita unter die in den Benutzerhinweisen genannte Ausnahme zum Definitionswortschatz fallen - „einige Ergänzungen in Klammern“ (LTWDaF 2 2007, S. 9). Dennoch geben in den meisten Fällen erst die Bestimmungswörter der Komposita den entscheidenden Hinweis für das Verständnis der Definitionen. So wären die Definitionen allein mit den Grundwörtern zwar verständlich, dann enthielten sie aber wahrscheinlich nicht mehr den entscheidenden Schlüsselreiz für die Kopplung des fremden Konzeptes mit dem eigenen Konzept. 414 So liefert beispielsweise die Definition des Lemmas anstelle, an Stelle ‘(stellvertretend) für’ ohne das eingeklammerte stellvertretend nicht genügend Kontext für die Semantisierung. Eine weitere, sehr kleine Gruppe des nicht lemmatisierten Definitionswortschatzes bilden die Partikelverben mit den drei Types abspielen, hervorrufen und vorausgehen. Hier wirkt sich die Nichtlemmatisierung besonders nachteilig auf den Verstehensprozess beim Benutzer aus, da sich die Gesamtbedeutung der Partikelverben abspielen und hervorrufen aufgrund ihrer eigenständigen Semantik nicht aus der Bedeutung ihrer Einzelteile ergibt. 415 Doch nicht alle Lexeme, die zum Definitionswortschatz der Untersuchung gehören und keinen Eintrag im LTWDaF 2 besitzen, sind motivierte Ergebnisse von Wortbildungsprozessen. Bei ein in der Verwendung als Indefinitpronomen handelt es sich um ein nicht lemmatisiertes primäres Lexem. Mit äußer-, Kalium, Natrium, Roulette und vorhanden werden in den Definitionen fünf nicht verzeichnete demotivierte Lexeme verwendet. 416 In den Fällen ein, äußer- und vorhanden sollte der Definitionswortschatz unbedingt lemmatisiert werden, da es nicht einmal motivierte Wortbildungsprodukte sind. Für das Verständnis von Kalium, Natrium und Roulette findet der Benutzer im LTWDaF 2 keinen Anhaltspunkt, diese Lexeme sollten demzufolge aus dem Definitionswortschatz entfernt werden. 414 Vgl. hierzu die Diskussion bei Herbst ( 1986, S. 110), in den Definitionen des LDOCE 1 fehle zum Verständnis teilweise „the rather important clue“, vgl. Kapitel 2.3.1.2. 415 Abist als Verbpartikel zwar verzeichnet, die Semantik von abspielen lässt sich daraus jedoch nicht herleiten. 416 Der Umlaut bei äußerlässt darauf schließen, dass es sich um ein Wortbildungsprodukt handelt, die Motivation ist jedoch verloren gegangen. Die Wortformen der nicht nativen Lexeme Kalium, Natrium und Roulette weisen auf Wortbildungsprodukte hin, die semantische Motivation besteht im Deutschen jedoch nicht. Zur Etymologie von vorhanden vgl. Kapitel 3.3.2.1.2, Anm. 361. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 250 Immerhin rund ein Drittel des Definitionswortschatzes ohne eigenen Artikel steht als Wortbildungsprodukt im Artikel eines Glieds aus der Wortfamilie (37,68 Prozent bei den Types und 31,09 Prozent bei den Tokens). Ziemlich genau die Hälfte dieser Wortbildungsprodukte bilden die folgenden 25 Derivate, wobei das Lemma, unter dem sie genannt werden, hinter der Ableitung in Klammern steht: akzeptabel (akzeptieren), Aufforderung (auffordern), Äußerung (äußern), befindlich (befinden), Benutzer (benutzen), Betrachter (betrachten), Blutung (bluten), Charakterisierung (charakterisieren), Entwicklung (entwickeln), Erwartung (erwarten), Feststellung ( feststellen), Feuchtigkeit (feucht), Flüssigkeit (flüssig), Forderung (fordern), formelhaft (Formel), Gegenseitigkeit (gegenseitig), Gleichzeitigkeit (gleichzeitig), hoffnungslos (Hoffnung), rhetorisch (Rhetorik), Subtraktion (subtrahieren), Überlegung (überlegen 2 ), Verfasser (verfassen), Verwandtschaft (verwandt), Würdigung (würdigen) und Zustimmung (zustimmen). Diese Derivate sind zwar von ihrer Bildung her transparent, trotzdem muss der Benutzer über ein bestimmtes Maß an Wortbildungswissen verfügen, um sich die Bedeutung der einzelnen Derivate erschließen zu können. Besonders vor dem Hintergrund, dass Lerner der Grundstufe explizit zur Zielgruppe gehören, sollten in einer Neuauflage mehr Wortbildungselemente (wie -er oder -haft) lemmatisiert und am besten noch zusätzlich in einem eigenen Anhang aufgeführt und beschrieben werden. Die zweite umfangreiche Gruppe des Definitionswortschatzes, der lediglich in den Artikeln eines Glieds der Wortfamilie erwähnt wird, besteht aus 18 Komposita. Eingeklammert stehen im Folgenden wiederum die Lemmata, in deren Artikel die Komposita aufgeführt sind - in acht Fällen das Erstglied, in drei Fällen das Zweitglied und in sieben Fällen beide: Abfalleimer (Abfall), Ausrufesatz (Ausruf ), Bezugspunkt (Bezug 3 ), Bezugswort (Bezug 3 ), Endpunkt (Ende), Lebensjahr (Leben), Videorekorder (Video) und Zahlenwert (Zahl); Menschenmenge (Menge), Passivkonstruktion (Konstruktion) und Verkehrssituation (Situation); Fernsehgerät (Fernsehen, Gerät), Gerichtsverhandlung (Gericht, Verhandlung), Gesprächspartner (Gespräch, Partner), Kopfschmerzen (Kopf, Schmerz), Schmuckstück (Schmuck, Stück), Wohnort (wohnen, Ort) und Zeitangabe (Zeit, Angabe). Auffälligerweise besteht diese Zusammenstellung ausschließlich aus substantivischen Komposita. 417 Die Partikelverben der Untersuchung sind im LTWDaF 2 meist im Artikel ihrer Verbpartikeln aufgelistet. Verbpartikeln nehmen unter den verzeichneten Wortbildungselementen den größten Anteil ein (vgl. Datensammlung A.1.1.2). 417 Ebenfalls im LTWDaF 2 als Kompositum verzeichnet ist festmachen unter fest. In der Analyse wird dies jedoch als Partikelverbbildung gewertet. Wörterbuchanalyse 251 Bei dem Definitionswortschatz ohne eigenen Artikel betrifft das die vier Partikelverben aufhängen (verzeichnet unter auf-), einwirken (verzeichnet unter ein-), erlernen (verzeichnet unter er-) und weiterbewegen (verzeichnet unter weiter-). Besonders hier wäre eine alleinige Nennung des Wortbildungsproduktes durch die zumeist übertragene Bedeutung der Partikelverben für den Benutzer kaum eine Hilfe. Im LTWDaF 2 erhalten die Partikelverben, die unter den Verbpartikeln stehen, deshalb eine eigene Definition. Allerdings ist fraglich, ob dadurch im Vergleich zu eigenen Artikeln so viel Platz eingespart wird, zumal die Lemmatisierung der Partikelverben in einem eigenen Artikel die benutzerfreundlichste Variante wäre. Das fünfte Partikelverb - festmachen - wird im LTWDaF 2 ohne Definition wie die Komposita unter fest verzeichnet, was im Vergleich zu den anderen Partikelverbbildungen inkonsequent ist. Die letzte Wortbildungsart, deren Produkte in Artikeln von Wortfamiliengliedern verzeichnet sind, ist die Konversion. In den untersuchten Definitionen des LTWDaF 2 finden sich die folgenden vier Beispiele, in Klammern steht das Lemma, in dessen Artikel das Konversionsprodukt genannt wird: Eintrag (eintragen), erben (Erbe 1 und Erbe 2 ), genügend (genügen) und Wegfall (wegfallen). Die Lexikalisierung wird bei diesen Beispielen durch die semantische Selbstständigkeit der Konversion (genügend) beziehungsweise durch das Fehlen einer homonymen Basis (Eintrag, erben und Wegfall) unterstützt. Zusammenfassend kann festgehalten werden, dass das LTWDaF 2 den Anspruch nicht erfüllt, in seinen Definitionen einen computerkontrollierten Definitionswortschatz zu verwenden, da in der Untersuchung jedes zehnte Type nicht zum Lemmabestand des Wörterbuchs gehört (vgl. Kap. 3.3.1.1). Davon werden mehr als 60 Prozent an keiner Stelle im Wörterbuch verzeichnet, die übrigen knapp 40 Prozent werden als Wortbildungsprodukte in den Artikeln ihrer Wortfamilie genannt. Je nach Fallgruppe wären andere Vorgehensweisen jedoch erheblich benutzerfreundlicher. Zudem sollte das LTWDaF 2 in den Wörterbuchaußentexten stärker offenlegen, welche Gruppen von Wörtern außerhalb des computerkontrollierten Definitionswortschatzes verwendet werden. Vor allem die deverbalen und deadjektivischen Substantivkonversionen (z.B. das Kochen, das Ganze) sind von ihrer Semantik zumeist noch sehr eng an ihr Basiswort gekoppelt. In diesen Fällen würde es genügen, in den Erläuterungen zum Definitionswortschatz auf die systematische Verwendung dieser Konversionsprodukte in den Definitionen hinzuweisen und einige Beispiele anzuführen. Dies funktioniert jedoch nur, wenn die Basisverben und -adjektive vollständig verzeichnet sind. Prinzipiell gilt dies auch für die Adjektivkonversionen mit partizipieller Basis. Da diese in ihrer Semantik jedoch Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 252 oft stärker von den verbalen Partizipien entfernt sind, ist hier verstärkt auf eine Übereinstimmung der Bedeutung zwischen Basis und Wortbildungsprodukt zu achten. Die in den Definitionen verwendeten Derivate und Komposita sollten entweder als eigene Lemmata oder zumindest in einem Artikel ihrer Wortfamilie verzeichnet werden, ebenso desubstantivische Konversionen wie urteilen. Bei den Derivaten würde es sich zudem anbieten, verstärkt Wortbildungselemente als Strichlemmata aufzunehmen und ihnen einen eigenen Abschnitt in den Wörterbuchaußentexten zu widmen. Die Partikelverben sollten aufgrund ihrer oft übertragenen Bedeutung im Idealfall eigene Artikel erhalten. Ist dies nicht möglich, genügt die Lemmatisierung unter der Verbpartikel, dann allerdings mit eigener Bedeutungsdefinition. Dieses Vorgehen wendet das LTWDaF 2 bereits an, es muss jedoch konsequent auf alle Partikelverben übertragen werden. In einigen Fällen führt zukünftig kein Weg daran vorbei, den Definitionswortschatz in eigenen Artikeln zu lemmatisieren. Dies betrifft zum einen primäre Lexeme wie ein in der Verwendung als Indefinitpronomen, zum anderen demotivierte oder schwer durchsichtige Wortbildungsprodukte wie vorhanden, äußer- oder stellvertretend. Um dem Anspruch des computerkontrollierten Definitionswortschatzes gerecht zu werden, müssen die Definitionen und Artikel des LTWDaF 2 zumindest nach diesen Kriterien überarbeitet werden. 3.3.2.3.3.2 Analyse des DHWDaF 2 12,86 Prozent der Types des DHWDaF 2 sind nicht im Lemmabestand des Wörterbuchs enthalten. Lediglich 1,27 Prozent davon (2 von 157 Types) sind in einem Artikel der Wortfamilie verzeichnet, 98,73 Prozent werden hingegen an keiner Stelle des Wörterbuchs aufgeführt. Ein Blick auf die Zusammensetzung dieser Lexeme unter dem Aspekt der Wortbildung zeigt, dass sich die Werte für die einzelnen Wortbildungsarten bei den Types und bei den Tokens kaum voneinander unterscheiden (vgl. Abb. 46). 418 Den größten Anteil am nicht verzeichneten Definitionswortschatz besitzt die Konversion - bei den Types 43,23 Prozent (67 der 155 Types), bei den Tokens sind es mit 40,31 Prozent (77 der 191 Tokens) geringfügig weniger. Mit 25,81 Prozent der Types (40 Types) und 27,75 Prozent der Tokens (53 Tokens) entfällt ziemlich genau ein Viertel auf die Derivation. An dritter Stelle steht die Komposition mit einer relativen Häufigkeit von 14,19 Prozent bei den Types 418 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Für die beiden unter der Wortfamilie verzeichneten Lexeme gibt es kein eigenes Diagramm, weshalb Types und Tokens gegenübergestellt werden. Wörterbuchanalyse 253 (22 Types) und 12,04 Prozent bei den Tokens (23 Tokens). Die letzte Wortbildungsart ist die Partikelverbbildung, die bei den Types einen Wert von 6,45 Prozent (zehn Types) und bei den Tokens einen Wert von 5,76 Prozent (elf Tokens) erreicht. Zahlenmäßig noch vor der Partikelverbbildung liegen allerdings die primären Lexeme, die bei den Types 8,39 Prozent (13 Types) und bei den Tokens 12,57 Prozent (24 Tokens) ausmachen. Die demotivierten Lexeme machen mit jeweils drei Elementen bei den Types 1,94 Prozent aus, bei den Tokens 1,57 Prozent. Der primäre Wortschatz verfügt damit nicht nur über die größte Differenz zwischen beiden Zählarten, sondern auch über den höchsten Zugewinn bei den Tokens im Vergleich zu den Types. Auch die Derivation erhöht ihren Anteil von den Types zu den Tokens leicht. Bei allen anderen sekundären Wörtern sinken die Werte bei den Tokens im Vergleich zu den Types um wenige Prozentpunkte. Bei den beiden Types (beziehungsweise zwei Tokens) in den Definitionen des DHWDaF 2, die unter ihrer Wortfamilie verzeichnet sind, handelt es sich um Komposita, sodass eine ausführliche Beschreibung der Zusammensetzung nach Wortbildungsarten hier entfallen kann. a) Types b) Tokens Abb. 46: Die Verteilung der Wortbildungsarten im DHWDaF 2 - nicht verzeichnete Types (a) und Tokens (b) Die Gegenüberstellung von DHWDaF 2 und LTWDaF 2 zeigt beim DHW- DaF 2 eine ausgeglichenere, weniger extrem ausgeprägte Verteilung als beim LTWDaF 2. Trotzdem ist die Reihenfolge der Wortbildungsarten in beiden Wörterbüchern identisch - Konversion, Derivation, Komposition und Partikelverbbildung. Die Dominanz der Konversion ist im DHWDaF 2 weniger deutlich, dafür erreichen Derivate, Komposita, Partikelverbbildungen und der primäre Wortschatz höhere Anteile. Bei den Tokens ändert sich die Verteilung Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 254 der einzelnen Wortbildungsarten im DHWDaF 2 kaum, im LTWDaF 2 hingegen erhöht sich der Anteil der Konversion, alle anderen Wortbildungsarten und die primären Lexeme werden weiter zurückgedrängt. Auch für das DHWDaF 2 ist es nach dieser allgemeinen Beschreibung der Anteile der Wortbildungsarten interessant, welche Lexeme es im Einzelnen sind, die zwar in den Definitionen verwendet werden, jedoch selbst nicht im Wörterbuch verzeichnet sind. 419 Begonnen wird erneut mit dem an keiner Stelle verzeichneten Definitionswortschatz. Den größten Anteil daran nehmen mit 43,23 Prozent der Types beziehungsweise 40,31 Prozent der Tokens die Konversionen ein. Wie beim LTWDaF 2 zeigt sich so die geringe Lexikalisierungsaffinität der Wortbildungsart Konversion, da ihr Anteil an allen Wortbildungsprodukten mit 23,02 Prozent bei den Types und 20,97 Prozent bei den Tokens wesentlich niedriger liegt (vgl. Kap. 3.3.2.3.2.2 und 3.3.2.3.3.1). Die 67 nicht verzeichneten Konversionen lassen sich nach ihrer Basis- und ihrer Zielwortart wiederum in verschiedene Untergruppen gliedern - in deverbale, deadjektivische und sonstige Substantivkonversionen sowie in departizipiale Adjektivkonversionen. Mit den folgenden 40 Types ist auch im DHWDaF 2 die Gruppe der deverbalen Substantivkonversionen am umfangreichsten, bei der Infinitive in die Wortart Substantiv umgesetzt werden: das Angreifen, das Ankommen, das Anmelden, das Annehmen, das Ausbleiben, das Besorgen, das Bestehen, das Billigen, das Einsetzen, das Eintreffen, das Empfinden, das Fangen, das Fehlen, das Handeln, das Kochen, das Kommen, das Mieten, das Mischen, das Missbrauchen, das Mitteilen, das Rechnen, das Schneiden, das Schreiben, das Sichbemühen, das Sicheinsetzen, das Sprechen, das Stattfinden, das Staunen, das Tätigsein, das Verlieren, das Vermischen, das Verschwinden, das Verstehen, das Verwalten, das Verzeihen, das Verzweifeltsein, das Vorhandensein, das Zusammensein, das Zusammenwirken und das Zutreffen. 420 Da die Wörterbuchaußentexte des DHWDaF 2 an keiner Stelle auf die Prinzipien der Arbeit mit einem computerkontrollierten Definitionswortschatz beziehungsweise auf irgendwelche Ausnahmen eingehen, ist es nicht verwunderlich, dass die systematische Verwendung von Infinitivkonversionen keine Erwähnung findet. Für die deadjektivischen Substantivkonversionen gilt das ebenso, allein ihre Zahl ist mit 17 Types niedriger: der/ die Anrufende, das Bestimmte, das Blau, der/ die/ das Folgende, das Ganze, das Geheime, das Ge- 419 Eine tabellarische Übersicht dazu findet sich in der Datensammlung B.2.2. 420 Hier wird diese Gruppe unter dem Aspekt der Lemmatisierung im DHWDaF 2 betrachtet. Die Substantivkonversionen werden im Kapitel 3.3.2.1.1 aus der Perspektive der Wortartenzugehörigkeit thematisiert, im Kapitel 3.3.2.3.2.2 stehen die substantivischen Konversionen im DHWDaF 2 unter Wortbildungsgesichtspunkten im Mittelpunkt. Wörterbuchanalyse 255 nannte, das Gesagte, das Gleiche, das Herkömmliche, das Lange, der/ die/ das Nächste, das Neue, das Schwierige, das Unbekannte, das Weitere und das Wichtigste. 421 Gleiches kann auch für die departizipialen Adjektivkonversionen festgestellt werden, von denen diese neun Types in den Definitionen der Untersuchung vorkommen: angestellt, anhaltend, befreundet, bemüht, betreffend, geachtet, gegeben, genügend und vergangen. Eine Substantivkonversion schließlich besitzt eine Partikel als Basis - Nein. Im Gegensatz zum LTW- DaF 2 verzeichnet das DHWDaF 2 zumindest alle verbalen, adjektivischen beziehungsweise partizipialen Basen der Konversionen sowie die Partikel nein als Lemmata, wenn auch nicht in jedem Fall in der entsprechenden Semantik, wie weiter unten deutlich wird. Ein Vergleich zwischen den über den computerkontrollierten Definitionswortschatz hinausgehenden Konversionsprodukten in den beiden Wörterbüchern ergibt, dass 22 Types, also ein Drittel dieser Konversionen im DHWDaF 2 und 44 Prozent dieser Konversionen im LTWDaF 2, identisch sind: das Angreifen, das Annehmen, das Eintreffen, das Kochen, das Rechnen, das Schneiden, das Verlieren, das Verstehen; das Bestimmte, das Blau, der/ die/ das Folgende, das Ganze, das Genannte, das Gesagte, das Gleiche, der/ die/ das Nächste, das Neue; angestellt, befreundet, betreffend, geachtet und vergangen. Das liegt zum Teil natürlich daran, dass die untersuchten Definitionen zu den gleichen Lemmata gehören und sich dadurch beim Definieren Parallelen ergeben. Zum Teil können die Überschneidungen zwischen DHWDaF 2 und LTWDaF 2 jedoch auch darauf zurückgeführt werden, dass es sich um Lexeme handelt, die für das Definieren allgemein nützlich sind, also genau die Lexeme, die Ayto (1984, S. 53) als „words of particular lexicographic usefulness“ bezeichnet (vgl. Kap. 2.3.2). Die vorliegenden Konversionen sind zwar keine Oberbegriffe im klassischen Sinn, auf die sich Ayto bezieht. Allerdings eignen sich Formulierungen wie das Folgende oder … betreffend dafür, Definitionen zu strukturieren. Mit Wortgruppen wie etwas Neues können bestimmte Eigenschaften der Bezugselemente genannt werden, ohne diese zu genau beschreiben zu müssen. Bei diesen Lexemen sollte überlegt werden, sie in den Lemmabestand aufzunehmen. Ein gutes Viertel des im DHWDaF 2 nicht verzeichneten Definitionswortschatzes gehört zur Wortbildungsart Derivation (25,81 Prozent bei den Types und 27,75 Prozent bei den Tokens). Die folgenden 40 Derivate gehen über den Lemmabestand des DHWDaF 2 hinaus: Annäherung, Anrecht, Aufeinanderfolge, Begründung, Behältnis, Beliebigkeit, belustigen, Beschuldigung, Bestä- 421 Die Thematisierung erfolgt hier aus dem Blickwinkel der Lemmatisierung im DHWDaF 2, im Kapitel 3.3.2.1.3 werden alle deadjektivischen Substantivkonversionen aus Sicht der Wortartenzugehörigkeit behandelt. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 256 tigung, Beteiligung, Durchführung, eisern, elliptisch, erfüllen 2 , Erreichung, erschöpfen, ersetzen, Erwartung, fremdsprachig, Geltung, Gewinnung, Hinwendung, 422 intensivieren, nominalisieren, periodisch, Stäbchen, unbeabsichtigt, undekliniert, unerkannt, ungeordnet, unnütz, Unterweisung, Verbreitung, Vermutung, Verschmelzung, Verwendung, Verzögerung, Wahrscheinlichkeit, wertlos und Zugehörigkeit. In den meisten Fällen ist die Derivationsbasis - beispielsweise beliebig bei Beliebigkeit - verzeichnet. Bei einigen Lexemen muss der Benutzer jedoch über sehr viel sprachliches Wissen und speziell über Wortbildungswissen verfügen, um ein Lemma aus der Wortfamilie zu finden. So wird Annäherung in den Definitionen verwendet, verzeichnet ist allerdings nur nähern. Die Bedeutung von Aufeinanderfolge muss sich der Benutzer aus aufeinander- und Folge herleiten. Von unsowie den Verben beabsichtigen, deklinieren, erkennen und ordnen muss der Leser auf die Bedeutung von unbeabsichtigt, undekliniert, unerkannt und ungeordnet schließen, in unnütz muss er un- und nützen/ nutzen entdecken, in eisern die Derivationsbasis Eisen. Auch das Schließen von belustigen auf lustig kann bei einem Lerner der Grund- und Mittelstufe keinesfalls erwartet werden. Noch nachteiliger wird es für den Benutzer allerdings, wenn in den Definitionen Derivate verwendet werden, aus deren Wortfamilie kein Element zum Lemmabestand des Wörterbuchs gehört, wie beim Lexem elliptisch. Auch das Derivat Verschmelzung gehört zum Definitionswortschatz des DHWDaF 2, geht allerdings über den Lemmabestand des Wörterbuchs hinaus. Das Verb schmelzen ‘flüssig werden/ machen’ ist zwar verzeichnet, nicht allerdings verschmelzen in seiner übertragenen Bedeutung. Die in den Definitionen des DHWDaF 2 verwendeten Derivate, die nicht im Wörterbuch lemmatisiert sind, könnten als Wortbildungsprodukte größtenteils sehr leicht in die Artikel ihrer Basen integriert werden, wenn kein zusätzlicher Artikel ins Wörterbuch aufgenommen werden kann. Das gilt besonders für die deverbalen Substantivderivate auf -ung oder die deadjektivischen Substantivderivate auf -keit. Jedoch ist hier das DHWDaF 2 dem LTWDaF 2 gegenüber benachteiligt, weil es sich in der Mikrostruktur seiner Artikel keinen Platz für die Verzeichnung dieser Art von Elementen der Wortfamilie geschaffen hat. Für die Aufnahme von Komposita (mit dem Lemma als Grundwort) existiert allerdings eine solche Stelle im DHWDaF 2. Trotzdem werden dort - beziehungsweise als Lemmata - nicht alle im Definitionswortschatz verwendeten Komposita aufgeführt. Insgesamt 22 Types sind in der Untersuchung davon 422 Hinwendung wird - genauso wie Abwendung - als Kompositum zu Wendung aufgeführt. Von der Wortbildung wesentlich plausibler ist jedoch die Entstehung als Suffixderivat aus hinwenden/ abwenden + -ung. Wörterbuchanalyse 257 betroffen: Aussagesatz, Briefsendung, Einklang, fünfzehn, Genitivattribut, gernhaben, Geschehensbereich, irgendwohin, Kürbisfrucht, Nebensatz, ohnehin, Possessivpronomen, Relativpronomen, rotbraun, Satzteil, Seinsbereich, Tätigkeitsbereich, Unterton, weitaus, Wortpaar, wünschenswert und Zeitdauer. Fast immer sind die Grundwörter der Komposita als Lemmata im Wörterbuch vorhanden, hier wäre es also auch für das DHWDaF 2 ein Leichtes, die in den Definitionen verwendeten Komposita bei den Grundwörtern als Zusammensetzungen nachzutragen. Dies empfiehlt sich jedoch nur bei usuellen Komposita - Zusammensetzungen wie Seinsbereich gehören nicht in ein Wörterbuch für nicht muttersprachliche Lerner der Grund- und Mittelstufe, allerdings auch nicht in dessen Definitionswortschatz. Weiterhin könnten linguistische Termini, wie Aussagesatz, Genitivattribut, Nebensatz, Possessivpronomen, Relativpronomen, Satzteil und Wortpaar, in einem eigenen Glossar innerhalb der Wörterbuchaußentexte erläutert werden. Da sie zudem meist in den Teilen der Definition vorkommen, die eher an Verwendungshinweise erinnern, und nicht zum grundlegenden Wortschatz gehören, sollten sie den Lemmabestand nicht unnötig vergrößern. Es sind auch genau diese sprachwissenschaftlichen Termini, von denen nicht einmal das Grundwort der Komposita verzeichnet ist - Genitivattribut, Possessivpronomen und Relativpronomen. Bei den Adverbien ohnehin und weitaus sollte im Redaktionsprozess geprüft werden, wie wichtig sie für die Formulierung der Definitionen sind. Aufgrund ihrer Demotivation ist eine reine Auflistung als Komposita unter dem Grundwort wenig erhellend, eine Lemmatisierung würde sich in diesem Fall stärker anbieten. Die letzte Wortbildungsart, deren Produkte über den computerkontrollierten Definitionswortschatz hinausgehen, ist die Partikelverbbildung mit den folgenden zehn Types: anpflanzen, aufeinanderfolgen, hergehen, hervorrufen, hineinfließen, hinzukommen, vorausgehen, weitergehen, zusammenbauen und zuweisen. Die Basisverben sind vollzählig verzeichnet. Die Hälfte der Verbpartikeln ist zusätzlich als Strichlemma verzeichnet (an-, aufeinander-, her-, zusammen- und zu-). Vier der Partikeln sind allein als Adverbien lemmatisiert (hervor, hinein, voraus und weiter), im Fall hinzukommen existiert sogar nur das Partikelverb hinzufügen mit der gleichen Partikel als Lemma. Die hier genannten Partikelverben liegen in ihrer Semantik fast immer noch sehr nah am einfachen Basisverb, sodass die Definitionen notfalls auch ohne die Verbpartikeln verständlich wären. Dies kann aber auch ganz anders sein, wie das Beispiel hervorrufen zeigt, dessen Bedeutung ‘verursachen’ sich nicht aus der Semantik des Basisverbs erschließen lässt. Mag die Verzeichnung der Verb- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 258 partikeln als Strichlemmata bei den Partikelverben mit wörtlicher Bedeutung noch ausreichen, so müssen die Partikelverben mit übertragener Bedeutung in jedem Fall einen eigenen Artikel erhalten. Auch drei demotivierte Wortbildungsprodukte sind Teil des nicht verzeichneten Definitionswortschatzes des DHWDaF 2 - ansprechend, Urheber und zugegen. Sie sollten entweder in den Definitionen ersetzt werden, beispielsweise durch schön in der Definition von attraktiv, durch Ursache in der Definition von von oder durch Weglassen in der Definition von anwesend. Neben den Wortbildungsprodukten gibt es auch primären Wortschatz, der in den Definitionen verwendet wird und im DHWDaF 2 nicht zum Lemmabestand gehört. In der vorliegenden Untersuchung sind das 13 Types - Adjektiv, Adverb, Genitiv, Indikativ, Komparativ, Konjunktiv, Nomen, Präsens, Präteritum, Subjekt, Superlativ, Verb und erst- 2 . Bei der Zusammenstellung ist auffällig, dass es sich dabei bis auf die Ausnahme erst- 2 ausschließlich um sprachwissenschaftliche Termini handelt. Wie bereits bei den entsprechenden Komposita vorgeschlagen, könnten auch diese Fachausdrücke in einem eigenen Glossar in den Wörterbuchaußentexten erklärt werden, um den Lemmabestand des DHWDaF 2 nicht unnötig zu erweitern. Das Lexem erst- 2 muss jedoch unbedingt in die Stichwortliste aufgenommen werden, wenn es in den Definitionen nicht durch andere Formulierungen ersetzt wird. Lediglich zwei Types aus den untersuchten Definitionen - dorthin und Oberseite - sind allein als Zusammensetzungen unter ihren Grundwörtern hin beziehungsweise Seite genannt. Der sich daraus ergebende Anteil von etwas mehr als einem Prozent am nicht verzeichneten Definitionswortschatz liegt im DHWDaF 2 viel niedriger als im LTWDaF 2, wo rund ein Drittel des nicht verzeichneten Definitionswortschatzes zu dieser Gruppe gehört. In der Zusammenfassung dieses Kapitels muss festgestellt werden, dass auch das DHWDaF 2 seinen Anspruch, in den Definitionen mit einem computerkontrollierten Wortschatz zu arbeiten, nicht erfüllen kann. In knapp 27 Prozent der Lemmata beziehungsweise in gut 22 Prozent der Definitionen tauchen Lexeme auf, die im Wörterbuch selbst nicht lemmatisiert sind. Diese Werte unterscheiden sich lediglich in zwei Prozentpunkten von denen des LTW- DaF 2. Auf der Ebene der Types ist im DHWDaF 2 jedes achte Type (12,86 Prozent), auf der Ebene der Tokens jedes zwanzigste Token (5,09 Prozent) des Definitionswortschatzes nicht im Wörterbuch verzeichnet. Mit diesen Werten liegt das DHWDaF 2 jeweils rund zwei Prozentpunkte über den Werten des LTWDaF 2. Der Definitionswortschatz ohne eigenen Wörterbuchartikel ist im Wörterbuchanalyse 259 DHWDaF 2 lediglich zu einem Prozent unter der Wortfamilie aufgeführt, im LTWDaF 2 ist es hingegen rund ein Drittel. In beiden Wörterbüchern ist der größte Teil des nicht verzeichneten Definitionswortschatzes das Ergebnis von Wortbildungsprozessen. Sowohl im DHWDaF 2 als auch im LTWDaF 2 nehmen Konversion, Derivation, Komposition und Partikelverbbildung dabei in ihrer Bedeutung ab. Die Anteile der einzelnen Wortbildungsarten sind im DHWDaF 2 gleichmäßiger verteilt als im LTWDaF 2, wo die Dominanz der Konversion noch stärker spürbar ist. Je nach Wortbildungsart ergeben sich für das DHWDaF 2 unterschiedliche Empfehlungen für die zukünftige Arbeit mit dem Definitionswortschatz. Die Wörterbuchaußentexte sollten unbedingt durch einen Abschnitt über den Definitionswortschatz und die Prinzipien der Arbeit mit einem solchen ergänzt werden. In diesem Text könnte beispielsweise die systematische Verwendung bestimmter Konversionsarten außerhalb des computerkontrollierten Definitionswortschatzes erläutert werden, da diese durch ihre Benennungs-, Variations- und Textfunktion eine wichtige Rolle in den Definitionen spielen (vgl. Schröder 1997, S. 144f.). Sinnvoll wäre ebenfalls ein eigenes Glossar für die sprachwissenschaftlichen Termini, die in den Definitionen verwendet werden, aber nicht als Lemmata ins Wörterbuch aufgenommen werden sollen. Hiervon sind vor allem Komposita und der primäre Wortschatz betroffen. Die primären Lexeme, die nicht zu den linguistischen Fachausdrücken zählen, sollten - sofern sie weiter als Definitionswortschatz fungieren - unbedingt einen eigenen Artikel erhalten. Gleiches gilt für die demotivierten Wortbildungsprodukte, für die Partikelverben mit übertragener Bedeutung sowie für Teile der Komposita, der Derivate und der Konversionen. Derivate und Komposita können zum Teil auch bei ihren Basen oder Grundwörtern ergänzt werden. Bei den Partikelverben mit wörtlicher Bedeutung genügt auch eine Verzeichnung der Partikel als Strichlemma. 3.4 Lemmatypspezifische Analyse des untersuchten Definitionswortschatzes In der vorliegenden Arbeit werden nicht nur allgemeine Aussagen über den Definitionswortschatz der untersuchten Wörterbücher getroffen, sondern auch Aussagen, die spezielle Gruppen von Lemmata betreffen. Dabei handelt es sich um die Wortarten bzw. Lemmatypen, nach denen auch die Quotenauswahl erfolgt ist - Substantiv, Verb, Adjektiv und Sonstiges (vgl. Kap. 3.2.1). Der Definitionswortschatz der Stichprobe wird ebenso nach diesen Lemmatypen getrennt betrachtet. Als lemmatypspezifische Eigenschaften werden so- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 260 mit diejenigen Eigenschaften bezeichnet, die sich nur auf einen Teilbereich der untersuchten Stichprobe beziehen - auf einen der vier analysierten Lemmatypen. 423 Wie bei der lemmatypübergreifenden werden auch bei der lemmatypspezifischen Untersuchung zunächst die Länge der Definitionen sowie der Umfang des Definitionswortschatzes und der Anteil des nicht lemmatisierten Definitionswortschatzes untersucht, bevor anschließend die Wortart, die Herkunft und die Wortbildung analysiert werden. 3.4.1 Länge der Definitionen, Umfang und Verzeichnung des Definitionswortschatzes 3.4.1.1 Analyse des LTWDaF 2 Die 400 Lemmata der Stichprobe sind im LTWDaF 2 mit insgesamt 799 Sememen verzeichnet, was pro Lemma eine durchschnittliche Sememanzahl von zwei bedeutet (vgl. Kap. 3.3.1.1). Schlüsselt man diese Sememanzahl nach den vier Lemmatypen auf, die auch der Quotenauswahl zugrunde liegen - Substantiv, Verb, Adjektiv und Sonstiges -, erhält man folgende Ergebnisse (vgl. Abb. 47). 424 Lemmaytyp Sememanzahl Abb. 47: Die lemmatypspezifische Sememanzahl der Lemmata im LTWDaF 2 423 Bei Wolski bezeichnet der Terminus Lemmatyp hingegen die alphabetische Anordnungsform der Lemmata, also die Unterscheidung zwischen den striktalphabetischen Anordnungen der glatt- und nischenalphabetischen Struktur und der nicht striktalphabetischen Anordnung der nestalphabetischen Struktur bzw. besondere Lemmata wie Verweislemmata (vgl. Wolski 1989, S. 364f.). 424 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Wörterbuchanalyse 261 Zum einen steht die Sememanzahl pro Lemma mit dessen Wortart in Zusammenhang. So liegt der Mittelwert für die Sememanzahl der substantivischen Lemmata mit 1,67 deutlich unterhalb des wortartenübergreifenden Durchschnittswertes von zwei. Die Adjektive liegen mit 2,01 Sememen pro Lemma genau im Schnitt, die Verben mit 2,06 geringfügig darüber. Der Lemmatyp Sonstiges verfügt mit 2,58 Sememen pro Lemma über einen überdurchschnittlich hohen Wert. Neben der Tatsache, dass ein Zusammenhang zwischen der Sememanzahl und der Wortart des Lemmas besteht, erscheint plausibel, welche Wortarten im Durchschnitt über mehr Sememe verfügen als andere. So sind die rein autosemantischen Wortarten Substantiv, Adjektiv und Verb im Mittelwert weniger polysem als die Gruppe Sonstiges, in der sich - mit Ausnahme des Adverbs - ausschließlich die synsemantischen Wortarten (Präpositionen, Junktionen, Partikeln und Pronomen) befinden. Lemmatyp Wortanzahl Lemmatyp Abb. 48: Die lemmatypspezifische Wortanzahl der Definitionen im LTWDaF 2 Als nächstes Merkmal wird die Länge der untersuchten Definitionen im LTW- DaF 2 betrachtet (vgl. Abb. 48). Diese wird ermittelt, indem die Anzahl der verwendeten Tokens durch die Anzahl der Definitionen (Sememe) dividiert wird. Im Durchschnitt besteht eine Definition im LTWDaF 2 aus 8,23 Wörtern (vgl. Kap. 3.3.1.1). Betrachtet man die analysierten Definitionen nach ihren Lemmatypen getrennt, ergibt sich dieses Bild: Die Adjektivdefinitionen sind mit durchschnittlich 6,58 Wörtern pro Definition am kürzesten. Ebenfalls unter dem lemmatypübergreifenden Durchschnitt liegen die Verbdefinitionen, die im Mittelwert 7,87 Wörter umfassen. Trotz der teilweise recht umfangreichen Definitionen in der Gruppe Sonstiges, die aufgrund der zu definierenden Lemmata Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 262 zuweilen eher den Charakter eines Verwendungskommentars besitzen, sind deren Definitionen mit 8,33 Wörtern nur unwesentlich länger als der allgemeine Mittelwert. Die längsten Definitionen besitzen mit einem durchschnittlichen Umfang von 9,36 Wörtern pro Definition die Substantive. Zur Erklärung für diese Verteilung empfiehlt sich die Betrachtung der allgemeinen Struktur und der Zusammensetzung des Lexikons. Eine Möglichkeit, Definitionen sehr kurz zu halten, ist das Zurückgreifen auf Synonyme, beispielsweise ‘etwas herstellen, machen’ als Definition von anfertigen im LTWDaF 2. Diese Synonymierelationen sind im Bereich der Adjektive und der Verben auf einer allgemeinsprachlichen Ebene stärker ausgeprägt als bei den Substantiven. Dies bestätigt Cruse (2002, S. 495): „Generally speaking, synonym clustering is much more frequent in verbs and adjectives than in nouns; this contrasts with the fact that hyponymous relations are markedly more frequent in nouns.“ Definitionen von Substantiven sind weiterhin deshalb umfangreicher, weil vor allem Konkreta in ihren Erklärungen viel Platz benötigen, wie beispielsweise die Definition des Lemmas Anker ‘eine Art schwerer Haken, den man an einem Seil ins Wasser lässt, um dort ein Schiff oder Boot festzumachen’. Verwendungshäufigkeit Lemmatyp Abb. 49: Die lemmatypspezifische Verwendungshäufigkeit im LTWDaF 2 Betrachtet man das Verhältnis zwischen den verwendeten Types und Tokens im LTWDaF 2, ergeben sich für die Definitionen der einzelnen Lemmatypen ebenfalls sehr unterschiedliche Werte. In der Abbildung 49 ist dargestellt, wie häufig die einzelnen Types jeweils verwendet werden. Der angezeigte Wert ergibt sich als Quotient aus Tokens und Types. Die Gesamtmenge der Lexeme der untersuchten Definitionen wird 4,90-mal verwendet (6 572 Tokens dividiert durch 1 342 Types), wie im Kapitel 3.3.1.1 beschrieben. Die Tokens der Wörterbuchanalyse 263 analysierten Adjektivdefinitionen werden mit 2,68-mal (1 060 Tokens dividiert durch 396 Types) im Durchschnitt am seltensten verwendet. Es folgen die Verbdefinitionen, deren Tokens im Mittelwert dreimal gebraucht werden (1 298 Tokens dividiert durch 433 Types). Die Tokens der substantivischen Definitionen liegen mit einer durchschnittlich 3,36-maligen Verwendung darüber (2 498 Tokens dividiert durch 743 Types). Am häufigsten werden die Tokens der Definitionen verwendet, deren Lemmata zur Gruppe Sonstiges gehören - im Mittelwert 4,11-mal (1 716 Tokens dividiert durch 418 Types). Art der Lemmata Lemmatyp Abb. 50: Die lemmatypspezifische Verteilung der Lemmata mit verzeichnetem und nicht verzeichnetem Definitionswortschatz im LTWDaF 2 Wie im Kapitel 3.3.1.1 dargestellt, gehen 115 der 400 untersuchten Lemmata des LTWDaF 2 (28,75 Prozent) in ihrem Definitionswortschatz über die im Wörterbuch verzeichneten Lemmata hinaus. Schlüsselt man diesen Gesamtwert nach den einzelnen Lemmatypen auf, treten weitere Unterschiede auf (vgl. Abb. 50). So lässt sich lediglich in 17 der insgesamt 80 verbalen Lemmata - also bei 21,25 Prozent - nicht lemmatisierter Definitionswortschatz finden. Bei den Adjektiven sind mit 22 von 80 Lemmata 27,50 Prozent aller Lemmata betroffen. Über dem lemmatypunabhängigen Wert liegen die Substantive mit genau 30,00 Prozent (48 der 160 analysierten Lemmata) und die Gruppe Sonstiges mit exakt 35,00 Prozent (28 der 80 untersuchten Lemmata). Ein möglicher Grund für diese Verteilung liegt in der Auffälligkeit der Wörter, die in den Definitionen dieser beiden Lemmatypen vorkommen (vgl. Kap. 3.3.2.1.2). Diese Auffälligkeit zeigt sich ebenfalls bei den anderen untersuchten Merkmalen. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 264 Für nicht muttersprachliche Benutzer des LTWDaF 2 ist es zu viel, wenn in den Definitionen jedes fünften (Lemmatyp Verb) bis jedes dritten (Lemmatypgruppe Sonstiges) Lemmas Wörter verwendet werden, die nicht im Wörterbuch selbst nachgeschlagen werden können. Dies ist nicht nur äußerst benutzerunfreundlich, sondern widerspricht auch vollkommen den eigenen Prinzipien für die Arbeit mit dem computerkontrollierten Definitionswortschatz, durch den „die in den Definitionen verwendeten Wörter [...] selbst als Einträge vorhanden“ (LTWDaF 2 2007, S. 3) sein sollen. Anteil der Definitionen Lemmatyp Abb. 51: Die lemmatypspezifische Verteilung der Definitionen mit verzeichnetem und nicht verzeichnetem Definitionswortschatz im LTWDaF 2 Die nächsttiefere Ebene nach den Lemmata ist die Zahl der analysierten Definitionen. Von den insgesamt 799 untersuchten Definitionen enthalten 20,78 Prozent (166 Definitionen) mindestens ein Wort, das kein Lemma des LTW- DaF 2 ist (vgl. Kap. 3.3.1.1 und Abb. 51). Auch hier besitzt die Lemmatypgruppe Sonstiges den höchsten Anteil an nicht im Wörterbuch verzeichneten Lexemen - in 52 der 206 Definitionen kommen Wörter vor, die nicht zum Lemmabestand des LTWDaF 2 gehören, was einer relativen Häufigkeit von 25,24 Prozent entspricht. An zweiter Stelle befinden sich wiederum die substantivischen Definitionen mit einem Anteil von 23,97 Prozent (64 der 267 Definitionen). Weit dahinter liegen die Definitionen des Lemmatyps Adjektiv, von denen 15,53 Prozent nicht im LTWDaF 2 verzeichnete Lexeme enthalten (25 der 161 Definitionen). Die wenigsten Verstöße gegen das Prinzip des computerkontrollierten Definitionswortschatzes bestehen mit 14,55 Prozent (24 der 165 Definitionen) bei den Definitionen der Verben. Bei einem Vergleich der Zahlen zu den Lemmata und zu den Definitionen fällt auf, dass die Reihenfolge der einzelnen Lemmatypen - von Sonstiges (die Wörterbuchanalyse 265 meisten Verstöße) über Substantiv und Adjektiv zu Verb (die wenigsten Verstöße) - bestehen bleibt, obwohl sich die einzelnen Werte ändern. Unabhängig vom Lemmatyp verringert sich die relative Häufigkeit der Elemente mit nicht verzeichneten Lexemen von den Lemmata zu den Definitionen. Die Differenz von sieben bis zehn Prozent entsteht durch die unterschiedliche Art der Zählung. 3.4.1.2 Analyse des DHWDaF 2 Die Stichprobe zur Untersuchung des Definitionswortschatzes im DHWDaF 2 umfasst weniger Lemmata als die im LTWDaF 2, nämlich nur 382 anstatt 400. Dies liegt - wie bereits im Kapitel 3.2.2.2 ausführlich dargestellt - im unterschiedlichen Aufbau und der anders gearteten Lemmatisierung der beiden Wörterbücher begründet. In 16 Fällen werden Lemmata, die das LTWDaF 2 als homonym wertet und demzufolge in zwei oder mehr Artikeln behandelt, im DHWDaF 2 als Polyseme in einem Artikel beschrieben (vgl. Kap. 3.2.2.2). Das DHWDaF 2 fasst seine Inhalte mehr zusammen und bündelt sie in wenigen Punkten, anstatt sie - wie das LTWDaF 2 - durch eine umfangreichere Struktur nach außen hin stärker zu gliedern. Diese Tendenz zeigt sich beim DHWDaF 2 jedoch nicht nur auf der Ebene der Lemmata, indem weniger Homonyme verzeichnet werden als im LTWDaF 2, sondern auch innerhalb der einzelnen Wörterbuchartikel selbst. So verfügen die Artikel des DHW- DaF 2 über weniger Sememe als die des LTWDaF 2: Besitzt ein Wörterbuchartikel des LTWDaF 2 im Mittelwert zwei Sememe, sind es im DHWDaF 2 nur 1,69 (vgl. Kap. 3.3.1.2). 425 Sememanzahl Lemmatyp Abb. 52: Die lemmatypische Sememanzahl der Lemmata im DHWDaF 2 425 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 266 Je nach Lemmatyp bestehen jedoch auch hier große Unterschiede (vgl. Abb. 52). Die 157 substantivischen Definitionen bestehen aus 212 Sememen, wodurch sich eine durchschnittliche Anzahl von 1,35 Sememen pro Definition ergibt, was der niedrigste Wert insgesamt ist. Etwas höher liegt der Wert mit 1,49 Sememen pro Definition bei den Adjektiven, deren 118 Sememe sich auf 79 Lemmata verteilen. Leicht über den lemmatypübergreifenden Durchschnitt von 1,69 kommen die Verben. Ihr Wert von 1,85 Sememen pro Definition ergibt sich aus den 78 Lemmata mit ihren 144 Sememen. Die meisten Sememe besitzt die Lemmatypgruppe Sonstiges. Ihre 68 Definitionen umfassen insgesamt 171 Sememe, woraus sich der Wert von durchschnittlich 2,51 Sememen pro Definition errechnet. Der Vergleich beider Wörterbücher zeigt, dass die durchschnittliche Höhe der Sememanzahl pro Definition im DHWDaF 2 grundsätzlich niedriger ist als im LTWDaF 2. Davon sind alle Lemmatypen betroffen, meist in einer durchschnittlichen Höhe von 0,2 Sememen pro Lemma weniger. Allein die Lemmatypgruppe Sonstiges nimmt eine Sonderstellung ein, hier gleichen sich die Werte beider Wörterbücher beinahe vollständig. Der bestehende Zusammenhang zwischen dem Lemmatyp und der Anzahl der Sememe ist wörterbuchübergreifend in gleicher Weise vorhanden. So stimmt die Reihenfolge der Lemmatypen in beiden untersuchten Wörterbüchern überein - ausgehend von den substantivischen Definitionen nimmt die Sememanzahl über die adjektivischen und die verbalen Definitionen bis zu den Definitionen der Gruppe Sonstiges zu. Auch beim DHWDaF 2 ist die letztgenannte Lemmatypgruppe aufgrund ihrer zumeist synsemantischen Lemmata am stärksten polysem. Die rein autosemantischen Lemmatypen Substantiv, Adjektiv und Verb besitzen hingegen eine größere Tendenz zur Monosemie. Den nächsten Aspekt der Betrachtung bildet die Anzahl der Wörter, die in der Stichprobe zum DHWDaF 2 in einer Definition verwendet werden, also die durchschnittliche Länge der Definitionen. Im Mittelwert umfasst im DHW- DaF 2 jede Definition 5,88 Wörter (vgl. Kap. 3.3.1.2). Aus der Abbildung 53 geht deutlich hervor, wie unterschiedlich lang die Definitionen in Abhängigkeit von ihrem jeweiligen Lemmatyp sind. Am kürzesten sind demnach die Adjektivdefinitionen, die im Mittelwert aus lediglich 4,39 Wörtern bestehen - ihre 118 Definitionen bestehen aus 518 Tokens. Gefolgt werden diese von den verbalen Definitionen, bei denen sich aus den 754 Tokens und 144 Definitionen eine durchschnittliche Länge von 5,24 Wörtern pro Definition ergibt. Wiederum durchschnittlich gut ein Wort länger sind die Definitionen der Wörterbuchanalyse 267 Lemmatypgruppe Sonstiges mit einem Wert von 6,36 Wörtern pro Definition. Hier setzen sich die insgesamt 171 Definitionen aus 1 088 Tokens zusammen. Die umfangreichsten Definitionen der Stichprobe zum DHWDaF 2 finden sich beim Lemmatyp Substantiv, wo eine Definition im Mittelwert 6,77 Tokens umfasst. Dies ergibt sich aus den 1 435 Tokens, die sich auf die 232 Definitionen dieser Lemmatypgruppe verteilen. Wortanzahl Lemmatyp Abb. 53: Die lemmatypspezifische Wortanzahl der Definitionen im DHWDaF 2 Bei einer Gegenüberstellung des DHWDaF 2 mit dem LTWDaF 2 überwiegen wiederum die Gemeinsamkeiten sehr stark. Für beide Wörterbücher lassen sich ganz klare Zusammenhänge zwischen der Länge der Definition und dem Lemmatyp bzw. der Lemmatypgruppe feststellen. Des Weiteren ist die Reihenfolge der Lemmatypen ähnlich: Die Adjektive und die Verben besitzen die kürzesten Definitionen. Die substantivischen Lemmata sowie die aus der Gruppe Sonstiges sind hingegen sowohl im DHWDaF 2 als auch im LTW- DaF 2 überdurchschnittlich lang. Zwei der Ursachen dafür wurden bereits im Kapitel 3.4.1.1 angesprochen. Zum einen sorgen stark ausgeprägte Synonymierelationen bei den Adjektiven und bei den Verben für kürzere Definitionen, zum anderen gestalten sich gerade die Worterklärungen für Konkreta bei den Substantiven sehr umfangreich. Der letzte Punkt lässt sich auch in ähnlicher Weise auf die Lemmata der Gruppe Sonstiges übertragen. Diese Gruppe zeichnet sich dadurch aus, dass die eigentlichen Definitionen oft durch Verwendungshinweise ergänzt oder sogar ganz ersetzt werden, die zumeist umfangreicher sind als die Definitionen von Wörtern mit einer konkreteren lexikalisch-semantischen Bedeutung. Eine weitere wichtige Erkenntnis, die durch die Untersuchung gewonnen wird, ist die grundsätzlich Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 268 unterschiedliche Länge der Definitionen in beiden Wörterbüchern. So sind die Definitionen im DHWDaF 2 sowohl lemmatypunabhängig als auch bei den einzelnen Lemmatypen um zwei bis drei Wörter kürzer als im LTWDaF 2. Das klingt auf den ersten Blick nicht nach einem großen Unterschied, macht aber relativ gesehen jeweils rund ein Drittel des Umfangs der Definitionen aus. Eine mögliche Ursache dafür könnte in der muttersprachlichen Tradition liegen, in der das Duden-Wörterbuch stärker steht als das von Langenscheidt. Verwendungshäufigkeit Lemmatyp Abb. 54: Die lemmatypspezifische Verwendungshäufigkeit im DHWDaF 2 Der nächste und letzte Aspekt, der bei den allgemeinen Merkmalen der Definitionen eine Rolle spielen soll, ist die Verwendungshäufigkeit der auftretenden Types in den einzelnen Lemmatypen (vgl. Abb. 54). Der lemmatypübergreifende Durchschnitt liegt bei einer 3,11-maligen Verwendung pro Type (vgl. Kap. 3.3.1.2). Den niedrigsten Wert aller Lemmatypen besitzen mit einer durchschnittlichen Verwendungshäufigkeit von 1,77-mal die Types der adjektivischen Definitionen (293 Types bei 518 Tokens). Bei den Verben liegt die Verwendungshäufigkeit mit 2,23-mal schon etwas höher (338 Types bei 754 Tokens). Noch höher ist die Verwendungshäufigkeit der Types, die in den substantivischen Definitionen vorkommen - im Mittelwert wird jedes der 606 Types hier 2,37-mal gebraucht (1 435 Tokens). Über die höchste Verwendungshäufigkeit der Stichprobe verfügen jedoch die Definitionen der Lemmatypgruppe Sonstiges, für deren 363 Types sich bei 1 088 Tokens eine dreimalige Verwendung errechnet. Bei einer Gegenüberstellung von DHWDaF 2 und LTWDaF 2 ergeben sich auch unter diesem Aspekt der Betrachtung hauptsächlich Parallelen. Die Reihenfolge der Lemmatypen von einer niedrigen zu einer höheren Verwen- Wörterbuchanalyse 269 dungshäufigkeit ist in beiden Wörterbüchern identisch und geht von den Adjektiven über die Verben und die Substantive hin zur Lemmatypgruppe Sonstiges. Besonders hervorzuheben ist, dass sich diese Gliederung zu großen Teilen mit der Abfolge zur Anzahl der Wörter pro Definition deckt. Die Verwendungshäufigkeit der einzelnen Types ist also umso höher, je länger die Definitionen der Lemmata sind. Denn wenn mehr Wörter pro Definition verwendet werden, geht dies meist mit einer häufigeren Wiederholung der einzelnen Types einher. Diese Tatsache korrespondiert mit der Beobachtung Neubauers, dass sich die Zahl der Lemmata und die Größe des Definitionswortschatzes nicht proportional zueinander verhalten. 426 Hat das Definitionsvokabular erst einmal einen gewissen Umfang erreicht, reichen für die Definition neuer Lemmata zumeist wenige Ergänzungen aus. Unter dem Schlagwort der Sprachökonomie wird diese Beobachtung als Argument für die Verwendung eines begrenzten Definitionsvokabulars angeführt (vgl. Kap. 2.3.1.1). An dieser Stelle leuchtet ein, dass bei den Lemmatypen mit einer höheren Wortanzahl pro Definition - bei Substantiven sowie bei der Lemmatypgruppe Sonstiges - die Types im Mittelwert häufiger verwendet werden, da dort eher auf Umschreibungen und Verwendungshinweise und weniger auf spezielle Synonyme zurückgegriffen wird. Auch dies steht mit der Markiertheitstheorie in Zusammenhang, nach der weniger auffällige Lexeme häufiger verwendet werden als auffällige (vgl. Kap. 3.3.2.1.2). Durch die häufigere Verwendung von Synonymen sind die Definitionen der Adjektive und Verben als semantisch auffälliger einzuschätzen als die Definitionen der Substantive und der Lemmatypgruppe Sonstiges (vgl. Kap. 3.4.1.1). Ein Unterschied zwischen beiden analysierten Wörterbüchern besteht zudem in der absoluten Höhe der Verwendungshäufigkeit, die im DHWDaF 2 prinzipiell um rund eine Verwendung pro Type niedriger liegt als im LTWDaF 2. Dies deckt sich ebenfalls mit den Aussagen zur Definitionslänge, die im DHWDaF 2 unter der des LTWDaF 2 liegt. Wie im Kapitel 3.3.1.2 beschrieben, enthalten von den 382 untersuchten Lemmata des DHWDaF 2 insgesamt 103 Lemmata (26,96 Prozent) in den Definitionen nicht im Wörterbuch lemmatisierte Lexeme. Wie aus der Abbildung 55 hervorgeht, unterscheiden sich die einzelnen Lemmatypen dabei erheblich. Den niedrigsten Anteil am nicht zum Lemmabestand des Wörterbuchs gehörenden Definitionswortschatz besitzen mit 20,25 Prozent (16 der 78 Lemmata) die adjektivischen Lemmata. Sehr nah am Mittelwert befinden sich die verbalen und substantivischen Lemmata mit 26,92 Prozent (21 der 78 Lemmata) 426 Vgl. Neubauer (1980, S. 51f.), Neubauer (1984, S. 118) und Kapitel 2.3.1.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 270 beziehungsweise 27,39 Prozent (43 der 157 Lemmata). Der Anteil der Lemmata mit vollständig computerkontrolliertem Definitionswortschatz beträgt bei diesen beiden Lemmatypen somit weniger als drei Viertel. Weit über dem Mittelwert liegen die 68 Lemmata der Gruppe Sonstiges, von denen 23, also 33,82 Prozent, sich in ihrem verwendeten Definitionswortschatz nicht an die Grenze der im DHWDaF 2 verzeichneten Lemmata halten. Hier erfüllen nur noch zwei Drittel der Lemmata den Anspruch, mit einem computerkontrollierten Definitionswortschatz zu arbeiten. Anteil der Lemmata Lemmatyp Abb. 55: Die lemmatypspezifische Verteilung der Lemmata mit verzeichnetem und nicht verzeichnetem Definitionswortschatz im DHWDaF 2 Der Vergleich zwischen den Wörterbüchern beim nicht verzeichneten Definitionswortschatz ergibt Folgendes: Das LTWDaF 2 propagiert die Verwendung eines computerkontrollierten Definitionswortschatzes in seinen Wörterbuchaußentexten mit mehr Nachdruck als das DHWDaF 2 und führt im Anhang eine Liste des verwendeten Definitionswortschatzes auf. Trotzdem ist der Prozentsatz der Lemmata, deren Definitionswortschatz ausschließlich aus Lemmata des Wörterbuchs besteht, im DHWDaF 2 höher als im LTWDaF 2. Diese Beobachtung gilt mit den Adjektiven, den Substantiven und der Gruppe Sonstiges auch für die Mehrzahl der einzelnen Lemmatypen, wobei das DHW- DaF 2 bis zu sieben Prozentpunkte über dem LTWDaF 2 liegt. Allein bei den verbalen Lemmata ist das Verhältnis zwischen den beiden untersuchten Wörterbüchern umgekehrt: Im DHWDaF 2 gibt es bei den Verben über fünf Prozent mehr Lemmata, die in ihrem Definitionswortschatz über den Bestand des Wörterbuchs hinausgehen als im LTWDaF 2. Wörterbuchanalyse 271 Anteil der Definitionen Lemmatyp Abb. 56: Die lemmatypspezifische Verteilung der Definitionen mit verzeichnetem und nicht verzeichnetem Definitionswortschatz im DHWDaF 2 Von den 645 untersuchten Sememen beziehungsweise Definitionen des DHW- DaF 2 gehen 143 dieser Definitionen in ihren Lexemen über den computerkontrollierten Definitionswortschatz hinaus, also 22,48 Prozent (vgl. Kap. 3.3.1.2). Die Werte der Lemmatypen Substantiv und Verb liegen dabei dicht an diesem lemmatypübergreifenden Wert - wie bereits bei der Analyse der Lemmata. So enthält mit 22,64 Prozent der substantivischen und 19,44 Prozent der verbalen Definitionen ebenfalls rund ein Fünftel der Definitionen Vokabular, das nicht im DHWDaF 2 selbst verzeichnet ist (vgl. Abb. 56). Die adjektivischen Definitionen verfügen wiederum über den lemmatypspezifisch niedrigsten Wert, bei den Definitionen liegt er bei 15,25 Prozent. Mit 28,65 Prozent ist der Anteil der Definitionen mit Vokabular außerhalb des computerkontrollierten Definitionswortschatzes in der Lemmatypgruppe Sonstiges beinahe doppelt so hoch. Verglichen mit den Werten der Lemmata liegen die Werte der Definitionen je nach Lemmatyp zwischen vier Prozentpunkten (Gruppe Sonstiges) und mehr als sieben Prozentpunkten (Lemmatyp Verb) darunter. Diese Erscheinung existiert im LTWDaF 2 ebenso und ist nicht ungewöhnlich (vgl. Kap. 3.4.1.1). Denn die Auswertung der einzelnen Definitionen ist genauer als die der Lemmata. Bei der Zählung der Lemmata führt bereits ein Element außerhalb des computerkontrollierten Definitionswortschatzes dazu, dass das gesamte Lemma (und damit alle seine Sememe/ Definitionen) als über den Lemmabestand des Wörterbuchs hinausgehend gewertet wird. Bei der Zählung der Definitionen wird hingegen nur die einzelne Definition so gewertet. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 272 Die Gegenüberstellung der beiden untersuchten Wörterbücher kehrt an dieser Stelle den oben für die Lemmata beschriebenen Trend um, da die meisten Lemmatypen des DHWDaF 2 bei den Definitionen mehr Vokabular enthalten, das über den computerkontrollierten Definitionswortschatz hinausgeht. So liegen die Definitionen der Verben und der Gruppe Sonstiges im DHW- DaF 2 in dieser Hinsicht fünf beziehungsweise vier Prozentpunkte über denen des LTWDaF 2, bei den adjektivischen Definitionen sind die Werte beinahe identisch. Allein die Substantivdefinitionen des DHWDaF 2 liegen einen Prozentpunkt unter denen des LTWDaF 2, was allerdings ein sehr geringer Unterschied ist. Diese Ergebnisse revidieren für die Neuauflagen den Eindruck Klosas, das DHWDaF 1 setze das Prinzip des computerkontrollierten Definitionswortschatzes in den Artikeln sorgfältiger um als das LTW- DaF 1 (vgl. Klosa 2004, S. 301 und Kap. 3.3.1.2). Alles in allem unterscheiden sich die beiden Wörterbücher in den lemmatypübergreifenden Werten kaum voneinander. Knapp 27 Prozent (DHWDaF 2) bzw. knapp 29 Prozent (LTWDaF 2) der Lemmata und gut 22 Prozent (DHWDaF 2) bzw. knapp 21 Prozent (LTWDaF 2) der Definitionen enthalten Lexeme, die nicht im jeweiligen Wörterbuch verzeichnet sind. Nach einer Stichprobe von Herbst gehen im LDOCE 1 weniger als sieben Prozent der in den Definitionen verwendeten Wörter über den kontrollierten Definitionswortschatz hinaus (vgl. Herbst 1986 und Kap. 2.3.1.1). Damit ist der Prozentsatz des nicht verzeichneten Definitionswortschatzes im DHWDaF 2 und im LTWDaF 2 rund dreimal so hoch, obwohl es ausschließlich um einen computerkontrollierten Definitionswortschatz geht. Es ist nachteilig für die Benutzer, dass - obwohl die Arbeit mit dem computerkontrollierten Definitionswortschatz besonders im LTW- DaF 2 so stark betont wird - so viele Lemmata und Definitionen in ihrem verwendeten Vokabular den computerkontrollierten Definitionswortschatz übersteigen. 3.4.2 Zusammensetzung des untersuchten Definitionswortschatzes 3.4.2.1 Wortart und Wortartengruppe 3.4.2.1.1 Analyse des LTWDaF 2 Bei der lemmatypspezifischen Verteilung der Wortarten wird ebenfalls zwischen der Zählung der Types und der Tokens unterschieden. An dieser Stelle kommt es nicht darauf an, alle einzelnen relativen Häufigkeiten der Wortarten für die vier Lemmatypen ausführlich zu kommentieren und mit den ande- Wörterbuchanalyse 273 ren Häufigkeiten zu vergleichen. Dafür sei auf die Abbildung 57, Abbildung 59 sowie die Datensammlung B.2.1 hingewiesen, in denen die entsprechenden Zahlen umfassend in grafischer und tabellarischer Form dargestellt sind. Hier geht es vielmehr um die zusammenfassende Analyse und Wertung der erkennbaren Tendenzen, welche die lemmatypspezifische Verteilung der Wortarten betrifft. 427 Zunächst erfolgt eine Analyse der Types (vgl. Abb. 57). 428 Bei der Auswertung der Daten fällt auf, dass beispielsweise die Präpositionen in jeder lemmatypspezifischen Analyse über einen höheren Wert verfügen als in der Gesamtanalyse - bei den Substantiven kommen sie auf 3,10 Prozent, bei den Verben auf 3,70 Prozent, bei den Adjektiven auf 4,80 Prozent und in der Gruppe Sonstiges auf 6,46 Prozent, in der Gesamtanalyse machen sie jedoch nur 2,53 Prozent der Types aus (vgl. Kap. 3.3.2.1.2). Das Phänomen, in der Gesamtanalyse aller untersuchter Definitionen der Stichprobe über einen niedrigeren Wert zu verfügen als im Mittelwert aller vier lemmatypspezifischen Analysen, betrifft die Mehrzahl der Wortarten - drei der synsemantischen Wortarten (Junktion, Präposition und Pronomen) sowie Adverb und Substantiv. Lediglich die Wortarten Verb, Adjektiv und Partikel sind davon ausgenommen. Als erstes wichtiges Ergebnis ist festzuhalten, dass bei der Wortartenverteilung Besonderheiten auftreten, die auf die Lemmatypspezifik der untersuchten Lemmata zurückzuführen sind. Wie aus Abbildung 57 429 deutlich wird, handelt es sich dabei um Erscheinungen der Übereinstimmung zwischen dem Lemmatyp und der relativen Häufigkeit bestimmter Wortarten in den Definitionen. Die den einzelnen Lemmatyp konstituierenden Wortarten sind in den Definitionen dieses Lemmatyps selbst stärker repräsentiert als in den Defi-nitionen der anderen Lemmatypen. So bestehen die Verbdefinitionen in ihren Types zu 33,49 Prozent aus Verben. In den Adjektivdefinitionen sind das nur 24,24 Prozent, in den Definition der substantivischen Lemmata 19,78 Prozent und in den Definitionen der Gruppe Sonstiges sogar nur 17,94 Prozent (Anteil der Verben an der Gesamtmenge der Types: 23,03 Prozent). 427 Zur Bestimmung der Wortarten vgl. Kapitel 3.3.2.1.1. 428 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. 429 Die Darstellung ist sehr komplex, vor allem durch die Wortarten mit niedrigen Anteilen. Für eine bessere Orientierung sei darauf hingewiesen, dass die Abfolge der Wortarten bei allen Lemmatypen die gleiche ist. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 274 Anteil der Types Lemmatyp Abb. 57: Die lemmatypspezifische Verteilung der Wortarten bei den Types im LTWDaF 2 Wörterbuchanalyse 275 Genauso verhält es sich bei den Substantiven. Sie machen in den substantivischen Definitionen mit 54,64 Prozent mehr als die Hälfte der dort verwendeten Types aus. In den Definitionen der anderen drei Lemmatypen sind sie weniger stark vertreten - zu 40,43 Prozent in der Gruppe Sonstiges, zu 34,41 Prozent bei den Verben und lediglich zu 28,79 Prozent bei den Adjektiven (Anteil der Substantive an der Gesamtmenge der Types: 47,54 Prozent). Gleiches gilt für die Adjektive. In den Definitionen des Lemmatyps Adjektiv besitzen sie einen Anteil von 24,49 Prozent an den Types. Bei allen anderen Lemmatypen ist ihr Anteil deutlich niedriger - lediglich 13,46 Prozent bei den Substantivdefinitionen, 14,55 Prozent bei den Verbdefinitionen und 14,83 Prozent bei den Definitionen der Gruppe Sonstiges (Anteil der Adjektive an der Gesamtmenge der Types: 16,99 Prozent). Ein ähnliches Bild zeigt sich auch bei den Definitionen des Lemmatyps Sonstiges, deren Types zu elf Prozent aus Adverbien bestehen. Die Nähe zwischen Adverb und Adjektiv wird daran erkennbar, dass in den Definitionen des Lemmatyps Adjektiv immerhin noch 8,33 Prozent der Types Adverbien sind. Bei den übrigen Lemmatypen sind es deutlich weniger - 5,54 Prozent in den Definitionen der Verben und lediglich 4,44 Prozent in denen der Substantive (Anteil der Adverbien an der Gesamtmenge der Types: 5,96 Prozent). Auch die übrigen Wortarten sind am stärksten oder zumindest am zweitstärksten in den Definitionen der Gruppe Sonstiges vertreten - die Junktionen mit 3,35 Prozent (3,23 Prozent bei den Verben, 3,03 Prozent bei den Adjektiven, 1,75 Prozent bei den Substantiven und 1,49 Prozent der Gesamtmenge der Types), die Präpositionen mit 6,46 Prozent (4,80 Prozent bei den Adjektiven, 3,70 Prozent bei den Verben, 3,10 Prozent bei den Substantiven und 2,53 Prozent der Gesamtmenge der Types) und die Pronomen mit 5,50 Prozent (6,06 Prozent bei den Adjektiven, 4,39 Prozent bei den Verben, 2,56 Prozent bei den Substantiven und 2,16 Prozent der Gesamtmenge der Types). Die Partikeln können hier unbeachtet bleiben, da sich aufgrund ihrer geringen Gesamtzahl von vier Types keine statistisch verlässlichen Aussagen treffen lassen. Die zweite Erkenntnis, welche die lemmatypspezifische Verwendung der Wortarten in der Untersuchung zum Definitionswortschatz im LTWDaF 2 betrifft, bezieht sich auf die Wortartengruppen der Autosemantika und der Synsemantika. Auch die Anteile der autosemantischen und synsemantischen Types sind in der Stichprobe des LTWDaF 2 je nach Lemmatyp in den Definitionen unterschiedlich stark vertreten, wie in Abbildung 58 dargestellt ist. Hierbei gilt: Je stärker autosemantisch die Wortart eines untersuchten Lemmas selbst Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 276 ist, umso höher ist auch der Anteil der autosemantischen Types in der Definition dieses Lemmas. Dies hängt mit der semantischen Dichte der Wortarten zusammen (vgl. Kap. 3.3.2.1.2 und 3.3.2.1.3). Anteil der Types Lemmatyp Abb. 58: Die lemmatypspezifische Verteilung der Wortartengruppen bei den Types im LTWDaF 2 So liegt die relative Häufigkeit der synsemantischen Types in den Definitionen der Lemmatypgruppe Sonstiges, in der neben den Adverbien sämtliche synsemantische Wortarten vertreten sind, mit 17,22 Prozent am höchsten. 430 Doch auch die Definitionen des Lemmatyps Adjektiv bestehen zu 15,66 Prozent aus synsemantischen Types. Bei den Verben sind es nur 13,86 Prozent. In den Definitionen des Lemmatyps Substantiv können lediglich 8,75 Prozent der Types zu den Synsemantika gerechnet werden. In einer zweiten Betrachtung erfolgt die Zählung der Tokens, bei der die Auftretenshäufigkeit eines Types berücksichtigt wird (vgl. Abb. 59). Wiederum soll zunächst die Analyse der einzelnen Wortarten im Mittelpunkt der Betrachtung der lemmatypspezifischen Besonderheiten stehen. Für die Untersuchung an den Tokens des Definitionswortschatzes des LTWDaF 2 bestätigen sich weitgehend die weiter oben zu den Types getroffenen Aussagen. Für die Tokens lässt sich ebenfalls zunächst festhalten, dass in der Verwendung des Definitionsvokabulars lemmatypspezifische Unterschiede bestehen, die sich in der Verteilung der in den Definitionen verwendeten Wortarten manifestieren. 430 Zur Einteilung von Synsemantika und Autosemantika vgl. Kapitel 3.3.2.1.1. Wörterbuchanalyse 277 So machen die Verben in den Definitionen der verbalen Lemmata selbst 22,96 Prozent der Tokens aus, in allen anderen Lemmatypen bzw. Lemmatypgruppen hingegen viel weniger. Die Definitionen der Lemmatypgruppe Sonstiges bestehen zu 17,48 Prozent aus Verben, bei den adjektivischen Lemmata sind es nur 15,00 Prozent und bei den Substantiven lediglich 12,61 Prozent der Tokens. Vergleicht man diese Reihenfolge der Lemmatypen bzw. Lemmatypgruppen - Verb, Sonstiges, Adjektiv, Substantiv - mit der Reihenfolge bei den Types - Verb, Adjektiv, Substantiv, Sonstiges - fällt allerdings der unterschiedliche Rang der Lemmatypgruppe Sonstiges auf. In den Definitionen dieser Lemmatypgruppe ist der Anteil der verbalen Tokens recht hoch (300 Tokens), wohingegen nur sehr wenige verbale Types (75 Types) verwendet werden. Daraus ergibt sich für Verb-Types in dieser Lemmatypgruppe eine durchschnittlich viermalige Verwendungshäufigkeit. Unter den autosemantischen Wortarten ist das der höchste Wert - adjektivische Types werden in den Definitionen der Gruppe Sonstiges 2,23-mal verwendet, substantivische Types 1,94-mal und Adverb-Types 1,63-mal. Die Erklärung für dieses Phänomen zeigt sich, wenn man die häufig gebrauchten Verben in dieser Gruppe analysiert. Neben dem Vollverb sein finden sich unter den ersten fünf Verben mit angeben, bezeichnen, ausdrücken 2 und verwenden ausschließlich Zustandsverben mit einem sehr stark referenziellen Charakter. Sie werden in fast schon formelhaften Wendungen wie verwendet, um … (anzugeben/ zu bezeichnen) oder drückt … aus benutzt, beispielsweise in der Definition des Lemmas vielmehr (‘verwendet nach einer verneinten Aussage, um diese zu korrigieren und zu ergänzen oder um einen Gegensatz auszudrücken’) oder vielfach (‘drückt aus, dass etwas sich viele Male wiederholt oder in gleicher Form sehr oft vorhanden ist’). Semantisch fallen diese Verben dadurch kaum noch auf. Ihre häufige Verwendung kann mit der Markiertheitstheorie und der semantischen Dichte erklärt werden (vgl. Kap. 3.3.2.1.2). Wie die Verben zeichnen sich die Substantive bei den Tokens durch einen stark lemmatypspezifischen Gebrauch aus: Sie verfügen in ihrem eigenen Lemmatyp über einen Anteil von 25,82 Prozent an den in den Definitionen verwendeten Tokens. Dieser Anteil an substantivischen Tokens umfasst bei der Lemmatypgruppe Sonstiges nur 19,11 Prozent. Die adjektivischen Definitionen bestehen lediglich zu 15,57 Prozent aus Substantiv-Tokens, in den Definitionen der Verben sind es mit 15,33 Prozent sogar noch weniger. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 278 Abb. 59: Die lemmatypspezifische Verteilung der Wortarten bei den Tokens im LTWDaF 2 Wörterbuchanalyse 279 Besonders eindrücklich zeigt sich die Korrelation zwischen Lemmatyp und den in den Definitionen verwendeten Lexemen bei den Adjektiven. Die Tokens der adjektivischen Definitionen setzen sich zu 15,75 Prozent aus Adjektiven zusammen. Ihr Anteil ist bei allen anderen Lemmatypen bzw. Lemmatypgruppen nur halb so hoch. Er beträgt bei den substantivischen und verbalen Definitionen jeweils 8,09 Prozent und bei den Definitionen der Lemmatypgruppe Sonstiges 8,04 Prozent. Bei diesen Werten ist besonders auffällig, dass die Anteile der Adjektive in den Definitionen der Lemmatypen Substantiv, Verb und der Gruppe Sonstiges identisch sind - sie bewegen sich zwischen 8,04 Prozent (Sonstiges) und 8,09 Prozent (Substantiv und Verb). Die Wortart Adjektiv spielt demnach in den Definitionen adjektivischer Lemmata eine übergeordnete Rolle. In den Definitionen der anderen Lemmatypen ähnelt sich ihre Bedeutung stark. Auch die Junktionen passen in der Verteilung ihres Auftretens in dieses Schema. Mit einer relativen Häufigkeit von 16,67 Prozent ist ihr Anteil an den Definitionen der Lemmatypgruppe Sonstiges am höchsten. Dies deckt sich mit der Beobachtung, dass die Verwendungshäufigkeit der Junktionen dort mit 20,43-mal überdurchschnittlich hoch ist. In der Häufigkeit folgt bei den Tokens der Junktionen der Lemmatyp Adjektiv mit 13,40 Prozent. Bei den Tokens der Verbdefinitionen sind immerhin noch 10,94 Prozent Junktionen, bei den Substantiven 8,29 Prozent. Die Verteilung der Wortart Junktion bei den Tokens kann ebenfalls als sehr typisch gelten, und zwar nicht nur wegen der Korrelation zwischen Lemmatyp und der Auftretenshäufigkeit der entsprechenden Wortart, sondern auch wegen der syntaktischen Struktur der Definitionen. Junktionen dienen der Verbindung von Sätzen, von Satzgliedern oder von Satzgliedteilen. Je komplexer der syntaktische Bau einer Definition nun ist, desto höher ist auch der Anteil an Junktionen. Wie bereits oben in Verbindung mit der relativen Häufigkeit der Verben erklärt wurde, dominieren in den Definitionen der Lemmatypgruppe Sonstiges Wendungen wie verwendet, um … (anzugeben/ zu bezeichnen), in denen Junktionen häufig gebraucht werden. Die für die adjektivischen Definitionen typische Formulierung so, dass …, bei der der eigentliche Inhalt der Definition in den Nebensatz verlagert wird, sorgt durch ihre Einleitung mit der Konjunktion dass für den hohen Anteil an Junktionen bei den Adjektiv-Tokens. Ein Beispiel hierfür ist die Definition des Lemmas angenehm ‘so, dass etwas ein gutes Gefühl erzeugt oder Freude macht’. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 280 Die Präpositionen folgen zwar ebenfalls dem Phänomen, dass Wortarten in den Definitionen der eigenen Lemmatypgruppe besonders häufig auftauchen, allerdings liegen die Werte wesentlich dichter beieinander. In der Lemmatypgruppe Sonstiges haben Präpositionen mit 11,77 Prozent die höchste relative Häufigkeit. Die Definitionen des Lemmatyps Substantiv liegen mit 10,01 Prozent jedoch nur unwesentlich darunter. Gleiches gilt für den Anteil der Präpositionen an den Tokens in den Definitionen der Adjektive - 9,34 Prozent - und der Verben - 8,32 Prozent. Bei der nächsten Wortart, den Pronomen, besteht der bisher einheitliche Zusammenhang zwischen Lemmatyp und der in den Definitionen am häufigsten verwendeten Wortart nicht. Pronomen besitzen mit 31,59 Prozent den höchsten Anteil an den Tokens in den Definitionen der substantivischen Lemmata. Danach folgen die verbalen Definitionen, in denen die Pronomen auf eine relative Häufigkeit von 28,27 Prozent kommen. Erst an dritter Stelle stehen die Definitionen der Lemmatypgruppe Sonstiges, immerhin noch mit einem Anteil von 22,03 Prozent an Pronomen. Am niedrigsten ist der Anteil der Pronomen an den Tokens der adjektivischen Definitionen, er beträgt dort lediglich 17,36 Prozent. Dies korrespondiert wiederum mit den Zahlen der Verwendungshäufigkeit, die für die Pronomen in den Adjektivdefinitionen mit 7,67-mal extrem niedrig liegen. Bei allen anderen Lemmatypen und Lemmatypgruppen werden die Pronomen im Durchschnitt häufiger verwendet: Der Mittelwert liegt in der Gruppe Sonstiges bei 16,43-mal, bei den Verben bei 19,32-mal und bei den Substantiven sogar bei 41,53-mal. Dafür gibt es eine simple Erklärung. Die Wortart der Pronomen, zu denen auch die Artikelwörter gerechnet werden, steht funktional-semantisch den Substantiven recht nahe: „Als Artikelwörter charakterisieren sie das zugehörige Substantiv bzw. die zugehörige Nominalphrase, als Pronomen übernehmen sie gesamthaft die Funktion einer entsprechenden Nominalphrase.“ (Duden-Grammatik 2009, S. 252). Somit erscheint es plausibel, dass die Definitionen des Lemmatyps Substantiv neben dem höchsten Anteil an substantivischen Tokens auch über den höchsten Anteil an pronominalen Tokens verfügen. Auch die Adverbien verhalten sich ähnlich wie die Pronomen und folgen nicht der üblichen Korrelation zwischen Lemmatyp und der in den Definitionen am häufigsten verwendeten Wortart. Die Adverbien finden sich mit einem Anteil von 11,70 Prozent an den Tokens am zahlreichsten in den Definitionen der Adjektive. Die Lemmatypgruppe Sonstiges, zu deren Lemmata die Adverbien zählen, folgen dann mit 4,37 Prozent. In den Definitionen der Verben und der Substantive liegt die relative Häufigkeit der adverbialen Tokens mit 3,78 Pro- Wörterbuchanalyse 281 zent bzw. 3,24 Prozent allerdings noch niedriger. An diesem Ergebnis zeigt sich wiederum sehr eindeutig die semantische Nähe zwischen Adjektiven und Adverbien. Außerdem genügt hier die in den Adjektivdefinitionen sehr oft verwendete Formel so, dass … mit dem Adverb so, um die relative Häufigkeit der Adverbien stark ansteigen zu lassen. Die Types der Wortart Adverb, die in den Definitionen der Adjektive auftreten, werden im Durchschnitt 3,76-mal gebraucht. Dies stellt dort den höchsten Mittelwert der Verwendungshäufigkeit bei den Autosemantika dar. Außerdem liegt dieser Wert sogar noch über dem statistischen Mittelwert der in den Definitionen der Adjektive verwendeten Types (2,68-mal). Die Partikeln werden - wie bereits bei der Untersuchung der Types - bei der Token-Analyse der lemmatypspezifischen Verwendung der Wortarten nicht berücksichtigt, da sie wegen ihrer niedrigen Gesamtzahl von fünf Tokens keine statistische Aussagekraft besitzen. Auch die Tokens werden noch nach ihrer Verteilung in den Wortartengruppen der Autosemantika und der Synsemantika untersucht. Das hier vorliegende Ergebnis ist sehr einheitlich. Die Definitionen fast aller Lemmatypen und Lemmatypgruppen bestehen auf der Ebene der Tokens zur Hälfte aus autosemantischen und zur anderen Hälfte aus synsemantischen Wortarten (vgl. Abb. 60). Die genauen Zahlen bewegen sich dabei meist nur um rund zwei Prozent um die genaue 50-Prozent-Marke. Bei den Verben verfügen die synsemantischen Tokens in den Definitionen beispielsweise über einen Anteil von 51,39 Prozent, bei der Lemmatypgruppe Sonstiges über 51,98 Prozent. Der Lemmatyp Substantiv konstituiert sich zu 52,64 Prozent aus synsemantischen Tokens. Die adjektivischen Tokens bestehen nur zu 43,58 Prozent aus synsemantischen Tokens, die Mehrheit bilden hier die Autosemantika. Die Adjektivdefinitionen nehmen damit eine Sonderrolle ein, da sich bei ihren Tokens die Verteilung von Auto- und Synsemantika anders gestaltet. Die Verteilung kommt vor allem durch die hohen Werte bei den Adjektiven und Adverbien auf der einen Seite sowie durch den niedrigen Wert bei den Pronomen auf der anderen Seite zustande. In der gesamten Stichprobe zum Definitionswortschatz des LTWDaF 2 bestätigt sich die Erkenntnis, dass Synsemantika und Autosemantika jeweils die Hälfte der Tokens der Definitionen ausmachen - hier liegen die genauen Anteile bei 50,88 Prozent für die synsemantischen und dementsprechend 49,12 Prozent für die autosemantischen Wortarten (vgl. Kap. 3.3.2.1.2). Aus den hier ermittelten Zahlenwerten zur Verteilung der Autosemantika und der Synsemantika bei den Tokens der untersuchten Definitionen lassen sich außerdem noch weitere Schlüsse ziehen. Zum einen zeigt die beschriebene Verteilung erneut, dass es sich bei Wörterbuchdefinitionen Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 282 des LTWDaF 2 um Texte handelt. Denn die Anteile von Autosemantika und Synsemantika liegen in allgemeinsprachlichen Texten ebenfalls bei jeweils rund 50 Prozent. 431 Zum anderen spricht die Tatsache, dass sich die Werte in älteren Untersuchungen mit denen der vorliegenden Arbeit decken, für die Wahl der Stichprobe und deren Repräsentativität (vgl. Kap. 3.2.1). Anteil der Tokens Lemmatyp Abb. 60: Die lemmatypspezifische Verteilung der Wortartengruppen bei den Tokens im LTWDaF 2 Zusammenfassend lässt sich für die Verteilung der Wortarten in den Definitionen der vier Typen von Lemmata im LTWDaF 2 Folgendes konstatieren: Der Lemmatyp beeinflusst die relative Häufigkeit, mit der die einzelnen Wortarten in den Definitionen auftreten. Es hängt also vom Typ des Lemmas ab, mit welcher Häufigkeit die Wortarten in den Definitionen Verwendung finden. Dabei gilt das Prinzip der Übereinstimmung bzw. der Nähe. Lexeme werden dann häufig in den Definitionen verwendet, wenn sie zur gleichen Wortart gehören wie das definierte Lemma oder wenn zwischen beiden Wortarten funktional-semantische Ähnlichkeiten bestehen. Einen möglichen Erklärungsansatz hierfür liefert die Markiertheitstheorie (vgl. Kap. 3.3.2.1.2). Die lemmatypspezifische Verteilung der Wortarten deckt sich dabei zum großen Teil zwischen der Verwendung als Types und als Tokens. Für die Wortartengruppen ergeben sich hingegen je nach Art der Zählung starke Unterschiede. Die Werte der synsemantischen Types liegen lemmatypübergreifend sehr niedrig. Auch hier gilt jedoch das Prinzip der Nähe, weshalb der Wert in den Definitionen des Lemmatyps Sonstiges rund doppelt so hoch ist wie beim 431 Zu den Quellen und zum Verständnis der Wörterbuchdefinitionen als Texte sei auf Kapitel 3.2.1 verwiesen. Wörterbuchanalyse 283 Lemmatyp Substantiv. In der Zählung der Tokens gleichen sich diese Werte jedoch an und liegen lemmatypübergreifend bei rund 50 Prozent an synsemantischen Tokens, was der Verteilung in einem allgemeinsprachlichen Text entspricht. 3.4.2.1.2 Analyse des DHWDaF 2 Die lemmatypspezifische Verteilung der Wortarten wird auch für das DHW- DaF 2 nach Types und Tokens getrennt untersucht und jeweils im Anschluss mit dem LTWDaF 2 verglichen. Begonnen wird mit der lemmatypspezifischen Analyse der einzelnen Wortarten für die Types, wie sie in Abbildung 61 dargestellt ist. 432 Aus dieser geht hervor, dass sich die Anteile der einzelnen Wortarten lemmatypspezifisch unterscheiden. Dabei gilt Folgendes: Die relative Häufigkeit einer Wortart ist in den Definitionen desjenigen Lemmatyps höher, zu dem sie selbst gehört. Die Wortart Verb ist somit in den Definitionen des Lemmatyps Verb bei den Types mit einer relativen Häufigkeit von 39,64 Prozent am stärksten vertreten. Die Anteile der Verben an den Types der anderen Lemmatypen liegen um rund die Hälfte niedriger - in den adjektivischen Definitionen machen sie 21,84 Prozent aus, in den substantivischen 18,98 Prozent und in den Definitionen der Lemmatypgruppe Sonstiges sogar nur 16,53 Prozent. Genauso deutlich sind die Werte für die Adjektive: Bei den adjektivischen Definitionen nehmen sie mit einem Anteil von 30,38 Prozent der Types den ersten Platz ein, was die relative Häufigkeit aller Wortarten betrifft. Bei den anderen Lemmatypen sind die Werte für die Adjektive dann rund halb so hoch. So gehören 14,69 Prozent der Types in den substantivischen Definitionen zur Wortart Adjektiv, in den Definitionen der Lemmatypgruppe Sonstiges sind es 16,25 Prozent und bei den Verbdefinitionen 16,27 Prozent. Ähnliches gilt für die substantivischen Types, die in den Definitionen der Substantive selbst mit 56,27 Prozent mehr als die Hälfte aller Types überhaupt ausmachen. Dies ist insgesamt der höchste Wert für eine Wortart, der in der vorliegenden Untersuchung erreicht wird. So groß wie bei den Verben und bei den Adjektiven sind bei den substantivischen Types die Abstände zu den anderen Lemmatypen jedoch nicht. Vor allem bei den Types der Lemmatypgruppe Sonstiges ist der Anteil der Substantive mit 41,32 Prozent ebenfalls sehr hoch. Die Definitionen der Verben und der Adjektive fallen mit einem Wert von 26,33 Prozent bzw. 23,89 Prozent für die substantivischen Types hingegen stärker ab. 432 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 284 Anteil der Types Lemmatyp Abb. 61: Die lemmatypspezifische Verteilung der Wortarten bei den Types im DHWDaF 2 Wörterbuchanalyse 285 Ein sehr interessantes Bild liefern die Werte für die adverbialen Types. Erwartungsgemäß ist ihr Anteil in den Definitionen der Lemmatypgruppe Sonstiges mit 11,02 Prozent am höchsten. Mit nur geringem Abstand folgen die adjektivischen Definitionen, in denen 9,56 Prozent der Types zur Wortart Adverb gehören. Dieses Phänomen lässt sich durch die semantische Nähe zwischen Adjektiv und Adverb begründen. In den Definitionen der Lemmatypen Verb und Substantiv liegt die relative Häufigkeit der adverbialen Types wesentlich niedriger - sie beträgt 6,51 Prozent bei den Verb- und lediglich 2,31 Prozent bei den Substantivdefinitionen. Dieser Zusammenhang zwischen der relativen Häufigkeit der einzelnen Wortarten und den Lemmatypen zeigt sich allerdings nicht nur bei den autosemantischen Wortarten, sondern auch bei den Synsemantika. So verfügen die Präpositionen bei den Types der Lemmatypgruppe Sonstiges mit 6,89 Prozent über die höchste relative Häufigkeit aller Lemmatypen. Es folgen die adjektivischen Definitionen, in denen die Präpositionen 5,12 Prozent der Types ausmachen, die Verbdefinitionen mit einem Anteil von 5,03 Prozent an Präpositionen und schließlich die Definitionen der substantivischen Lemmata, die nur zu 3,47 Prozent aus präpositionalen Types bestehen. Die gleiche Reihenfolge gilt für die Types der Junktionen. Auch sie besitzen ihren höchsten Anteil an den Definitionen der Lemmatypgruppe Sonstiges, er beträgt dort 3,03 Prozent. In den adjektivischen Definitionen sind es 2,73 Prozent, bei den Verbdefinitionen 2,37 Prozent und bei den substantivischen Definitionen 1,32 Prozent. Die Pronomen (mit den Artikelwörtern) bilden die einzige Wortart, die in ihrem eigenen Lemmatyp nicht über den höchsten Anteil an Types verfügt. Die pronominalen Types sind mit einer relativen Häufigkeit von 5,46 Prozent in den Definitionen der Adjektive am stärksten vertreten. In der Lemmatypgruppe Sonstiges, zu der die Pronomen als Lemmata zählen, ist der Wert mit 4,13 Prozent etwas niedriger. Noch geringer ist die relative Häufigkeit der pronominalen Types in den Definitionen der Verben (3,55 Prozent) und der Substantive (2,64 Prozent). Ein möglicher Erklärungsansatz für diese Ausnahme könnte zum einen darin bestehen, dass in der Stichprobe selbst keine Pronomen vorhanden sind, die in der Lemmatypgruppe Sonstiges analysiert werden. Zum zweiten weisen Pronomen und Artikelwörter eine große morphologische Ähnlichkeit mit den Adjektiven auf. Die Types der Partikeln bleiben aufgrund ihrer extrem niedrigen Anteile von weniger als einem Prozent unberücksichtigt. Vergleicht man Abbildung 57 und Abbildung 61 - die Werte für die lemmatypspezifische Verteilung der Wortarten bei den Types im DHWDaF 2 und im LTWDaF 2 - bietet sich ein recht homogenes Bild. Das liegt in erster Linie natürlich darin begründet, dass sich die These vom Zusammenhang zwischen dem Lemmatyp und der relativen Häufigkeit der ihn konstituierenden Wortarten sowohl für das DHWDaF 2 als auch für das LTWDaF 2 bestätigen lässt. So Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 286 verfügen die Wortarten Verb, Adjektiv, Substantiv, Adverb, Präposition und Junktion in beiden Wörterbüchern jeweils über die höchste relative Häufigkeit bei den Types der Definitionen ihrer eigenen Lemmatypen. In beiden Stichproben bilden lediglich die Pronomen und Artikelwörter eine Ausnahme, weil sie in ihrem eigenen Lemmatyp, der Lemmatypgruppe Sonstiges, nur auf dem zweiten Platz landen (jeweils hinter den adjektivischen Definitionen). In zweiter Linie hängt die starke Ähnlichkeit zwischen Abbildung 57 und Abbildung 61 natürlich auch mit den nominal oft kongruenten Werten für die einzelnen Wortarten zusammen. Von den insgesamt 32 Werten, die sich pro Wörterbuch für die vier Lemmatypen mit jeweils acht Wortarten ergeben, weichen 18 in weniger als einem Prozentpunkt und acht weitere in weniger als zwei Prozentpunkten voneinander ab. Lediglich bei den restlichen sechs Werten bestehen zwischen dem DHWDaF 2 und dem LTWDaF 2 Unterschiede von mehr als zwei Prozentpunkten. Aus der Analyse der Types geht außerdem hervor, dass der Zusammenhang zwischen dem Lemmatyp und der Verwendung bestimmter Wortarten im DHWDaF 2 stärker ausgeprägt ist als im LTWDaF 2. Besonders auffällig ist dies bei den Types der verbalen Definitionen, die im DHWDaF 2 über sechs Prozent mehr Verben enthalten als im LTWDaF 2, sowie bei den adjektivischen Definitionen, die im DHWDaF 2 aus knapp sechs Prozent mehr Adjektiven bestehen als die entsprechenden Definitionen des LTWDaF 2. Neben der lemmatypspezifischen Verteilung der einzelnen Wortarten wird bei den Types der Stichprobe zum Definitionswortschatz im DHWDaF 2 auch untersucht, ob es hinsichtlich der Verteilung der Wortartengruppen lemmatypspezifische Besonderheiten gibt. Anteil der Types Lemmatyp Abb. 62: Die lemmatypspezifische Verteilung der Wortartengruppen bei den Types im DHWDaF 2 Wörterbuchanalyse 287 Solche Unterschiede bestehen tatsächlich, wie in Abbildung 62 zu sehen ist. Der Anteil der synsemantischen Types liegt in den substantivischen Definitionen mit lediglich 8,58 Prozent am niedrigsten, in den Definitionen der Verben beträgt er 13,31 Prozent. In den Definitionen der Adjektive machen die Synsemantika 15,02 Prozent aller Types aus, bei der Lemmatypgruppe Sonstiges 15,70 Prozent. Die Verteilung der Wortartengruppen bei den einzelnen Lemmatypen erscheint logisch - je stärker synsemantisch der Lemmatyp selbst ist, umso höher liegt auch der Anteil der Synsemantika bei den Types seiner Definitionen. Nicht nur dieses Untersuchungsergebnis verbindet die beiden analysierten Wörterbücher DHWDaF 2 und LTWDaF 2. Neben der gleichen Reihenfolge der einzelnen Lemmatypen in Bezug auf die Anteile der Wortartengruppen ist erstaunlich, wie stark sich die einzelnen Werte einander gleichen, obwohl das LTWDaF 2 grundsätzlich über die höheren Anteile bei den synsemantischen Types verfügt. Bei den Lemmatypen Substantiv, Verb und Adjektiv liegt das DHWDaF 2 bei den relativen Häufigkeiten für die Synsemantika jeweils weniger als einen Prozentpunkt unter den Werten des LTWDaF 2. Allein bei der Lemmatypgruppe Sonstiges beträgt der Unterschied rund anderthalb Prozentpunkte. Erneut bestechen also die Gemeinsamkeiten zwischen den beiden Wörterbüchern. Im folgenden Abschnitt steht ebenfalls die lemmatypspezifische Verteilung der Wortarten im Vordergrund, allerdings werden nun die Tokens ausgewertet (vgl. Abb. 63). Diese verdeutlicht, dass auch bei den Tokens der Stichprobe zum Definitionswortschatz des DHWDaF 2 ein Zusammenhang zwischen den einzelnen Lemmatypen und der relativen Häufigkeit der dort auftretenden Wortarten besteht. Eine Wortart ist dann besonders stark in den Definitionen eines bestimmten Lemmatyps des DHWDaF 2 vertreten, wenn sie selbst diesen Lemmatyp konstituiert. Besonders deutlich wird dies wiederum bei den Verben, die in den Definitionen ihres eigenen Lemmatyps mit 30,64 Prozent über den höchsten Anteil aller vier Lemmatypen verfügen. Die Werte der verbalen Tokens sind im Vergleich dazu bei den anderen Lemmatypen nur rund halb so hoch - so machen die verbalen Tokens in den Definitionen der Adjektive 16,60 Prozent aus. Die Tokens der Definitionen der Lemmatypgruppe Sonstiges bestehen zu 14,71 Prozent aus Verben, bei den substantivischen Definitionen sind es sogar nur 12,75 Prozent. Für die Wortart Adjektiv lässt sich ein ganz ähnliches Bild zeichnen: Bei ihrem eigenen Lemmatyp bestehen die Definitionen zu 22,39 Prozent aus adjektivischen Tokens. Nicht einmal halb so hoch ist der Anteil der adjektivischen Tokens hingegen in den Definitionen der anderen Lemmatypen. Hier liegt er sehr einheitlich zwischen zehn und elf Prozent - in den verbalen Definitionen Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 288 besitzen die adjektivischen Tokens einen Anteil von 10,34 Prozent, in den substantivischen Definitionen 10,66 Prozent und in den Definitionen der Lemmatypgruppe Sonstiges 10,75 Prozent. Auch die Substantive verfügen in den Definitionen ihres eigenen Lemmatyps über den mit Abstand höchsten Wert - 33,94 Prozent aller Tokens gehören hier zur Wortart Substantiv. Allerdings liegt hier der zweithöchste Wert für die substantivischen Tokens, den mit 21,51 Prozent die Definitionen der Lemmatypgruppe Sonstiges einnehmen, nicht so weit abgeschlagen wie bei den Wortarten Verb und Adjektiv. In den adjektivischen Definitionen besitzen die substantivischen Tokens lediglich eine relative Häufigkeit von 16,02 Prozent, in den verbalen Definitionen sogar nur 14,72 Prozent. Ähnlich wie bei den Substantiven ist die Situation bei den Präpositionen. Erwartungsgemäß erreichen die Präpositionen in den Definitionen der Lemmatypgruppe Sonstiges mit 15,81 Prozent den höchsten Wert unter den Tokens aller Lemmatypen. An zweiter Stelle liegen hier die Definitionen der Verben, deren Tokens zu 11,94 Prozent aus Präpositionen bestehen. Fast identisch sind die Anteile der präpositionalen Tokens bei den verbleibenden beiden Lemmatypen, wo sie eine relative Häufigkeit von 10,59 Prozent in den substantivischen Definitionen beziehungsweise von 10,42 Prozent in den adjektivischen Definitionen erreichen. Die Junktionen verhalten sich ebenfalls gemäß der oben aufgestellten These, sodass sie mit 8,18 Prozent über den höchsten Wert bei den Tokens der Definitionen in der Lemmatypgruppe Sonstiges verfügen. Auch hier sind die Abstände zu den anderen Lemmatypen vergleichsweise gering: An zweiter Stelle folgen die verbalen Definitionen mit einem Anteil von 7,03 Prozent junktionaler Tokens und anschließend die adjektivischen Definitionen, in denen die Junktionen eine relative Häufigkeit von 6,95 Prozent der Tokens ausmachen. Die Tokens der substantivischen Definitionen bestehen zu 6,34 Prozent aus Junktionen. Für die verbleibenden beiden Wortarten ist solch eine vollkommen einheitliche Aussage nicht möglich. Doch hier erreichen die Wortarten bei ihren eigenen Lemmatypen zumindest den zweithöchsten Wert. So nimmt die Wortart Adverb in der Lemmatypgruppe Sonstiges bei den Tokens eine relative Häufigkeit von 5,61 Prozent ein. Der Anteil der Adverb-Tokens ist in den Definitionen der Adjektive mit 10,81 Prozent jedoch um einiges höher. An dieser Stelle wird das Prinzip des direkten Zusammenhangs zwischen Wortart und Lemmatyp erneut durch das Prinzip der semantischen Nähe ergänzt, die zwischen Adjektiven und Adverbien besteht. Wörterbuchanalyse 289 Anteil der Tokens Lemmatyp Abb. 63: Die lemmatypspezifische Verteilung der Wortarten bei den Tokens im DHWDaF 2 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 290 Bei den Pronomen und Artikelwörtern liegen die substantivischen Definitionen mit einem Anteil von 24,18 Prozent bei den Tokens auf dem ersten Platz. Dicht darauf folgen die Definitionen der Lemmatypgruppe Sonstiges, in denen die Pronomen und Artikelwörter 22,33 Prozent aller Tokens für sich beanspruchen. Es folgen die Definitionen der Verben mit einer relativen Häufigkeit von 20,03 Prozent für die Pronomen. Weit davon entfernt sind hier die adjektivischen Definitionen, in denen die pronominalen Tokens lediglich einen Wert von 12,36 Prozent erreichen. Die Wortart Partikel bleibt aufgrund ihrer niedrigen Anteile erneut außerhalb der Betrachtung. Nur ein Wert ist in diesem Zusammenhang erwähnenswert - in den adjektivischen Definitionen kommen die Partikeln auf einen Anteil von 4,44 Prozent der Tokens, was auf die häufige Verwendung der Negationspartikel nicht zurückzuführen ist. Die Gegenüberstellung von DHWDaF 2 und LTWDaF 2 hinsichtlich der lemmatypspezifischen Wortartenverteilung auf der Ebene der Tokens bestätigt die aufgestellte These vom Zusammenhang zwischen der Häufigkeit der Wortart und der Art des Lemmatyps in beiden Wörterbüchern. Fünf der sieben statistisch relevanten Wortarten (die Partikeln als achte Wortart besitzen eine zu geringe relative Häufigkeit) erreichen sowohl im DHWDaF 2 als auch im LTW- DaF 2 in den Definitionen ihrer eigenen Lemmatypen die höchsten Werte bei den Tokens. Das gilt für die Wortarten Verb, Adjektiv und Substantiv in den Definitionen der jeweils eigenen Lemmatypen sowie für die Wortarten Präposition und Junktion in den Definitionen der Lemmatypgruppe Sonstiges. Die Adverbien treten in beiden Wörterbüchern als Tokens am häufigsten in den adjektivischen Definitionen auf und besitzen in ihrer eigenen Lemmatypgruppe nur den zweithöchsten Wert. Dies ist mit der semantischen Nähe zwischen Adjektiv und Adverb zu erklären. Allein die Pronomen erreichen in den Wörterbüchern unterschiedliche Ergebnisse: Im DHWDaF 2 verfügen sie hinter den Definitionen der Substantive in ihrer eigenen Lemmatypgruppe über den zweithöchsten Anteil. Im LTWDaF 2 hingegen schieben sich noch die Definitionen der Verben dazwischen und verdrängen die Lemmatypgruppe Sonstiges auf den dritten Rang. Stimmen also die Tendenzen im DHWDaF 2 und im LTW- DaF 2 überein und können die formulierten Thesen für beide Wörterbücher bestätigt werden, so weichen hingegen die absoluten Werte bei den Tokens viel stärker voneinander ab als bei den Types. So unterscheiden sich bei den Tokens 18 der insgesamt 32 Werte (vier Lemmatypen mit je acht Wortarten) im DHW- DaF 2 und im LTWDaF 2 in mehr als zwei Prozentpunkten voneinander. In vier Fällen liegt der Unterschied zwischen einem und zwei Prozentpunkten. Nur noch zehn Werte gleichen sich so stark, dass der Unterschied weniger als Wörterbuchanalyse 291 ein Prozent beträgt. Sehr auffällig ist hierbei, dass in den Definitionen des DHWDaF 2 lemmatypübergreifend viel weniger Junktionen verwendet werden als im LTWDaF 2 (vgl. Kap. 3.3.2.1.3 und 3.4.2.1.1). Gleiches gilt für die Verwendung von Pronomen und Artikelwörtern, mit Ausnahme der Lemmatypgruppe Sonstiges. Unabhängig vom Lemmatyp finden hingegen Adjektive und Präpositionen in den Definitionen des DHWDaF 2 häufiger Verwendung als im LTWDaF 2. Dies trifft auch auf die Substantive (mit Ausnahme des Lemmatyps Verb) und auf die Verben (mit Ausnahme der Lemmatypgruppe Sonstiges) zu. Es bleibt also festzuhalten, dass sich auch hier die Tendenzen in beiden Wörterbüchern gleichen, die einzelnen Werte sich bei den Tokens jedoch stärker voneinander unterscheiden, wobei im DHWDaF 2 die autosemantischen Wortarten über höhere Werte verfügen als im LTWDaF 2. Nach den einzelnen Wortarten werden noch die Wortartengruppen in ihrer lemmatypspezifischen Verteilung bei den Tokens des DHWDaF 2 untersucht (vgl. Abb. 64). Für alle Lemmatypen ist eine mehr oder minder klare Dominanz der Autosemantika festzustellen. Lediglich bei den Tokens der Definitionen der Lemmatypgruppe Sonstiges ist im DHWDaF 2 das Verhältnis von auto- und synsemantischen Wortarten fast ausgeglichen. Hier verfügen die Synsemantika über eine relative Häufigkeit von 49,36 Prozent. Bei den anderen drei Lemmatypen fällt das Verhältnis viel stärker zugunsten der Autosemantika aus. So bestehen die Tokens der Definitionen der Substantive nur zu 44,11 Prozent aus Synsemantika. In den verbalen und adjektivischen Definitionen ist der Anteil der synsemantischen Wortarten mit 42,57 Prozent beziehungsweise 34,75 Prozent der Tokens noch niedriger. Anteil der Tokens Lemmatyp Abb. 64: Die lemmatypspezifische Verteilung der Wortartengruppen bei den Tokens im DHWDaF 2 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 292 Diese vergleichsweise niedrigen Zahlen für die synsemantischen Wortarten sollten jedoch nicht über die enorme Steigerung ihrer Anteile bei den Tokens im Vergleich zu den Types im DHWDaF 2 hinwegtäuschen. Dies zeigen die Werte zur Verwendungshäufigkeit, die im DHWDaF 2 mit einer Ausnahme bei allen autosemantischen Wortarten unter dem jeweiligen lemmatypspezifischen Durchschnitt liegen. 433 Die Verwendungshäufigkeiten aller synsemantischen Wortarten sind hingegen ausnahmslos überdurchschnittlich hoch, was den Mittelwert der einzelnen Lemmatypen betrifft. Jedoch zeigt ein Vergleich des DHWDaF 2 mit dem LTWDaF 2 deutliche Unterschiede in den Anteilen der Autosemantika und der Synsemantika bei den Tokens. Mit Ausnahme der adjektivischen Definitionen bewegen sich die Werte im LTWDaF 2 um die 50-Prozent-Marke (plus/ minus zwei Prozent). Im DHWDaF 2 sind die Anteile der autosemantischen Wortarten hingegen lemmatypübergreifend um rund neun Prozentpunkte höher als im LTWDaF 2, die dann dementsprechend bei den Synsemantika fehlen. Dies mag zunächst im Hinblick auf die Untersuchung etwas ungewöhnlich erscheinen, werden doch im Kapitel 3.4.2.1.1 gerade die jeweils 50-prozentigen Anteile von synsemantischen und autosemantischen Wortarten bei den Tokens als Bestätigung dafür herangezogen, dass es sich bei den Wörterbuchdefinitionen um Texte mit einer entsprechenden Verteilung dieser Wortartengruppen handelt (vgl. Kap. 3.2.1). Jedoch muss ganz klar zwischen den Definitionen der beiden untersuchten Wörterbücher unterschieden werden. Bereits das Kapitel 3.3.2.1.3 erläutert ausführlich, dass die Definitionen im LTWDaF 2 im Vergleich zum DHWDaF 2 viel umfangreicher sind und in stärkerem Maß über satzähnliche Strukturen verfügen. Diese These lässt sich an dieser Stelle erneut belegen, und zwar mit ebendiesem höheren Anteil der autosemantischen Tokens an den Definitionen des DHWDaF 2. Der niedrige Wert der Synsemantika in den Definitionen der Adjektive weist beispielsweise darauf hin, dass dort in den Definitionen besonders stark auf Synonyme zurückgegriffen wird, wovon auch der extrem hohe Anteil der Adjektive bei diesem Lemmatyp zeugt (vgl. Kap. 3.4.1.1). Die einzelnen Werte für die Gebrauchshäufigkeit liegen sowohl bei den jeweiligen Wortarten als auch bei den Wortartengruppen im LTWDaF 2 grundsätzlich höher als im DHWDaF 2. Vor allem bei den synsemantischen Wortarten sind die Abstände zwischen beiden Wörterbüchern besonders groß. Das wird zum Beispiel an der Verwendungshäufigkeit der Pronomen in den substantivischen Definitionen deutlich, 433 Bei der einzigen Ausnahme handelt es sich um die Adverbien, die in den Definitionen der Adjektive im Mittelwert zweimal verwendet werden, was über der durchschnittlichen Verwendungshäufigkeit von 1,77-mal beim Lemmatyp Adjektiv liegt. Dass die einzige Abweichung ausgerechnet das Adverb ist, zeigt einmal mehr dessen zu Teilen unklare Stellung zwischen Autosemantika und Synsemantika (vgl. Kapitel 3.3.2.1.1 und Duden-Grammatik 2009, S. 569). Wörterbuchanalyse 293 die im LTWDaF 2 mit 41,43-mal rund doppelt so hoch ist wie im DHWDaF 2 mit 21,69-mal. Durch solche Zahlen erklärt sich dann, warum sich die Werte für die Synsemantika und die Autosemantika, die bei den Types noch beinahe identisch sind, bei den Tokens viel stärker voneinander unterscheiden. Die im DHWDaF 2 durchgängig niedrigeren Verwendungshäufigkeiten lassen sich erneut mit der Markiertheitstheorie begründen (vgl. Kap. 3.3.2.1.2). Für die lemmatypspezifische Verteilung der Wortarten und der Wortartengruppen lässt sich resümierend festhalten, dass auch unter diesem Aspekt die Gemeinsamkeiten zwischen den beiden untersuchten Wörterbüchern dominieren. Die aufgestellte These über den Zusammenhang zwischen Lemmatyp und den in den Definitionen verwendeten Wortarten kann sowohl für das LTW- DaF 2 als auch für das DHWDaF 2 bestätigt werden. Die beschriebenen Entwicklungstendenzen gelten in den zwei Wörterbüchern gleichermaßen. Bei der Analyse der Types kommt hinzu, dass sich das DHWDaF 2 und das LTW- DaF 2 enorm in den einzelnen nominalen Werten gleichen. Aufgrund bestimmter Unterschiede in der Definitionspolitik in beiden Wörterbüchern unterscheiden sich die einzelnen Werte bei den Tokens stärker. 3.4.2.2 Herkunft 3.4.2.2.1 Analyse des LTWDaF 2 Die Herkunft des Definitionswortschatzes, der in der Untersuchung des LTW- DaF 2 gebraucht wird, lässt sich lemmatypspezifisch ebenfalls ausführlicher darstellen, als das in einer Gesamtbetrachtung möglich ist. 434 Wiederum werden zunächst die Types analysiert (vgl. Abb. 65): Anteil der Types Lemmatyp Abb. 65: Die lemmatypspezifische Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Types im LTWDaF 2 434 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 294 Wie bei der übergreifenden Betrachtung aller Types der Stichprobe (vgl. Kap. 3.3.2.2.2) sind die nativen Lexeme bei der lemmatypspezifischen Analyse ebenfalls stark vorherrschend. Sie erreichen je nach Lemmatyp Anteile zwischen gut 85 und knapp 91 Prozent. Am schwächsten sind die nicht nativen Lexeme mit 9,09 Prozent bei den Types der adjektivischen Definitionen vertreten. Ein fast identisches Ergebnis weisen die Definitionen der verbalen Lemmata auf - die nicht nativen Types machen 9,24 Prozent der Gesamtmenge aus. Mit 11,96 Prozent machen die nicht nativen Lexeme bei den Types der Definitionen in der Lemmatypgruppe Sonstiges einen etwas höheren Anteil aus. Die höchste relative Häufigkeit besitzen die nicht nativen Lexeme mit 14,94 Prozent bei den Types des Lemmatyps Substantiv. Der Wert für die nicht nativen Types in den Definitionen der substantivischen Lemmata liegt damit noch über dem Anteil von 14,08 Prozent, den die nicht nativen Lexeme in der lemmaübergreifenden Analyse erreichen. In einem zweiten Schritt folgt die Auswertung der Anteile, die sich auf die Herkunft der Tokens beziehen (vgl. Abb. 66). Im Vergleich zu den Types sinken die Anteile der nicht nativen Lexeme noch einmal um rund die Hälfte. Den höchsten Wert für nicht native Tokens besitzen erneut die Definitionen des Lemmatyps Substantiv mit 6,61 Prozent, ganz ähnlich ist er mit 6,29 Prozent in den Definitionen der Lemmatypgruppe Sonstiges. Die relative Häufigkeit der nicht nativen Lexeme in den adjektivischen Definitionen beträgt bei den Tokens 4,72 Prozent, mit 3,54 Prozent ist sie in den Verbdefinitionen am niedrigsten. Die hier beschriebene geringere relative Häufigkeit der nicht nativen Tokens im Vergleich zu den Types lässt sich mit den Werten der Verwendungshäufigkeit der nicht nativen Types illustrieren. Denn diese sind extrem niedrig und liegen bei allen Lemmatypen unter den dortigen Durchschnittswerten, was auf die Auffälligkeit der nicht nativen Lexeme zurückzuführen ist (vgl. Kap. 3.3.2.1.2). In der Gruppe Sonstiges erzielen die nicht nativen Types mit einer Verwendungshäufigkeit von 2,16-mal den höchsten Wert. Bei diesem Lemmatyp liegt die allgemeine Verwendungshäufigkeit der Types mit 4,11-mal jedoch ebenfalls sehr hoch. Die Werte für die Verwendungshäufigkeit der anderen Lemmatypen sind mit 1,49-mal bei den Substantiven (lemmatypspezifischer Durchschnitt 3,36-mal), mit 1,39-mal bei den Adjektiven (lemmatypspezifischer Durchschnitt 2,68-mal) und mit 1,15-mal bei den Verben (lemmatypspezifischer Durchschnitt dreimal) viel niedriger. Diese Tatsache erklärt, warum beim nicht nativen Definitionswortschatz trotz ähnlicher relativer Häufigkeiten wie bei den synsemantischen Types die Anteile bei den Tokens sinken. Wörterbuchanalyse 295 Anteil der Tokens Lemmatyp Abb. 66: Die lemmatypspezifische Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Tokens im LTWDaF 2 Als Resümee lässt sich für die lemmatypspezifische Analyse der Herkunft des Definitionswortschatzes im LTWDaF 2 feststellen, dass der Anteil der nicht nativen Types unabhängig vom Lemmatyp sehr niedrig ist. Aufgrund der geringen Verwendungshäufigkeit verkleinern sich diese Werte bei den Tokens - wiederum lemmatypübergreifend - um rund die Hälfte. Die nicht nativen Lexeme spielen im LTWDaF 2 für das Definieren der Lemmata demzufolge eine untergeordnete Rolle. 3.4.2.2.2 Analyse des DHWDaF 2 Die Herkunft des Definitionswortschatzes wird auch für das DHWDaF 2 in Bezug auf seine lemmatypspezifischen Besonderheiten dargestellt. Im Anschluss daran erfolgt wiederum ein Vergleich mit den Ergebnissen zum LTWDaF 2. Zunächst erfolgt die Analyse der Types (vgl. Abb. 67). 435 Bereits auf den ersten Blick fällt der hohe Anteil der nativen Lexeme auf, der - unabhängig vom jeweiligen Lemmatyp - bei über 90 Prozent liegt. Die Werte der zwei Lemmatypen Substantiv und Adjektiv sowie der Lemmatypgruppe Sonstiges ähneln sich dabei recht stark: Die Definitionen der Substantive besitzen in ihren Types mit 9,90 Prozent den höchsten Anteil an nicht nativen Lexemen. Etwas niedriger liegt die relative Häufigkeit der fremden Lexeme bei den Types der Definitionen der Lemmatypgruppe Sonstiges, in der sie 8,82 Prozent ausma- 435 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 296 chen. Die Definitionen des Lemmatyps Adjektiv bestehen zu einem noch niedrigeren Anteil aus nicht nativen Lexemen - 7,85 Prozent aller Types verfügen über diese Eigenschaft. In den Definitionen des Lemmatyps Verb sind hier lediglich 5,33 Prozent der Types den nicht nativen Lexemen zuzurechnen. Diese Zahlen zur Herkunft der Lexeme bei den Types der Stichprobe des DHWDaF 2 verdeutlichen, dass die fremden Lexeme grundsätzlich eine eher geringere Bedeutung für den Definitionswortschatz besitzen. Anteil der Types Lemmatyp Abb. 67: Die lemmatypspezifische Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Types im DHWDaF 2 Ein Vergleich zwischen den beiden Wörterbüchern offenbart an dieser Stelle Parallelen im Verhältnis von nativen und nicht nativen Lexemen, da die fremden Lexeme in beiden Werken eine unbedeutendenere Rolle spielen als die heimischen. Dass sich die einzelnen Werte im DHWDaF 2 und im LTWDaF 2 dabei um einige Prozentpunkte unterscheiden, fällt kaum ins Gewicht. Die Anteile der fremden Lexeme liegen lemmatypübergreifend bei den Types im LTW- DaF 2 höher als im DHWDaF 2 - bei den adjektivischen Definition um rund einen Prozentpunkt, bei den Types der Lemmatypgruppe Sonstiges um etwa drei, bei den verbalen Definitionen um vier und beim Lemmatyp Substantiv sogar um fünf Prozentpunkte. Sowohl im DHWDaF 2 als auch im LTWDaF 2 haben die fremden Lexeme in den Definitionen des Lemmatyps Substantiv und der Lemmatypgruppe Sonstiges den höchsten Anteil. Der nächste Abschnitt beschäftigt sich mit der Herkunft der Tokens der einzelnen Lemmatypen im DHWDaF 2. In Abbildung 68 fällt auf, dass sich der Anteil der nicht nativen Lexeme aller vier Lemmatypen im Vergleich zu den Werten der Types verringert. Über den höchsten Anteil an fremden Lexemen Wörterbuchanalyse 297 bei den Tokens des DHWDaF 2 verfügen erneut die Definitionen des Lemmatyps Substantiv, er ist mit 6,62 Prozent allerdings rund zwei Drittel kleiner als bei den Types. Den zweithöchsten Wert besitzen mit 5,21 Prozent die adjektivischen Definitionen. Die Lemmatypgruppe Sonstiges gibt mehr als die Hälfte ihrer Anteile bei den fremden Lexemen ab, bei den Tokens besitzen sie nur noch eine relative Häufigkeit von 4,23 Prozent. Die Tokens des Lemmatyps Verb enthalten mit 3,32 Prozent relativ die wenigsten fremden Lexeme. Der Rückgang der Anteile der nicht nativen Lexeme von den Types zu den Tokens kann abermals anschaulich mit den Daten zur Verwendungshäufigkeit der einzelnen Types untermauert werden. Bei allen Lemmatypen besitzen die nativen Lexeme eine über dem lemmatypeigenen Durchschnitt liegende Verwendungshäufigkeit, bei den nicht nativen Lexemen liegt sie indessen prinzipiell unter diesem Mittelwert. Begründbar ist dies wiederum mit der Markiertheitstheorie und der damit im Zusammenhang stehenden höheren Auffälligkeit der nicht nativen Lexeme (vgl. Kap. 3.3.2.1.2). Nominal gesehen sind die Verwendungshäufigkeiten der nicht nativen Lexeme im DHWDaF 2 extrem niedrig, sie bewegen sich bei Werten zwischen 1,17 und 1,58. Anteil der Tokens Lemmatyp Abb. 68: Die lemmatypspezifische Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Tokens im DHWDaF 2 Bei einer Gegenüberstellung des DHWDaF 2 und des LTWDaF 2 sind auch unter diesem Aspekt der Betrachtung die Parallelen offensichtlich. In beiden Wörterbüchern verkleinern sich die ohnehin geringen Anteile der nicht nativen Lexeme von den Types zu den Tokens erneut. Allerdings ist die Differenz im LTWDaF 2 deutlich größer als im DHWDaF 2. So gleichen sich die nominalen Werte für die Verteilung von nativen und nicht nativen Lexemen Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 298 bei einigen Lemmatypen fast vollständig an - die Werte bei den Definitionen der Substantive und Verben sind beinahe identisch, bei den Adjektiven unterscheiden sie sich lediglich um einen halben Prozentpunkt. Selbst die zwei Prozentpunkte, in denen die Anteile bei den Definitionen der Lemmatypgruppe Sonstiges differieren, fallen nicht wirklich ins Gewicht. Auch bei den Tokens enthalten die Definitionen der Substantive sowohl im DHWDaF 2 als auch im LTWDaF 2 noch den höchsten Anteil an fremden Lexemen. Für die lemmatypspezifische Analyse des Definitionswortschatzes hinsichtlich seiner Herkunft kann zusammenfassend auf die wiederum stark dominierenden Gemeinsamkeiten zwischen den beiden untersuchten Wörterbüchern verwiesen werden. Sowohl im DHWDaF 2 als auch im LTWDaF 2 spielen die nicht nativen Lexeme in den Definitionen der verschiedenen Lemmatypen eine geringe Rolle. Die bereits bei den Types schwach ausgeprägten Anteile der fremden Lexeme sind bei den Tokens noch niedriger. Dies zeigt deutlich, dass die nicht nativen Lexeme in den Definitionen der zwei Wörterbücher selten verwendet werden. 436 3.4.2.3 Wortbildung 3.4.2.3.1 Analyse des LTWDaF 2 Das nächste Merkmal, nach dem die Stichprobe des Definitionswortschatzes im LTWDaF 2 lemmatypspezifisch untersucht wird, ist die Wortbildung. Wie bereits bei der allgemeinen Analyse stehen unterschiedliche Aspekte des Gebietes Wortbildung im Mittelpunkt (vgl. Kap. 3.3.2.3.1, 3.3.2.3.2.1 und 3.3.2.3.3.1). So stellt sich zunächst die Frage, ob die Autosemantika des verwendeten Definitionswortschatzes das Ergebnis von Wortbildungsprozessen sind. Auf der nächsten Ebene ist von Interesse, welche Anteile die einzelnen Wortbildungsarten an den motivierten Wortbildungsprodukten besitzen. Diese Schwerpunkte werden wie in den vergangenen Kapiteln in Bezug auf die Types und auf die Tokens untersucht. Für eine bessere Übersicht erfolgt die Darstellung der Types und der Tokens hier immer gemeinsam, nach Merkmalen geordnet. Zuerst werden die Anteile der Wortbildungsprodukte an den Autosemantika für die einzelnen Lemmatypen im LTWDaF 2 näher untersucht, zunächst bei den Types (vgl. Abb. 69). 437 436 Zur Rolle der Internationalismen in den Definitionen einsprachiger Lernerwörterbücher vgl. Herbst (1986, S. 115f.), Whitcut (1986, S. 121), Jehle (1990b, S. 504), Herbst/ Klotz (2003, S. 52), Wellmann (2004, S. 99f.) sowie Kapitel 2.3.2 und 3.1.1. 437 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Wörterbuchanalyse 299 Anteil der Types Lemmatyp Abb. 69: Die lemmatypspezifische Verteilung der autosemantischen Types nach Wortgebildetheit im LTWDaF 2 Betrachtet man die Stichprobe unter dem Aspekt der Wortgebildetheit, zeigen sich lemmatypspezifische Unterschiede. Die Definitionen des Lemmatyps Sonstiges besitzen mit 34,68 Prozent den niedrigsten Anteil an primären Types. Die motivierten Types machen hier 58,67 Prozent der autosemantischen Types aus, die verbleibenden 6,65 Prozent entfallen auf die demotivierten Lexeme. Der zweithöchste Wert bei den motivierten Types ist mit 54,42 Prozent bei den Verbdefinitionen zu finden. 8,31 Prozent entfallen hier auf die demotivierten und 37,27 Prozent auf die primären Types. Eine sehr ähnliche relative Häufigkeit bei den motivierten Types besteht mit 53,83 Prozent bei den Substantivdefinitionen. Die verbleibenden Lexeme sind zu 7,23 Prozent der Types demotiviert, zu 38,94 Prozent der Types primär. Den höchsten Anteil haben die primären Autosemantika mit 43,71 Prozent an den Types der adjektivischen Definitionen. Der Wert für die motivierten Types liegt mit 48,20 Prozent am niedrigsten. Die restlichen 8,08 Prozent entfallen auf die demotivierten Types. Neben der Erkenntnis, dass die Verteilung von motiviertem und primärem Definitionswortschatz vom Lemmatyp abhängig ist, gibt es noch eine weitere Beobachtung: Die Anteile der demotivierten Lexeme bei den Types der verschiedenen Lemmatypen sind mit Werten von 6,65 Prozent (Lemmatyp Sonstiges) bis 8,31 Prozent (Lemmatyp Verb) sehr ähnlich. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 300 Anteil der Tokens Lemmatyp Abb. 70: Die lemmatypspezifische Verteilung der autosemantischen Tokens nach Wortgebildetheit im LTWDaF 2 Bei einem Vergleich der Werte der autosemantischen Types mit den Werten für die Tokens im LTWDaF 2 fällt auf, dass sich die relativen Häufigkeiten bei den meisten Lemmatypen um rund zehn Prozent zugunsten der primären Lexeme verschieben (vgl. Abb. 70). Die Anteile der motivierten Lexeme sinken etwa in gleichem Maß. Den höchsten Wert für primären autosemantischen Definitionswortschatz bei den Tokens findet man erneut in der Lemmagruppe Adjektiv, er beträgt 58,70 Prozent. Bei den adjektivischen Definitionen verteilen sich die restlichen Anteile zu 35,12 Prozent auf die motivierten und zu 6,19 Prozent auf die demotivierten Tokens. An zweiter Stelle stehen die substantivischen Definitionen, bei denen die relative Häufigkeit der primären autosemantischen Tokens 51,14 Prozent beträgt. Hier entfallen auf die motivierten Tokens 42,18 Prozent und auf die demotivierten 6,68 Prozent. Bei den Verbdefinitionen liegt die Quote für die primären Tokens mit 48,18 Prozent erstmals unter der 50-Prozent-Marke. Die verbleibenden Tokens sind zu 45,64 Prozent motiviert und zu 6,18 Prozent demotiviert. Die autosemantischen Tokens der Lemmagruppe Sonstiges bestehen nur zu 37,74 Prozent aus primären Lexemen. Die motivierten Tokens besitzen einen Anteil von 56,31 Prozent, die demotivierten Tokens machen 5,95 Prozent aus. Der Lemmatyp Sonstiges stellt damit eine Besonderheit dar, weil die Werte für die motivierten Tokens im Vergleich zu den Types nur schwach sinken. Die Reihenfolge der einzelnen Lemmatypen ändert sich von den Types zu den Tokens für die Anteile der motivierten und der primären Lexeme nicht. So steigen die Werte für die motivierten Lexeme von den Lemmagruppen Adjek- Wörterbuchanalyse 301 tiv über Substantiv und Verb zur Gruppe Sonstiges an. Bei den primären Lexemen wachsen die Quoten von den Lemmagruppen Sonstiges über Verb und Substantiv zur Gruppe Adjektiv. Auch für die demotivierten Lexeme lassen sich interessante Beobachtungen machen. Ihre Anteile sind nicht nur, wie bereits oben festgestellt, bei der Zählung der Types lemmatypübergreifend sehr ähnlich, sondern auch bei der Zählung der Tokens. Hier liegen die Werte der einzelnen Lemmagruppen mit Quoten zwischen 5,95 Prozent (Sonstiges) und 6,68 Prozent (Substantiv) sogar noch viel dichter beieinander und können somit als lemmatypunabhängig bezeichnet werden. Noch viel überraschender ist allerdings die Tatsache, dass sich die Werte für die demotivierten Lexeme im Vergleich zwischen Types und Tokens ebenfalls kaum ändern. Bei den Types liegen ihre Anteile zwischen 6,65 Prozent (Sonstiges) und 8,31 Prozent (Verb), bei den Tokens zwischen 5,95 Prozent (Sonstiges) und 6,68 Prozent (Substantiv). Anteil der Types Lemmatyp Abb. 71: Die lemmatypspezifische Verteilung der Wortbildungsarten bei den motivierten autosemantischen Types im LTWDaF 2 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 302 Zuletzt erfolgt noch die Analyse der lemmatypspezifischen Besonderheiten, welche die Verteilung der einzelnen Wortbildungsarten im LTWDaF 2 betreffen. Hierfür wird der Anteil der motivierten Lexeme noch ausführlicher untersucht. Wiederum werden zunächst die Types betrachtet (vgl. Abb. 71). Lemmatypübergreifend ist die Derivation die bei den Types mit Abstand am häufigsten vorkommende Wortbildungsart. Sie erreicht je nach Lemmatyp Werte zwischen 50 Prozent und 62 Prozent. Mit einem Anteil von 50,25 Prozent liegt die Quote der derivierten Types bei der Lemmagruppe Sonstiges am niedrigsten. Sie steigert sich über 55,34 Prozent bei den substantivischen Lemmata bis hin zu 59,61 Prozent bei den Verben und 62,11 Prozent bei den Adjektiven. An zweiter Stelle steht - ebenfalls lemmatypunabhängig - die Konversion. Bei den Types ist diese in den Definitionen der Substantive mit 24,93 Prozent besonders stark vertreten. Es folgen die Definitionen der Lemmagruppe Sonstiges mit 21,67 Prozent der Types, die Verben mit einem Anteil von 20,20 Prozent an Konversionsprodukten sowie die adjektivischen Definitionen, in denen immerhin noch 19,88 Prozent der motivierten Types auf Konversion zurückgehen. Die dritthäufigste Wortbildungsart ist die Komposition. Sie verfügt in den verbalen Definitionen über eine Quote von 8,87 Prozent bei den Types, bei den substantivischen Types macht sie 12,33 Prozent aus und in den Definitionen der Adjektive 12,42 Prozent. Der Lemmatyp Sonstiges besitzt von allen Lemmatypen den höchsten Anteil an Kompositionen, hier entfallen 19,21 Prozent der motivierten Types auf diese Wortbildungsart. Die Partikelverbbildung ist besonders stark beim Lemmatyp Verb vertreten, die relative Häufigkeit beträgt dort 10,84 Prozent. Damit ist bei den Types des Lemmatyps Verb die Partikelverbbildung sogar von höherer Bedeutung als die Komposition. In den Definitionen des Lemmatyps Sonstiges können 8,87 Prozent der motivierten Types zur Partikelverbbildung gerechnet werden, beim Lemmatyp Substantiv sind es 6,30 Prozent und beim Lemmatyp Adjektiv lediglich 5,59 Prozent. Kurzwörter sind ausschließlich in den substantivischen und in den verbalen Definitionen vorhanden, ihre Anteile sind mit 1,10 Prozent bzw. 0,49 Prozent jedoch sehr gering. Abschließend wird die Verteilung der Wortbildungsarten auch für die Tokens im LTWDaF 2 analysiert (vgl. Abb. 72). Verglichen mit den Types ändert sich an der Reihenfolge der Wortbildungsarten in Bezug auf ihre Anteile bei den Tokens bis auf zwei Einschränkungen nichts. Die Derivation kommt am häufigsten vor, gefolgt von der Konversion, der Komposition, der Partikelverbbildung und der Kurzwortbildung. Allein beim Lemmatyp Verb und bei der Lemmatypgruppe Sonstiges tauschen die Partikelverbbildung und die Kom- Wörterbuchanalyse 303 position ihre Plätze. Ansonsten verschieben sich je nach Wortbildungsart lediglich die genauen Werte. Die Derivation kann - als Wortbildungsart mit den höchsten Anteilen - ihre Werte lemmatypunabhängig sogar noch verstärken. In den adjektivischen Definitionen besitzt die Derivation mit 64,29 Prozent auch unter den Tokens den höchsten Wert. Bei den Verbdefinitionen steigt der Anteil der Derivationsprodukte auf 60,76 Prozent. Den dritten Platz nimmt mit 58,19 Prozent die Lemmagruppe Sonstiges ein. Hier verfügen die derivierten Tokens über ein auffällig starkes Wachstum von acht Prozent im Vergleich zu den Types. Doch auch in den Substantivdefinitionen, bei denen die derivierten Tokens eine Quote von 56,51 Prozent der motivierten autosemantischen Lexeme ausmachen, sowie in den anderen Lemmatypen steigt der Anteil der Derivate leicht. Anteil der Tokens Lemmatyp Abb. 72: Die lemmatypspezifische Verteilung der Wortbildungsarten bei den motivierten autosemantischen Tokens im LTWDaF 2 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 304 Diese Beobachtung lässt sich sehr anschaulich an den Werten der Verwendungshäufigkeit der derivierten Types zeigen. In den Lemmagruppen Adjektiv, Verb und Substantiv liegen diese nur unwesentlich höher als der Durchschnitt. Die Verwendungshäufigkeit der Derivate der Lemmatypgruppe Sonstiges ist hingegen mit 2,65-mal deutlich überdurchschnittlich. Insgesamt verfügen alle vier Lemmagruppen bei den Derivaten über recht ähnliche Werte. Trotz der im Vergleich zu den Types fast überall sinkenden Anteile der Konversion an den motivierten autosemantischen Tokens bleibt diese Wortbildungsart auf dem zweiten Platz. Am stärksten ist die Konversion mit einer sogar leicht gestiegenen relativen Häufigkeit von 25,25 Prozent hierbei in den Definitionen der Substantive vertreten. Es folgen die Definitionen der Adjektive (19,05 Prozent) und der Verben (17,36 Prozent). Die Unterschiede wirken sich am deutlichsten bei den Definitionen der Lemmagruppe Sonstiges aus - hier sinkt die Quote der Konversionen bei den Tokens um mehr als fünf Prozent auf 16,16 Prozent. Dies wird auch bei der Verwendungshäufigkeit sichtbar, die beim Lemmatyp Sonstiges mit 1,70-mal für die Konversionen weit unter dem lemmatypspezifischen Mittelwert von 2,29-mal liegt. Bei den anderen Lemmatypen mit unterdurchschnittlicher Verwendungshäufigkeit ist der Abstand zum lemmatypspezifischen Mittelwert deutlich geringer. Auch die Komposition als dritthäufigste Wortbildungsart sinkt bei fast allen Lemmatypen in ihren Token-Anteilen gegenüber den Types. Bemerkenswert ist, wie dicht die lemmatypspezifischen Werte insgesamt beieinanderliegen. So verfügen die adjektivischen Definitionen mit 11,90 Prozent über die höchste Quote an Kompositionsprodukten bei den motivierten autosemantischen Tokens. Der Wert der Lemmagruppe Sonstiges ist mit 11,21 Prozent jedoch kaum niedriger. Es folgen die substantivischen Definitionen, deren motivierte autosemantische Tokens zu 10,62 Prozent aus Kompositionen bestehen, und die Verbdefinitionen mit einer relativen Häufigkeit von 9,03 Prozent. Die Verben sind damit der einzige Lemmatyp, bei dem der Anteil der Komposition im Vergleich zu den Types zumindest geringfügig steigt. Bei den Kompositionen sinken die Werte beim Lemmatyp Sonstiges mit acht Prozent am stärksten. Kompositionsprodukte werden beim Lemmatyp Sonstiges im Schnitt 1,33-mal verwendet - das ist für diesen Lemmatyp der niedrigste wortbildungsartspezifische Wert. Im Vergleich zu den Types steigen die Anteile der Partikelverbbildungen bei den Tokens fast bei allen Lemmatypen. Für diese Wortbildungsart differieren die lemmatypspezifischen Werte sehr stark. So liegt die relative Häufigkeit der Partikelverben bei den Tokens Wörterbuchanalyse 305 des Lemmatyps Sonstiges mit 14,44 Prozent am höchsten. Dieser Lemmatyp verfügt wiederum über die stärkste Abweichung gegenüber den Types. Die Zunahme von rund sechs Prozent macht sich in der Verwendungshäufigkeit bemerkbar, die mit 3,72-mal weit über dem wortbildungsartspezifischen Durchschnittswert von 2,29-mal liegt. Auch der Anteil der Partikelverbbildungen an den motivierten autosemantischen Tokens der Verbdefinitionen ist mit 12,50 Prozent noch hoch. Für dieses Phänomen gibt es eine einfache Erklärung: Die Partikelverbbildung ist als einzige Wortbildungsart auf lediglich eine Wortart beschränkt - die Verben. Einerseits erscheint es plausibel, dass der Anteil dieser Wortbildungsart besonders groß bei den Lemmatypen ist, deren Definitionen auch für die Wortart Verb über hohe Werte verfügen, also die Verben und die Gruppe Sonstiges. Andererseits besitzt die Gruppe Sonstiges eine so hohe relative Häufigkeit bei den Partikelverben, weil schablonenartige Formulierungen (mit drückt … aus oder gibt … an) dort häufig verwendet werden - ausdrücken wird beispielsweise in den 80 im LTWDaF 2 untersuchten Lemmata der Gruppe Sonstiges 32-mal gebraucht (vgl. auch Kap. 3.4.2.3.2). Bei den substantivischen Definitionen machen die Partikelverbbildungen nur 6,81 Prozent dieser Tokens aus, bei den Adjektivdefinitionen 4,76 Prozent. In den Adjektivdefinitionen ist der Anteil der Partikelverben gegenüber den Types sogar noch niedriger. Wie bei den Types wird die Kurzwortbildung aus der Betrachtung herausgelassen, da sie nur bei den Lemmagruppen Substantiv und Verb vorkommt und dort mit 0,80 Prozent bzw. 0,35 Prozent der nach der Wortbildungsart analysierten Tokens lediglich einen verschwindend geringen Anteil der motivierten autosemantischen Tokens ausmacht. Im Vergleich der Lemmatypen nach den Anteilen der einzelnen Wortbildungsarten ist auffällig, dass die Gruppe Sonstiges bei allen Wortbildungsarten über die stärksten Veränderungen von Types zu Tokens verfügt. 3.4.2.3.2 Analyse des DHWDaF 2 Als letzter Punkt der lemmatypspezifischen Analyse des Definitionswortschatzes im DHWDaF 2 soll nun die Wortgebildetheit der autosemantischen Lexeme im Mittelpunkt stehen. In diesem Kapitel gibt es zahlreiche Einzelaspekte zu beschreiben, weshalb Types und Tokens aus Gründen der besseren Lesbarkeit jeweils direkt nacheinander analysiert werden, gefolgt von einer Gegenüberstellung von DHWDaF 2 und LTWDaF 2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 306 Anteil der Types Lemmatyp Abb. 73: Die lemmatypspezifische Verteilung der autosemantischen Types nach Wortgebildetheit im DHWDaF 2 Bei den Autosemantika spielt die Verteilung von motivierten, demotivierten und primären Lexemen eine Rolle. 438 Wie gewohnt, wird mit der Beschreibung der Ergebnisse bei den Types begonnen (vgl. Abb. 73). Der Anteil der primären Lexeme an den autosemantischen Types im DHWDaF 2 liegt je nach Lemmatyp zwischen rund 28 und 35 Prozent. Lediglich ein gutes Viertel bis ein Drittel der autosemantischen Types ist also nicht das Ergebnis eines Wortbildungsprozesses. Den niedrigsten Wert weisen dabei die primären Lexeme mit 28,43 Prozent in den Definitionen der Lemmatypgruppe Sonstiges auf, den höchsten Wert mit 34,94 Prozent in den adjektivischen Definitionen. Dazwischen befinden sich - dicht beisammen - die Definitionen der Lemmatypen Substantiv und Verb, in denen der primäre Wortschatz über 32,13 Prozent beziehungsweise über 31,74 Prozent der Types verfügt. Der jeweils verbleibende Teil der Lexeme - in Abhängigkeit vom Lemmatyp zwischen 65 Prozent und knapp 72 Prozent, also rund zwei Drittel - kann als Wortbildungsprodukt bezeichnet werden. Diese lassen sich in morphosemantisch motivierte und demotivierte Lexeme unterscheiden, wobei auf die motivierten Types mit Werten zwischen 54 Prozent und 65 Prozent der größte Anteil entfällt. Den höchsten Wert von 64,71 Prozent erreichen die motivierten autosemantischen Types in den Definitionen der Lemmatypgruppe Sonstiges. Mit einer relativen Häufigkeit von 61,91 Prozent folgen an zweiter Stelle die sub- 438 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Wörterbuchanalyse 307 stantivischen Definitionen und mit einem Anteil von 59,39 Prozent die Definitionen der Verben. Über den niedrigsten Wert (53,82 Prozent) verfügen die motivierten autosemantischen Types in den Definitionen des Lemmatyps Adjektiv. Dafür besitzt dieser Lemmatyp den höchsten Anteil an demotivierten Types, er liegt bei den adjektivischen Definitionen bei 11,24 Prozent. Hier folgen an zweiter Stelle die verbalen Definitionen, in denen die demotivierten Types 8,87 Prozent der Autosemantika ausmachen. Wiederum etwas niedriger ist ihre relative Häufigkeit in den Definitionen der Lemmatypgruppe Sonstiges, hier liegt sie bei 6,86 Prozent. In den substantivischen Definitionen kommen die demotivierten autosemantischen Types am seltensten vor, sie erreichen hier einen Anteil von 5,96 Prozent. Stellt man das DHWDaF 2 und das LTWDaF 2 gegenüber, lassen sich einige interessante Beobachtungen machen. So bestehen die autosemantischen Types der Definitionen des DHW- DaF 2 aus weniger primärem Wortschatz als die des LTWDaF 2, je nach Lemmatyp betragen die Unterschiede zwischen sechs und knapp neun Prozent. Dafür enthält das LTWDaF 2 im Gegenzug weniger motivierte Types als das DHWDaF 2, hier differieren die Werte der beiden Wörterbücher um fünf bis neun Prozent. Erstaunlich sind die großen Übereinstimmungen zwischen den Werten, welche die demotivierten Types in den Definitionen des DHWDaF 2 und des LTWDaF 2 erreichen. Das DHWDaF 2 besitzt hier zumeist höhere Werte als das LTWDaF 2. Für die Types bleibt also insgesamt festzuhalten, dass im DHWDaF 2 die Wortbildung eine größere Rolle spielt als im LTWDaF 2, weil die motivierten und demotivierten Bildungen dort stärker vertreten sind. Das LTWDaF 2 besitzt hingegen den höheren Anteil an primären Lexemen. Im nächsten Schritt werden die Tokens hinsichtlich ihrer Wortgebildetheit untersucht. Im Vergleich zu den Types ergeben sich dabei einige Verschiebungen (vgl. Abb. 74). Verglichen mit den Types steigen bei den Tokens die primären Lexeme am stärksten, je nach Lemmatyp zwischen fünf und elf Prozent. Über den höchsten Anteil an primären Autosemantika verfügen auch bei den Tokens die Definitionen des Lemmatyps Adjektiv, er liegt bei 43,49 Prozent. In kleinerem Abstand folgen die Lemmatypen Verb und Substantiv, deren Definitionen zu 42,49 Prozent beziehungsweise 40,15 Prozent aus primären Tokens bestehen. Auffallend niedriger liegt die relative Häufigkeit der primären Autosemantika in den Definitionen der Lemmatypgruppe Sonstiges, wo sie lediglich 33,94 Prozent der Tokens ausmachen. Im Vergleich zu den Types erhöhen sich auch die Anteile der demotivierten Lexeme, allerdings nur um ein bis zwei Prozentpunkte. Ihre relativen Häufigkeiten bewegen sich bei den Tokens zwischen knapp acht und gut elf Prozent. Die Reihenfolge der Lem- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 308 matypen bleibt die gleiche wie bei den Types, weshalb auch hier die adjektivischen Definitionen mit 11,54 Prozent über den höchsten Anteil an den demotivierten Lexemen verfügen. Wie gehabt, folgen darauf die verbalen Definitionen, deren autosemantische Tokens zu 9,24 Prozent aus demotivierten Wortbildungsprodukten bestehen. In den substantivischen Definitionen sinkt dieser Anteil auf 8,10 Prozent, in den Definitionen der Lemmatypgruppe Sonstiges sind es sogar nur 7,80 Prozent. Was bei den demotivierten und bei den primären Tokens hinzukommt, geht bei den motivierten Lexemen verloren - jeweils rund zehn Prozent. Jedoch ändert sich die Reihenfolge der einzelnen Lemmatypen nicht. In den Definitionen der Lemmatypgruppe Sonstiges ist der Verlust mit rund sechs Prozentpunkten nicht ganz so hoch, hier liegt der Anteil an motivierten Autosemantika mit 58,26 Prozent von allen Lemmatypen am höchsten. Mit einer relativen Häufigkeit von 51,75 Prozent ist in den substantivischen Definitionen immer noch mehr als die Hälfte der autosemantischen Lexeme motiviert. Bei den Definitionen der Verben sinkt dieser Anteil mit 48,27 Prozent erstmals unter die 50-Prozent-Marke. Über die wenigsten motivierten Autosemantika verfügen die Definitionen der Lemmatypgruppe Sonstiges, hier machen sie 44,97 Prozent der Tokens aus. Dieser Verlust bei den motivierten Tokens spiegelt sich in den Verwendungshäufigkeiten wider, die bei den motivierten Autosemantika lemmatypübergreifend unter dem allgemeinen autosemantischen Durchschnitt liegen. Anteil der Tokens Lemmatyp Abb. 74: Die lemmatypspezifische Verteilung der autosemantischen Tokens nach Wortgebildetheit im DHWDaF 2 Wörterbuchanalyse 309 Der Vergleich zwischen dem DHWDaF 2 und dem LTWDaF 2 offenbart an diesem Teil der Untersuchung einige Unterschiede zwischen den beiden analysierten Wörterbüchern, was die Verteilung von primärem, demotiviertem und motiviertem Definitionswortschatz bei den Tokens anbelangt. Im Bereich der motivierten Lexeme erreicht das DHWDaF 2 prinzipiell höhere Werte als das LTWDaF 2 - in den Definitionen der Substantive und der Adjektive rund zehn Prozent, in den anderen beiden zwei Prozent. Auch die demotivierten Lexeme sind im DHWDaF 2 stärker vertreten als im LTWDaF 2, allerdings bewegen sich die Differenzen hier lediglich zwischen zwei und fünf Prozentpunkten. Bei den primären Tokens verhält es sich dann genau umgekehrt - die Anteile sind im DHWDaF 2 grundsätzlich niedriger als im LTWDaF 2. Hier besteht wieder eine recht große Spannbreite bei den lemmatypspezifischen Differenzen der Werte zwischen beiden Wörterbüchern, sie reicht von vier Prozentpunkten bei der Lemmatypgruppe Sonstiges bis hin zu 15 Prozentpunkten in den Definitionen der Adjektive. Die oben gemachten Beobachtungen für die Types bestätigen sich bei den Tokens. Insgesamt spielen Prozesse der Wortbildung im DHWDaF 2 eine größere Rolle als im LTWDaF 2, wie sich an den Werten für die primären Lexeme auf der einen Seite und an denen für die sekundären - die motivierten und demotivierten - Lexeme auf der anderen Seite erkennen lässt. Diese Tatsache ist wiederum eine direkte Konsequenz aus der jeweiligen Definitionspolitik der beiden Wörterbücher. Das LTWDaF 2 mit seinem niedrigeren Wert für sekundäre Autosemantika greift in seinen Definitionen stärker auf syntaktische Mittel zurück, hingegen nutzt das DHWDaF 2 eher die Möglichkeiten der Wortbildung. Dies könnte durch die stärker muttersprachlich geprägte Lexikografietradition verursacht sein. Für die Verwendungshäufigkeiten zeigen sich im Vergleich zwischen den beiden Wörterbüchern ebenfalls interessante Details. Das LTWDaF 2 besitzt generell höhere Verwendungshäufigkeiten. Dies trifft allerdings nicht auf die demotivierten Lexeme zu, deren Types mit Ausnahme der Lemmatypgruppe Sonstiges im Mittelwert im DHWDaF 2 häufiger verwendet werden. Der letzte Aspekt, der in Bezug auf die Wortgebildetheit der verwendeten Lexeme eine Rolle spielt, ist die Analyse der motivierten Lexeme hinsichtlich ihrer verschiedenen Wortbildungsarten im DHWDaF 2. Aus Abbildung 75 geht hervor, dass auch unter diesem Blickwinkel zwischen den untersuchten Lemmatypen Unterschiede bestehen. Die Derivation ist mit Werten von um 50 Prozent lemmatypübergreifend die häufigste Wortbildungsart. Jedoch schwanken die einzelnen Anteile zwischen rund 49 Prozent und 58 Prozent. Die niedrigste relative Häufigkeit weist die Derivation dabei mit 49,49 Prozent bei den Types der Definitionen der Lemmatypgruppe Sonstiges auf. Etwas höher lie- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 310 gen ihre Anteile bei den Types mit 51,15 Prozent in den verbalen Definitionen und mit 55,22 Prozent in den Definitionen der Adjektive. Auf den höchsten Wert von 57,73 Prozent kommen die derivierten Types in den Definitionen des Lemmatyps Substantiv. Für die meisten Lemmatypen ist die Konversion die am zweitstärksten vertretene Wortbildungsart. Auch hier liegen zwischen dem Lemmatyp mit dem höchsten Anteil an Konversionen und dem mit dem niedrigsten Anteil rund neun Prozentpunkte. Im Lemmatyp Adjektiv erreicht die Konversion mit 26,87 Prozent die höchste relative Häufigkeit. An zweiter Stelle stehen die substantivischen Definitionen mit einem Anteil von 22,45 Prozent für die Types, die auf die Wortbildungsart Konversion zurückführbar sind. Dicht dahinter liegen die Definitionen der Lemmatypgruppe Sonstiges, in denen die Konversionen 22,22 Prozent der Types ausmachen. Auf einen Wert von lediglich 18,39 Prozent kommt die Konversion in den verbalen Definitionen, bei diesem Lemmatyp schiebt sich jedoch die Partikelverbbildung mit einem sehr hohen Wert auf den zweiten Platz der häufigsten Wortbildungsarten. Anteil der Types Lemmatyp Abb. 75: Die lemmatypspezifische Verteilung der Wortbildungsarten bei den motivierten autosemantischen Types im DHWDaF 2 Wörterbuchanalyse 311 Zumindest bei drei von vier Lemmatypen ist die Komposition die dritthäufigste Wortbildungsart bei den Types des DHWDaF 2. Die Spannbreite der erreichten Werte beträgt hier sogar mehr als zehn Prozentpunkte. Auffällig hoch ist die relative Häufigkeit der Kompositionsprodukte bei den Types der Lemmatypgruppe Sonstiges, in deren Definitionen sie einen Anteil von 19,19 Prozent einnehmen. Beinahe um die Hälfte niedriger ist der Wert von 11,08 Prozent, den die Kompositionen in den substantivischen Definitionen ausmachen. Nur wenig darunter liegen die Definitionen der Adjektive, deren motivierte autosemantische Types zu 9,70 Prozent aus Kompositionen bestehen. Am niedrigsten ist der Anteil dieser Wortbildungsart bei den Types des Lemmatyps Verb, wo die Kompositionen über eine relative Häufigkeit von 8,05 Prozent verfügen. Durch den extrem hohen Anteil der Partikelverbbildung liegt die Komposition bei den Verbdefinitionen nur auf dem vierten Platz, was die Häufigkeit der Wortbildungsarten bei den Types betrifft. Konstante Werte zwischen acht und neun Prozentpunkten erreicht die Partikelverbbildung. Sie landet bei allen Lemmatypen - die Verben ausgenommen - hinter Derivation, Konversion und Komposition auf dem vierten Platz der häufigsten Wortbildungsarten. So sind in den Definitionen der Adjektive 8,21 Prozent der motivierten autosemantischen Types Partikelverben, in den substantivischen Definitionen sind es 8,16 Prozent und in den Definitionen der Lemmatypgruppe Sonstiges 9,09 Prozent. Wie bereits erwähnt, bilden die verbalen Definitionen hier eine Ausnahme, weil sie mit 21,26 Prozent der Types über einen extrem hohen Anteil an Partikelverbbildungen verfügen. Damit sind die Verben der einzige Lemmatyp, für den die Reihenfolge Derivation, Konversion, Komposition, Partikelverbbildung und Kurzwortbildung in Bezug auf die Häufigkeit der Wortbildungsarten bei den Types nicht gilt, weil sich die Partikelverbbildung hinter die Derivation auf den zweiten Platz vorschiebt. Wie bereits am Beispiel des LTWDaF 2 erläutert (vgl. Kap. 3.4.2.3.1), besteht zwischen dem Vorkommen der Verben und der Partikelverben in den Definitionen der Verben ein Zusammenhang, da die Partikelverbbildung als Wortbildungsart an die Wortart Verb gebunden ist. Der in den verbalen Definitionen des DHWDaF 2 enthaltene Anteil an Verben ist rund doppelt so hoch wie in den Definitionen der anderen Lemmatypen, was den hohen Wert für die Partikelverbbildung erklärt. An fünfter und letzter Stelle der Wortbildungsarten steht überall die Kurzwortbildung, die lediglich in zwei der vier Lemmatypen überhaupt vorkommt. Insgesamt ist der Anteil der Kurzwörter mit 1,15 Prozent der Types in den verbalen Definitionen und mit 0,58 Prozent der Types in den Definitionen des Lemmatyps Substantiv so gering, dass er statistisch kaum ins Gewicht fällt. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 312 Hinsichtlich der Verteilung der Wortbildungsarten in den Stichproben zum DHWDaF 2 und zum LTWDaF 2 kann bei den Types eine gemischte Bilanz gezogen werden. Einerseits gibt es zahlreiche Gemeinsamkeiten zwischen beiden Wörterbüchern, andererseits unterscheiden sie sich in einigen Punkten voneinander. Die Reihenfolge der fünf Wortbildungsarten stimmt überein - in abnehmender Häufigkeit sind es Derivation, Konversion, Komposition, Partikelverbbildung und Kurzwortbildung. Allein für die Definitionen des Lemmatyps Verb gilt das nicht, da sich hier das außergewöhnlich starke Auftreten der Partikelverbbildung auswirkt, sodass diese Wortbildungsart im LTWDaF 2 den dritten Platz und im DHWDaF 2 sogar den zweiten Platz einnimmt. Die häufigste Wortbildungsart bei den Types ist in beiden Wörterbüchern die Derivation. Im LTWDaF 2 liegen ihre relativen Häufigkeiten allerdings meist höher als im DHWDaF 2 - vor allem in den adjektivischen und verbalen Definitionen macht sich dies bei einer Differenz von acht Prozentpunkten deutlich bemerkbar. Lediglich der Lemmatyp Substantiv verfügt bei den Types im DHWDaF 2 über einen leicht höheren Anteil an Derivaten als im LTWDaF 2. Bei der Konversion bietet sich ein gespaltenes Bild. Während die Lemmatypen Substantiv und Verb im DHWDaF 2 bei den Konversionen rund zwei Prozentpunkte weniger aufweisen als im LTWDaF 2, besitzt diese Wortbildungsart im DHWDaF 2 in den Definitionen der Gruppe Sonstiges einen etwas höheren und in den adjektivischen Definitionen sogar einen um sieben Prozentpunkte höheren Wert als im LTWDaF 2. Im DHWDaF 2 erreichen die Komposita zumeist um bis zu drei Prozentpunkte niedrigere Anteile als im LTWDaF 2. Bei der Partikelverbbildung ist hingegen das DHWDaF 2 viel stärker vertreten als das LTWDaF 2, dessen Werte zwischen zwei und zehn Prozent - letzterer Wert gilt für die verbalen Definitionen - unter denen des DHWDaF 2 liegen. Nur die Anteile in der Lemmatypgruppe Sonstiges stimmen hier fast überein. Bei den Kurzwörtern, für die sich aufgrund ihres seltenen Auftretens wenige Aussagen treffen lassen, ist interessant, dass sie in beiden Wörterbüchern lediglich in den Definitionen der Lemmatypen Substantiv und Verb vorkommen. In gleicher Weise wie die Types werden die Tokens der Stichprobe des DHW- DaF 2 auf die Anteile der einzelnen Wortbildungsarten an den motivierten Autosemantika untersucht. Erneut ist auf den ersten Blick ersichtlich, dass hier zwischen den vier verschiedenen Lemmatypen Unterschiede bestehen (vgl. Abb. 76). Lemmatypübergreifend ist bei den Tokens ebenfalls die Derivation die am häufigsten vorkommende Wortbildungsart, meist sind ihre Werte sogar leicht höher als bei den Types. In Abhängigkeit vom Lemmatyp unterliegen ihre Anteile jedoch Schwankungen von über 16 Prozent. Den Wörterbuchanalyse 313 höchsten Wert erreicht die Derivation mit 59,76 Prozent in den Definitionen des Lemmatyps Substantiv, womit sie ihren Anteil im Vergleich zu den Types um zwei Prozentpunkte steigern kann. Ähnliche Zuwachsraten erzielen die Derivate auch bei den Tokens der adjektivischen und der verbalen Definitionen, die mit einer relativen Häufigkeit von 56,58 Prozent beziehungsweise 53,11 Prozent abermals den zweiten und dritten Platz einnehmen. Der im Vergleich zu den Types leichte Anstieg der Anteile der derivierten Tokens bei diesen Lemmatypen spiegelt sich in den minimal überdurchschnittlichen Verwendungshäufigkeiten wider, allerdings zeigen sich die Unterschiede hier erst in der zweiten Dezimalstelle. Bei der Lemmatypgruppe Sonstiges liegt die Verwendungshäufigkeit mit 1,40-mal hingegen unter dem eigenen Mittelwert von 1,62-mal, wodurch die relative Häufigkeit der Derivation um mehr als sechs Prozentpunkte auf einen Wert von 40,30 Prozent sinkt. Anteil der Tokens Lemmatyp Abb. 76: Die lemmatypspezifische Verteilung der Wortbildungsarten bei den motivierten autosemantischen Tokens im DHWDaF 2 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 314 Bei den Tokens bleibt zumindest bei der Hälfte der Lemmatypen die Konversion trotz leicht sinkender Anteile auf dem zweiten Platz der häufigsten Wortbildungsarten. Die Verwendungshäufigkeiten der Konversion liegen leicht unter dem jeweiligen lemmatypspezifischen Mittelwert. Wie bei den Types verfügen bei den Tokens die adjektivischen Definitionen über den höchsten Anteil an Konversionen, hier liegt er bei 25,66 Prozent. An zweiter Stelle folgen die Substantivdefinitionen, in denen die Konversionen 22,41 Prozent der Tokens ausmachen. Unter der 20-Prozent-Marke liegt der Anteil der Konversionen in den Definitionen der Lemmatypgruppe Sonstiges und des Lemmatyps Verb, er beträgt dort 19,00 Prozent beziehungsweise 17,70 Prozent. Bei diesen beiden Lemmatypen ist die Partikelverbbildung nach der Derivation die zweithäufigste Wortbildungsart. Generell kann die Partikelverbbildung im Vergleich zu den Types in ihren relativen Häufigkeiten zulegen. Prozentual gesehen verfügen wiederum die verbalen Definitionen mit 21,53 Prozent über den höchsten Anteil an Partikelverbbildungen, somit bleibt der Wert im Vergleich zu den Types fast unverändert. Dicht dahinter folgen mit einer relativen Häufigkeit von 19,94 Prozent die Definitionen der Lemmatypgruppe Sonstiges. Durch eine extrem hohe Verwendungshäufigkeit von 3,56-mal - der lemmatypspezifische Durchschnitt der motivierten Autosemantika liegt bei 1,62-mal - kann sich der Wert bei den Tokens so mehr als verdoppeln. In der Lemmatypgruppe Sonstiges spielen dabei erneut vor allem häufig wiederholte Formulierungen wie drückt … aus oder gibt … an eine Rolle, die hauptsächlich in den Verwendungshinweisen auftreten, welche die Definitionen ergänzen und teilweise ganz ersetzen (vgl. Kap. 3.4.2.3.1). Das Verb ausdrücken kommt beispielsweise in den Definitionen der 68 analysierten Lemmata der Gruppe Sonstiges im DHWDaF 2 insgesamt 31 Mal vor, unter anderem in der Definition des Lemmas na ‘leitet eine Äußerung ein, die ein persönliches Empfinden oder Interesse ausdrückt’. Bei der Partikelverbbildung sind die Anteile der beiden verbleibenden Lemmatypen Adjektiv und Substantiv mit 9,21 Prozent und 7,47 Prozent bei den Tokens mit großem Abstand am niedrigsten. Bei den adjektivischen Tokens steigt der Anteil der Partikelverbbildung gegenüber den Types, bei den substantivischen Tokens geht er hingegen etwas zurück. Das lässt sich auch an der Verwendungshäufigkeit erkennen, die bei den Adjektiven mit 1,27-mal etwas über dem Mittelwert von 1,13-mal liegt, bei den Substantiven hingegen mit 1,11-mal leicht unter dem Durchschnitt von 1,21-mal. Bei der Komposition, die bei der Tokenzählung außer bei den substantivischen Definitionen den vierten Platz einnimmt, gibt es ebenfalls einen Lemmatyp, der sich stark von den anderen drei abhebt. Dabei Wörterbuchanalyse 315 handelt es sich um die Lemmatypgruppe Sonstiges, die mit einer relativen Häufigkeit von 17,76 Prozent den mit Abstand höchsten Wert für die Komposita aufweist. Es folgen die Definitionen der Substantive, deren Anteil an Komposita bei den Tokens mit 9,64 Prozent nur rund halb so hoch ist. Noch niedrigere Werte erreicht die Komposition in den Definitionen der Lemmatypen Adjektiv und Verb, deren Tokens zu lediglich 8,55 Prozent beziehungsweise 6,70 Prozent aus Komposita bestehen. Bei allen vier Lemmatypen nimmt die relative Häufigkeit der Komposita bei den Tokens im Vergleich zu den Types ab, weil die Verwendungshäufigkeiten grundsätzlich unter dem lemmatypspezifischen Durchschnitt liegen. Die Kurzwortbildung ist mit ihren insgesamt lediglich fünf Tokens, die sich auf die Substantiv- und Verbdefinitionen verteilen und dort jeweils eine relative Häufigkeit von unter einem Prozent erreichen, aufgrund der geringen Menge für die Gesamtbetrachtung statistisch nicht relevant. Bei der Gegenüberstellung von DHWDaF 2 und LTWDaF 2 in Bezug auf die Verteilung der Wortbildungsarten bei den Tokens zeigen sich neben einigen Gemeinsamkeiten auch wörterbuchspezifische Eigenheiten. Zum Beispiel ähnelt sich die Reihenfolge der einzelnen Wortbildungsarten im DHWDaF 2 und im LTWDaF 2 sehr. Die Derivation ist lemmatyp- und wörterbuchübergreifend bei den Tokens klar die häufigste Wortbildungsart. Allerdings unterscheiden sich die jeweiligen Werte der derivierten Tokens bei den einzelnen Lemmatypen zuweilen recht stark voneinander - so enthält das LTWDaF 2 in den Definitionen der Lemmatypgruppe Sonstiges rund 15 Prozent mehr derivierte Tokens als das DHWDaF 2, in den Definitionen der Adjektive und Verben sind es mehr als sieben Prozent. Sowohl im DHWDaF 2 als auch im LTWDaF 2 liegen die Verwendungshäufigkeiten der derivierten Types jeweils leicht über dem Mittelwert, sodass die Derivation ihre Anteile von den Types zu den Tokens leicht ausbauen kann. Die einzige Ausnahme bildet die Lemmatypgruppe Sonstiges im DHWDaF 2, wo die Werte aufgrund einer unterdurchschnittlichen Verwendungshäufigkeit rückläufig sind. Fast überall nimmt die Konversion den zweiten Platz bei der Verteilung der Wortbildungsarten ein, ausgenommen bei den Definitionen der Verben und der Lemmatypgruppe Sonstiges im DHWDaF 2, wo Konversion und Partikelverbbildung miteinander die Plätze tauschen. Die relativen Häufigkeiten der Lemmatypen liegen bei der Konversion in den beiden Wörterbüchern dichter beisammen als bei der Derivation. Außer beim Lemmatyp Substantiv erreicht die Konversion nur unterdurchschnittliche Verwendungshäufigkeiten, was mit einem Sinken ihrer Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 316 Anteile von den Types zu den Tokens einhergeht. Die Platzierung der Partikelverbbildung stellt sich weniger einheitlich dar: Von ihrem dritten Platz weicht sie, wie bereits erwähnt, im DHWDaF 2 bei den Verben und der Lemmatypgruppe Sonstiges ab und tauscht mit der Konversion. Zudem nimmt die Partikelverbbildung im LTWDaF 2 bei den Adjektiven und in beiden Wörterbüchern bei den Substantiven nur den vierten Platz ein. Davon abgesehen, erreichen die Partikelverben bei den Tokens des DHWDaF 2 grundsätzlich höhere Werte als im LTWDaF 2 - rund ein Prozent bei den Substantiven, in etwa fünf Prozent bei den Adjektiven und in der Lemmatypgruppe Sonstiges sowie neun Prozent bei den Verben. Bei fast allen Lemmatypen können die Partikelverben ihre Anteile bei den Tokens erhöhen. Außer in den genannten Fällen (die Substantive in beiden Wörterbüchern sowie die Adjektive im LTW- DaF 2) liegt die Komposition auf dem vierten Platz. Die Werte für die beiden Wörterbücher ergeben ein heterogenes Bild. So ist die Komposition bei den Tokens der substantivischen, verbalen und adjektivischen Definitionen des LTWDaF 2 mit teils über drei Prozentpunkten stärker vertreten als im DHW- DaF 2. Die Definitionen der Lemmatypgruppe Sonstiges enthalten hingegen im DHWDaF 2 rund sechs Prozent mehr Komposita als das LTWDaF 2. Verglichen mit den Types sinken die Werte der Komposita aufgrund der unterdurchschnittlichen Verwendungshäufigkeiten bei den Tokens durchgängig, bis auf den Lemmatyp Verb im LTWDaF 2. Die Kurzwortbildung findet sich in beiden Wörterbüchern nur in den Definitionen der Substantive und Verben, allerdings mit so niedrigen Werten, dass sie bei der Analyse unberücksichtigt bleiben können. Abschließend sei noch einmal betont, dass der Vergleich der beiden Wörterbücher sowohl Ähnlichkeiten als auch Abweichungen hinsichtlich des lemmatypspezifischen Einflusses der Wortbildung auf den Definitionswortschatz erkennen lässt. Bei den Autosemantika wird im LTWDaF 2 mehr primärer Wortschatz verwendet, das DHWDaF 2 enthält dafür mehr motivierte und demotivierte Lexeme. Diese Aussage gilt für die Tokens in noch stärkerem Maß als für die Types. Die einzelnen Wortbildungsarten stimmen in den zwei Wörterbüchern in ihrer Reihenfolge größtenteils überein, lediglich bei den jeweiligen Anteilen bestehen einige Unterschiede. Wie erläutert, liegen die Abweichungen in den Anteilen der Wortbildung und der einzelnen Wortbildungsarten in den unterschiedlichen Traditionen der Wörterbücher und den Vorlieben für bestimmte Formulierungen begründet. Wörterbuchanalyse 317 3.5 Vergleich des untersuchten Definitionswortschatzes mit pädagogischen Wortschätzen Dieses Kapitel öffnet die Analyse des Definitionswortschatzes nach außen hin, über die Definitionen der beiden Wörterbücher hinaus. Im Folgenden wird der untersuchte Definitionswortschatz des LTWDaF 2 und der des DHWDaF 2 mit pädagogischen Wortschätzen verglichen - mit dem Grundwortschatz Langenscheidt Basic German Vocabulary (Kap. 3.5.1), mit dem Frequenzwörterbuch Frequency Dictionary (Kap. 3.5.2) und mit dem Zertifikatswortschatz Zertifikat Deutsch (Kap. 3.5.3). 3.5.1 Vergleich des untersuchten Definitionswortschatzes mit dem Grundwortschatz Langenscheidt Basic German Vocabulary 3.5.1.1 Grundlagen Über das Thema des Grundwortschatzes wird in der linguistischen und sprachdidaktischen Forschung breit diskutiert. Da an dieser Stelle nicht der gesamte Inhalt der wissenschaftlichen Debatte wiedergegeben werden kann, sei aufgrund ihrer Relevanz vor allem auf die Publikationen von Kühn (1979), Krohn (1992) und Schnörch (2002) verwiesen. In Anlehnung an Heusinger (2004, S. 28) bezeichnet der Terminus Grundwortschatz hier „jenen Teil der Lexik, der in der Sprachgemeinschaft allgemein üblich ist, sich in Form und Semantik über mehrere Generationen wenig verändert und vorzugsweise der Alltagskommunikation dient“. Ein Grundwortschatz umfasst die „für die Kommunikation wichtigsten Wörter“ (Rosengren 1976, S. 330), denn er „ist als ein kommunikatives Wortschatzminimum zu verstehen“. Die Lexeme des Grundwortschatzes sollten „dem Wortschatz der Standardsprache entnommen werden“ und „nicht auf eine bestimmte Situationsklasse beschränkt“ sein (ebd.). Jedoch kann das Ergebnis bei der Zusammenstellung eines Grundwortschatzes recht unterschiedlich ausfallen, je nachdem, welche Kriterien der Auswahl zugrunde gelegt werden. Grundwortschätze werden meist aus sprachdidaktischen Gründen zusammengestellt. Neben der Frequenz der aufgenommenen Lexeme spielen dabei vor allem die jeweiligen Zielsetzungen und die damit verbundenen Kriterien der Nützlichkeit eine Rolle. Schmidt (1955, S. 531) nennt drei Hauptkriterien für die Zugehörigkeit eines Wortes zum Grundwortschatz: Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 318 1. Unentbehrlichkeit und Allgemeingebräuchlichkeit innerhalb der gesamten Sprachgemeinschaft; 2. Stabilität durch mehrere Epochen der sprachlichen Entwicklung; 3. Eignung als Basis für weitere Wortbildungen. Die Aufzählung ergänzt er durch drei weitere, fakultative Merkmale des Grundwortschatzes: 4. stilistische Neutralität, 5. Polysemie (Fähigkeit zur Ausweitung der Wortbedeutung) 439 und 6. die „Verwendung als Grundlage stehender Wortverbindungen“ (Schmidt 1955, S. 531). Der Grundwortschatz kann dabei zu den Primärstammwörtern oder zu den Sekundärstammwörtern gehören (ebd., S. 530f.). Ähnliche Merkmale des Grundwortschatzes bzw. des core vocabulary bestimmen Stubbs (vgl. 1986, S. 104ff.) und Carter (1998, S. 36ff.) mit ihren Tests. Demnach sind Elemente des Grundwortschatzes schwerer zu definieren, sie besitzen häufiger Antonyme, sie haben mehr Kollokationen, sie verfügen im Wörterbuch über mehr Einträge, sie sind eher generisch als spezifisch, sie sind meist kulturungebunden, außerdem sind sie pragmatisch und thematisch neutral. All dies lässt sich damit begründen, dass Lexeme des Grundwortschatzes im Zentrum des Vokabulars stehen. So haben sie einerseits ihre eigene Semantik stark ausgebaut, andererseits sind sie auch umfangreich mit den anderen Lexemen vernetzt. Als zentrale Elemente zeichnen sie sich daneben durch eine höhere Frequenz aus, wobei der Umkehrschluss, dass jedes häufige Lexem auch zum Grundwortschatz gehört, jedoch nicht gilt, denn „frequency is no guarantee of coreness“ (Carter 1998, S. 47). 440 Kühn (1979, S. 24ff.) betont in seiner grundlegenden Arbeit zum Grundwortschatz vor allem, wie relativ jede der genannten Eigenschaften des Grundwortschatzes ist: So passt sich der Grundwortschatz trotz seiner Stabilität an die Bedürfnisse der Kommunikationsgemeinschaft an und er muss nicht zwangsläufig eine Grundbegrifflichkeit ausdrücken. Zudem ist die Kompositions- und Derivationsfähigkeit einzelsprachlich sehr unterschiedlich ausgeprägt. Das Kriterium der stilistischen Neutralität greift nur bei der Erstellung eines Grundwortschatzes der Standardsprache. Die Polysemie ist ein Merkmal, über das Elemente des Grundwortschatzes nicht zwingend verfügen müssen. Die Fähigkeit zur idiomatischen Verwendung besitzen hingegen auch Wörter außerhalb des Grundwortschatzes. Das Kriterium der Unentbehrlichkeit und der Gebrauchswichtigkeit existiert zumeist nur als subjektive Festlegung ohne weitere Erklärung. Gerade aus diesem Grund hoffte man, mit Fre- 439 Die Fähigkeit zur Ausweitung der Wortbedeutung bildet einen Teilaspekt der Eigenschaft des Wortschatzes, dynamisch zu sein. 440 Vgl. hierzu auch Henne (1976, S. 107). Wörterbuchanalyse 319 quenzanalysen die Zuordnung einzelner Lexeme zum Grundwortschatz zu entsubjektivieren und somit überprüfbar zu machen. So werden Listen frequenter Lexeme häufig als Grundlage für die Erstellung von Grundwortschätzen genutzt (vgl. Kap. 2.3.2). Dem Hauptkriterium der Häufigkeit werden dabei jedoch noch weitere Kriterien zur Seite gestellt. So wird die reine Frequenz von Auto- und Synsemantika im Grundwortschatz gewichtet, „weil die Strukturwörter zwar die häufigsten einer Sprache darstellen, zahlenmäßig jedoch nur eine kleine Gruppe im Wortschatz ausmachen“ (Kühn 1979, S. 32). Die Forderung, die gesprochene Sprache in die analysierten Korpora einzubeziehen, schwächte sich mit der These der Identität von geschriebener und gesprochener Sprache wieder ab (ebd., S. 33f.). Weitere Kriterien, nach denen der Grundwortschatz ausgewählt werden sollte, sind die Verwendungsbreite und die Verfügbarkeit bzw. die Vertrautheit der Lexeme, die bereits im Kapitel 3.2 im Zusammenhang mit den Selektionskriterien für den Definitionswortschatz näher erläutert werden. Kühn (1979, S. 40ff.) kritisiert die bisherige Grundwortschatzforschung in unterschiedlichen Bereichen, indem er auf lexikostatistische, lexikosemantische, lexikosyntaktische, lexikomorphologische und lexikopragmatische Probleme hinweist. 441 Aus dieser Kritik heraus entwickelt er seinen Neuansatz, der sowohl von der rein subjektiven Auswahl eines Grundwortschatzes als auch von der Verabsolutierung des Frequenzkriteriums abrückt und den Grundwortschatz stattdessen als Funktionswortschatz versteht: Der Grundwortschatz muss somit als kommunikatives Wortschatzminimum begriffen werden, das das zur sprachlichen Interaktion erforderliche lexikalische Instrumentarium bereitstellt und dadurch zur Optimierung der Kommunikationsfähigkeit des Lernenden beiträgt. (Kühn 1979, S. 60) Aus der standardsprachlichen Varietät wird nun anhand der Faktoren Sprecher/ Schreiber, Rolle, Intention, Situation, Modus und Thema das lexikalische Minimum bestimmt. Die Benutzer eines Grundwortschatzes sind sowohl von ihrer Altersstruktur (Kinder, Jugendliche, Erwachsene) als auch von den im fremdsprachlichen Unterricht eingenommenen Rollen (symmetrische oder komplementäre Kommunikation) sehr unterschiedlich. Typische Kommuni- 441 Die lexikostatistischen Probleme betreffen die zum Teil fehlende Deckung zwischen dem frequenten und dem nützlichen Wortschatz. Die lexikosemantischen Probleme beziehen sich auf die fehlende Berücksichtigung von Bedeutungsstrukturen. Die lexikosyntaktischen Probleme erwachsen aus der syntaktischen Kombinierbarkeit. Die lexikomorphologischen Probleme entstehen durch die Beachtung von Wortbildungsregularitäten. Die lexikopragmatischen Probleme betreffen die fehlende Übereinstimmung zwischen dem frequenten und dem für eine Kommunikation notwendigen Wortschatz. Vgl. auch Schnörch (2002, S. 19f.). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 320 kationssituationen können hingegen mithilfe bestimmter Aufstellungen (z.B. Restaurant, Kino, Kaufhaus) geplant werden. Gleiches gilt für die Handlungsmuster, wie beispielsweise das Begrüßen, das Entschuldigen oder das Gratulieren. Auch der Modus der Kommunikation beeinflusst den Umfang und den Inhalt des lexikalischen Minimums. Die Themen der Kommunikation hängen mit den Situationen und den Intentionen der Sprachbenutzer zusammen und werden durch diese eingeschränkt. 442 Thematisch besteht der Grundwortschatz aus den Substantiven, die menschliche Körperteile, Gegenstände und Erscheinungen in der Natur, Verwandtschaftsverhältnisse, Nahrungsmittel und Geräte sowie Tiere und Pflanzen bezeichnen. Dazu kommen die wichtigsten Vertreter der Adjektive, der Verben und der übrigen Wortarten (Schmidt 1955, S. 534). Inhaltlich deckt sich diese Auffassung mit der anthropologischen Definition von Lutzeier (1995, S. 12): Als Grundwortschatz zählt eine Ansammlung von möglichst morphologisch einfachen Wörtern, die mindestens Bezeichnungen für Körperteile, Bezeichnungen für Nahrungsmittel, also für Speisen und Getränke, Farbbezeichnungen und Bezeichnungen für Pflanzen, Bäume [sic], Tiere und wichtige Himmelskörper umfassen. Bei einer Betrachtung der Kriterien für die Erstellung eines Grundwortschatzes fallen sofort dessen Ähnlichkeiten mit dem Definitionswortschatz auf (vgl. Kap. 2.3.2). Die Ausdrücke Frequenz, Vertrautheit, Allgemeingültigkeit, semantische Breite, Nützlichkeit, Reichweite und stilistische Neutralität finden in beiden Kontexten Anwendung. Es bestehen jedoch auch wichtige Unterschiede. So werden für den Definitionswortschatz daneben auch Eindeutigkeit und Einfachheit des verwendeten Vokabulars betont. Beim Grundwortschatz steht stärker die zentrale Position der Lexeme im Mittelpunkt - in ihrer zeitlichen Stabilität und in ihrer umfangreichen Vernetzung. Was die Motivation für die Erstellung von Grundwortschätzen und Definitionsvokabularen betrifft, ergeben sich ebenfalls zahlreiche Übereinstimmungen (vgl. Kap. 2.2). Im Rahmen der vorliegenden Untersuchung zum Definitionswortschatz in deutschen Lernerwörterbüchern sind jedoch weniger die theoretischen Überlegungen zum Thema Grundwortschatz von Bedeutung. Hier spielen vor allem die praktischen Ansätze der Grundwortschatzlexikografie eine Rolle, da analysiert wird, inwieweit sich Grundwortschatz und Definitionswortschatz decken. 443 442 Zu diesem Abschnitt vgl. Kühn (1979, S. 61ff.). 443 Zu den Schnittmengen zwischen den deutschen Grundwortschätzen vgl. Krohn (1992, S. 163ff.). Wörterbuchanalyse 321 Bei dem ausgewählten Grundwortschatz handelt es sich um das Langenscheidt Basic German Vocabulary. Dafür gibt es mehrere Gründe. Zum einen ist diese Zusammenstellung die aktuellste, die für Deutsch als Fremdsprache erhältlich ist - alle anderen Grundwortschätze sind wesentlich älter. 444 Zum anderen existiert kein weiterer DaF-Grundwortschatz, der über diese Größenordnung und Zielstellung verfügt. Das Langenscheidt Basic German Vocabulary erscheint 1991 für Englisch-Muttersprachler, im gleichen Jahr werden die französische Version Vocabulaire allemand de base und die spanische Ausgabe Vocabulario fundamental del alemán veröffentlicht. Zur Publikation des italienischen Grundwortschatzes Vocabolario fondamentale di tedesco kommt es bereits 1990. Zu der Reihe gehört auch ein einsprachig deutsches Buch mit Übungen zum Grundwortschatz, Grundwortschatz Deutsch. Übungsbuch aus dem Jahr 1991. In einem Vorwort zum Langenscheidt Basic German Vocabulary werden die Zielgruppen des Grundwortschatzes, die Motivation für seine Erstellung, die Auswahlkriterien und sein Aufbau näher erläutert. Nach der Hervorhebung der Wichtigkeit, die grundlegenden Lexeme einer Fremdsprache zu beherrschen, wird das Ziel des Langenscheidt Basic German Vocabulary erläutert - „to facilitate the acquisition of that core vocabulary in the easiest and most efficient manner possible“ (Langenscheidt Basic German Vocabulary 1991, S. VII). Der Grundwortschatz wendet sich an Deutschlerner ohne Vorkenntnisse, außerdem an fortgeschrittene Lerner, die sich selbst überprüfen oder auf einen Test vorbereiten möchten, sowie an alle, die aus beruflichen oder privaten Gründen eine Reise in ein deutschsprachiges Land planen (ebd.). Nach dem Durcharbeiten des Buches stellt der Verlag „the necessary knowledge to function and communicate in all everyday situations in German“ (ebd.) in Aussicht. Die Zusammenstellung enthält insgesamt 4 000 Lexeme, die zu gleichen Teilen zu zwei Gruppen gehören. 445 Mit der ersten Gruppe, welche die 2 000 wichtigsten und häufigsten Lexeme enthält, beherrscht der Lerner bereits „80 % of all written and oral communication“ (ebd.). Durch die zweite Gruppe mit wiederum 2 000 Lexemen kommen bei der Textabdeckung noch einmal fünf Prozent bis zehn Prozent hinzu. Inhaltlich gliedert sich der Grundwortschatz in themenbezogene Ausdrücke mit 21 Bereichen: 1. Der Mensch; 2. Handlungen und Aktivitäten; 3. Sprache und Sprechabsichten; 4. Mensch und Gesellschaft; 5. Alltagswelt; 6. Wirtschaft und Verwaltung; 7. Kunst und Interessen; 8. Öffentliches Leben; 9. Umwelt; 10. Technik und Materialien; 11. Reise und Verkehr; 12. 444 Auch beim Frequenzwortschatz besteht das Problem der veralteten Daten (vgl. Kap. 3.5.2.1). 445 Laut Tschirner (2006, S. 1282) enthält das Langenscheidt Basic German Vocabulary nicht die vom Verlag angegebenen 4 000 Wörter, sondern nur 3 593. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 322 Länder und Völker; 13. Zeit; 14. Räumliche Begriffe; 15. Menge und Maß; 16. Ordnung und Bezüge; 17. Art und Weise, Vergleich; 18. Farben; 19. Formen; 20. Ursache und Wirkung und 21. Zustand und Veränderung. Dazu kommen Strukturwörter mit den drei Untergruppen Pronomen, Konjunktionen und Adverbien. Viele dieser insgesamt 24 Gruppen sind einzeln noch stärker unterteilt, beispielsweise Umwelt in Stadt und Dorf, Landschaft, Natur: Allgemeines, Tiere, Pflanzen sowie Wetter und Klima. Alle Lexeme sind durchgängig bilingual aufgeführt und werden jeweils durch Beispielsätze kontextuell eingebettet. Zur Auswahl des Vokabulars und zu dessen Herkunft werden im Vorwort ebenfalls einige Angaben gemacht. „All the important sources of information on word frequency in written and spoken German were considered“ (Langenscheidt Basic German Vocabulary 1991, S. VIII). Als Beispiele werden die Statistiken von Käding, Meier, Ortmann, das Mannheimer Korpus 1 und 2, das Bonner Zeitungskorpus und der Zertifikatswortschatz genannt. 446 Als Selektionskriterien für den Grundwortschatz werden die Frequenz, die Vertrautheit und die Nützlichkeit erwähnt. Eine vollständige Auflistung und eine detaillierte Beschreibung der Auswertung und der Gewichtung erfolgt jedoch nicht, sodass ein subjektives Moment bei der Zusammenstellung des Langenscheidt Basic German Vocabulary erhalten bleibt. Aus der folgenden Abbildung geht der Aufbau eines Artikels hervor: Abb. 77: Ausschnitt aus dem Langenscheidt Basic German Vocabulary (1991, S. 139) Auf das Lemma folgen auf der linken Seite die Ausspracheangabe, grammatische Angaben und mindestens ein Beispielsatz auf Deutsch. Rechts stehen die jeweiligen englischen Entsprechungen, allerdings wird hier auf die Angabe der Aussprache sowie auf einige grammatische Details verzichtet. Für die Erforschung der Frage, inwieweit sich Grundwortschatz und Definitionswortschatz decken, wird das in der Stichprobe der Untersuchung verwendete Definitionsvokabular (vgl. Kap. 3.5.1.2 und 3.5.1.3) mit der Grundwortschatzliste des Langenscheidt Basic German Vocabulary verglichen. Näheres zum Vorgehen findet sich in den folgenden Unterkapiteln zu den beiden Wörterbüchern. 446 Zum Terminus Korpus vgl. Kapitel 3.2.1. Zu den Mannheimer Korpora und dem Bonner Zeitungskorpus vgl. Institut für Deutsche Sprache (2007a) und (2007b). Wörterbuchanalyse 323 3.5.1.2 Analyse des LTWDaF 2 Um einen Vergleich zwischen dem in der Stichprobe des LTWDaF 2 verwendeten Definitionswortschatz und dem Grundwortschatz Langenscheidt Basic German Vocabulary sinnvoll durchzuführen, dürfen natürlich nicht nur die Formative - also die äußere Struktur - der beiden Lexemsammlungen gegenübergestellt werden. Auch die Semantik der einzelnen Lexeme muss berücksichtigt werden, zumal das Langenscheidt Basic German Vocabulary explizit darauf verweist, nicht alle Bedeutungen der enthaltenen Lexeme aufzulisten (vgl. Langenscheidt Basic German Vocabulary 1991, S. IX). Zu diesem Zweck wird die semantische Gliederung der Lemmata des LTWDaF 2 in Homonyme genutzt. Jedes Element, das im Definitionswortschatz der untersuchten Stichprobe verwendet wird und im LTWDaF 2 als Homonym aufgelistet ist, wird beim Vergleich mit der Liste im Langenscheidt Basic German Vocabulary explizit daraufhin überprüft, ob sich die Semantik der Lexeme der beiden Listen entspricht. Ein weiterer zu beachtender Punkt beim Vergleich der beiden Auflistungen ist der Veröffentlichungstermin des Langenscheidt Basic German Vocabulary. Die Publikation im Jahr 1991 liegt zeitlich vor der gesamten Reform der deutschen Orthografie. Betroffen sind davon die Lexeme aus dem Problemfeld Getrennt- und Zusammenschreibung, die vor der Rechtschreibreform noch keinen Wortstatus besaßen, im konkreten Fall Fügungen aus Präposition und Substantiv. Die meisten von ihnen, darunter anstelle und aufgrund, durften bereits nach der alten Orthografie zusammengeschrieben werden. Anders ist der Fall allerdings bei mithilfe gelagert, das erst seit der aktuell gültigen Rechtschreibung zusammengeschrieben werden darf. Hier wird überprüft, ob im Langenscheidt Basic German Vocabulary beim Lemma Hilfe auch die Fügung mit Hilfe verzeichnet ist. Der Vergleich der Liste des in der Stichprobe der Untersuchung verwendeten Definitionswortschatzes des LTWDaF 2 mit dem Langenscheidt Basic German Vocabulary bringt einige interessante Ergebnisse ans Licht (vgl. Abb. 78). 447 So liegt der prozentuale Anteil des verwendeten Definitionswortschatzes, der nicht im Langenscheidt Basic German Vocabulary verzeichnet ist, mit 29,06 Prozent bei den Types sehr hoch (vgl. Abb. 78a). Doch die Verhältnisse verschieben sich, wenn die Verwendungshäufigkeit der einzelnen Lexeme in die Betrachtung einbezogen wird und die Berechnung nach den Tokens erfolgt. Dann entspricht die Verteilung des zum Grundwortschatz ge- 447 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 324 hörenden Definitionswortschatzes zu dem dort nicht verzeichneten einem Verhältnis von vier zu eins (vgl. Abb. 78b). Nur noch 20,39 Prozent der Tokens des Stichprobendefinitionswortschatzes sind nicht im Langenscheidt Basic German Vocabulary verzeichnet. Diese Veränderungen der Anteile von den Types zu den Tokens zeigen sich auch darin, dass der im Vergleichsgrundwortschatz enthaltene Definitionswortschatz pro Type im Mittelwert 5,50-mal verwendet wird, die nicht enthaltenen Lexeme hingegen lediglich 3,44-mal. Der allgemeine Durchschnitt liegt bei einer 4,90-maligen Verwendung pro Type. a) Types b) Tokens Abb. 78: Die Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Types (a) und Tokens (b) im LTWDaF 2 Bei einer lemmatypspezifischen Analyse zur Verzeichnung des untersuchten Definitionswortschatzes des LTWDaF 2 im Langenscheidt Basic German Vocabulary ergeben sich ebenfalls neue Erkenntnisse. Denn je nach Lemmatyp unterscheiden sich die einzelnen Werte bei den Types (vgl. Abb. 79). Der Anteil der Lexeme des Definitionswortschatzes, die nicht im Grundwortschatz vertreten sind, ist bei den adjektivischen Definitionen mit 19,44 Prozent am niedrigsten, sehr dicht daran befinden sich die verbalen Definitionen mit 21,71 Prozent der verwendeten Types. Noch höher ist der Wert der Types mit 24,50 Prozent bei den untersuchten Definitionen der Substantive. Die höchste relative Häufigkeit besitzen Types, die nicht im Langenscheidt Basic German Vocabulary verzeichnet sind, mit 28,95 Prozent bei den Definitionen des Lemmatyps Sonstiges. Wörterbuchanalyse 325 Anteil der Types Lemmatyp Abb. 79: Die lemmatypspezifische Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Types im LTWDaF 2 Bei der Betrachtung der Tokens des LTWDaF 2 bleibt diese Reihenfolge der Types vollständig erhalten (vgl. Abb. 80). Somit liegt der Wert für den nicht im Grundwortschatz enthaltenen Definitionswortschatz mit 16,32 Prozent bei den Tokens der adjektivischen Definitionen am niedrigsten. Die Anteile der Tokens in den Definitionen der Verben liegen mit 16,64 Prozent lediglich minimal über dem entsprechenden Wert der adjektivischen Definitionen. Ein etwas größerer Abstand besteht zu den Substantivdefinitionen, bei denen 19,98 Prozent der untersuchten Tokens nicht zum Vergleichsgrundwortschatz gehören. Damit entsprechen die Definitionen der Substantive am stärksten den Werten der Gesamtmenge (20,39 Prozent des Definitionswortschatzes sind nicht im Grundwortschatz enthalten). Am höchsten liegt die relative Häufigkeit der Lexeme, die nicht Teil des Grundwortschatzes sind, bei den Definitionen des Lemmatyps Sonstiges, wo sie 26,34 Prozent ausmachen. Die absoluten Werte, die bei den einzelnen Lemmatypen erreicht werden, ändern sich allerdings von den Types zu den Tokens. Die Anteile des im Grundwortschatz enthaltenen Vokabulars sind dabei lemmatypspezifisch zwischen knapp drei (Adjektiv) und fünf Prozentpunkten (Verb) höher. In der Gesamtuntersuchung werden die Unterschiede mit fast neun Prozent sogar noch deutlicher. Diese Unterschiede zwischen Types und Tokens werden bei den Zahlen zur Verwendungshäufigkeit sichtbar. Der Nichtgrundwortschatz wird seltener verwendet als der lemmatypspezifische Mittelwert, der Grundwortschatz hingegen häufiger. Wie bereits in den vorangehenden Kapiteln der Analyse kann an dieser Stelle die Markiertheits- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 326 theorie die Erklärung liefern - der Grundwortschatz ist sowohl formal als auch semantisch nicht markiert, wodurch sich seine häufigere Verwendung ergibt (vgl. Kap. 3.3.2.1.2). Anteil der Tokens Lemmatyp Abb. 80: Die lemmatypspezifische Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Tokens im LTWDaF 2 Resümierend fällt der hohe Anteil der Lexeme auf, die zwar in den Definitionen des LTWDaF 2 Verwendung finden, die jedoch nicht Teil des Vergleichsgrundwortschatzes Langenscheidt Basic German Vocabulary sind. Bei den Tokens fällt dieser Wert niedriger aus als bei den Types. Dies zeigt, dass die Verwendungshäufigkeit beim Nichtgrundwortschatz geringer ist als bei den Elementen des Grundwortschatzes. Die Definitionen des Lemmatyps Sonstiges weisen sowohl bei den Tokens als auch bei den Types den höchsten Wert für nicht im Grundwortschatz verzeichnetes Vokabular auf, die Adjektivdefinitionen den niedrigsten. 3.5.1.3 Analyse des DHWDaF 2 Für die Gegenüberstellung der in den Definitionen des DHWDaF 2 enthaltenen Lexeme mit dem ausgewählten Grundwortschatz Langenscheidt Basic German Vocabulary wird in gleicher Weise vorgegangen wie mit den Lexemen des LTWDaF 2 (vgl. Kap. 3.5.1.2). Das betrifft zum einen die Tatsache, dass 1991 beim Erscheinen des Langenscheidt Basic German Vocabulary die Orthografiereform noch nicht umgesetzt ist - weshalb beim Abgleich der Elemente des Definitionswortschatzes des DHWDaF 2 mit dem Grundwortschatz auch auf die ehemalige Orthografie geachtet werden muss. So wäre das Lexem mithilfe im Langenscheidt Basic German Vocabulary noch unter Hilfe Wörterbuchanalyse 327 verzeichnet, gernhaben müsste unter gern oder haben stehen. Weiterhin sind davon die homonymen Lexeme betroffen. Diese gilt es bei der Gegenüberstellung mit dem Grundwortschatz gesondert daraufhin zu überprüfen, ob sie auch in der jeweiligen Bedeutung verzeichnet sind. Im Fall der in der Stichprobe des DHWDaF 2 verwendeten Lexeme gilt das ausschließlich für Verben, beispielsweise für anlegen, das im Langenscheidt Basic German Vocabulary nur in der Bedeutung ‘ankommen, landen (bei Schiffen)’ verzeichnet ist und nicht in der Bedeutung ‘erstellen, planen’, in der es beispielsweise in der Definition des Lemmas Vorgang im DHWDaF 2 auftaucht. Weitere Beispiele hierfür sind bestehen (in der Definition von alt im DHWDaF 2 in der Bedeutung ‘existieren, da sein’ verwendet, im Langenscheidt Basic German Vocabulary jedoch nur als ‘schaffen, absolvieren’ verzeichnet) oder erfüllen (in der Definition von voll im DHWDaF 2 auch in der Bedeutung ‘voll sein mit’ verwendet, im Langenscheidt Basic German Vocabulary allerdings nur als ‘nachkommen, entsprechen’ lemmatisiert). a) Types b) Tokens Abb. 81: Die Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Types (a) und Tokens (b) im DHWDaF 2 Wertet man die in den Definitionen der Stichprobe zum DHWDaF 2 verwendeten Lexeme hinsichtlich ihrer Verzeichnung im Langenscheidt Basic German Vocabulary aus, wie es in Abbildung 81 dargestellt ist, zeigen sich folgende Details. 448 Bei den Types sind 38,33 Prozent des Vokabulars, das in den Definitionen gebraucht wird, nicht im Vergleichsgrundwortschatz enthalten (vgl. Abb. 81a). Zwar sinkt der Anteil der Elemente, die nicht zum Grundwortschatz gehören, bei der Zählung der Tokens um fast zehn Prozentpunkte (vgl. Abb. 81b). Trotzdem ist auch dort noch mehr als ein Viertel des Defini- 448 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 328 tionswortschatzes - 27,56 Prozent - nicht im Langenscheidt Basic German Vocabulary lemmatisiert. Die Entwicklung der relativen Häufigkeiten von den Types zu den Tokens lässt sich anschaulich mit den Zahlen zur Verwendungshäufigkeit der beiden Gruppen unterstreichen. So werden die Elemente des Grundwortschatzes im Mittelwert 3,65-mal verwendet, was über dem allgemeinen Durchschnitt des DHWDaF 2 von 3,11-mal liegt. Die Lexeme, die nicht im Langenscheidt Basic German Vocabulary enthalten sind, werden hingegen mit 2,24-mal seltener gebraucht. Bei der Gegenüberstellung der beiden analysierten Wörterbücher zeigt sich deutlich, dass sich der Definitionswortschatz des LTWDaF 2 stärker mit dem Grundwortschatz Langenscheidt Basic German Vocabulary deckt. So sind bei den Types über neun und bei den Tokens immerhin noch über sieben Prozent des verwendeten Definitionswortschatzes mehr im Grundwortschatz verzeichnet als im DHWDaF 2. Das lässt sich erstens damit begründen, dass sowohl der Grundwortschatz als auch das LTWDaF 2 aus dem Haus Langenscheidt stammen und daher mit einer größeren Deckung der Daten in den verschiedenen Werken zu rechnen ist als bei einem Vergleich mit einem Werk eines anderen Verlages. Zweitens zeigt sich aber auch in diesem Resultat die verschiedenartige Struktur und Zusammensetzung der Definitionen in den beiden Wörterbüchern (vgl. Kap. 3.4.2.3). Das hängt vor allem mit dem Einfluss der Wortbildung auf den Definitionswortschatz zusammen. So enthalten die Definitionen des DHWDaF 2 bei den Types fast sechs und bei den Tokens sogar über neun Prozent weniger primäre Autosemantika als die Definitionen des LTWDaF 2 und dementsprechend mehr sekundäre Lexeme (vgl. Kap. 3.3.2.3.3.2). Wie im Kapitel 3.5.1.1 dargestellt, wird jedoch als eine Eigenschaft des Grundwortschatzes seine „Eignung als Basis für weitere Wortbildungen“ (Schmidt 1955, S. 531) hervorgehoben und der Grundwortschatz als „Ansammlung von möglichst morphologisch einfachen Wörtern“ (Lutzeier 1995, S. 12) definiert. Deshalb kann der niedrigere Anteil des Grundwortschatzes in den Definitionen des DHW- DaF 2 auch in dem beschriebenen Mehrvorkommen an sekundären Lexemen begründet sein. Obwohl die Werte für den nicht zum Grundwortschatz gehörenden Definitionswortschatz im LTWDaF 2 deutlich unter denen des DHW- DaF 2 liegen, ist an dieser Stelle ein Anteil von einem Fünftel (LTWDaF 2) gegenüber einem Viertel (DHWDaF 2) kein Grund zur Zufriedenheit. In beiden Wörterbüchern besteht Verbesserungsbedarf, den verwendeten Definitionswortschatz zukünftig stärker mit dem Grundwortschatz des Deutschen abzustimmen, da dieser als der zentrale Wortschatz der Sprache gilt. Bei den Verwendungshäufigkeiten liegt das DHWDaF 2 in absoluten Werten grundsätzlich unter den Werten des LTWDaF 2. Beide Wörterbücher zeigen jedoch die gleiche Entwicklung, dass von den Types zu den Tokens die Elemente des Wörterbuchanalyse 329 Grundwortschatzes ihre Anteile vergrößern, wohingegen die Werte für das nicht im Grundwortschatz verzeichnete Vokabular sinken. Dadurch wird der Grundwortschatz im Vergleich zur Gesamtmenge überdurchschnittlich häufig verwendet, der Nichtgrundwortschatz im Gegensatz dazu unterdurchschnittlich häufig. Anteil der Types Lemmatyp Abb. 82: Die lemmatypspezifische Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Types im DHWDaF 2 Im nächsten Schritt werden die Erkenntnisse zur Gesamtstichprobe nach den vier verschiedenen Lemmatypen differenziert. Bei den Types des DHWDaF 2 bestehen zwischen den einzelnen Lemmatypen sichtbare Unterschiede, was die Verzeichnung der Elemente des Definitionswortschatzes im Langenscheidt Basic German Vocabulary betrifft (vgl. Abb. 82). Die relativen Häufigkeiten unterscheiden sich um bis zu neun Prozent voneinander. Die Lemmatypgruppe Sonstiges enthält in ihren Definitionen mit 38,57 Prozent die meisten Types, die nicht zum Grundwortschatz gehören. An zweiter Stelle für die Types außerhalb des Grundwortschatzes stehen die substantivischen Definitionen mit einem Wert von 33,17 Prozent, darauf folgen die Definitionen der Adjektive mit 32,42 Prozent und die verbalen Definitionen mit 29,59 Prozent. Der oben erläuterte Zusammenhang zwischen der Wortgebildetheit der Lexeme und ihrer Zugehörigkeit zum Grundwortschatz lässt sich auch bei den lemmatypspezifischen Ergebnissen für die Types des DHWDaF 2 nachweisen. Die Lemmatypgruppe Sonstiges, in deren Definitionen der Grundwortschatz den niedrigsten lemmatypspezifischen Anteil an den Types erreicht, ist gleichzeitig der Lemmatyp mit dem höchsten Anteil an Types, die sich auf Wortbildung zurückführen lassen. Im Vergleich zwischen den beiden Wörterbüchern ist Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 330 ersichtlich, dass die Übereinstimmung zwischen dem verwendeten Definitionswortschatz und dem Grundwortschatz Langenscheidt Basic German Vocabulary bei den Types im LTWDaF 2 wesentlich größer ist als im DHWDaF 2. Je nach Lemmatyp sind es zwischen acht Prozent (Verbdefinitionen) und 13 Prozent (Adjektivdefinitionen) der Types, die sich im DHWDaF 2 weniger mit dem Grundwortschatz decken. Anteil der Tokens Lemmatyp Abb. 83: Die lemmatypspezifische Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Tokens im DHWDaF 2 Um das Bild zu komplettieren, werden noch die lemmatypspezifischen Werte für die Anteile des Grundwortschatzes an den Tokens der Definitionen des DHWDaF 2 ausgewertet (vgl. Abb. 83). Wie bereits bei der Gesamtbetrachtung ist die relative Häufigkeit des Grundwortschatzes bei den Tokens im Vergleich zu den Types bei den einzelnen Lemmatypen höher, meist sechs bis sieben Prozent. Die Anteile der Tokens, die nicht im Langenscheidt Basic German Vocabulary lemmatisiert sind, sind dementsprechend niedriger. Dies lässt sich wiederum mit den Werten der Verwendungshäufigkeiten belegen, die bei den im Grundwortschatz enthaltenen Elementen über dem lemmatypspezifischen Durchschnitt liegt, bei den anderen hingegen darunter. Diese Zahlen bestätigen ein weiteres Mal die Theorie der Markiertheit (vgl. Kap. 3.3.2.1.2). Der Grundwortschatz ist in diesem Sinn sowohl semantisch als auch formal unauffällig. 449 Die Reihenfolge der Lemmatypen ändert sich von den Types zu den Tokens nicht, auch der Abstand zwischen den beiden unterschiedlichsten Lemmatypen bleibt mit rund zehn Prozent gleich. So ver- 449 Wahrscheinlich bemühen sich die Wörterbuchredakteure bereits, den Grundwortschatz in den Definitionen zu verwenden. Wörterbuchanalyse 331 fügt auch bei den Tokens die Lemmatypgruppe Sonstiges mit 32,81 Prozent in ihren Definitionen über den höchsten Anteil an Definitionswortschatz, der nicht im Grundwortschatz verzeichnet ist - beinahe jedes dritte in den Definitionen verwendete Lexem. Erneut folgen danach die Definitionen des Lemmatyps Substantiv mit einem Wert von 26,48 Prozent der Tokens, die nicht Teil des Grundwortschatzes sind. Dicht dahinter liegen die adjektivischen Definitionen, deren Tokens zu 25,87 Prozent nicht zum Langenscheidt Basic German Vocabulary gehören. In den Definitionen des Lemmatyps Verb sind 23,21 Prozent der Tokens nicht im Grundwortschatz verzeichnet. Die Gegenüberstellung der beiden Wörterbücher offenbart auch unter dem Aspekt der Übereinstimmung mit dem Grundwortschatz Langenscheidt Basic German Vocabulary bei den Tokens deutliche Ähnlichkeiten. So liegt der Anteil der nicht zum Grundwortschatz gehörenden Elemente bei den Tokens zwar generell niedriger als bei den Types, ist aber mit Werten zwischen 16 Prozent (Adjektivdefinitionen im LTWDaF 2) und fast 33 Prozent (Definitionen der Lemmatypgruppe Sonstiges im DHWDaF 2) entschieden zu hoch. Sowohl im DHWDaF 2 als auch LTWDaF 2 enthalten die Definitionen der Lemmatypen Sonstiges und Substantiv die wenigsten Tokens aus dem Grundwortschatz. Allerdings gibt es zwischen den beiden Wörterbüchern auch Unterschiede, wovon vor allem die reinen Zahlenwerte betroffen sind. Die relativen Häufigkeiten für die Tokens des Grundwortschatzes liegen im LTWDaF 2 zwischen 6,47 Prozent (Lemmatypgruppe Sonstiges) und 9,55 Prozent (Lemmatyp Adjektiv) höher als im DHWDaF 2. Resümierend muss noch einmal betont werden, wie hoch in den Definitionen der Stichprobe der Anteil der Lexeme ist, die nicht zum Vergleichsgrundwortschatz Langenscheidt Basic German Vocabulary gehören - und zwar in beiden Wörterbüchern, bei Types und Tokens. Die Anteile schwanken dabei zwischen mehr als 16 Prozent (Tokens der Adjektivdefinitionen im LTWDaF 2) und fast 39 Prozent (Types der Definitionen der Lemmatypgruppe Sonstiges im DHWDaF 2). In Abhängigkeit vom Wörterbuch, vom Lemmatyp und von der Art der Zählung sind also ein Sechstel bis zwei Fünftel der in den Definitionen verwendeten Lexeme nicht Bestandteil des Vergleichsgrundwortschatzes Langenscheidt Basic German Vocabulary. Dabei liegt der Anteil des Grundwortschatzes am Definitionswortschatz des LTWDaF 2 höher als am Definitionswortschatz des DHWDaF 2, bei den Tokens ist er höher als bei den Types. Vor dem Hintergrund, dass der Grundwortschatz im Zentrum des Lexikons einer Sprache steht (vgl. Kap. 3.5.1.1), sollten die in den Definitionen Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 332 der Wörterbücher für Deutsch als Fremdsprache benutzten Lexeme zukünftig stärker mit dem Grundwortschatz abgestimmt werden. Zudem wäre es dringend notwendig, den Grundwortschatz zu überarbeiten und zu aktualisieren. 3.5.2 Vergleich des untersuchten Definitionswortschatzes mit dem Frequenzwörterbuch Frequency Dictionary 3.5.2.1 Grundlagen Das Thema des frequenten Wortschatzes ist im Gegensatz zum Grundwortschatz in der Sprachwissenschaft weniger breit erforscht, mit Martin (1990) und Alekseev (1984, 2005) sei hier auf die grundlegende Literatur auf dem Gebiet der Frequenzwörterbücher hingewiesen. 450 Bei der Frequenz handelt es sich auf den ersten Blick um ein sehr objektives Merkmal. Es spielt in der Sprachstatistik beziehungsweise in der quantitativen Linguistik eine Rolle, wenn es um die Häufigkeit, die Verteilung oder die Wahrscheinlichkeit des Auftretens bestimmter sprachlicher Erscheinungen in einem Korpus geht. Frequenzuntersuchungen können dabei auf allen Ebenen der Sprache durchgeführt werden, also beispielsweise in der Phonologie, der Morphologie, der Lexik oder der Syntax. Auf den Ergebnissen von Frequenzuntersuchungen basieren unter anderem das Morsealphabet, die Stenografie oder die Brailleschrift. Die Mehrzahl der neu erscheinenden Wörterbücher nutzt ebenfalls die Resultate von Frequenzuntersuchungen. 451 Wirklich objektiv sind jedoch nicht die Frequenzuntersuchungen an sich, sondern vielmehr die mathematischen Operationen, die bei der Auswertung der Korpusdaten verwendet werden. Die Zusammensetzung des Korpus, an dem die Frequenzuntersuchungen durchgeführt werden, beeinflusst und bestimmt die Resultate der Analyse. Um verlässliche Informationen zu erhalten, bedarf es also der geschickten Zusammenstellung eines umfangreichen zugrunde liegenden Korpus. Gleiche Ergebnisse kommen dabei nur bei identischen Korpora zustande. Mit der Erstellung von Korpora für Frequenzanalysen verbinden sich zwei grundsätzliche Probleme - das der Repräsentativität und das der Homogenität. 452 Zum einen beziehen sich die Ergebnisse einer Häufigkeitsuntersu- 450 Weiterhin sei in diesem Zusammenhang auf Harkin (1957), Frumkina (1964), Ernst (1979) und Köhler (2005) verwiesen. 451 Zur Bedeutung des Frequenzkriteriums für die Selektion von kontrollierten Definitionswortschätzen vgl. Kapitel 2.3.2. 452 Vgl. Köhler (2005, S. 958) und Martin (1990, S. 1316f.). Zum Terminus Korpus vgl. Kapitel 3.2.1. Wörterbuchanalyse 333 chung in erster Linie auf das ausgewählte Korpus, keinesfalls können sie automatisch auf andere Textsorten oder sogar eine wie auch immer geartete Gesamtsprache übertragen werden. Zum anderen wird das Korpus mit wachsender Größe und Diversität zunehmend inhomogener. Nach Rosengren (1985, S. 156) ist ein Frequenz- oder Häufigkeitswörterbuch „eine Widerspiegelung der Anwendung des Wortschatzes und der Wortbildungsregeln einer bestimmten Sprechergruppe in einer oder mehreren abgrenzbaren und definierbaren Situationen“. Darin werden die in einem bestimmten Korpus vertretenen sprachlichen Ausdrücke aufgelistet, diese können dabei nach der Häufigkeit ihres Vorkommens, initialalphabetisch oder finalalphabetisch geordnet sein. Oft wird das Material auch in mehreren Listen aufgeführt - beispielsweise alphabetisch und nach der Frequenz. In jedem Fall sind jedoch in der Mikrostruktur der Artikel zumindest die Angaben zur Häufigkeit oder Häufigkeitsklasse enthalten. Aus Platzgründen werden die Ergebnisse vieler Frequenzuntersuchungen nur zum Teil publiziert, im Wörterbuch stehen dann lediglich die sprachlichen Elemente bis zu einer gewissen Häufigkeit. Zwar existieren Frequenzwörterbücher auch zu anderen sprachlichen Elementen, im Folgenden stehen allerdings die Nachschlagewerke im Mittelpunkt, die Lexeme oder Wortformen enthalten. 453 Je nach Art der Anwendung verknüpfen sich mit den Frequenzwörterbüchern unterschiedliche Funktionen (vgl. Alekseev 1984, S. 18ff.): Für die pädagogisch-didaktische Praxis bilden sie die „Datenbasis für die Erstellung von Grundwortschätzen, Grundschul- und Lernerwörterbüchern“ (Engelberg/ Lemnitzer 2009, S. 46). 454 Auf einer abstrakteren Ebene werden sie in der linguistischen Forschung „als Grundlage für texttypologische und sprachtypologische Untersuchungen herangezogen“ (ebd.). Nicht zuletzt können sie auch für „die Feststellung der gebräuchlichsten Bedeutung eines Wortes“ (ebd.) eine Rolle spielen. Der verbindende Gedanke ist dabei die Ökonomie: „Words have been counted in many languages for many reasons, but always for purposes of simplification and economy, whether of thought, effort, or material.“ (Harkin 1957, S. 113). Nach Alekseev (2005, S. 313ff.) lassen sich Frequenzwörterbücher nach folgenden neun Kriterien typologisieren: 1. nach der untersuchten Sprache (z.B. Englisch), 2. nach der analysierten Subsprache, dem Stil, dem Ideolekt, dem Text (z.B. Zeitungssprache, ein einzelner Autor), 3. nach dem untersuchten sprachlichen Element (z.B. Silben, Grapheme), 4. nach dem Umfang der Textauswahl (z.B. eine Million laufende Wörter), 5. nach dem Umfang des Wörterbuchs (z.B. partiell bis zu einer bestimmten Häufigkeit), 6. nach den Mengenmerkmalen der Wörterbuchele- 453 Zu den Termini Lexem und Wortform vgl. Kapitel 2.1.1, Anm. 7. 454 Vgl. auch Rosengren (1985, S. 162) und Kapitel 3.5.1.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 334 mente (z.B. die relative Häufigkeit), 7. nach der Struktur des Wörterbuchs und der Artikel (z.B. die Angabe von Wortformen oder Wortbildungen), 8. nach der Technik der Wörterbucherstellung (z.B. mit dem Computer) sowie 9. nach dem Ziel und dem Adressaten (z.B. für die Verbesserung des Sprachunterrichts). 455 Von den mehr als 500 Frequenzwörterbüchern, die Alekseev (2005, S. 313) untersucht hat, beziehen sich knapp ein Drittel auf die englische Sprache, 15 Prozent auf das Russische und jeweils sieben Prozent auf die französische und die deutsche Sprache. Das für das Deutsche wichtigste Projekt wird im Folgenden kurz beschrieben, einige weitere werden aufgezählt. 456 Im Jahr 1898 beginnt Friedrich Wilhelm Käding mit der Veröffentlichung seines Häufigkeitswörterbuchs der deutschen Sprache. 457 Er analysiert 290 verschiedene schriftliche Quellen aus dem 19. Jahrhundert mit insgesamt 10 910 777 laufenden Wörtern - eine selbst im heutigen Computerzeitalter sehr hohe Zahl. Für die Arbeit kooperiert Käding mit 5 000 Stenografen und 800 Mitarbeitern. Er verfolgt keine pädagogischen Interessen, die Ergebnisse sollen stattdessen der Entwicklung einer stenografischen Schrift dienen. Aus diesem Grund interessiert sich Käding hauptsächlich für die Erkennung häufiger Graphemverbindungen. Homonyme werden nicht unterschieden. Im Korpus sind 258 173 unterschiedliche Wortformen vertreten, von denen 6 136 dann im Wörterbuch nach der Frequenz geordnet aufgelistet werden. Die Hälfte aller Wortformen insgesamt wird nur ein einziges Mal verwendet. Daraus schließen spätere Wissenschaftler, dass für eine statistische Untersuchung ein großes Korpus von mindestens einer Million Wörtern notwendig ist. Die pädagogische Anwendung Kädings erfolgt rund 30 Jahre später durch Bayard Quincy Morgan in dessen Werk German Frequency Word Book (1928). 1934 erscheint Hugo Bakonyis Die gebräuchlichsten Wörter der deutschen Sprache. Im gleichen Jahr publiziert Helen Slocomb Eaton ihre sprachvergleichende Studie Comparative Frequency List für Englisch, Französisch, Spanisch und Deutsch, die sie 1940 auch in Form des Wörterbuchs English-French-German-Spanish Word Frequency Dictionary veröffentlicht. Ab 1964 folgt Jay Alan Pfeffers umfangreiche Arbeit zu Grunddeutsch (vgl. Kap. 2.2.1.7). Für die Deutsche Sprachstatistik nutzt Helmut Meier 1964 erneut Kädings Daten. Rodney Newcomb Swenson widmet sich 1967 im Frequency Count of Contemporary Ger- 455 Vgl. auch Martin (1990, S. 1315f.). 456 Für wichtige englisch- und französischsprachigen Untersuchungen sei an dieser Stelle auf Kapitel 2.2.1 verwiesen, um inhaltliche Überschneidungen zu vermeiden. Das deutsche Projekt wird dort nicht behandelt, da es nicht zum Vocabulary Control Movement gehört. 457 Vgl. Bongers (1947, S. 29ff.), Harkin (1957, S. 115f.), Tschirner (2005, S. 135f.). Wörterbuchanalyse 335 man Vocabulary Based on Three Current Leading Newspapers der Häufigkeitsuntersuchung in Pressetexten, genau wie Inger Rosengren im Frequenzwörterbuch der deutschen Zeitungssprache, das 1972 und 1977 in zwei Bänden erscheint. Auch Wolf Dieter Ortmann greift ab 1975 für das vierbändige, in Kooperation mit dem Goethe-Institut entstandene Werk Hochfrequente deutsche Wortformen noch auf Kädings Daten zurück. Da Ortmanns Werk später als Basis für das Zertifikat Deutsch als Fremdsprache dient, hat es - und damit indirekt die Zählung Kädings - bis heute Einfluss auf die Auswahl der Lexik in den DaF-Lehrwerken, eine Tatsache, die von Tschirner zu Recht kritisiert wird (2006, S. 1280). Wie Pfeffer beschäftigt sich auch Arno Ruoff mit dem mündlichen Sprachgebrauch, 1981 veröffentlicht er das Häufigkeitswörterbuch gesprochener Sprache. Hochinteressant ist auch das Projekt Deutscher Wortschatz, das seit 1995 an der Leipziger Universität besteht. Das Korpus ist hier mit 35,7 Millionen Sätzen enorm groß. 458 Allerdings ist es für pädagogische Zwecke durch seine Konzentration auf elektronisch vorhandene Pressetexte und seine Nichtlemmatisierung der Wortformen nur bedingt von Interesse. Wie bereits im Kapitel 2.3.2 beschrieben, bestehen zwischen dem Definitionswortschatz und dem Frequenzwortschatz großflächige Überschneidungen. Das liegt darin begründet, dass bei der Selektion des Definitionswortschatzes die Frequenz ein Kriterium ist, das fast immer Berücksichtigung findet. Wie groß die Parallelen des hier gewählten Frequenzwortschatzes mit der Datengrundlage sind, der Stichprobe zum LTWDaF 2 und zum DHWDaF 2, wird in den Kapiteln 3.5.2.2 und 3.5.2.3 untersucht. 459 Bei dem für den Vergleich ausgewählten Frequenzwörterbuch handelt es sich um A Frequency Dictionary von Randall L. Jones und Erwin Tschirner, das 2006 bei Routledge erscheint. 460 Die Auswahl des Vergleichsfrequenzwortschatzes fällt leicht, da alle weiteren Projekte zum Deutschen - wie oben dargestellt - entweder inzwischen stark veraltet oder aus sonstigen Gründen (beispielsweise durch die Verwendung spezieller Korpora) nicht geeignet sind. 461 Das dem Wörterbuch zugrunde liegende Korpus, das Her- 458 Nach Auskunft eines Mitarbeiters war dies der Umfang im Jahr 1995. 459 Knapp 40 Prozent des Frequency Dictionary sind laut Tschirner (2006, S. 1282) nicht im Langenscheidt Basic German Vocabulary enthalten, umgekehrt seien es rund 32 Prozent. 460 Zu diesem Abschnitt vgl. Tschirner (2005, S. 137ff.), Jones/ Tschirner (2006, S. 2ff.), Tschirner (2006, S. 1280f.). 461 Das Problem mit den veralteten Daten stellt sich ebenfalls bei Forschungen und Publikationen zum Grundwortschatz (vgl. Kap. 3.5.1.1). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 336 der/ BYU-Korpus 462 , umfasst 4,2 Millionen laufende Wortformen, die aus 270 000 individuellen Wortformen bestehen, von denen wiederum zirka 57 Prozent nur einmal vorkommen. Das Ziel des Herder/ BYU -Korpus war es, ein aktuelles, ausgewogenes und für die deutschsprachigen Länder repräsentatives Korpus zu erstellen, das noch per Hand bearbeitet werden konnte und dessen Wortlisten lemmatisiert werden konnten. (Tschirner 2005, S. 137) Die Grundlage des Korpus bilden jeweils eine Million laufende Wörter aus den Bereichen Zeitungstexte, Sach- und Fachtexte, literarische Texte und gesprochene Sprache sowie 200 000 Wörter aus Gebrauchstexten, was seine Ausgewogenheit gewährleistet. 463 Damit umfasst es genau die Gebiete, die beispielsweise auch im Duden-Korpus berücksichtigt werden. 464 Alle Subkorpora weisen ein Verhältnis von 70 : 20 : 10 auf, was ihre Anteile an deutschen, österreichischen und Schweizer Texten anbelangt, und bestehen aus vielen verschiedenen Einzeltexten. Die ältesten Texte stammen von 1989, die Mehrzahl jedoch ist jüngeren Datums. Die Texte werden digitalisiert und in ihrer Rechtschreibung vereinheitlicht. Alle Wortformen werden zum Zweck der Disambiguierung mit einer Wortartenannotierung versehen und die 8 000 häufigsten anschließend lemmatisiert. So kann sichergestellt werden, dass im Frequenzwörterbuch auch wirklich die häufigsten Wörter verzeichnet werden, da sich die Häufigkeit bei den flektierbaren Wortarten durch die Lemmatisierung noch einmal stark erhöht. Im Wörterbuch sind die 4 034 häufigsten Lexeme des Deutschen verzeichnet, damit werden zwischen 80 und 90 Prozent des Korpus abgedeckt. Die Gesamtzahl von 4 034 Lemmata kommt zustande, weil aus Gründen der Gleichberechtigung nach dem viertausendsten Lemma noch alle diejenigen Lemmata mit ins Wörterbuch aufgenommen werden, die im Korpus genauso häufig vorhanden sind (jeweils 68-mal). Das Frequency Dictionary von Jones/ Tschirner besteht aus zwei großen Teilen. Im ersten Abschnitt werden die 4 034 Lemmata in abnehmender Häufigkeit aufgelistet. 462 Dieses Korpus entstand in Zusammenarbeit des Herder-Institutes der Universität Leipzig mit der Brigham Young University in Utah. 463 Für genauere Angaben zu den einzelnen Texten, aus denen sich das Korpus zusammensetzt, vgl. Tschirner (2005, S. 137f.) und Jones/ Tschirner (2006, S. 2f.). 464 Zum Duden-Korpus vgl. Rautmann (2010). Wörterbuchanalyse 337 Abb. 84: Ausschnitt aus dem Frequency Dictionary (Jones/ Tschirner 2006, S. 109) Wie aus der Abbildung 84 ersichtlich wird, enthält jeder Artikel Angaben zum Rang. Darauf folgen das Lemma, seine Wortart, eine englische Übersetzung, ein Beispielsatz, die absolute Häufigkeit des Lemmas pro Million Korpuswörter sowie teilweise Bemerkungen zu den Teilkorpora, in denen das Lemma unter- oder überrepräsentiert ist. Zu einigen Lemmata werden auch häufige Mehrwortlexeme aufgeführt, beispielsweise im Zusammenhang mit und in diesem Zusammenhang zum Lemma Zusammenhang. Dieser nach den Häufigkeiten geordnete Teil wird von insgesamt 21 Infoboxen aufgelockert, die thematisch gebundene Informationen zu Lexik und Grammatik enthalten: Bestimmte Artikel, Formen des Verbs sein, Formen des Verbs haben, Personalpronomen, Formen des Verbs werden, Possessivpronomen, Kollokationen zu Jahr, Zahlen, Kollokationen zu Zeit, Verwandtschaftsbezeichnungen, Kollokationen zu Fall, Sport, Wetter, Farben, Pflanzen und Gartenarbeit, Monate, Jahreszeiten, Wochentage, Geräte und Utensilien, Haustiere sowie Kleidung. Im zweiten Teil des Wörterbuchs sind die Lemmata alphabetisch geordnet, gefolgt von den Angaben zur Wortart, der englischen Übersetzung sowie dem Rang. Weiterhin gibt es eigene Listen für die einhundert häufigsten Verben, Substantive, Adjektive und Adverbien, für alle Präpositionen, Konjunktionen und Kurzwörter/ Abkürzungen, für die einhundert häufigsten Eigennamen und unregelmäßigen Verben, für Hilfs- und Modalverben sowie für häufige Kollokationen. Wie bereits im vorigen Kapitel zum Grundwortschatz wird für den Frequenzwortschatz ebenfalls in den folgenden Unterkapiteln untersucht, inwieweit er mit dem in der Stichprobe der beiden Wörterbücher LTWDaF 2 und DHW- DaF 2 verwendeten Definitionswortschatz kongruiert (vgl. Kap. 3.5.2.2 und Kap. 3.5.2.3). 3.5.2.2 Analyse des LTWDaF 2 Für den Vergleich des Frequenzwortschatzes Frequency Dictionary mit dem Definitionswortschatz der Stichprobe zum LTWDaF 2 gilt das Gleiche, was für Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 338 die Gegenüberstellung mit dem Grundwortschatz festgestellt werden kann: Es genügt nicht, die Formative der Lexeme zu überprüfen, vielmehr müssen diese ebenfalls auf ihre Semantik hin verglichen werden, wobei an dieser Stelle die recht starke Untergliederung der Lemmata des LTWDaF 2 in Homonyme sehr hilfreich ist. Allerdings verfügen die Artikel im Frequenzwörterbuch von Jones/ Tschirner über eine wesentlich schwächer ausgeprägte Mikrostruktur als die Artikel des LTWDaF 2, was sich auch in einer eher am Formativ als an der Semantik orientierten Lemmatisierungspolitik bemerkbar macht. Die Artikel im Frequency Dictionary sind selten nach einzelnen Sememen gegliedert, eine Unterteilung des Artikels geht gewöhnlich mit einem Wortartwechsel des Lemmas oder mit der Lemmatisierung einer Wortfügung einher. So ist aber beispielsweise in einem Artikel als Konjunktion und als Partikel verzeichnet, da als Adverb und als Konjunktion. Im Artikel zu Tag sind noch die Wortfügungen Guten Tag! , den ganzen Tag und am nächsten Tag erfasst. Eine wirkliche Betrachtung als Homonyme mit zwei getrennten Artikeln gibt es im Frequency Dictionary kaum. Sie kommt beispielsweise bei sein als Verb und als Pronomen vor. Durch die Aktualität des Frequency Dictionarys und der deshalb erfolgten Beachtung der amtlichen Neuregelung der Orthografie kann die Überprüfung der Schreibweisen von vor 1996 bei Wortfügungen wie mithilfe entfallen. Das Lexem Glaube, das in dieser Form in den Definitionen des LTW- DaF 2 verwendet wird, im Frequency Dictionary hingegen als Glauben lemmatisiert ist, wird trotz dieses kleinen Unterschieds als im Frequenzwörterbuch verzeichnet gewertet. 465 Wie aus der Abbildung 85a hervorgeht, ist gut ein Fünftel - ganz genau 21,46 Prozent - der in den Definitionen der Stichprobe zum LTWDaF 2 vertretenen Types nicht im Vergleichswortschatz, dem Frequency Dictionary von Jones/ Tschirner, vertreten. Dieser Prozentsatz mag auf den ersten Blick recht hoch erscheinen. Der Eindruck relativiert sich jedoch, wenn die Häufigkeit der Verwendung in die Betrachtung einbezogen wird und die Berechnung auf Grundlage der Tokens erfolgt (vgl. Abb. 85 b). Dann entfallen lediglich 6,18 Prozent auf die Lexeme, die nicht im Frequency Dictionary verzeichnet sind. Die starke Reduzierung dieses Anteils von den Types zu den Tokens lässt sich sehr anschaulich mit den Werten zur Verwendungshäufigkeit illustrieren. Im Durchschnitt wird in den Definitionen der Stichprobe zum LTWDaF 2 ein 465 In zahlreichen Printwörterbüchern (beispielsweise im GWDS) wird Glauben als seltenere Form zu Glaube geführt. Die Lemmatisierung von Glauben im Frequency Dictionary weist jedoch darauf hin, dass Glauben häufiger vorkommt als Glaube. Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Wörterbuchanalyse 339 Type 4,90-mal verwendet. Die nicht zum Frequency Dictionary gehörenden Lexeme werden mit durchschnittlich 1,41-mal wesentlich seltener gebraucht. Die Verwendungshäufigkeit der frequenten Lexeme liegt hingegen mit einer 5,85-maligen Verwendung pro Type über dem Mittelwert, wenn auch nicht übermäßig stark. a) Types b) Tokens Abb. 85: Die Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Types (a) und Tokens (b) im LTWDaF 2 Auch beim Vergleich des Definitionswortschatzes aus der Stichprobe zum LTW- DaF 2 mit dem Frequenzwortschatz wird eine lemmatypspezifische Analyse vorgenommen, die folgende Details ans Licht bringt (vgl. Abb. 86). So liegen bei den Types des LTWDaF 2-Definitionswortschatzes die jeweiligen Anteile der nicht zum Frequency Dictionary gehörenden Lexeme sehr dicht beieinander, sie unterscheiden sich bei den einzelnen Lemmatypen höchstens um rund vier Prozentpunkte. Über den niedrigsten Anteil an nicht im Frequenzwörterbuch verzeichneten Lexemen verfügen mit 12,88 Prozent der Types die Definitionen der Adjektive. Im Mittelfeld befinden sich die Definitionen des Lemmatyps Verb und der Lemmatypgruppe Sonstiges, deren Types zu 14,09 Prozent beziehungsweise zu 16,99 Prozent über die Lemmata des Frequenzwörterbuches von Jones/ Tschirner hinausgehen. Über den höchsten Wert für nicht im Vergleichsfrequenzwortschatz vertretenes Definitionsvokabular verfügen bei den Types die substantivischen Definitionen mit einer relativen Häufigkeit von 17,23 Prozent. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 340 Anteil der Types Lemmatyp Abb. 86: Die lemmatypspezifische Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Types im LTWDaF 2 Lagen im LTWDaF 2 die Werte für die Übereinstimmung des Definitionswortschatzes mit dem ausgewählten Frequenzwortschatz schon bei den Types der einzelnen Lemmatypen recht dicht beieinander, so unterscheiden sie sich bei den Tokens noch viel weniger (vgl. Abb. 87). Die Differenz zwischen den beiden am weitesten auseinanderliegenden Lemmatypen beträgt weniger als zwei Prozentpunkte. Lemmatypunabhängig sind die Anteile des Nichtfrequenzwortschatzes bei den Tokens höchstens halb so hoch wie bei den Types. Den niedrigsten Wert für den über den Frequenzwortschatz hinausgehenden Definitionswortschatz besitzen mit 5,57 Prozent erneut die Definitionen der Adjektive. Kaum andere Werte finden sich bei den Tokens der verbalen und substantivischen Definitionen, bei denen 5,70 Prozent beziehungsweise 5,96 Prozent des verwendeten Definitionswortschatzes nicht mit dem Frequency Dictionary übereinstimmen. Bei den Tokens ist die relative Häufigkeit der nicht frequenten Lexeme in der Lemmatypgruppe Sonstiges mit 7,23 Prozent am höchsten. Das oben für den Gesamtwert erläuterte Phänomen hinsichtlich der Verwendungshäufigkeit trifft auch auf alle vier Lemmatypen zu: Da die Anteile der frequenten Lexeme am Definitionswortschatz bei den Tokens etwas höher sind als bei den Types, liegen ihre Werte für die Verwendungshäufigkeit leicht über dem jeweiligen lemmatypspezifischen Mittelwert. Die Anteile des Nichtfrequenzwortschatzes sind bei den Tokens hingegen viel niedriger als bei den Types, sodass die Werte für die Verwendungshäufigkeit viel stärker unter dem lemmatypspezifischen Durchschnitt liegen. Die Lexeme, die nicht zum Frequenzwortschatz gehören, können im Sinn der Markiertheitstheorie als markiert gelten, wodurch sich ihre geringe Auftretenshäufigkeit erklärt (vgl. Kap. 3.3.2.1.2). Wörterbuchanalyse 341 Anteil der Tokens Lemmatyp Abb. 87: Die lemmatypspezifische Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Tokens im LTWDaF 2 Bei einer Zusammenfassung fallen im LTWDaF 2 die zwischen den einzelnen Lemmatypen eng zusammenliegenden Werte auf. Bei den Types reicht der Anteil des Nichtfrequenzwortschatzes in den Definitionen des LTWDaF 2 von rund 13 Prozent bis 17 Prozent. Bei den Types sinken diese Werte lemmatypübergreifend auf 5,57 Prozent bis 7,23 Prozent. Im Vergleich zum Grundwortschatz ist die Übereinstimmung zwischen dem Frequenzwortschatz des Frequency Dictionary und dem in der Stichprobe verwendeten Definitionswortschatz bei den Types rund zehn Prozentpunkte niedriger. Bei den Tokens vergrößert sich der Abstand zwischen dem Grundwortschatz und dem Frequenzwortschatz sogar noch, was die Deckung mit dem Definitionswortschatz betrifft, weil die Anteile des Grundwortschatzes hier weniger stark steigen als die des Frequenzwortschatzes. 3.5.2.3 Analyse des DHWDaF 2 Für das DHWDaF 2 ergibt sich bei der Untersuchung zur Kongruenz zwischen dem verwendeten Definitionswortschatz und dem Frequenzwortschatz Frequency Dictionary von Jones/ Tschirner die gleiche Vorgehensweise wie bereits beim LTWDaF 2 (vgl. Kap. 3.5.2.2). Eine Beachtung der alten Orthografieregelung ist auch hier nicht mehr notwendig, da sowohl das DHWDaF 2 als auch das Frequency Dictionary nach 1996 erscheinen. Überprüft werden muss wiederum nur, ob die Homonyme des Definitionswortschatzes auch in der jeweiligen Bedeutung im Frequency Dictionary verzeichnet sind. Als Beispiele, in denen das nicht der Fall ist, können wie bereits im Kapitel 3.5.1.3 einige Verben angeführt werden - wie anlegen, das im Frequency Dictionary Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 342 allein in der Bedeutung ‘investieren’ auftritt und nicht in der Bedeutung ‘erstellen, planen’, in der es beispielsweise in der Definition des Lemmas Vorgang im DHWDaF 2 verwendet wird. Ein weiteres Beispiel hierfür ist erfüllen, das in der Definition von voll im DHWDaF 2 in der Bedeutung ‘voll sein mit’ verwendet wird, im Frequency Dictionary jedoch nur als ‘nachkommen, entsprechen’ verzeichnet ist. a) Types b) Tokens Abb. 88: Die Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Types (a) und Tokens (b) im DHWDaF 2 Die exakte Auswertung aller Types, die in den Definitionen der Stichprobe zum DHWDaF 2 gebraucht werden, liefert folgende Ergebnisse (vgl. Abb. 88). 466 Von den Types des DHWDaF 2 sind 28,91 Prozent nicht Bestandteil des Frequenzwortschatzes (vgl. Abb. 88a). Dieser Prozentsatz ist zwar rund zehn Prozentpunkte niedriger als beim Definitionswortschatz des DHWDaF 2, der nicht zum Grundwortschatz gehört (vgl. Kap. 3.5.1.3), jedoch erscheint er immer zu hoch für ein Wörterbuch, das eigens für Nichtmuttersprachler konzipiert ist. Dem DHWDaF 2 muss jedoch zugute gehalten werden, dass sich der Anteil des nicht im Frequenzwörterbuch verzeichneten Definitionswortschatzes durch seine geringe Verwendungshäufigkeit bei den Tokens stark reduziert und dort nur noch 11,88 Prozent beträgt (vgl. Abb. 88b). Die Unterschiede zwischen den Anteilen des Frequenzwortschatzes am Definitionswortschatz des DHWDaF 2 von den Types zu den Tokens spiegeln sich in den Werten zur Verwendungshäufigkeit wider. Wie bereits beim LTWDaF 2 ist die relative Häufigkeit des nicht im Frequency Dictionary verzeichneten Defini- 466 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Wörterbuchanalyse 343 tionswortschatzes im Vergleich zu den Types bei den Tokens viel niedriger, weshalb die Verwendungshäufigkeit mit 1,28-mal deutlich unter dem allgemeinen Mittelwert von 3,11-mal liegt. Die Verwendungshäufigkeit des frequenten Wortschatzes ist mit 3,85-mal zwar überdurchschnittlich, jedoch nicht so weit vom Mittelwert entfernt wie der Nichtfrequenzwortschatz. Im Vergleich zum LTWDaF 2 verfügt das DHWDaF 2 in seinen Definitionen grundsätzlich über einen höheren Anteil an Lexemen, die nicht im Frequency Dictionary vertreten sind. Dies gilt sowohl für die Types als auch für die Tokens, wobei der relative Unterschied bei den Tokens größer ausfällt. Dort ist der Wert des Frequenzwortschatzes im LTWDaF 2 nur gut halb so hoch wie im DHWDaF 2, wohingegen er bei den Types immerhin rund drei Viertel des Wertes des DHWDaF 2 einnimmt. Anteil der Types Lemmatyp Abb. 89: Die lemmatypspezifische Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Types im DHWDaF 2 Fächert man die Daten zur Verzeichnung des Definitionswortschatzes im Frequency Dictionary nach den vier Lemmatypen auf, ergibt sich für das DHW- DaF 2 folgendes Bild (vgl. Abb. 89). Die Werte liegen lemmatypübergreifend sehr dicht beieinander und unterscheiden sich lediglich um weniger als vier Prozentpunkte voneinander. Über den höchsten Anteil an nicht frequenten Lexemen verfügen die Definitionen der Lemmatypgruppe Sonstiges mit 24,79 Prozent der Types. Bei den substantivischen Definitionen ist der Wert mit 24,75 Prozent jedoch fast identisch. Die Types der adjektivischen Definitionen gehören zu 22,18 Prozent nicht zum Frequency Dictionary. Die benutzerfreundlichste Einzelbilanz besteht im DHWDaF 2 beim Lemmatyp Verb - Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 344 hier sind nur 21,01 Prozent der Types nicht im Frequenzwörterbuch verzeichnet. Doch selbst dieser Wert ist sehr hoch. Einerseits liegen die relativen Häufigkeiten, die der Nichtfrequenzwortschatz bei den Types der Definitionen im Vergleichswörterbuch LTWDaF 2 erreicht, um sieben bis neun Prozentpunkte unter den Werten des DHWDaF 2. Andererseits ist es auch ohne den Vergleich mit einem zweiten Wörterbuch zu viel, wenn jedes fünfte bis jedes vierte Wort in den Definitionen eines Wörterbuchs für Deutsch als Fremdsprache nicht zu den häufigen Lexemen des Deutschen zählt. Allerdings deckt sich bei den Types des DHWDaF 2 der Frequenzwortschatz viel stärker mit dem Definitionswortschatz, als dies beim Grundwortschatz der Fall ist (vgl. Kap. 3.5.1.3), wobei diese Tatsache auch in der fehlenden Aktualität des Vergleichsgrundwortschatzes begründet sein kann. Anteil der Tokens Lemmatyp Abb. 90: Die lemmatypspezifische Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Tokens im DHWDaF 2 Für ein vollständiges Bild in Bezug auf die Übereinstimmung zwischen Frequenzwortschatz und Definitionswortschatz im DHWDaF 2 fehlt noch die lemmatypspezifische Aufschlüsselung für die Tokens, wie sie in Abbildung 90 dargestellt ist. Bereits auf den ersten Blick fallen die viel niedrigeren Werte des nicht zum Frequenzwortschatz gehörenden Definitionswortschatzes bei den Tokens auf. Lemmatypübergreifend liegen sie im Vergleich zu den Types rund halb so hoch. Bei den einzelnen Lemmatypen bestehen nur geringe Unterschiede zwischen den Werten - im Höchstfall weichen sie vier Prozent voneinander ab. Bei den Tokens der adjektivischen Definitionen gibt es mit 14,48 Prozent den höchsten Anteil an Lexemen, die nicht Teil des Frequency Dictio- Wörterbuchanalyse 345 nary sind. Die Tokens der substantivischen Definitionen bestehen zu 12,40 Prozent aus Nichtfrequenzwortschatz, die des Lemmatyps Verb zu 11,41 Prozent. In den Definitionen der Lemmatypgruppe Sonstiges sind 10,29 Prozent der Tokens nicht im Frequency Dictionary enthalten. Für das DHWDaF 2 lassen sich an dieser Stelle die gleichen Beobachtungen machen wie für das LTW- DaF 2: Relativ gesehen, sind die Anteile des Nichtfrequenzwortschatzes bei den Types im Vergleich zu den Tokens viel niedriger, als die des Frequenzwortschatzes höher sind. Dies zeigt sich daran, dass die lemmatypspezifischen Verwendungshäufigkeiten der Lexeme, die im Frequency Dictionary vorkommen, nur leicht über dem jeweiligen allgemeinen Mittelwert liegen, wohingegen die Verwendungshäufigkeiten der dort nicht verzeichneten Lexeme stark unterdurchschnittlich sind. Wie im LTWDaF 2 sind auch im DHWDaF 2 die nicht zum Frequenzwortschatz gehörenden Lexeme markiert, sie werden aufgrund dieser Auffälligkeit seltener verwendet als die frequenten Lexeme (vgl. Kap. 3.3.2.1.2). Trotz dieser Parallele deckt sich der im DHWDaF 2 verwendete Definitionswortschatz unabhängig vom jeweiligen Lemmatyp auch bei den Tokens weniger stark mit dem als Vergleichsgrundlage herangezogenen Frequenzwortschatz als der Definitionswortschatz des LTWDaF 2. Die einzelnen Lemmatypen differieren dabei zwischen drei Prozentpunkten (in den Definitionen der Lemmatypgruppe Sonstiges) und neun Prozentpunkten (in den Definitionen des Lemmatyps Adjektiv). Schon aus diesen Werten wird ersichtlich, dass sich an dieser Stelle kaum Verallgemeinerungen aus den einzelnen Beobachtungen gewinnen lassen, die über die Beschreibung des Istzustandes bei den beiden untersuchten Wörterbüchern hinausgehen. Wie bereits angedeutet, lassen sich in Bezug auf die Übereinstimmung zwischen dem zum Vergleich herangezogenen Frequenzwortschatz, dem Frequency Dictionary von Jones/ Tschirner, und dem Definitionswortschatz der Stichproben aus dem DHWDaF 2 und dem LTWDaF 2 nur schwer generalisierende Aussagen treffen. Unabhängig von der Art der Zählung - Types oder Tokens - und vom einzelnen Lemmatyp enthält das DHWDaF 2 in seinen Definitionen einen größeren Anteil an Lexemen, die nicht im Frequency Dictionary verzeichnet sind, als das LTWDaF 2. Die Lexeme, die Bestandteil des Frequency Dictionary sind, werden in den analysierten Definitionen jedoch viel häufiger verwendet als die nicht dort enthaltenen. Dadurch relativieren sich die hohen Anteile der nicht frequenten Lexeme bei den Tokens - im DHWDaF 2 sinkt ihre relative Häufigkeit unter Beachtung der Verwendungshäufigkeit von 28,91 Prozent auf 11,88 Prozent, im LTWDaF 2 von 21,46 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 346 Prozent auf 6,18 Prozent. Diese Erscheinung ist eine logische Konsequenz der Tatsache, dass im Frequency Dictionary ja genau die frequenten Lexeme lemmatisiert ist, die dann dementsprechend auch in den Definitionen der Wörterbücher häufiger auftreten. An diesem Punkt unterscheidet sich die Kongruenz zwischen dem Definitionswortschatz und dem Frequenzwortschatz auch am stärksten von der mit dem Grundwortschatz. 3.5.3 Vergleich des untersuchten Definitionswortschatzes mit dem Zertifikatswortschatz Zertifikat Deutsch 3.5.3.1 Grundlagen In den beiden vorhergehenden Kapiteln werden die in den Stichproben der Untersuchung vorkommenden Lexeme zwei unterschiedlichen Wörterbüchern gegenübergestellt - dem Grundwortschatz Langenscheidt Basic German Vocabulary und dem Frequency Dictionary von Jones/ Tschirner. Im Gegensatz dazu handelt es sich bei dem Zertifikat Deutsch um eine Prüfung auf dem Gebiet Deutsch als Fremdsprache. 467 Das Zertifikat Deutsch löste im Jahr 2000 zwei andere Prüfungen ab - das seit 1971 durch den Deutschen Hochschulverband und das Goethe-Institut vergebene Zertifikat Deutsch als Fremdsprache und die Grundstufe 2 des Österreichischen Sprachdiploms Deutsch, die seit 1994 bestand. Zahlreiche Institutionen im In- und Ausland bieten den Test für das Zertifikat Deutsch an. Die Träger sind das Goethe-Institut, die Weiterbildungs-Testsysteme GmbH für den Deutschen Hochschulverband, das Österreichische Sprachdiplom Deutsch sowie die Schweizerische Konferenz der kantonalen Erziehungsdirektoren. Entstanden ist das neue Zertifikat Deutsch, das an den Gemeinsamen europäischen Referenzrahmen für Sprachen angepasst ist, in einer zwischenstaatlichen Gemeinschaftsarbeit des Deutschen Instituts für Erwachsenenbildung, des Goethe-Instituts, des Österreichischen Sprachdiploms Deutsch und des Instituts für deutsche Sprache der Universität Freiburg/ CH. So wird das Verständnis von Deutsch als einer plurizentrischen Sprache mit unterschiedlichen nationalen Standardvarietäten überzeugend umgesetzt. Die Prüfung selbst besteht aus einem anderthalbstündigen schriftlichen Teil, der sich aus den vier Teilbereichen Leseverstehen (Global-/ Detail-/ selektives Verstehen), Sprachbausteine (Lückentexte), Hörverstehen (Global-/ Detail-/ selektives Verstehen) und schriftlicher Ausdruck (Brief) zusammensetzt. In diesem Teil können maximal 225 Punkte erreicht werden. Mit bis zu 75 Punkten kann der mündliche 467 Zu den folgenden Abschnitten vgl. Zertifikat Deutsch (1999, S. 7ff.). Wörterbuchanalyse 347 Teil bewertet werden, der 15 Minuten dauert. Er besteht aus einer Kontaktaufnahme, einem Gespräch über ein Thema und dem Lösen einer Aufgabe. Das Zertifikat Deutsch bildet den Abschluss der Grundstufe und kann frühestens nach 400 Unterrichtsstunden abgelegt werden. 468 Durch die Revision des alten Zertifikats konnte es an die Entwicklungen auf den Gebieten der Psychologie, der Linguistik und der Didaktik der letzten Jahrzehnte angepasst werden, um so eine „Objektivierung der Leistungsmessung, Schwerpunktsetzung in der gesprochenen Sprache, Handlungsorientierung und situative Einbettung, Alltagsbezug und Verknüpfung mit praktischer Verwendbarkeit“ (Zertifikat Deutsch 1999, S. 16) garantieren zu können. Die Neuentwicklung möchte zum einen „zeigen, wie Kommunikation funktioniert, und damit wichtige neue Impulse für den Sprachunterricht [...] geben; zum anderen ein verbindliches Sprachniveau als Grundlage für eine Zertifizierung [...] liefern“ (ebd., S. 7). Im Mittelpunkt stehen dabei die erwachsenen Lerner mit ihren individuellen Interessen und Bedürfnissen, „die Verbindung von Sprachenlernen mit persönlichem sowie beruflichem Alltag“ (ebd.) und eine stärkere Konzentration auf selbst gesteuertes Lernen, sodass Authentizität und Individualität als Schlüsselbegriffe gelten können. Der zentrale Ausgangspunkt hierfür sind die Szenarien: „Darunter sind die Handlungsmuster zu verstehen, mit denen die Sprecher einer Einzelsprache kommunikative Aufgaben lösen und Intentionen verwirklichen.“ (Huneke/ Steinig 2005, S. 204). Diese Szenarien enthalten ein bestimmtes Inventar an Lernzielen und verlagern das Gewicht vom formalen System der Sprache auf ihre Funktion. Gemeinsam mit den kommunikativen Aufgaben - den so genannten Tasks - bilden die Szenarien den Bereich, in dem sich die einzelnen Kompetenzen der Sprecher überschneiden - die soziokulturelle Kompetenz (der Sprachrahmen), die kommunikative Kompetenz (das Sprachhandeln) und die sprachstrukturelle Kompetenz (das Sprachsystem). Für das Zertifikat Deutsch spielen folgende vier Gruppen von Szenarien (eingeklammert sind die jeweiligen Einzelszenarien) eine Rolle: 1. um das Verhalten anderer zu beeinflussen (um einen Gefallen bitten, sich beschweren, jemanden überreden, Dienstleistungsgespräche, jemanden um Rat bitten/ Rat geben, jemanden einladen), 2. für soziale Kontakte (Smalltalk/ Alltagsgespräche, Language-in-Action/ handlungsbegleitende Gespräche), 3. für den Austausch von Informationen (etwas erklären/ Auskunft geben, erzählen/ berichten, jemanden um Informationen bitten) und 4. für den Austausch von Meinungen (Konsensfindung, Diskussion) (Zertifikat Deutsch 1999, S. 26). Im Begleitbuch Zertifikat Deutsch werden diese 13 Einzelszenarien einzeln genau vorgestellt - mit den Elementen Dis- 468 Zu weiteren Informationen zum Zertifikat Deutsch siehe Goethe-Institut (2010). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 348 kursphasen (z.B. Eröffnung), Diskursstrategien (z.B. ein Gespräch einleiten), Diskurselemente (z.B. Höflichkeitsformeln), Sprachintentionen (z.B. jemanden ansprechen) und Grammatik (z.B. Modalverben) (Zertifikat Deutsch 1999, S. 34ff.). Die Sprecher bewältigen die bereits erwähnten kommunikativen Aufgaben (Tasks), um ihre Sprachhandlungsziele umsetzen zu können, beispielsweise, um sich in einer fremden Stadt zurechtzufinden. Zahlreiche Redemittel, unter anderem „ein bestimmter themenbezogener Wortschatz, Grammatik, kontext- und adressatengerechter Einsatz von Strategien, Sprachintentionen“ (ebd., S. 20) werden dafür benötigt. Die Sprachintentionen sind im Zertifikat Deutsch in die fünf Gruppen soziale Kontakte, Gefühle und Stimmungen, Haltungen und Meinungen, Mitteilungen und Informationen sowie Aufforderungen zum Sprechen/ Handeln untergliedert (ebd., S. 63ff.). Je nach Art der Kommunikation lassen sich bei den Diskurs- und Kooperationsstrategien Strategien bei der direkten Kommunikation (z.B. Gliederung des Gesprächs, Sprecherwechsel, interaktive Strategien) oder bei der Kommunikation über Medien (z.B. Strategien beim Telefonieren oder beim Briefeschreiben) unterscheiden. Den Rahmen für die Szenarien bilden einerseits die sprachlichen Handlungsfelder (Domains), die im Zertifikat Deutsch durch die vier Gebiete privater Bereich, öffentlicher Bereich, Arbeitsplatz und Bildungsinstitution repräsentiert sind (ebd., S. 20f.). Sprachliche Handlungen müssen zudem nach den auftretenden produktiven und rezeptiven Fertigkeiten differenziert werden. Andererseits werden die Sprachhandlungen auch von den einzelnen Themen und so genannten Notionen bestimmt. Unter letzteren versteht man allgemein begriffliche Aussagen, die thematisch unabhängig verwendet werden. Das Zertifikat Deutsch nennt die folgenden elf Notionen: Eigenschaften und Zustände beschreiben, Besitz und Zugehörigkeit ausdrücken, einen Vorgang/ Tatbestand einordnen nach Ort/ Richtung, einen Vorgang/ Tatbestand einordnen nach Zeit, einen Vorgang/ Tatbestand einordnen nach Art und Weise, Angaben machen zu Zahl/ Menge/ Grad (Quantität), Fähigkeit/ Möglichkeit ausdrücken, Notwendigkeit/ Verpflichtung ausdrücken, Bedingungen/ Voraussetzungen und deren Folgen ausdrücken, etwas vergleichen sowie Aussagen machen zur Existenz von Personen und Dingen (ebd., S. 87ff.). An Themenfeldern sind für das Zertifikat Deutsch diese 16 relevant: Person, menschlicher Körper/ Gesundheit/ Körperpflege, Wohnen, Orte, tägliches Leben, Essen und Trinken, Erziehung/ Ausbildung/ Lernen, Arbeit und Beruf, Geschäfte/ Handel/ Konsum, Dienstleistungen, Natur und Umwelt, Reise und Verkehr, Freizeit und Unterhaltung, Medien und moderne Informationstech- Wörterbuchanalyse 349 niken, Gesellschaft/ Staat/ internationale Organisationen sowie Beziehungen zu anderen Menschen und Kulturen (Zertifikat Deutsch 1999, S. 94ff.). Auch das neue, didaktische Grammatikkonzept des Zertifikats Deutsch wird im Begleitbuch näher vorgestellt (ebd., S. 264ff.). Unabhängig von den jeweiligen Themen wird das für die Prüfung zum Zertifikat Deutsch vorausgesetzte Vokabular, das hier - analog zu den Ausdrücken Grundwortschatz und Frequenzwortschatz - auch als Zertifikatswortschatz bezeichnet wird, alphabetisch in einer Liste aufgeführt. Dabei wird zwischen Haupteinträgen und Nebeneinträgen unterschieden. Die Nebeneinträge sind eingerückt und enthalten Derivate oder Komposita der Haupteinträge. In der Zählung des gesamten Zertifikatswortschatzes werden die Nebeneinträge nicht berücksichtigt. Den Umfang des Zertifikatswortschatzes gibt Wingate (2002) mit 2 227 Lexemen an. 469 Die Lexemliste wird von weiteren Zusammenstellungen ergänzt, die thematisch geordnete Gruppen von Wörtern enthalten - Zahlen, Bruchzahlen/ Brüche, Datum, Uhrzeit, Zeitmaße/ Zeitangaben, Woche/ Wochentage, Tag/ Tageszeiten, Monat/ Monatsnamen, Jahr/ Jahreszeiten, Feiertage und Feste, Währungen, Maße und Gewichte, Länder/ Ländernamen, politische Einheiten und Begriffe sowie Schule und Bildungseinrichtungen (Zertifikat Deutsch 1999, S. 254ff.). Als Anhang zu den Wortlisten werden österreichische und schweizerische Standardvarietäten genannt (ebd., S. 259ff.). Bei der Auswahl der Lexeme ist ihre Funktionalität entscheidend: „Der didaktisch wichtige Ausschnitt der Alltagskommunikation spielt eine eindeutig größere Rolle als Frequenzkriterien. Folglich sind vorrangig Wörter aufgenommen worden, die in vielfältigen Zusammenhängen verwendbar sind.“ (ebd., S. 114). Problematisch ist an dieser Stelle, dass die zusammengestellten Lexeme auf dem früheren Zertifikat Deutsch als Fremdsprache basieren, welches wiederum Ortmann und damit indirekt Kädings alte Zählungen zur Grundlage hat (vgl. Kap. 3.5.2.1). Das Vokabular für das Zertifikat Deutsch wird durch die Aufnahme neuer Themen ergänzt, beispielsweise durch den Bereich Medien und moderne Informationstechniken. Andere Wörter erhielten neue Sememe, was durch die stärkere Berücksichtigung der gesprochenen Sprache vor allem den Bereich der Partikeln betrifft. Die nächsten beiden Unterkapitel beschäftigen sich mit der Frage, inwieweit sich die Lexeme des Zertifikats Deutsch mit den Lexemen decken, die in den Stichproben zum Definitionswortschatz im DHWDaF 2 und im LTWDaF 2 verwendet werden (vgl. Kap. 3.5.3.2 und 3.5.3.3). 469 Dabei handelt es sich allerdings um eine Ausgabe des Zertifikats Deutsch von 1985. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 350 3.5.3.2 Analyse des LTWDaF 2 Der Grundwortschatz und der Frequenzwortschatz, der im LTWDaF 2 verzeichnet ist, kann lediglich durch eine eigene Überprüfung als solcher erkannt werden. Im Gegensatz dazu werden die Lemmata des LTWDaF 2, die zum Vokabular des Zertifikats Deutsch – ‚ — ’~ kennzeichnet und damit für die Lerner als besonders wichtig hervorgehoben (vgl. Kap. 3.1.1). Das betrifft jedoch allein die Kennzeichnung der Lemmata, in den Definitionen ist der auftretende Zertifikatswortschatz hingegen nicht markiert. Wie bereits beim Vergleich mit dem Grundwortschatz und dem Frequenzwortschatz (vgl. Kap. 3.5.2.2 und 3.5.2.2) wird bei der Untersuchung der in den Definitionen verwendeten Lexeme darauf geachtet, dass die Wörter des Definitionswortschatzes des LTWDaF 2 und im Zertifikat Deutsch nicht nur in ihrer äußeren Form, sondern auch in ihrer Bedeutung übereinstimmen. Im Unterschied zum Grundwortschatz Langenscheidt Basic German Vocabulary und zum Frequenzwortschatz Frequency Dictionary erfolgt die Analyse beim Zertifikatswortschatz nicht nur in einem zweistufigen System (verzeichnet oder nicht verzeichnet). Die im Zertifikat Deutsch benutzte Einteilung in Haupt- und Nebeneinträge wird übernommen, sodass sich in der Auswertung ein dreistufiges System ergibt (Haupteintrag oder Nebeneintrag oder nicht verzeichnet). Nicht immer ist die Entscheidung, ob ein in den Definitionen verwendetes Wort als im Zertifikatswortschatz verzeichnet gilt oder nicht, vollkommen eindeutig zu treffen. Verhältnismäßig einfach ist der Prozess bei den Lexemen, die zwar nicht in der großen Liste des Zertifikats Deutsch auftauchen, die dann jedoch in den ergänzenden thematischen Wortgruppenlisten verzeichnet sind. In der Stichprobe des LTWDaF 2 sind davon die eingeklammerten Wörter aus folgenden Themenbereichen betroffen: Zahlen (ein 2 , Million, vier, viert-, zwei und zweit-), Zeitmaße/ Zeitangaben (Jahr, Minute, Stunde und Woche), Tag/ Tageszeiten (Mittag, Nachmittag, Nacht und Vormittag), politische Einheiten und Begriffe (Bundesland und Deutschland) sowie Schulen und Bildungseinrichtungen (Grundschule und Hauptschule). Ähnlich gelagert ist der Fall bei den Lexemen, die zwar in der umfangreichen Liste kurz erwähnt werden, bei denen jedoch sofort auf den Grammatikteil verwiesen wird. Dabei handelt es sich ausschließlich um Synsemantika. Beim Definitionswortschatz der Stichprobe des LTWDaF 2 betrifft dies die Junktionen dass und sodass sowie die Pronomen ein (Indefinitpronomen), sein 3 (Possessivpronomen), sich 1 (Reflexivpronomen) und sich 2 (reziprokes Pronomen). Auch das Präpositionaladverb woran wird im Grammatikteil behandelt. Allerdings ist es in der umfangreichen Wortliste selbst nicht verzeichnet, lediglich vom Wörterbuchanalyse 351 Strichlemma wo(r)wird auf den Grammatikteil verwiesen. Ebenfalls als Strichlemmata verzeichnet sind irgend-, Video- und zusammen-, bei den Beispielen werden die in den Definitionen verwendeten Wörter irgendwo, Videorekorder und zusammenleben dann genannt. Die Suppletivform des Komparativs besser ist allein unter dem Positiv gut vermerkt. Alle die bisher erwähnten Fälle werden als im Zertifikatswortschatz verzeichnet gewertet. Als nicht dort verzeichnet gelten hingegen folgende Fallgruppen: Die Elemente des Definitionswortschatzes dabei, Hauptsatz, Hauptstadt, hingehen, irgendwohin, weiterbewegen und zusammengehören sind zwar als Gesamtes oder in Teilen als Strichlemmata im Zertifikatswortschatz enthalten (da-/ dabei-, Haupt-, hin-, irgend-, weiter- und zusammen-), als Beispiele werden sie dort jedoch nicht genannt. Ebenfalls als nicht verzeichnet wird der Definitionswortschatz des LTWDaF 2 gewertet, der zwar in seinen Bestandteilen im Zertifikatswortschatz aufgelistet ist, nicht jedoch als Gesamtes. Dies betrifft in der Stichprobe des LTWDaF 2 ausschließlich präfigierte Adjektivderivate, bei denen die Basis sowie das Präfix unallein verzeichnet sind - unangenehm, unbestimmt, undeutlich, unfreundlich, ungewöhnlich, unhöflich und unnötig. 470 In gewohnter Weise wird bei der Gegenüberstellung des Definitionswortschatzes aus der Stichprobe des LTWDaF 2 mit dem Zertifikatswortschatz zwischen den beiden Zählungen (Types und Tokens) unterschieden. Das Ergebnis ist in Abbildung 91 dargestellt: 471 Lediglich 54,17 Prozent der in den Definitionen des LTWDaF 2 verwendeten Types gehören mit einem Haupteintrag zum Zertifikatswortschatz (vgl. Abb. 91a). Immerhin 6,56 Prozent der Types sind dort noch in einem Nebeneintrag verzeichnet. Allerdings sind fast 40 Prozent der Types, ganz genau 39,27 Prozent, nicht bei den Lexemen enthalten, die für das Zertifikat Deutsch vorausgesetzt werden, sondern gehen darüber hinaus. Wie wichtig es ist, zwischen der Zählung der Types und der Tokens zu unterscheiden, sieht man an diesem Teil der Untersuchung besonders deutlich. Der bei den Types gewonnene Eindruck verschiebt sich bei der Tokenzählung sehr stark (vgl. Abb. 91b). So können die im Zertifikatswortschatz mit einem Haupteintrag verzeichneten Elemente des Definitionswortschatzes des LTWDaF 2 ihren Anteil auf 81,21 Prozent ausbauen. Die als Nebeneinträge vorhandenen Tokens verlieren im Vergleich zu den Types hingegen rund die Hälfte ihrer Prozente, sie machen noch 2,92 Prozent der Tokens aus. Bei den nicht zum Zertifikat Deutsch gehörenden Lexemen fällt der Wert noch 470 Freundlich und gewöhnlich sind dabei nur als Nebeneinträge verzeichnet, alle anderen Basen besitzen einen Haupteintrag. 471 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.1. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 352 stärker, auf 15,87 Prozent. Diese Beobachtungen lassen sich wie immer anschaulich mit den Zahlen zu den Verwendungshäufigkeiten der einzelnen Untergruppen unterstreichen. Ein Type der Stichprobe in den Definitionen des LTWDaF 2 wird im Durchschnitt 4,90-mal verwendet. Sowohl bei den nicht im Zertifikatswortschatz enthaltenen Wörtern als auch bei den Wörtern, die dort in einem Nebeneintrag verzeichnet sind, liegt die Verwendungshäufigkeit mit 1,98-mal beziehungsweise 2,18-mal weit darunter. Im Gegensatz dazu wird das mit einem Haupteintrag zum Zertifikatswortschatz gehörende Vokabular mit 7,34-mal stark überdurchschnittlich häufig verwendet. a) Types b) Tokens Abb. 91: Die Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Types (a) und Tokens (b) im LTWDaF 2 Eine Aufschlüsselung der Daten für die Types nach den einzelnen Lemmatypen liefert noch genauere Ergebnisse (vgl. Abb. 92). Es wird ersichtlich, dass sich im LTWDaF 2 die Anteile des Zertifikatswortschatzes am Definitionswortschatz der Stichprobe sehr unterschiedlich auf die vier Lemmatypen Substantiv, Verb, Adjektiv und Sonstiges verteilen. Der höchste Anteil für nicht zum Zertifikatswortschatz gehörende Types findet sich mit 35,65 Prozent in den Definitionen der Lemmatypgruppe Sonstiges. Mit 34,32 Prozent liegen die substantivischen Definitionen jedoch nur wenig darunter. Ein größerer Abstand besteht zu den Definitionen des Lemmatyps Verb, die zu 28,64 Prozent aus Lexemen bestehen, die nicht für das Zertifikat Deutsch vorausgesetzt werden. Den niedrigsten Wert hierfür weisen mit einer relativen Häufigkeit von 26,01 Prozent schließlich die Types der adjektivischen Definitionen Wörterbuchanalyse 353 auf. Somit existieren bei den vier Lemmatypen Unterschiede in einer Spannbreite von knapp zehn Prozent. Wie beim Grund- und beim Frequenzwortschatz liegt der Anteil der Wörter, die in den Definitionen verwendet werden und nicht im Zertifikatswortschatz sind, beim Lemmatyp Adjektiv viel niedriger als bei den anderen Lemmatypen, wobei selbst dieser Wert für DaF- Lerner noch zu hoch ist. Auch bei den Lexemen, die im Zertifikat Deutsch in einem Nebeneintrag verzeichnet sind, bestehen zwischen den einzelnen Lemmatypen große Unterschiede, was die Anteile betrifft. So machen die Nebeneinträge des Zertifikatswortschatzes bei den Types der Verbdefinitionen 8,08 Prozent aus. Bei den Types der substantivischen Definitionen erreichen sie einen Anteil von 7,13 Prozent, in den Definitionen der Lemmatypgruppe Sonstiges sind es 5,50 Prozent. Es sind die Types der adjektivischen Definitionen, die auch bei den Nebeneinträgen den niedrigsten Wert besitzen - 4,29 Prozent. Dafür liegt der Lemmatyp Adjektiv mit einer relativen Häufigkeit von 69,70 Prozent bei den Types dann ganz vorn, wenn es um die Lexeme geht, die mit einem Haupteintrag zum Zertifikat Deutsch gehören. Gefolgt werden sie von den verbalen Definitionen, deren Types zu 63,28 Prozent einen Haupteintrag im Zertifikatswortschatz besitzen. Fast gleiche relative Häufigkeiten erreichen die Lexeme mit einem Haupteintrag im Zertifikat Deutsch mit 58,85 Prozent und 58,55 Prozent bei den Types der Definitionen der Lemmatypgruppe Sonstiges und der Substantive. Anteil der Types Lemmatyp Abb. 92: Die lemmatypspezifische Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Types im LTWDaF 2 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 354 Anteil der Tokens Lemmatyp Abb. 93: Die lemmatypspezifische Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Tokens im LTWDaF 2 Bei den Tokens des LTWDaF 2 bestehen zwischen den vier Lemmatypen nicht solche gravierenden Unterschiede wie bei den Types (vgl. Abb. 93). Bei den Tokens der Substantiv-, Verb- und Adjektivdefinitionen ergibt sich ein erstaunlich geschlossenes Bild, was die Übereinstimmung des Zertifikatswortschatzes mit dem Definitionswortschatz der Stichprobe des LTWDaF 2 anbelangt. Die Definitionen der Substantive und der Verben verfügen mit dem identischen Wert von 83,59 Prozent bei ihren Tokens über den höchsten Anteil an Haupteinträgen im Zertifikatswortschatz. Dicht dahinter liegen die adjektivischen Definitionen, in denen sich 82,83 Prozent der Tokens in einem Haupteintrag des Zertifikatswortschatzes wiederfinden. Ähnlich hoch ist die Übereinstimmung dieser drei Lemmatypen bei den Lexemen, die nicht Teil des Zertifikatswortschatzes sind. Bei den Definitionen der Verben sind lediglich 12,79 Prozent der Tokens nicht darin enthalten, bei den substantivischen Definitionen sind es 13,41 Prozent. Beim Lemmatyp Adjektiv entfallen 15,09 Prozent der Tokens auf die Lexeme, die nicht für das Zertifikat Deutsch vorausgesetzt werden. Aus diesen Zahlen wird bereits ersichtlich, dass nur noch sehr kleine Anteile für die Lexeme verbleiben, die als Nebeneintrag im Zertifikat Deutsch verzeichnet sind. Sie erreichen relative Häufigkeiten von 2,08 Prozent bei den Tokens der adjektivischen Definitionen, drei Prozent bei den Substantiven und 3,62 Prozent bei den Verben. Aus diesem einheitlichen Bild fallen allein die Werte der Lemmatypgruppe Sonstiges heraus. Hier entfallen auf die nicht zum Zertifikatswortschatz gehörenden Tokens 22,32 Prozent. Zu 2,80 Prozent bestehen die Definitionen aus Tokens, die im Zertifikat Deutsch Wörterbuchanalyse 355 einen Nebeneintrag besitzen. Lediglich 74,88 Prozent der Tokens, die in den Definitionen der Lemmatypgruppe Sonstiges verwendet werden, sind mit einem Haupteintrag im Zertifikatswortschatz vertreten. Bei einem Vergleich der Werte der Tokens mit denen der Types sind einige Tendenzen erkennbar: Bei den Lexemen, die als Haupteintrag zum Zertifikatswortschatz gehören, vergrößern sich die Anteile bei der Tokenzählung am stärksten - um Werte zwischen 13 Prozent (Adjektivdefinitionen) und 27 Prozent (Substantivdefinitionen). Dementsprechend sinken die Werte der anderen Gruppierungen. Bei den Lexemen, die im Zertifikat Deutsch mit einem Nebeneintrag verzeichnet sind, verringern sich die Anteile zwischen zwei Prozent (Adjektivdefinitionen) und vier Prozent (Verbdefinitionen). Das ist nominell zwar nicht sehr viel, macht relativ aber jeweils rund die Hälfte des eigentlichen Anteils aus. Der verbleibende Verlust entfällt auf die nicht zum Zertifikatswortschatz gehörenden Tokens. Je nach Lemmatyp sinken die Werte um knapp elf Prozent (Adjektivdefinitionen) bis 23 Prozent (Substantivdefinitionen). Diese Tendenzen werden von den Daten zu den Verwendungshäufigkeiten gestützt. Der in den Definitionen der Stichprobe verwendete Zertifikatswortschatz mit Haupteintrag wird im LTWDaF 2 überdurchschnittlich häufig gebraucht. Im Gegensatz dazu liegt der gar nicht oder nur in Nebeneinträgen des Zertifikatswortschatzes verzeichnete Definitionswortschatz in seiner Verwendungshäufigkeit unter dem lemmatypspezifischen Mittelwert. Der Zertifikatswortschatz gilt nach der Markiertheitstheorie als unauffällig und unmarkiert, woraus sich seine häufigere Verwendung ergibt. Die anderen Lexeme sind durch ihre Markiertheit hingegen auffälliger, sie werden deshalb weniger häufig verwendet (vgl. Kap. 3.3.2.1.2). Zum Abschluss soll noch einmal betont werden, wie stark sich Types und Tokens bei der Untersuchung zur Übereinstimmung zwischen dem Definitionswortschatz des LTWDaF 2 und dem Zertifikatswortschatz unterscheiden. Bei den Types bestehen zwischen den einzelnen Lemmatypen größere Unterschiede, die Tokens liegen hingegen sehr eng beisammen, von der einen Ausnahme abgesehen - der Lemmatypgruppe Sonstiges. Vergleicht man die Ergebnisse des LTWDaF 2 zum Zertifikatswortschatz mit den Ergebnissen zum Frequenzwortschatz und zum Grundwortschatz, lassen sich interessante Beobachtungen machen. So ist bei den Types der Anteil des nicht im Frequenzwortschatz enthaltenen Definitionswortschatzes des LTWDaF 2 jeweils nur halb so groß wie beim Zertifikatswortschatz. Bei den Tokens liegt der entsprechende Anteil des nicht verzeichneten Definitionswortschatzes für den Zertifikatswortschatz doppelt bis dreimal so hoch wie für den Frequenzwortschatz. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 356 Im Grundwortschatz liegen die Werte des nicht dort verzeichneten Definitionswortschatzes bei den Types immerhin noch zwischen sieben und zehn Prozent unter den Vergleichswerten des Zertifikatswortschatzes. Bei den Tokens erreichen der nicht zum Grundwortschatz und der nicht zum Zertifikatswortschatz gehörende Definitionswortschatz fast deckungsgleiche Werte. 3.5.3.3 Analyse des DHWDaF 2 Für die Untersuchung, inwieweit sich der im DHWDaF 2 verwendete Definitionswortschatz mit dem Vokabular für das Zertifikat Deutsch deckt, gelten dieselben Kriterien, die bereits oben in Bezug auf das LTWDaF 2 erläutert werden (vgl. Kap. 3.5.3.2). Unter den Lemmata des DHWDaF 2 ist der Zertifikatswortschatz ebenfalls leicht erkennbar - er unterscheidet sich durch seine Blauschreibung. Wird er in den Definitionen verwendet, ist er jedoch nicht hervorgehoben. Wie bei den anderen Analysen wird bei der Untersuchung zur Übereinstimmung der beiden Wortschätze nicht nur die äußere Form des jeweiligen Lexems, sondern auch seine Semantik berücksichtigt. Für die Verzeichnung des Definitionswortschatzes des DHWDaF 2 im Zertifikatswortschatz ergibt sich ein dreistufiges System (Haupteintrag oder Nebeneintrag oder nicht verzeichnet). Bei der Analyse des im DHWDaF 2 verwendeten Definitionswortschatzes bestehen dieselben Zweifelsfälle wie im LTWDaF 2. Das betrifft nicht allein die Fallgruppen von Wörtern, sogar die einzelnen Lexeme sind völlig identisch. Wie im LTWDaF 2 werden also auch im DHW- DaF 2 folgende Gruppierungen als im Zertifikatswortschatz verzeichnet gewertet: erstens Lexeme, die zwar nicht in der großen Liste vertreten sind, die dann aber in den Wortgruppenlisten auftauchen (vgl. Kap. 3.5.3.2). Im DHW- DaF 2 handelt es sich erneut um folgende Themenbereiche, die entsprechenden Lexeme stehen in Klammern: Zahlen (ein 2 , Million, vier, viert-, zwei und zweit-), Zeitmaße/ Zeitangaben (Jahr, Minute, Stunde und Woche), Tag/ Tageszeiten (Mittag, Nachmittag, Nacht und Vormittag), politische Einheiten und Begriffe (Bundesland und Deutschland) sowie Schulen und Bildungseinrichtungen (Grundschule und Hauptschule). Analog gilt das zweitens für die Lexeme, bei denen von der Liste auf den Grammatikteil verwiesen wird, also die Junktionen dass und sodass sowie die Pronomen ein (Indefinitpronomen), sein 3 (Possessivpronomen), sich 1 (Reflexivpronomen) und sich 2 (reziprokes Pronomen). Auch auf den dritten Fall - das Präpositionaladverb woran - wird im Grammatikteil eingegangen, jedoch ist es in der umfangreichen Wortliste nur in Form des Strichlemmas wo(r)verzeichnet. Die vierte Gruppe bilden die anderen Strichlemmata, bei denen das in den Definitionen verwendete Le- Wörterbuchanalyse 357 xem genannt wird, also irgendwo, Videorekorder und zusammenleben bei irgend-, Video- und zusammen-. Als Einzelfall zählt noch besser, das als Komparativ allein unter dem Positiv gut zu finden ist. Folgende Gruppierungen gelten hingegen als nicht im Zertifikat Deutsch verzeichnet: Dabei, Hauptsatz, Hauptstadt, hingehen, irgendwohin, weiterbewegen und zusammengehören enthält der Zertifikatswortschatz lediglich als Strichlemmata (da-/ dabei-, Haupt-, hin-, irgend-, weiter- und zusammen-), unter den Beispielen sind diese Elemente des Definitionswortschatzes jedoch nicht zu finden. Auch die präfigierten Adjektivderivate, bei denen die Basis sowie das Präfix unallein verzeichnet sind, zählen als nicht im Zertifikatswortschatz enthalten: unangenehm, unbestimmt, undeutlich, unfreundlich, ungewöhnlich, unhöflich und unnötig. 472 a) Types b) Tokens Abb. 94: Die Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Types (a) und Tokens (b) im DHWDaF 2 In der Abbildung 94 sind die lemmatypübergreifenden Zählungen zur Übereinstimmung des im DHWDaF 2 benutzten Definitionswortschatzes mit den Lexemen des Zertifikats Deutsch für die Types und für die Tokens dargestellt. 473 Vor allem die Ergebnisse zu den Types sind sehr deutlich - 47,50 Prozent des Definitionswortschatzes des DHWDaF 2 gehören nicht zum Zertifikatswortschatz (vgl. Abb. 94a). Der Anteil der Types, die im Zertifikat Deutsch einen Haupteintrag besitzen, liegt sogar nur bei 46,60 Prozent. Die 472 Freundlich und gewöhnlich sind dabei nur als Nebeneinträge verzeichnet, alle anderen Basen besitzen einen Haupteintrag. 473 Die Grundlage für die Auswertung des Materials befindet sich in der Datensammlung B.2.2. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 358 verbleibenden 5,90 Prozent der Types sind mit einem Nebeneintrag im Zertifikatswortschatz vertreten. Diese Verteilung, bei der knapp die Hälfte der in den Definitionen des DHWDaF 2 auftretenden Lexeme über den Zertifikatswortschatz hinausgeht, ist für einen nicht muttersprachlichen Lerner der Grund- und Mittelstufe extrem ungünstig, wenn es um das Verstehen und Behalten von Wörterbuchdefinitionen geht. Das Verhältnis zwischen Zertifikatswortschatz und Nichtzertifikatswortschatz ändert sich zugunsten des ersteren, wenn jedes Auftreten der Types berücksichtigt wird, wenn also die Tokens gezählt werden (vgl. Abb. 94b). Dann erhöht sich die relative Häufigkeit des Zertifikatswortschatzes mit einem Haupteintrag auf immerhin 74,23 Prozent. Der Wert des Nichtzertifikatswortschatzes sinkt auf 22,87 Prozent. Auch die im Zertifikat Deutsch als Nebeneintrag verzeichneten Lexeme verlieren an Prozenten und erreichen bei den Tokens noch 2,90 Prozent. Ganz deutlich zeigen sich diese Entwicklungen in den Daten zu den Verwendungshäufigkeiten. Klar über dem allgemeinen Mittelwert von 3,11-mal liegt der Zertifikatswortschatz mit Haupteintrag mit einer 4,95-maligen Verwendung. Die Nebeneinträge und die nicht zum Zertifikatswortschatz gehörenden Lexeme besitzen hingegen mit 1,53 und 1,50 stark unterdurchschnittliche Werte. Beim Vergleich der beiden untersuchten Wörterbücher ergeben sich einige Parallelen: Die Werte des Definitionswortschatzes, der nicht im Zertifikat Deutsch enthalten ist, liegen vor allem bei den Types jeweils erstaunlich hoch, sie nehmen bei der Zählung der Tokens allerdings ab. Die relativen Häufigkeiten der Nebeneinträge sind im LTWDaF 2 und DHWDaF 2 beinahe identisch. Beide Wörterbücher zeigen außerdem das gleiche Verhalten in Bezug auf die Verwendungshäufigkeiten. Der einzige Unterschied besteht darin, dass die Definitionen des DHWDaF 2 bei den Types rund acht Prozent, bei den Tokens rund sieben Prozent weniger Zertifikatswortschatz mit Haupteintrag enthalten als die Definitionen des LTWDaF 2. Umgekehrt gilt dieser Wert auch für den Nichtzertifikatswortschatz. Wie üblich werden die allgemeinen Werte im Folgenden für die vier Lemmatypen einzeln aufgeschlüsselt, zuerst für die Types des DHWDaF 2 (vgl. Abb. 95). Die Adjektivdefinitionen verfügen mit 56,66 Prozent bei den Types über den höchsten Anteil an Zertifikatswortschatz mit Haupteintrag. Fast den gleichen Wert erreichen mit 56,21 Prozent die Types der verbalen Definitionen. Ungefähr fünf Prozent darunter liegen die Substantivdefinitionen mit 51,49 Prozent. Die niedrigste relative Häufigkeit für den Zertifikatswortschatz mit Haupteintrag bei den Types findet sich mit 50,41 Prozent in den Definitionen der Lemmatypgruppe Sonstiges. In dieser Lemmatypgruppe ist der nicht Wörterbuchanalyse 359 zum Zertifikatswortschatz gehörende Definitionswortschatz mit 43,80 Prozent bei den Types am stärksten vertreten. An zweiter Stelle stehen die substantivischen Definitionen mit einem Anteil von 42,08 Prozent Nichtzertifikatswortschatz bei den Types. Bei den Types der adjektivischen Definitionen macht dieser noch 40,27 Prozent aus, in den Verbdefinitionen sind es 37,87 Prozent. Anteil der Types Lemmatyp Abb. 95: Die lemmatypspezifische Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Types im DHWDaF 2 Bei den beiden großen Gruppen - dem Zertifikatswortschatz mit Haupteintrag und dem Nichtzertifikatswortschatz - differieren die einzelnen Lemmatypen also um höchstens fünf bis sechs Prozent. Die noch verbleibenden Anteile entfallen auf den Definitionswortschatz, der im Zertifikat Deutsch über einen Nebeneintrag verfügt - 6,44 Prozent beim Lemmatyp Substantiv, 5,92 Prozent in den verbalen Definitionen, 5,79 Prozent bei den Types der Lemmatypgruppe Sonstiges und 3,07 Prozent in den Adjektivdefinitionen. Bei einem Vergleich von LTWDaF 2 und DHWDaF 2 wird deutlich, dass sich der im LTWDaF 2 verwendete Definitionswortschatz in höherem Maß mit dem Zertifikatswortschatz deckt als der Definitionswortschatz des DHWDaF 2. Bei den Types gehören im LTWDaF 2 je nach Lemmatyp zwischen knapp acht Prozent (Lemmatyp Substantiv) und über 14 Prozent (Lemmatyp Adjektiv) des Definitionswortschatzes mehr zu den Lexemen des Zertifikats Deutsch als im DHWDaF 2. In etwa die gleiche Menge haben die Definitionen des DHWDaF 2 dann mehr als das LTWDaF 2, wenn es um den Definitionswortschatz geht, der nicht zum Zertifikatswortschatz gehört. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 360 Die Untersuchung zum Zertifikatswortschatz im DHWDaF 2 wird mit den Ergebnissen zu den Tokens abgerundet (vgl. Abb. 96). Bereits auf den ersten Blick wird deutlich, dass sich die Verhältnisse hier im Vergleich zu den Types stark verschieben. Anteil der Tokens Lemmatyp Abb. 96: Die lemmatypspezifische Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Tokens im DHWDaF 2 So verlieren der Nichtzertifikatswortschatz und die Lexeme, die im Zertifikat Deutsch in einem Nebeneintrag stehen, bei den einzelnen Lemmatypen fast die Hälfte ihrer Anteile. Der Zertifikatswortschatz mit Haupteintrag kann seine Werte hingegen um die entsprechenden Prozentpunkte ausbauen. Die vier Lemmatypen des DHWDaF 2 liegen mit ihren einzelnen Werten dabei relativ dicht beisammen, im Höchstfall beträgt die Spannbreite sechs Prozentpunkte. Den höchsten Anteil an Zertifikatswortschatz mit Haupteintrag weisen mit 76,26 Prozent die Definitionen des verbalen Lemmatyps auf, die Substantive befinden sich mit 75,82 Prozent allerdings nur ganz knapp dahinter. Ähnlich dicht beieinander liegen die Werte des Zertifikatswortschatzes mit Haupteintrag in den Definitionen der Lemmatypgruppe Sonstiges (72,06 Prozent) und der Adjektive (71,43 Prozent). Ein ähnliches Bild ergibt sich für den Definitionswortschatz des DHWDaF 2, der nicht für das Zertifikat Deutsch vorausgesetzt wird. Mit 26,64 Prozent enthalten hier die adjektivischen Definitionen den höchsten Anteil, nahe bei den Definitionen der Lemmatypgruppe Sonstiges (25,28 Prozent). Die zweite Gruppe von Lemmatypen bilden wiederum die Verben und die Substantive, in deren Definitionen der Nichtzertifikatswortschatz mit 20,82 Prozent beziehungsweise 20,77 Prozent beinahe identische relative Häufigkeiten erzielt. Die wenigen verbleibenden Prozentpunkte Wörterbuchanalyse 361 bei den Tokens bestehen bei den Lexemen, die im Zertifikatswortschatz nur über einen Nebeneintrag verfügen - beim Lemmatyp Substantiv 3,41 Prozent, in den Verbdefinitionen 2,92 Prozent, bei der Lemmatypgruppe Sonstiges 2,67 Prozent und in den adjektivischen Definitionen sogar nur 1,93 Prozent. Hinsichtlich der Verwendungshäufigkeiten lässt sich die Aussage wiederholen, die oben für das Gesamtvokabular getroffen wurde: In allen vier Lemmatypen wird der Definitionswortschatz des DHWDaF 2, der mit einem Haupteintrag zum Zertifikatswortschatz gehört, überdurchschnittlich häufig verwendet. Im Gegensatz dazu liegen die Verwendungshäufigkeiten für den Nichtzertifikatswortschatz und für die Lexeme, die im Zertifikat Deutsch einen Nebeneintrag besitzen, bei allen Lemmatypen deutlich unter dem lemmatypspezifischen Mittelwert. Auch an dieser Stelle lässt sich als Beleg die Markiertheitstheorie anführen. Die Lexeme, die zum Zertifikatswortschatz gehören, sind unauffällig und damit unmarkiert, sie werden häufiger verwendet als die auffälligen Lexeme. Letztere - die Lexeme mit Nebeneintrag und ohne Eintrag im Zertifikatswortschatz - gelten hingegen als markiert, ihre Verwendungshäufigkeit ist niedriger (vgl. Kap. 3.3.2.1.2). Deckung des Definitionswortschatzes mit dem LTWDaF 2 DHWDaF 2 Types Tokens Types Tokens Langenscheidt Basic German Vocabulary 70,94% 79,61% 61,67% 72,44% Frequency Dictionary 78,54% 93,82% 71,09% 88,12% Zertifikat Deutsch 60,73% 84,13% 52,50% 77,13% Tab. 8: Die Deckung des untersuchten Definitionswortschatzes mit den pädagogischen Wortschätzen Bei einem Vergleich der unterschiedlichen analysierten Wortschätze (vgl. Tab. 8) zeigt sich, dass bei den Tokens im DHWDaF 2 die Schnittmenge des Definitionswortschatzes mit dem Zertifikationswortschatz bei fast allen Lemmatypen größer ist als die mit dem Grundwortschatz. Allein bei den Adjektivdefinitionen ist der Anteil der Tokens, die nicht zum Zertifikat Deutsch gehören, größer als der Anteil der Lexeme, die nicht zum Grundwortschatz zählen. Die Gegenüberstellung von Zertifikatswortschatz und Frequenzwortschatz ergibt hingegen ein anderes Bild. Die Menge des Definitionswortschatzes, der nicht im Zertifikatswortschatz verzeichnet ist, liegt im DHWDaF 2 lemmatypunabhängig fast doppelt so hoch wie die Menge des Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 362 Definitionswortschatzes, der nicht Teil des Frequenzwortschatzes ist. Der Vergleich zwischen LTWDaF 2 und DHWDaF 2 bestätigt bei den Tokens die Erkenntnisse der Types. Der Definitionswortschatz des LTWDaF 2 deckt sich zu einem größeren Teil mit dem Zertifikatswortschatz als der Definitionswortschatz des DHWDaF 2. Der Anteil des Definitionswortschatzes, der nicht zum Zertifikat Deutsch gehört, liegt im LTWDaF 2 je nach Lemmatyp drei bis elf Prozentpunkte niedriger als im DHWDaF 2. Die Nebeneinträge des Zertifikatswortschatzes erreichen bei den Tokens in beiden Wörterbüchern lemmatypübergreifend sehr ähnliche Werte. Auch die Entwicklung von den Types zu den Tokens verläuft im LTWDaF 2 und im DHWDaF 2 gleich - der Zertifikatswortschatz mit Haupteintrag kann seine relative Häufigkeit erhöhen, die anderen Wortgruppierungen verlieren an Anteilen. Als wichtigstes Ergebnis der Gegenüberstellung des in den Stichprobe verwendeten Definitionswortschatzes mit dem Wortschatz des Zertifikats Deutsch kann festgehalten werden, dass die Schnittmenge zwischen beiden Wortschätzen im DHWDaF 2 geringer ausfällt als im LTWDaF 2. Dies gilt unabhängig vom jeweiligen Lemmatyp und sowohl für die Types als auch für die Tokens. 3.6 Zusammenfassung der Wörterbuchanalyse Das folgende Kapitel fasst die wichtigsten Ergebnisse der Wörterbuchanalyse zusammen, viele detaillierte Beobachtungen aus den Kapiteln 3.3 bis 3.5 müssen deshalb unberücksichtigt bleiben. Die Erkenntnisse der Analyse sind dabei nach einzelnen Thesen geordnet. These 1: Wörterbuchdefinitionen besitzen Eigenschaften von Texten. In den untersuchten Definitionen des LTWDaF 2 und des DHWDaF 2 verteilen sich die beiden Wortartengruppen Synsemantika und Autosemantika bei den Tokens wie in anderen allgemeinsprachlichen Texten. Dies bedeutet, dass die Tokens in etwa jeweils zur Hälfte aus auto- und synsemantischen Wortarten bestehen. Für das LTWDaF 2 trifft diese Verteilung mit knapp 51 Prozent Synsemantika und gut 49 Prozent Autosemantika exakt zu (vgl. Kap. 3.2.1 und 3.3.2.1.2). Im DHWDaF 2 erhalten die autosemantischen Wortarten mit einem Anteil von knapp 56 Prozent etwas mehr Gewicht. Dementsprechend sind im DHWDaF 2 die verbleibenden gut 44 Prozent der Tokens synsemantisch (vgl. Kap. 3.3.2.1.3). Diese leichte Abweichung erklärt sich aus der besonderen Struktur der DHWDaF 2-Definitionen (vgl. These 4). Die Verteilung der Autosemantika und Synsemantika bei den Types gestaltet sich ganz anders als bei den Tokens. Unabhängig vom Wörterbuch bestehen die Types der ana- Wörterbuchanalyse 363 lysierten Definitionen zu rund 93 Prozent aus autosemantischen Wörtern, die restlichen rund sieben Prozent entfallen auf die Synsemantika (vgl. Kap. 3.3.2.1.2 und 3.3.2.1.3). Von den Tokens zu den Types verlieren die synsemantischen Wortarten enorm an Einfluss (zur Verteilung der einzelnen Wortarten vgl. These 3). Das starke Übergewicht der Autosemantika bei den Types spiegelt sich ebenso in der Verteilung der beiden Wortartengruppen im Lexikon des Deutschen wider. Für die Wahrnehmung der Wörterbuchdefinitionen als Text spielt es jedoch keine Rolle, da dort die Tokenzählung entscheidet. These 2: Das LTWDaF 2 und das DHWDaF 2 unterscheiden sich in der Art ihrer Lemmatisierung und im Aufbau ihrer Artikel. Diese These bezieht sich darauf, wie sich die Unterschiede, die beide Verlage in der Lemmatisierung und in der Anlage der Artikel in ihren Wörterbüchern machen, auf die Untersuchung auswirken. Der konkrete Aufbau der einzelnen Wörterbuchartikel, wie er in den Kapiteln 3.1.1 und 3.1.2 dargestellt ist, interessiert an dieser Stelle demzufolge weniger. Die Auswahl der Lemmata für die Stichprobe der Untersuchung zeigt, dass sich das LTWDaF 2 und das DHWDaF 2 in ihrer Art der Lemmatisierung unterscheiden. Im LTWDaF 2 besteht die Tendenz, für Lexeme mit mehreren Bedeutungen unterschiedliche Wörterbuchartikel anzulegen, wohingegen das DHWDaF 2 bei Gleichheit der äußeren Wortform Lexeme mit mehreren Bedeutungen eher in einem Artikel behandelt. Auf diese Weise wächst im DHW- DaF 2 die Mikrostruktur einzelner Artikel, im LTWDaF 2 erweitert sich die Makrostruktur des Wörterbuchs. Diese Unterschiede führen dazu, dass die 400 Lemmata des LTWDaF 2, die für die Stichprobe ausgewählt sind, im DHWDaF 2 nur 382 Lemmata entsprechen. Insgesamt 16 Untersuchungslemmata des LTWDaF 2 sind im DHWDaF 2 in einem Artikel zusammengefasst - zwei davon besitzen im LTWDaF 2 sogar drei Artikel (vgl. Kap. 3.3.1). Trotz dieser Tatsache verzeichnet das DHWDaF 2 bei den einzelnen Lemmata weniger Sememe als das LTWDaF 2. Verfügen die Lemmata des LTWDaF 2 im Durchschnitt über zwei Sememe, sind es im DHWDaF 2 nur 1,69 (vgl. Kap. 3.3.1.1 und 3.3.1.2). Ein weiterer Unterschied zwischen den beiden untersuchten Wörterbüchern besteht bei der Verzeichnung von Wortbildungsprodukten. Sowohl das LTW- DaF 2 als auch das DHWDaF 2 führen beim Lemma Komposita zum jeweiligen Semem auf (das DHWDaF 2 allerdings nur Komposita mit dem Lemma Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 364 als Grundwort). Das LTWDaF 2 verzeichnet am Ende des Artikels zusätzlich zahlreiche Derivate zum Lemma (vgl. Kap. 3.1.1, 3.1.2 und These 5). In ihrer Mikrostruktur unterscheiden sich die beiden untersuchten Wörterbücher außerdem, wenn es um die Länge der Definitionen geht (vgl. These 4). Im Durchschnitt enthält eine Definition des LTWDaF 2 8,23 Wörter. Die Definitionen des DHWDaF 2 sind mit 5,88 Wörtern rund ein Drittel kürzer (vgl. Kap. 3.3.1.1 und 3.3.1.2). These 3: Das LTWDaF 2 und das DHWDaF 2 weisen in ihren Definitionen und im Definitionswortschatz viele Ähnlichkeiten auf. Trotz der in These 2 beschriebenen Unterschiede in der Art der Lemmatisierung und im Aufbau der Artikel im LTWDaF 2 und im DHWDaF 2 lassen sich beinahe für jeden Aspekt, unter dem die Wörterbuchanalyse durchgeführt wird, die zwischen den beiden Wörterbüchern bestehenden Gemeinsamkeiten hervorheben. Obwohl das DHWDaF 2 seine Artikel im Durchschnitt mit weniger Sememen als das LTWDaF 2 aufbaut (vgl. Kap. 3.3.1.1, 3.3.1.2 und These 2), ist die Reihenfolge der einzelnen Lemmatypen die gleiche: Die durchschnittliche Anzahl der Sememe nimmt vom Lemmatyp Substantiv über die adjektivischen und die verbalen Definitionen zur Lemmatypgruppe Sonstiges zu (vgl. Kap. 3.4.1.1 und 3.4.1.2). Dies überrascht nicht, da die Lemmatypgruppe Sonstiges alle Synsemantika enthält, deren Bedeutung lexikalisch-begrifflich vager ist als beispielsweise die der Substantive. Der Anteil des verwendeten Definitionswortschatzes, der nicht im Wörterbuch verzeichnet ist, liegt im LTWDaF 2 und im DHWDaF 2 gleich hoch - sowohl bei den Lemmata als auch bei den Definitionen. Die sekundären Lexeme machen jeweils mehr als 90 Prozent des nicht verzeichneten Definitionswortschatzes aus, auch die Reihenfolge der Wortbildungsarten stimmt im LTWDaF 2 und im DHWDaF 2 überein (vgl. Kap. 3.3.2.3.3.1, 3.3.2.3.3.2 und These 5). Die Wortarten sind im Definitionswortschatz der beiden Wörterbücher sehr ähnlich verteilt: Bei den Types erreichen die Substantive 45-48 Prozent, die Verben 23-25 Prozent, die Adjektive 17-18 Prozent, die Adverbien sechs Prozent, die Präpositionen zwischen drei und sieben Prozent, die Pronomen und Artikelwörter zwei Prozent, die Junktionen ein bis zwei Prozent und die Partikeln weniger als ein halbes Prozent (vgl. Kap. 3.3.2.1.2 und 3.3.2.1.3). Die Wörterbuchanalyse 365 hohe Bedeutung der autosemantischen Wortarten für die Types wird an diesen Zahlen sehr deutlich. Bei den Types ergibt sich damit die Verteilung, die für die Auswahl der Lemmata bei der Konzipierung der Untersuchung angenommen wird - 40 Prozent Substantive und je 20 Prozent Verben, Adjektive und sonstige Wortarten (vgl. Kap. 3.2.1). Bei den Tokens ändern sich die Anteile der einzelnen Wortarten in der Art, dass die Werte der Synsemantika stark ansteigen, während die Autosemantika an Einfluss einbüßen. So liegen die Substantive bei den Tokens bei 20-24 Prozent, die Verben bei 16-17 Prozent, die Adjektive zwischen neun und zwölf Prozent, die Adverbien zwischen vier und fünf Prozent, die Präpositionen zwischen zehn und zwölf Prozent, die Pronomen und Artikelwörter bei 21-26 Prozent, die Junktionen zwischen sieben und zwölf Prozent und die Partikeln bei einem Prozent (vgl. Kap. 3.3.2.1.2 und 3.3.2.1.3). In Bezug auf die Wortartenverteilung bei den einzelnen Lemmatypen ergeben sich ebenso Parallelen zwischen dem LTWDaF 2 und dem DHWDaF 2 (vgl. These 6). Der untersuchte Definitionswortschatz der analysierten Wörterbücher ähnelt sich zudem, was die geringe Rolle der nicht nativen Lexeme betrifft. Sogar die sprachlichen Ebenen, bei denen sich die nicht nativen Lexeme von den nativen unterscheiden, zeigen ihre unterschiedlich hohe Integrationskraft gleichermaßen: Die nicht nativen Lexeme weichen meist auf der phonetischen und der Wortbildungsebene von den nativen ab, wohingegen sie sich auf der Morphologie- und Graphematikebene stärker in das native System des Deutschen integrieren (vgl. Kap. 3.3.2.2.2, 3.3.2.2.3 und These 6). Zwischen dem Definitionswortschatz des LTWDaF 2 und dem des DHW- DaF 2 bestehen außerdem Gemeinsamkeiten im Bereich der Wortbildung: Bei den Autosemantika liegen vor allem die Anteile von primärem, demotiviertem und motiviertem Definitionswortschatz bei den Types dicht beieinander (vgl. These 7). Ein genauer Blick auf den motivierten Definitionswortschatz zeigt zudem, dass sich die Verteilung der einzelnen Wortbildungsarten im LTWDaF 2 und im DHWDaF 2 bis auf wenige Ausnahmen deckt: Bei den Types machen die Derivate 50-54 Prozent aus, die Konversionsprodukte 24- 25 Prozent, die Komposita 13-14 Prozent, die Partikelverbbildungen sieben bis zwölf Prozent und die Kurzwortbildung ein halbes Prozent. Für die Tokens ändern sich die Anteile leicht - die Derivate kommen auf 52-58 Prozent, die Konversionsprodukte auf 21-22 Prozent, die Komposita auf elf Prozent, die Partikelverbbildungen auf 10-14 Prozent und die Kurzwortbildung auf weniger als ein halbes Prozent (vgl. Kap. 3.3.2.3.2.1 und 3.3.2.3.2.2). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 366 Bei den vier Lemmatypen gestaltet sich die Länge der untersuchten Definitionen in den beiden Wörterbüchern ähnlich: Die adjektivischen und verbalen Definitionen sind im LTWDaF 2 und im DHWDaF 2 unterdurchschnittlich kurz, was sich durch die bei diesen Wortarten besser ausgebauten Synonymierelationen erklären lässt (vgl. Kap. 3.4.1.1). Über dem Durchschnitt liegen die Definitionen der Substantive und der Lemmatypgruppe Sonstiges. Die Ursache hierfür ist darin zu suchen, dass die Definitionen der Lemmatypgruppe Sonstiges stark an Verwendungshinweise erinnern beziehungsweise dass die Definition substantivischer Konkreta mehr Raum einnimmt (vgl. Kap. 3.4.1.1 und 3.4.1.2). Die Länge der analysierten Definitionen korreliert zudem positiv mit der lemmatypspezifischen Verwendungshäufigkeit der Types, die von den adjektivischen über die verbalen und substantivischen Definitionen zu den Definitionen der Lemmatypgruppe Sonstiges hin zunimmt. Die Lemmatypen Adjektiv und Verb, deren Types über die niedrigste Verwendungshäufigkeit verfügen, enthalten in ihren Definitionen bei den Tokens auch die wenigsten Synsemantika (vgl. Kap. 3.4.1.1 und 3.4.1.2). Gerade die synsemantischen Wortarten besitzen eine sehr hohe Verwendungshäufigkeit (vgl. These 7). Die Gemeinsamkeiten im Definitionswortschatz zwischen den beiden untersuchten Wörterbüchern bestehen somit auf allen Ebenen des Vergleichs: die lemmatypspezifische Sememanzahl, ihre Länge und Verwendungshäufigkeit, aber auch die Eigenschaften des nicht verzeichneten Definitionswortschatzes, die Verteilung der Wortarten sowie die Rolle des nativen Wortschatzes und der Wortbildung. These 4: Die Unterschiede zwischen dem LTWDaF 2 und dem DHWDaF 2 , welche die Wörterbuchanalyse nachweist, liegen meist in der unterschiedlichen Definitionsstruktur der beiden Wörterbücher begründet. Bereits beim unsystematischen Lesen im LTWDaF 2 und im DHWDaF 2 gewinnt der aufmerksame Benutzer den Eindruck, dass sich die Definitionen in den beiden Wörterbüchern in ihrer Struktur unterscheiden. Die Wörterbuchanalyse belegt diese Wahrnehmung mit Fakten. Die Definitionen des DHW- DaF 2 zeichnen sich durch ihre knappe und synonymische Struktur aus, wohingegen die Definitionen des LTWDaF 2 länger sind und von ihrem Aufbau her stärker an Sätze erinnern. Der unterschiedliche Umfang der Definitionen lässt sich problemlos mit der Länge der Definitionen nachweisen. Im Durchschnitt sind die Definitionen des DHWDaF 2 5,88 Wörter lang. Die Defini- Wörterbuchanalyse 367 tionen des LTWDaF 2 enthalten im Mittelwert hingegen 8,23 Wörter, sie sind also beinahe ein Drittel länger als die des DHWDaF 2 (vgl. Kap. 3.3.2.1.2 und 3.3.2.1.3). Belege dafür, dass sich die Struktur der Definitionen in den beiden Wörterbüchern unterscheidet, findet man bei Daten zu den einzelnen Wortarten. Das DHWDaF 2 verfügt bei den Tokens der untersuchten Definitionen über rund sieben Prozent mehr Autosemantika als das LTWDaF 2. Bei den einzelnen Lemmatypen sind es sogar rund neun Prozent mehr, allerdings bildet die Lemmatypgruppe Sonstiges hier eine Ausnahme. Diese wörterbuchspezifische Verteilung der Wortartengruppen Autosemantika und Synsemantika zeigt bereits, dass die Definitionen des DHWDaF 2 eher aus Synonymen oder Wortgruppen als aus Sätzen bestehen. Noch deutlicher wird der Unterschied zwischen den beiden Wörterbüchern, wenn man einzelne Wortarten betrachtet: Mit Ausnahme der Lemmatypgruppe Sonstiges verfügen im DHWDaF 2 alle Lemmatypen bei den Tokens über weniger Pronomen und Artikelwörter. Auch die Junktionen sind im LTWDaF 2 lemmatypübergreifend stärker vertreten als im DHWDaF 2. Gerade das Vorkommen von Junktionen und Pronomen beweist die stärkere syntaktische Gliederung der LTWDaF 2-Definitionen (vgl. Kap. 3.3.2.1.2 und 3.3.2.1.3). Die Verwendungshäufigkeiten der Synsemantika sind ebenfalls ein Nachweis für den Textcharakter einer Folge von Wörtern, da sich die Synsemantika in gewöhnlichen Texten viel häufiger wiederholen als in knappen Wortgruppen. Im DHWDaF 2 liegt die durchschnittliche Verwendungshäufigkeit aller Types bei 3,11-mal, im LTWDaF 2 ist sie mit 4,90-mal deutlich höher. Ein autosemantischer Type wird in den Definitionen des DHWDaF 2 1,87-mal verwendet, ein synsemantischer Type 20,13-mal. Die Zahlen des LTWDaF 2 sind mit einer 2,59-maligen Verwendung der autosemantischen Types und mit einer 34,83-maliger Verwendung der synsemantischen Types deutlich höher (vgl. Kap. 3.3.2.1.2 und 3.3.2.1.3). These 5: Der im LTWDaF 2 und im DHWDaF 2 verwendete Definitionswortschatz geht in seinem Umfang über die Lemmata des jeweiligen Wörterbuchs hinaus. Bei dem nicht verzeichneten Definitionswortschatz spielen Wortbildungsprodukte eine große Rolle. Beide Wörterbücher behaupten von sich, in ihren Definitionen einen computerkontrollierten Definitionswortschatz zu verwenden, also lediglich Wörter, die als Lemmata im jeweiligen Wörterbuch verzeichnet sind (vgl. Kap. 3.1.1 und 3.1.2). Dieses Versprechen halten weder das LTWDaF 2 noch das DHW- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 368 DaF 2 ein. Von den untersuchten Lemmata enthalten knapp 27 Prozent im DHWDaF 2 beziehungsweise knapp 29 Prozent im LTWDaF 2 nicht verzeichneten Definitionswortschatz. Die Lemmatypgruppe Sonstiges ist davon jeweils am stärksten betroffen. Dies gilt auch für die nächste Ebene, die der Definitionen. Knapp 22 Prozent der Definitionen des DHWDaF 2 beziehungsweise knapp 21 Prozent der Definitionen des LTWDaF 2 gehen in ihrem verwendeten Definitionswortschatz über die im Wörterbuch enthaltenen Lemmata hinaus - in beiden Wörterbüchern somit mehr als ein Fünftel der Definitionen. Sowohl bei den Lemmata als auch bei den Definitionen bestehen zwischen beiden Wörterbüchern kaum Unterschiede, obwohl das LTW- DaF 2 die Verwendung eines computerkontrollierten Definitionswortschatzes in seinen Wörterbuchaußentexten viel deutlicher betont als das DHWDaF 2. Bei den Types gehen im DHWDaF 2 12,45 Prozent über den Lemmabestand hinaus, im LTWDaF 2 sind mit 10,06 Prozent der Types geringfügig weniger. Dieser Wert verringert sich bei der Zählung der Tokens erneut. Hier sind es im DHWDaF 2 noch 4,87 Prozent und im LTWDaF 2 noch 2,89 Prozent des untersuchten Definitionswortschatzes, die nicht im Wörterbuch lemmatisiert sind (vgl. Kap. 3.3.1.1 und 3.3.1.2). Bei einem großen Teil des nicht lemmatisierten Definitionswortschatzes handelt es sich um das Ergebnis von Wortbildungsprozessen. So lassen sich im DHWDaF 2 90,67 Prozent dieser Types als Wortbildungsprodukt klassifizieren. Im LTWDaF 2 sind es sogar 97,62 Prozent der Types. Dieser hohe Anteil sinkt auch bei den nicht lemmatisierten Tokens nur unwesentlich - im LTW- DaF 2 sind es 95,42 Prozent dieser Tokens, im DHWDaF 2 86,89 Prozent (vgl. Kap. 3.3.2.3.3.1 und 3.3.2.3.3.2). Die einzelnen Wortbildungsarten sind dabei unterschiedlich wichtig. Sowohl bei den Types als auch bei den Tokens beider Wörterbücher ist die Konversion die häufigste Wortbildungsart. Gefolgt wird sie von der Derivation, der Komposition und der Partikelverbbildung. Bei den einzelnen Anteilen der Wortbildungsarten bestehen jedoch auch einige Unterschiede zwischen den beiden Wörterbüchern. Im DHWDaF 2 ähneln sich die Zählungen der Types und der Tokens sehr, außerdem ist die Verteilung zwischen den einzelnen Wortbildungsarten viel ausgeglichener als im LTWDaF 2. Das LTWDaF 2 ist hingegen stärker auf die Konversion konzentriert. Die Ursache hierfür liegt darin, dass ein Drittel des nicht im LTWDaF 2 verzeichneten Definitionswortschatzes unter der Wortfamilie notiert ist. In diesen Fällen handelt es sich jedoch vor allem um Derivate und teilweise um Komposita. Dadurch sind die Konversionsprodukte bei dem nicht lemmatisierten Definitionswortschatz des LTWDaF 2 stärker repräsentiert (vgl. Kap. 3.3.2.3.3.1 und 3.3.2.3.3.2). Wörterbuchanalyse 369 These 6: Zwischen den untersuchten Definitionen bestehen Unterschiede, die auf die einzelnen Lemmatypen zurückführbar sind. Die Untersuchung weist nach, dass Wortarten in den Definitionen desjenigen Lemmatyps am häufigsten vorkommen, zu dem sie als Lemmata selbst gehören. In beiden Wörterbüchern lässt sich dies auf überzeugende Weise zeigen: Bei den Types besitzen die Verben, die Adjektive, die Substantive, die Adverbien, die Präpositionen und die Junktionen jeweils in den Definitionen ihrer eigenen Lemmatypen (also Verb, Adjektiv, Substantiv und Sonstiges) die höchste relative Häufigkeit. Im DHWDaF 2 ist diese Verteilung der einzelnen Wortarten noch stärker ausgeprägt als im LTWDaF 2. An dieser Stelle stimmen die beiden Wörterbücher nicht nur in dem beschriebenen Fakt allgemein überein, auch die einzelnen Prozentwerte weisen viele Ähnlichkeiten auf. Nur sechs der insgesamt 32 Werte des DHWDaF 2 und des LTWDaF 2 weichen mehr als zwei Prozentpunkte voneinander ab (vgl. Kap. 3.4.2.1.1 und 3.4.2.1.2). Auch bei den Tokens erreichen die Verben, die Adjektive, die Substantive, die Präpositionen und die Junktionen in den Definitionen ihrer eigenen Lemmatypen die höchsten Anteile. Die Adverbien sind allerdings in den adjektivischen Definitionen am stärksten vertreten, was sich durch die semantische Nähe beider Wortarten erklären lässt. Die absoluten Werte der einzelnen Wortarten im DHWDaF 2 und im LTWDaF 2 weichen bei den Tokens jedoch stärker ab als bei den Types - 18 der 32 Werte unterscheiden sich stärker als zwei Prozent voneinander (vgl. Kap. 3.4.2.1.1 und 3.4.2.1.2). Eine weitere lemmatypspezifische Besonderheit der untersuchten Wörterbücher besteht darin, dass sich die Definitionen der Lemmatypen Substantiv und Sonstiges in einigen Punkten von den Definitionen der Lemmatypen Adjektiv und Verb unterscheiden. So sind die adjektivischen und verbalen Definitionen im Durchschnitt kürzer, sie enthalten mehr Verben und weniger Substantive sowie mehr heimischen Wortschatz. Diese Unterschiede liegen in den semantischen Besonderheiten der Lemmatypen begründet: Die Lemmatypgruppe Sonstiges besteht zu großen Teilen aus synsemantischen Lemmata, der substantivische Lemmatyp fällt vor allem durch die Definitionen der Konkreta auf. Mit den anderen Wortschätzen ergeben sich mit dem Definitionswortschatz der Adjektive und Verben größere Schnittmengen (vgl. Kap. 3.4.1, 3.4.2.1, 3.4.2.2, 3.5.1, 3.5.2 und 3.5.3). Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 370 These 7: Der auffällige Definitionswortschatz wird seltener verwendet als der unauffällige Definitionswortschatz. Die durch die Prager Schule entwickelte Theorie der Markiertheit differenziert zwischen markierten und unmarkierten Lexemen. Diese beiden unterscheiden sich im Grad ihrer Auffälligkeit sowie in der Häufigkeit ihrer Verwendung - markierte Lexeme sind auffälliger und werden deshalb seltener gebraucht als unmarkierte (vgl. Kap. 3.3.2.1.2). Diese allgemeine sprachliche Theorie lässt sich hervorragend auf die vorliegende Untersuchung zum Definitionswortschatz übertragen. Die in den Definitionen verwendeten Lexeme, die in irgendeiner Weise auffällig sind, werden weniger häufig gebraucht als die unauffälligen. Die Auffälligkeit kann sich dabei auf die formale und/ oder auf die inhaltliche Seite des sprachlichen Zeichens beziehen. Als formal auffällig kann erstens der nicht native Definitionswortschatz bezeichnet werden, weil er sich auf mindestens einer dieser sprachlichen Ebenen - Phonologie, Graphematik, Morphologie, Wortbildung - nicht in das heimische System integriert (vgl. Kap. 3.3.2.2). Wie in den Kapiteln 3.3.2.2 und 3.4.2.2 dargestellt, halbieren sich die Anteile der nicht nativen Lexeme wörterbuchübergreifend von den Types zu den Tokens in etwa; die daraus resultierenden niedrigen Verwendungshäufigkeiten lassen sich mit der Auffälligkeit der nicht nativen Lexeme erklären. Ein zweiter Bereich, in dem der Zusammenhang zwischen äußerer Auffälligkeit des sprachlichen Zeichens und seiner Verwendungshäufigkeit deutlich wird, ist die Wortgebildetheit des Lexems (vgl. Kap. 3.3.2.3 und 3.4.2.3). Als auffällig gelten hier die Wortbildungsprodukte bei den Autosemantika: Primäre Lexeme werden häufiger verwendet als die sekundäre Vergleichsgruppe. Unter den Wortbildungsprodukten gibt es jedoch einige Wörter, die aufgrund ihrer teilweise formelhaften Verwendung semantisch weniger auffallen und deshalb vergleichsweise hohe Verwendungshäufigkeiten aufweisen. Dies betrifft vor allem einige Partikelverben sowie Derivate. Formal auffällig sind zudem die in den Definitionen verwendeten Wörter, die nicht im Wörterbuch lemmatisiert sind (vgl. Kap. 3.3.1). In den meisten Fällen handelt es sich dabei um Produkte von Wortbildungsprozessen, die selten verwendet werden. Die niedrigen Verwendungshäufigkeiten zeigen sich jedoch nicht nur bei den formal auffälligen Lexemen, sondern auch bei denjenigen, deren Auffälligkeit durch die Semantik bedingt ist. Das betrifft zum einen die Wortartengruppen der Autosemantika und der Synsemantika. Die autosemantischen Wortarten Wörterbuchanalyse 371 sind durch ihre semantische Dichte gegenüber den Synsemantika auffällig beziehungsweise markiert (vgl. Thom 1975, S. 327 und Kap. 3.3.2.1). Bei beiden Wortartengruppen zeigt sich dies in der Verwendungshäufigkeit - die autosemantischen Wortarten liegen deutlich unter dem allgemeinen Mittelwert der Verwendungshäufigkeit, die synsemantischen Wortarten hingegen noch viel deutlicher darüber (vgl. Kap. 3.3.2.1). Der Zusammenhang zwischen semantischer Dichte, Auffälligkeit und damit der Verwendungshäufigkeit lässt sich auch für die einzelnen Wortarten nachweisen: Je dichter die Semantik der Wortart ist, desto auffälliger ist sie auch und desto seltener findet sie in den Definitionen Verwendung (vgl. Kap. 3.3.2.1). Die Verwendungshäufigkeit der Wortarten steigt dabei wörterbuchübergreifend von den Substantiven über die Adjektive, die Verben, die Adverbien, die Partikel, die Präpositionen und die Junktionen bis zu den Pronomen und Artikelwörtern hin an. Im DHWDaF 2 reicht die Spanne der Häufigkeit der Verwendung dabei von 1,66-mal bei den Substantiven bis zu 33,54-mal bei den Pronomen, im LTWDaF 2 sogar von 2,10-mal bei den Substantiven bis zu 59,24-mal bei den Pronomen. Sowohl die Form als auch die Semantik der Lexeme spielen eine Rolle, wenn es um die Auffälligkeit der Vergleichswortschätze geht. Der in der vorliegenden Untersuchung analysierte Definitionswortschatz, der in den Vergleichswortschätzen - dem Grundwortschatz Langenscheidt Basic German Vocabulary, dem Frequenzwortschatz Frequency Dictionary und dem Zertifikatswortschatz Zertifikat Deutsch - nicht enthalten ist, zeichnet sich gegenüber den dort verzeichneten Lexemen durch seine formale und/ oder semantische Auffälligkeit aus. In jedem Fall verkörpern die in den Vergleichswortschätzen enthaltenen Lexeme eine Art Zentrum - ob nun ihre allgemeine Elementarität oder ihre Frequenz in den Fokus der Aufmerksamkeit gerückt wird. Von diesem Zentrum weichen die dort nicht enthaltenen Lexeme in irgendeiner Weise ab, sei es durch eine formale Auffälligkeit, beispielsweise die Wortgebildetheit bei den Wortbildungsprodukten, oder sei es durch die Komplexität des enthaltenen Konzepts. These 8: Der im LTWDaF 2 und im DHWDaF 2 verwendete Definitionswortschatz deckt sich unterschiedlich stark mit anderen pädagogischen Wortschätzen. Für die Erstellung von kontrollierten Definitionswortschätzen werden häufig Kriterien wie Frequenz, Allgemeingültigkeit und Nützlichkeit herangezogen (vgl. Kap. 2.3.2). Diese sind auch in anderen pädagogischen Wortschätzen Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 372 von Bedeutung, weshalb die lexikografische Forschung häufig die Deckung des Definitionswortschatzes mit diesen anderen Wortschätzen betont. Das trifft für den Grundwortschatz Langenscheidt Basic German Vocabulary, den Frequenzwortschatz Frequency Dictionary und den Zertifikatswortschatz Zertifikat Deutsch jedoch in unterschiedlich starkem Maß zu. Der im LTWDaF 2 und im DHWDaF 2 verwendete Definitionswortschatz zeigt mit dem Frequency Dictionary die meisten Übereinstimmungen - vom Definitionswortschatz des LTWDaF 2 sind 78,54 Prozent der Types und 93,82 Prozent der Tokens im Frequency Dictionary aufgeführt. Vom DHWDaF 2 sind die 71,09 Prozent der Types und 88,12 Prozent der Tokens. Diese vergleichsweise hohe Kongruenz lässt darauf schließen, dass die Frequenz eines Wortes für den Definitionswortschatz selbst dann eine besonders große Bedeutung besitzt, wenn es sich nicht um kontrollierte, sondern um unbeschränkte Definitionswortschätze handelt (vgl. Kap. 3.5.2). Deutlich niedriger ist die Deckungsgleichheit zwischen den Definitionswortschätzen des LTW- DaF 2 und im DHWDaF 2 und dem Grundwortschatz Langenscheidt Basic German Vocabulary. Hier sind 70,94 Prozent der Types und 79,61 Prozent der Tokens des untersuchten Definitionswortschatzes des LTWDaF 2 beziehungsweise 61,67 Prozent der Types und 72,44 Prozent der Tokens des DHWDaF 2 verzeichnet. Ein Grund hierfür könnte zwar das relative hohe Alter des Vergleichsgrundwortschatzes (erschienen 1991) sein, trotzdem sollte sich der Definitionswortschatz stärker am Grundwortschatz orientieren (vgl. Kap. 3.5.1). Gleiches kann auch für den Zertifikatswortschatz Zertifikat Deutsch festgestellt werden, der sich bei den Types am stärksten vom untersuchten Definitionswortschatz unterscheidet: Dort sind - als Haupt- und Nebeneinträge - 60,73 Prozent der Types und 84,13 Prozent der Tokens des untersuchten Definitionswortschatzes des LTWDaF 2 beziehungsweise 52,50 Prozent der Types und 77,13 Prozent der Tokens des DHWDaF 2 enthalten (vgl. Kap. 3.5.3). 4. Schlussfolgerungen 4.1 Empfehlungen an die praktische Lexikografie für die Gestaltung des Definitionswortschatzes Aus den Resultaten der durchgeführten Untersuchung ergeben sich einige Ansätze für Wörterbuchverlage, den Umgang mit dem verwendeten Definitionswortschatz in der Praxis zu verändern. Diese Möglichkeiten werden im Folgenden in Form von Empfehlungen wiedergegeben: Empfehlung 1: Der verwendete Definitionswortschatz sollte konsequent computerkontrolliert sein. Eine wesentliche Voraussetzung für die erfolgreiche Arbeit mit einem Wörterbuch ist die Möglichkeit, mit diesem als einem geschlossenem System selbstständig arbeiten zu können, ohne auf zusätzliche Nachschlagewerke angewiesen zu sein. Auf der Ebene der Definitionen impliziert dies unter anderem den Gebrauch eines computerkontrollierten Definitionswortschatzes, bei dem die in den Definitionen verwendeten Wörter auf den Umfang des Lemmabestands des Wörterbuchs beschränkt sind. Auf diese Weise kann verhindert werden, dass die Nachschlagehandlung des Benutzers beim Lesen der Definitionen an unbekannten Wörtern scheitert, die nicht im Wörterbuch selbst aufgesucht werden können, weil sie keinen Eintrag besitzen. Mehrere Untersuchungen, so die von Kharma (1985), Müllich (1990), Kostrzewa (1994) und Wingate (2002), wiesen dem unbekannten Definitionswortschatz die Hauptursache für das Misslingen beim Verstehen von Definitionen zu (vgl. Kap. 2.3.1.1). Ein computerkontrollierter Definitionswortschatz gilt somit als erster Schritt zur Reduzierung des Definitionswortschatzes und zur Gewährleistung der Verständlichkeit der Definitionen. Empfehlung 2: Der benutzte Definitionswortschatz sollte auf die Häufigkeit seiner Verwendung in den Definitionen überprüft und dementsprechend reduziert werden. Die Verwendung eines computerkontrollierten Definitionswortschatzes bildet nur den Ausgangspunkt für Definitionen, die auch für weniger fortgeschrittene Lerner verständlich sind. Denn selbst wenn allein die im Wörterbuch ent- Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 374 haltenen Lemmata für die Formulierung der Definitionen verwendet werden, sind das für Nichtmuttersprachler noch zu viele. Wörterbücher für die Grund- und Mittelstufe enthalten bereits um die 10 000 Lemmata, ein nicht muttersprachlicher Lerner ist von einem Definitionswortschatz, der potenziell 10 000 Wörter enthält, jedoch überfordert. Aus diesem Grund ist eine weitere Reduzierung des Definitionswortschatzes dringend nötig. Für die Durchführung dieser Reduzierung bestehen unterschiedliche Möglichkeiten. Den klassischen Weg gehen die englischsprachigen Lernerwörterbücher mit ihrem kontrollierten Definitionswortschatz: Vor dem Verfassen der Wörterbuchartikel wird eine Liste mit 2 000 bis 3 500 Wörtern angelegt, wie dies für das LDOCE, das OALD und das CIDE/ CALD im Kapitel 2.4.1 ausführlich beschrieben ist. Diese Liste steht anschließend für das Formulieren der Definitionen zur Verfügung. Einen Nachteil dieses stark deduktiv orientierten Vorgehens bildet die Tatsache, dass hier vorher festgelegt werden muss, welche Wörter in den Definitionen verwendet werden dürfen und welche beim Definieren besonders nützlich sind. Eine zweite Möglichkeit, einen computerkontrollierten Definitionswortschatz weiter zu reduzieren, soll im Folgenden vorgestellt werden. Dabei werden die Definitionen zunächst ohne Einschränkungen aus dem computerkontrollierten Definitionswortschatz - also dem Lemmabestand des Wörterbuchs - formuliert. In einem nächsten Schritt wird überprüft, welche Wörter in den Definitionen sehr häufig verwendet werden und welche nicht, indem der gesamte Definitionswortschatz nach seiner Frequenz geordnet wird. Bei den flektierbaren Wortarten muss dafür mit den Grundformen gearbeitet werden, wenn diese nicht in der Annotation hinterlegt sind. Besteht die Liste mit dem verwendeten Definitionswortschatz und der Häufigkeit seines Auftretens, kann an einer bestimmten Stelle entschieden werden, die anderen, weniger häufig verwendeten Wörter nicht mehr zu berücksichtigen. So können beispielsweise Wörter, die in den Definitionen weniger als zehnmal auftreten, systematisch durch andere, häufiger vorkommende Wörter ersetzt werden. In Abhängigkeit von der gesetzten Untergrenze ergeben sich so einerseits variable Steuerungsmechanismen, andererseits beträchtliche Einsparpotenziale, was den Umfang des Definitionswortschatzes betrifft. In der im Rahmen der vorliegenden Arbeit durchgeführten Untersuchung werden zum Beispiel im LTWDaF 2 lediglich knapp sechs Prozent der Types des Definitionswortschatzes mindestens zehnmal verwendet, im DHWDaF 2 sind es sogar nur knapp vier Prozent (vgl. Datensammlung B.2.1 und B.2.2). Schlussfolgerungen 375 Diese Anteile würden sich bei der Berücksichtigung des gesamten Definitionswortschatzes aller Definitionen natürlich noch stark erhöhen. Denn der Definitionswortschatz wiederholt sich dann häufiger, im Verhältnis zu den definierten Lemmata wächst er nicht proportional (vgl. Neubauer 1980, S. 51f.; 1984, S.118 sowie Kap. 2.3.1.1). Insgesamt machen diese Zahlen deutlich, auf welche Weise sich der Definitionswortschatz eines Wörterbuchs gesteuert reduzieren lässt. Die Wörter des Definitionswortschatzes, die in den Definitionen laut Festlegung zu selten verwendet werden, müssen dann durch andere Wörter ersetzt werden, die ihrerseits zu den häufiger verwendeten Wörtern zählen. Dieser Vorgang ist äußerst arbeitsaufwendig, da jede Definition einzeln umzuformulieren ist. Am Ende dieses Prozesses bestehen die Definitionen jedoch aus einem induktiv erstellten Definitionswortschatz, der für den nicht muttersprachlichen Benutzer von hoher Relevanz und Nützlichkeit ist. Er bietet gleichzeitig auch für den alltäglichen Sprachgebrauch ein geeignetes Instrumentarium, um bei Vokabellücken Wörter angemessen umschreiben zu können. Neben der gezielten Ersetzung der weniger frequenten Wörter des Definitionswortschatzes durch häufiger vorkommende Wörter stellt die Eliminierung von Synonymen eine geeignete Möglichkeit dar, den benutzten Definitionswortschatz zu reduzieren. Auch hier sollte darauf geachtet werden, dass das häufiger verwendete Synonym im Definitionswortschatz erhalten bleibt. Das Collins Cobuild Essential English Dictionary geht in Ansätzen von dem hier beschriebenen Vorgehen aus (vgl. Kap. 2.3.2). Im Anhang werden in einer Liste die Wörter mit Häufigkeitsangabe aufgeführt, die mindestens zehnmal in den Definitionen verwendet werden. Den nächsten Schritt - die Beschränkung des gesamten Definitionswortschatzes auf diese häufig verwendeten Wörter - geht das Collins Cobuild Essential English Dictionary jedoch nicht. Dennoch kann bereits eine solche Liste dem Wörterbuchbenutzer dazu dienen, sich den häufig verwendeten Definitionswortschatz anzueignen, was sein Verständnis der Definitionen mit Sicherheit erhöhen wird. Unterstützt werden könnte dies durch speziell abgestimmte Vokabeltrainings, die beispielsweise online oder auf CD-ROM angeboten werden. 474 Die Vorteile der zweiten Art des Vorgehens liegen darin, dass sich aus dem jeweiligen Bedarf heraus ein induktiv ermittelter kontrollierter Definitionswortschatz ergibt. Der einzige Nachteil besteht in dem sehr hohen Arbeitsaufwand bei der Erstellung und Überprüfung der Definitionen, der sich jedoch bei jeder Folgeauflage stark verringern würde. 474 Auf der CD-ROM zum CALD werden beispielsweise interaktive Übungen angeboten, für das OALD 7 auch für den „Oxford 3 000“. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 376 Empfehlung 3: Der verwendete Definitionswortschatz sollte auf seine Bedeutung hin kontrolliert werden. Die bisher beschriebene Reduzierung der Lexeme, die in den Definitionen verwendet werden, bezieht sich lediglich auf die äußere Form der Wörter. Daneben sollte der verwendete Definitionswortschatz jedoch auch auf seine Semantik hin kontrolliert werden. Denn dem Benutzer hilft es nicht, wenn er ein unbekanntes Wort aus der Definition zwar im Wörterbuch selbst nachschlagen kann, es aber dort in einer anderen Bedeutung verzeichnet ist, als es in der Definition verwendet wird. Dieser Fall kann für einen nichtmuttersprachlichen Benutzer sogar noch nachteiliger sein, als wenn ein in den Definitionen auftretendes Wort gar nicht verzeichnet ist: Wenn ein Benutzer ein gesuchtes Wort im Wörterbuch nicht findet, misslingt zwar seine Nachschlagehandlung, der Benutzer ist sich dessen jedoch bewusst. Wenn der Benutzer das gesuchte Wort hingegen findet, das Lemma jedoch nicht in der verwendeten Bedeutung verzeichnet ist, bemerkt der Benutzer unter Umständen das Scheitern seiner Nachschlagehandlung nicht einmal. Für Lernerwörterbücher ist die Kontrolle des Definitionswortschatzes auf Sememebene besonders wichtig, da in diesem Wörterbuchtyp weniger häufige oder ältere Bedeutungen teilweise ausgespart werden (vgl. Kap. 2.1.1). Um den verwendeten Definitionswortschatz vollständig daraufhin zu überprüfen, ob die aktuelle, in den Definitionen auftretende Bedeutung im Wörterbuch selbst enthalten ist, müsste jedes Wort des Definitionswortschatzes einzeln kontrolliert werden. Ein solches Vorgehen ist extrem arbeits- und zeitaufwendig, vor allem vor dem Hintergrund, dass es manuell durchgeführt werden muss, solange die einzelnen Bedeutungen im verwendeten Korpus nicht mit einer entsprechenden Annotation hinterlegt sind. „Die semantische Aufbereitung von Korpora steckt zu diesem Zeitpunkt noch in den Kinderschuhen.“ (Lenz 2000, S. 11). Der Kostenfaktor ist der Grund dafür, dass es momentan kein einziges Lernerwörterbuch gibt, das seinen Definitionswortschatz auf der Ebene der Sememe vollständig überprüft (vgl. Kap. 2.3.1.2). Wie bei der vorhergehenden Empfehlung gilt jedoch auch hier, dass der überwältigende Teil der Arbeit nur einmal, nämlich bei der Erstauflage, zu leisten ist - alle weiteren Auflagen könnten davon fast vollständig profitieren. Bis zum Erscheinen eines solchen Wörterbuchs gilt es, die verantwortlichen Redakteure für dieses Problem zu sensibilisieren. Sie müssen ihr lexikografisches Gespür für seltene beziehungsweise nicht im Wörterbuch verzeichnete Bedeutungen einsetzen und zumindest in den Zweifelsfällen den Semembestand des Wörterbuchs überprüfen. Schlussfolgerungen 377 Empfehlung 4: Im verwendeten Definitionswortschatz sollten die zu anderen pädagogischen Wortschätzen bestehenden Parallelen stärker genutzt werden. Pädagogische Wortschätze, wie Grund-, Häufigkeits- oder spezielle Prüfungswortschätze, werden nach bestimmten Kriterien zusammengestellt, die auch für den Definitionswortschatz von Bedeutung sind, beispielsweise die Allgemeingültigkeit und die Frequenz der Wörter sowie die Nützlichkeit für die jeweilige Zielgruppe. Diese Parallelen sollten bei der Zusammenstellung oder Bearbeitung eines Definitionswortschatzes zukünftig stärker berücksichtigt werden, indem ein Abgleich der Wortschätze erfolgt. Die Vergleichswortschätze können zum Beispiel dabei behilflich sein, frequentere oder zielgruppenadäquatere Synonyme für Teile des Definitionswortschatzes zu finden und so die Benutzerfreundlichkeit der Lernerwörterbücher zu erhöhen. Empfehlung 5: Grammatische Fachtermini sollten aus dem Definitionswortschatz ausgeklammert werden und eine eigene Liste in den Wörterbuchaußentexten erhalten. Je nach Lemmatyp unterscheiden sich die jeweiligen Definitionen zuweilen beträchtlich. Besonders deutlich wird dies an den synsemantischen Lemmata, deren Definitionen häufig den Charakter von Verwendungshinweisen besitzen. Deshalb enthalten sie in einem teilweise erheblichen Maß zumeist grammatische Fachtermini, welche für die Erläuterung der Verwendung des Lemmas nötig sind. Da diese grammatischen Termini zu großen Teilen nicht einem allgemeinen Wortschatz, sondern dem linguistischen Fachwortschatz angehören, sind sie nicht in Lernerwörterbüchern wie dem LTWDaF 2 oder dem DHWDaF 2 verzeichnet. Wie bei den anderen Wörtern des Definitionswortschatzes, die keinen Eintrag im jeweiligen Wörterbuch besitzen, hat der Benutzer dadurch keine Chance, die Ausführungen zur Bedeutung zu verstehen, wenn ihm darin enthaltene Wörter nicht bekannt sind. Eine Verzeichnung dieser Fachtermini in einem Lernerwörterbuch für die Grund- und Mittelstufe ist jedoch aus dem erwähnten Grund der Zugehörigkeit dieser Wörter zum Fachwortschatz der Linguistik nicht gerechtfertigt. Deshalb bietet es sich an, diese grammatischen Termini stattdessen in einer eigenen Liste in den Wörterbuchaußentexten aufzuführen und dort zu erläutern. 475 In den Hinweisen zum 475 Ob für diese Definitionen ebenfalls mit einem kontrollierten Definitionswortschatz gearbeitet werden sollte, ist fraglich. Denn einerseits handelt es sich bei den grammatischen Ausdrücken vielfach um Internationalismen. Andererseits birgt das grund- und mittelstufengerechte Definieren dieser konzeptuell schwierigen Fachtermini zahlreiche Probleme in sich. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 378 Definitionswortschatz sollte diese Tatsache für die Benutzer erläutert werden. Als Vorbild oder Muster kann an dieser Stelle das OALD 7 gelten, das im Anschluss an die Liste des kontrollierten Definitionswortschatzes eine Ansammlung von 78 so genannten language study terms verzeichnet, die für ein besseres Verständnis der grammatischen und pragmatischen Informationen im Wörterbuch sorgen sollen (vgl. OALD 7 2005, S. R 99 und Kap. 2.4.1.2). Im OALD 7 ist diese Auflistung jedoch noch ohne Erläuterungen, diese müssten für einen wirklichen Mehrwert für den Benutzer noch ergänzt werden, wenn nicht auf Erläuterungen in den Benutzerhinweisen verwiesen werden kann. In den Definitionen selbst sollten diese grammatischen Termini hervorgehoben werden, da sie kein Bestandteil des Definitionswortschatzes sind. Empfehlung 6: Das Arbeiten mit einem kontrollierten Definitionswortschatz sollte immer von der Maxime der Ehrlichkeit und von dem Ziel des größtmöglichen Nutzens für den Lerner geprägt sein. Das LTWDaF 2 ist bisher das einzige Lernerwörterbuch für Deutsch als Fremdsprache, das in seinem Anhang den verwendeten Definitionswortschatz in Form einer Liste aufführt. Allerdings macht das LTWDaF 2 in den Erläuterungen zu dieser Liste zahlreiche Einschränkungen und Ausnahmen: So werden folgende sieben Fälle nicht in der Liste des kontrollierten Definitionswortschatzes aufgeführt: 1. im Artikel des Grundwortes unter || hierzu stehende Derivate, 2. Ergänzungen in Klammern, 3. transparente, leicht verständliche Wortbildungsprodukte, 4. einige Ausnahmen, 5. nur einmal verwendete Wörter, 6. Internationalismen und 7. miteinander verwandte Wörter (vgl. LTW- DaF 2 2007, S. 9, 545 sowie Kap. 3.3.1). Besonders durch den vierten Punkt, der mit dem Argument der vorhergehenden Analyse und pädagogischen Bewertung der Liste des kontrollierten Definitionswortschatzes verbunden wird, verliert das ursprüngliche Konzept sehr viel an Kontur (vgl. ebd., S. 545). Das anfängliche Ziel, mithilfe des beschränkten Definitionsvokabulars die Definitionen zu vereinfachen und so ihre Verständlichkeit für den nicht muttersprachlichen Benutzer zu verbessern, wird auf diese Weise umgangen. Durch die Vorgehensweise des LTWDaF 2 könnte sogar der Verdacht aufkommen, für den Verlag stünde der Werbenutzen im Vordergrund, der sich aus dem international angesehenen Ansatz der Arbeit mit einem kontrollierten Definitionswortschatz ergibt. Allerdings muss dem LTWDaF 2 an dieser Stelle zugute gehalten werden, dass das Bestreben, den Umfang des begrenzten Definitionsvokabulars auf eine möglichst kleine und damit werbetechnisch vorteilhafte Zahl zu beschränken, in den englischsprachigen Wörterbüchern Schlussfolgerungen 379 sein Vorbild findet. Wie im Kapitel 2.4.1 dargestellt, wenden auch die Verlage Oxford University Press, Cambridge University Press und Longman einige Kunstgriffe an, durch die der Umfang des für den Benutzer genannten und des tatsächlich verwendeten Definitionswortschatzes zum Teil sehr stark voneinander abweichen. Die Benutzer der Lernerwörterbücher würden davon profitieren, wenn der kontrollierte Definitionswortschatz in den Verlagen in Zukunft nicht nach dem Umfang zusammengestellt würde, sondern auf ehrliche Weise nach dem Nutzen für den Lerner (vgl. Kap. 2.3.2). Empfehlung 7: In Abhängigkeit von den Charakteristika der jeweiligen Wörter gibt es zahlreiche Einzelempfehlungen, die den kontrollierten Definitionswortschatz betreffen. Die bisher gegebenen Empfehlungen sind allgemeiner Natur und beziehen sich grundsätzlich auf die Arbeit mit dem Prinzip des kontrollierten Definitionswortschatzes. Neben diesen übergreifenden Anmerkungen ergeben sich aus der durchgeführten Untersuchung auch detaillierte Beobachtungen für ein zukünftiges, benutzerfreundlicheres Vorgehen. An den Stellen, an denen der verwendete Definitionswortschatz über die verzeichneten Lemmata hinausgeht, an denen das Prinzip des computerkontrollierten Definitionswortschatzes also verletzt wird, muss unbedingt nachgearbeitet werden. Denn für nicht muttersprachliche Benutzer sind Wörterbuchdefinitionen nachteilig, in denen jedes zehnte (LTWDaF 2) oder sogar jedes achte Type (DHWDaF 2) nicht im Wörterbuch verzeichnet ist. Welches Vorgehen für diese Types am vorteilhaftesten ist, unterscheidet sich je nach Fallgruppe. Einen eigenen Artikel müssen die primären Types erhalten, da ihre Semantik nicht von anderen Gliedern der Wortfamilie ableitbar ist. Bei den Wortbildungsprodukten wäre ein eigener Artikel ebenfalls die benutzerfreundlichste Lösung. Da dies aus Platzgründen jedoch nicht immer möglich sein wird, sollte auch hier weiter differenziert werden. Für die Wortbildungsprodukte, die sich in ihrer Semantik noch sehr nah an den Basen befinden, wie beispielsweise die meisten deverbalen und deadjektivischen Substantivkonversionen, genügt es, ausführlich auf ihre Verwendung in den Definitionen und die entsprechende Nachschlagemöglichkeit bei den Basen einzugehen. Dies kann zum Beispiel in den Hinweisen zur Benutzung des Wörterbuchs beziehungsweise in den Erklärungen zum Definitionswortschatz geschehen. Die Basen dieser Wortbildungsprodukte müssen dann allerdings vollständig im Wörterbuch lemmatisiert sein. Andere Wortbildungsprodukte, die sich in Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 380 ihrer Semantik stärker verselbstständigt haben, sollten im Idealfall einen eigenen Artikel erhalten oder zumindest bei ihrer Basis als Wortbildungsprodukt aufgeführt werden. Für diese Variante, wie sie das LTWDaF 2 mit den Verweisen unter || hierzu praktiziert, sollte sich das DHWDaF 2 unbedingt einen Raum in seinen Artikeln schaffen. Eine solche Auflistung besitzt zudem den Vorteil, bei den DaF-Lernern bestehende Unsicherheiten in Bezug auf die Bildung von Wortbildungsprodukten zu verringern. Für die Derivation und Teile der Komposition sollte die Verzeichnung von Affixen und Konfixen als Strichlemmata ausgebaut werden. Unabhängig davon sollte in den Benutzerhinweisen beziehungsweise in den Anmerkungen vor der Liste des Definitionswortschatzes stärker auf die Art der Zusammenstellung des Definitionswortschatzes und auf eventuelle Ausnahmen eingegangen werden (vgl. Kap. 3.3). 4.2 Resümee und Ausblick Die vorliegende Arbeit setzt sich mit dem Definitionswortschatz in einsprachigen deutschen Lernerwörterbüchern auseinander. Ihr Ziel war es erstens, die auf diesem Teilgebiet der Metalexikografie bestehenden Forschungslücken zu schließen. Zweitens sollten die durch eine Wörterbuchanalyse gewonnenen Erkenntnisse in Form von Empfehlungen an die praktische Lexikografie weitergegeben werden. Aus diesem doppelten Anspruch ergaben sich die in der Einleitung aufgeführten Fragestellungen, die im Laufe der Arbeit durch unterschiedliche Methoden folgendermaßen beantwortet werden konnten: 1) Das Verfahren, den verwendeten Definitionswortschatz in Lernerwörterbüchern einzuschränken, besitzt zwei Traditionslinien unterschiedlicher Ausprägungen - das Vocabulary Control Movement und die semantischen Primitiva. Die als Vocabulary Control Movement bekannt gewordene Bewegung besteht seit den Zwanzigerjahren des vergangenen Jahrhunderts in einer Vielzahl von Projekten. Diese richten sich in ihren pädagogischdidaktischen Zielen darauf, die jeweilige Fremdsprache leichter lehren und lernen zu können. Damit geht die Reduzierung des verwendeten Wortschatzes auf ein erforderliches Minimum einher, das zumeist in mehrere Niveaustufen eingeteilt wird. Die Mehrzahl dieser Bemühungen findet für Englisch als Fremdsprache statt, beispielsweise in den Arbeiten von Palmer, Ogden, West und Hornby. Doch es existieren mit Gougenheim und Pfeffer auch Ansätze für die französische und die deutsche Sprache. In diesem Rahmen, der häufig durch Kooperationen unter den Sprachlehrern und den Sprachwissenschaftlern geprägt ist, professionalisiert und spezia- Schlussfolgerungen 381 lisiert sich der Fremdsprachenunterricht, die ersten Lernerwörterbücher entstehen. Die Suche nach den semantischen Primitiva geht in ihren Ursprüngen auf die Philosophen des 17. Jahrhunderts zurück und wird von Diderot und d'Alembert in der Encyclopédie weiterentwickelt. Im 20. Jahrhundert zielt die Forschung um Wierzbicka vor allem darauf, eine allen Sprachen gemeinsame lexikalische Basis des Menschen zu finden, mittels derer sich Lösungen für Probleme des logischen Denkens ergeben. Für den Einsatz eines beschränkten Definitionswortschatzes in einem Lernerwörterbuch sind diese Ansätze ungeeignet, weil die Zahl der semantischen Primitiva zu niedrig und ihr semantischer Gehalt zu wenig komplex ist. Zudem ist die bei einzelnen Wissenschaftlern (beispielsweise bei Jackendoff und Apresjan) entwickelte Metasprache zu formalistisch. Die semantischen Primitiva können demzufolge eher als sprachphilosophischer Hintergrund betrachtet werden. Die Auseinandersetzung mit der wissenschaftlichen Diskussion über den kontrollierten Definitionswortschatz hat gezeigt, dass sowohl zahlreiche Vorals auch Nachteile der Arbeit mit einem beschränkten Definitionswortschatz aufgeführt werden. Die zentralen Vorteile bestehen aus der Sicht der Lerner in einer besseren Verständlichkeit der Definitionen und in einer erhöhten Benutzerfreundlichkeit. Lehrer sehen vor allem pädagogisch-didaktische Vorteile, wie die größere Strukturierung der Lexeme. Die Lexikografen erhöhen ihre eigene Disziplin beim Verfassen der Definitionen. Alle Benutzergruppen profitieren schließlich von der möglichen Vermeidung des lexikografischen Zirkels. Als Nachteile werden vor allem das Missverhältnis zwischen angegebener und tatsächlicher Größe des Definitionswortschatzes, eine grundsätzliche Ungeeignetheit und Unnötigkeit sowie die Sprache und Länge der mit einem kontrollierten Definitionswortschatz verfassten Definitionen genannt. Letztendlich bewertet die Mehrheit der Wissenschaftler den Ansatz jedoch positiv, da seine Vorteile überwiegen und er sich in der weltweit führenden englischsprachigen Wörterbuchpraxis als Standard durchgesetzt hat. Ebenfalls ermittelt werden konnte, dass als Kriterien für die Zusammenstellung eines kontrollierten Definitionswortschatzes vor allem die Frequenz, die Vertrautheit, die Allgemeingültigkeit, die semantische Breite, die Eindeutigkeit, die Einfachheit, die Nützlichkeit und die Reichweite der Wörter eine Rolle spielen. All diesen genannten Kriterien ist die Eignung der Wörter für die jeweilige Benutzergruppe übergeordnet. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 382 Das erste Lernerwörterbuch, das von einem kontrollierten Definitionswortschatz Gebrauch macht, ist 1978 das LDOCE 1. Im Jahr 1995 übernehmen das OALD 5 und das erstmalig erscheinende CIDE dieses Vorgehen. Der verwendete Definitionswortschatz wird vorher festgelegt und im Anhang des Wörterbuchs aufgeführt. Zwischen dem als kontrollierten Definitionswortschatz deklarierten und dem tatsächlich verwendeten Definitionswortschatz besteht im Umfang jedoch ein Missverhältnis. Verursacht wird dieses durch die Verzeichnung des Definitionswortschatzes in Klammerschreibungen sowie durch die mögliche Verwendung von Wortbildungsprodukten oder Mehrwortlexemen aus den Bestandteilen des aufgeführten Definitionswortschatzes beziehungsweise die Verwendung der Elemente des Definitionswortschatzes in mehreren Wortarten. Trotz dieser Einschränkungen hat sich durch die Arbeit mit dem kontrollierten Definitionswortschatz die Benutzerfreundlichkeit der Wörterbücher aufgrund der Verständlichkeit der Definitionen erhöht, was mehrere Untersuchungen belegen. So stellt der kontrollierte Definitionswortschatz heute ein Merkmal der großen englischsprachigen Lernerwörterbücher dar. Für die Wörterbücher im Bereich Deutsch als Fremdsprache gilt dies nicht. Hier existiert kein einziges Lernerwörterbuch, das nach englischem Vorbild mit einem kontrollierten Definitionswortschatz arbeitet. Dafür werden sowohl sprachexterne als auch sprachinterne Gründe verantwortlich gemacht, beispielsweise das fehlende Prestige von Wörterbüchern im deutschsprachigen Raum, die niedrigere Bedeutung von Deutsch als Fremdsprache, die kaum vorhandene Tradition der Lernerlexikografie sowie die andere Struktur der deutschen Sprache. Letztere würde jedoch lediglich zu einem größeren Umfang eines beschränkten Definitionswortschatzes führen, sodass die tatsächlichen Gründe wohl eher sozioökonomischer Natur sind. 2) Um konkrete Aussagen über die Eigenschaften des Definitionswortschatzes in deutschen Lernerwörterbüchern treffen zu können, wurde mittels einer Stichprobenerhebung eine vergleichende Wörterbuchanalyse durchgeführt. Mit dem Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (LTWDaF 2) und dem Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (DHWDaF 2) standen dafür zwei in Zielgruppe und Umfang vergleichbare Werke zur Verfügung, die laut Eigenaussage von einem computerkontrollierten Definitionswortschatz Gebrauch machen. 476 476 Besonders aus diesem zweiten Fragekomplex entstand eine Fülle von Einzelbeobachtungen, weshalb an dieser Stelle auf die resümierenden Abschnitte der einzelnen Kapitel sowie auf das zusammenfassende Kapitel 3.9 verwiesen wird. Schlussfolgerungen 383 Die Untersuchung hat jedoch gezeigt, dass dies für keines der beiden Wörterbücher bestätigt werden kann - sowohl das LTWDaF 2 als auch das DHWDaF 2 gehen in ihrem Definitionswortschatz in einem ähnlichen Ausmaß über ihren eigenen Lemmabestand hinaus. Das LTWDaF 2 verzeichnet von diesen nicht zum Lemmabestand gehörenden Wörtern des Definitionswortschatzes jedoch mehr in Artikeln von Gliedern der Wortfamilie als das DHWDaF 2, weil sich die Artikelstruktur des LTWDaF 2 dafür anbietet. Der nicht verzeichnete Definitionswortschatz besteht jeweils fast vollständig aus Wortbildungsprodukten. Die unterschiedliche Art des Definierens in beiden Wörterbüchern konnte ebenfalls nachgewiesen werden - knapper, stärker synonymisch und weniger satzähnlich im DHWDaF 2, im LTWDaF 2 hingegen umfangreicher, satzähnlicher und syntaktisch stärker gegliedert. Dies zeigt sich beispielsweise in der durchschnittlichen Länge der Definitionen oder in der relativen Häufigkeit bestimmter Wortarten, wie den Junktionen. Weiterhin enthalten die Lemmata im DHWDaF 2 weniger Sememe als im LTWDaF 2 und die Types werden seltener verwendet. Bei der Verteilung der einzelnen Wortarten, bei der Bedeutung der Herkunft der Wörter und ihrer formalsemantischen Komplexität (Wortbildung) ergab die Analyse große Ähnlichkeiten zwischen dem LTWDaF 2 und dem DHWDaF 2. Viele Parallelen zwischen den beiden Wörterbüchern zeigten sich auch bei der lemmatypspezifischen Untersuchung des verwendeten Definitionswortschatzes. Die Arbeit konnte zudem nachweisen, dass der Lemmatyp die Eigenschaften der Definition beeinflusst. So stehen die Anzahl der Sememe, die Länge der Definitionen und die Verwendungshäufigkeit der Types in enger Abhängigkeit von der Wortartenzugehörigkeit des Lemmas. Je niedriger die semantische Dichte des Lemmas ist, desto höher ist die Anzahl der Sememe, desto länger sind die Definitionen und desto höher ist die Verwendungshäufigkeit der Types. Auch die relative Häufigkeit der einzelnen Wortarten in den Definitionen hängt vom Lemmatyp ab. Eine Wortart ist in den Definitionen eines Lemmatyps besonders stark vertreten, wenn sie selbst zu diesem Lemmatyp gehört oder wenn eine semantische Nähe zu diesem besteht. 3) In der Metalexikografie wird wiederholt auf die Überschneidungen zwischen dem Definitionswortschatz und anderen pädagogischen Wortschätzen hingewiesen. Diese Aussage wurde in der vorliegenden Arbeit anhand des Grundwortschatzes Langenscheidt Basic German Vocabulary, des Frequenzwortschatzes Frequency Dictionary und des Zertifikatswortschatzes Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 384 Zertifikat Deutsch genauer untersucht. Die Übereinstimmung zwischen den Wortschätzen fällt dabei unterschiedlich hoch aus, je nachdem, wie relevant das Kriterium, das bei der Zusammenstellung des Vergleichswortschatzes die entscheidende Rolle spielt, für den Definitionswortschatz ist. Vom Frequency Dictionary über das Langenscheidt Basic German Vocabulary hin zum Zertifikat Deutsch nimmt die Kongruenz zum verwendeten Definitionswortschatz ab. Die in dieser Arbeit gewonnenen Erkenntnisse sind in praktische Empfehlungen umgesetzt, welche die Wörterbuchredaktionen zukünftig für die Erstellung und die Gestaltung des Definitionswortschatzes in deutschen Lernerwörterbüchern nutzen können. Hier besteht akuter Handlungsbedarf, wenn die deutschen Verlage den Anschluss an die internationale Lexikografie in diesem Bereich nicht verpassen wollen. Nachbemerkung Sophie erbt nach dem Tod ihres Großvaters dessen dreiundsiebzig Notizbücher, mit denen er seine Sprache retten wollte: Sophie bewahrte sie in einer Kiste auf, die rechts neben ihrem Bett stand, und immer, wenn sie nicht einschlafen konnte, las sie ein wenig darin herum. Der letzte Eintrag war offensichtlich über seinen Sohn, ihren Vater. Er lautete: Herbert bedeutet Ernte-, aber auch Pflanzzeit zugleich. Auf den darauffolgenden Seiten stand nichts mehr. Sie waren über und über mit Schokolade beschmiert. (Beuse 1999) Ihre Eltern schenken Sophie schließlich ein Notizbuch, mit dem sie selbst die Sprache vor dem Vergessen bewahren kann: Sie starrt auf das leere Etikett auf dem Einband, dann öffnet sie das Buch und beginnt zu schreiben. (Beuse 1999) 5. Literatur 5.1 Wörterbücher/ Korpora/ Lehrmaterialien Baker, Paul/ Hardie, Andrew/ McEnery, Tony (2006): A glossary of corpus linguistics. Edinburgh. Bakonyi, Hugo (1934): Die gebräuchlichsten Wörter der deutschen Sprache. Für den Fremdsprachenunterricht stufenmäßig zusammengestellt. (= Beiträge zur Methodik des deutschen Sprachunterrichts im Ausland 1). München. CALD = Cambridge Advanced Learner's Dictionary (2005). Cambridge. CIDE = Cambridge International Dictionary of English (1995). Cambridge. COBUILD 1 = Collins COBUILD English Language Dictionary (1987). Hrsg. v. John Sinclair. London/ Glasgow. COBUILD 2 = Collins COBUILD English Dictionary (1995). Hrsg. v. John Sinclair. London/ Glasgow. Collins COBUILD Essential English Dictionary (1991). Glasgow. Deutscher Wortschatz (2008): Wortschatz Universität Leipzig. Internet: http: / / wortschatz. uni-leipzig.de/ (Stand: 28.10.2010). DHWDaF 1 = Wörterbuch Deutsch als Fremdsprache (2003). Das einsprachige Wörterbuch für Kurse der Grund- und Mittelstufe. Ismaning u.a. DHWDaF 2 = Wörterbuch Deutsch als Fremdsprache (2007). Das einsprachige Wörterbuch für Kurse der Grund- und Mittelstufe. Ismaning. Diderot, Denis/ d'Alembert, Jean Le Rond (1754): Encyclopédie, ou Dictionnaire Raisonné des Sciences, des Arts et des Métiers, par une Société de Gens de Lettres. Tome quatrieme. Paris. DPF = Dictionnaire Pratique du Français (1987). Das neue einsprachige Nachschlagewerk für Schule u. Hochschule. Hrsg. v. Marie Gatard. Berlin u.a. DSWDaF = Duden Standardwörterbuch Deutsch als Fremdsprache (2002). Hrsg. v. der Dudenredaktion. Mannheim u.a. Duden-Grammatik (1998) = Duden - Grammatik der deutschen Gegenwartssprache. 6., neu bearb. Aufl. Hrsg. v. der Dudenredaktion. Bearb. v. Peter Eisenberg, Hermann Gelhaus, Helmut Henne, Horst Sitta u. Hans Wellmann. (= Der Duden in zwölf Bänden). Mannheim u.a. Duden-Grammatik (2009) = Duden - die Grammatik. Unentbehrlich für richtiges Deutsch. 8., überarb. Aufl. Hrsg. v. der Dudenredaktion. (= Der Duden in zwölf Bänden). Mannheim u.a. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 388 Eaton, Helen Slocomb (1934): Comparative Frequency List. A study based on the first thousand words in English, French, Spanish, and German frequency lists. New York. Eaton, Helen Slocomb (1940): An English-French-German-Spanish Word Frequency Dictionary. A correlation of the first six thousand words in four single-language frequency lists. New York. Ek, Jan Ate van (1975): Threshold Level English in a European Unit/ Credit System for Modern Language Learning by Adults. Oxford u.a. Europarat, Rat für kulturelle Zusammenarbeit (1976): Un niveau-seuil. Systèmes d'apprentissage des langues vivantes par les adultes. Von Daniel Coste, Janine Courtillon, Viktor Ferenczi, Michel Martins-Baltar, Eliane Papo. Straßburg. Europarat, Rat für kulturelle Zusammenarbeit (1979): Un nivel umbral. Von Peter Jan Slagter. Straßburg. Europarat, Rat für kulturelle Zusammenarbeit (1981): Livello soglia per l'insegnamento dell'italiano come lingua straniera. Von Nora Galli de' Paratesi. Straßburg. Europarat, Rat für kulturelle Zusammenarbeit (1989): Kontaktschwelle Deutsch als Fremdsprache. Von Markus Baldegger, Martin Müller, Günther Schneider in Zus.arb. mit Anton Näf. Berlin u.a. Faucett, Lawrence William/ Maki, Itsu (1932): A Study of English Word-Values, Statistically Determined from the Latest Extensive Word-Counts. Tokio. Gougenheim, Georges (1958): Dictionnaire Fondamental de la Langue Française. Nouvelle édition revue et augmentée. Paris. GWDS = Duden - das große Wörterbuch der deutschen Sprache (1999): In zehn Bänden. Hrsg. v. Wissenschaftlichen Rat der Dudenredaktion. 3., völlig neu bearb. u. erw. Aufl. Mannheim u.a. Haase, Alfred (1961): Englisches Arbeitswörterbuch. The learner's standard vocabulary. Der aktive englische Wortschatz in Wertigkeitsstufen und Sachgruppen mit Berücksichtigung des amerikanischen Sprachgebrauchs, der Phonetik und der Wortbildungslehre. 2., verb. Aufl. Frankfurt a.M. u.a. Hartmann, Reinhard Rudolf Karl/ James, Gregory (1998): Dictionary of Lexicography. London/ New York. Hindmarsh, Roland (1980): Cambridge English Lexicon. A graded word list for materials writers and course designers. Cambridge. Hornby, Albert Sidney (1954): A Guide to Patterns and Usage in English. 4. Aufl. London. Hornby, Albert Sidney/ Palmer, Harold Edward (1934): The IRET Standard English Vocabulary: The 1000-word radius. In: Bulletin 100, S. 8-9. Horst, Meta (1946): Basic English. Englisch mit 850 Wörtern. Teil I/ II. Nach dem Lehrsystem des Direktors des Orthological Institute Cambridge und London C.K. Ogden. 2., erw. Aufl. Heidelberg. Literatur 389 Idiomatic and Syntactic English Dictionary (1942). Hrsg. v. Albert Sydney Hornby, Edward Vivian Gatenby u. Hugh Wakefield. Tokio. Interim Report on Vocabulary Selection for the Teaching of English as a Foreign Language (1936). London. Jones, Randall/ Tschirner, Erwin (2006): A Frequency Dictionary. German core vocabulary for learners. Unt. Mitarb. v. Agnes Goldhahn, Isabel Buchwald, Antina Ittner. London/ New York. Kaeding, Friedrich Wilhelm (1898): Häufigkeitswörterbuch der deutschen Sprache. Festgestellt durch einen Arbeitsausschuß der deutschen Stenographiesysteme. Steglitz bei Berlin. Kempcke, Günter (2000): Wörterbuch Deutsch als Fremdsprache. Unt. Mitarb. v. Barbara Seelig, Birgit Wolf, Elke Tellenbach u.a. Berlin/ New York. Langenscheidt Basic German Vocabulary (1991). A learner's dictionary divided into subject categories with example sentences. Edited by the German as a Foreign Language Department. Berlin u.a. Langenscheidt vocabolario fondamentale di tedesco (1990). Un vocabolario didattico con frasi d'esempio e suddivisione tematica. Elaborato dalla redazione di Langenscheidt. Berlin/ München u.a. Langenscheidt vocabulaire de base allemande (1991). Dictionnaire d'apprentissage classé par thèmes avec phrases d'exemples. Réalisé par la Service d'allemand langue étrangère. Berlin u.a. Langenscheidt vocabularion fundamental del alemán (1991). Un vocabulario temático con frases-ejemplo. Elaborado por la redacción de Langenscheidt. Berlin u.a. LDOCE 1 = Longman Dictionary of Contemporary English (1978). Nachdr. 1986. Harlow. LDOCE 2 = Longman Dictionary of Contemporary English (1987). Hrsg. v. Della Summers. Harlow. LDOCE 3 = Longman Dictionary of Contemporary English (1995). Hrsg. v. Della Summers. Harlow. LDOCE 4 = Longman Dictionary of Contemporary English (2003). The Living Dictionary. Hrsg. v. Adam Gadsby. Harlow. Lexikon der Sprachwissenschaft (2008). Hrsg. v. Hadumod Bußmann. 4., durchges. u. bibliograph. erg. Aufl. unt. Mitarb. v. Hartmut Lauffer. Stuttgart. LTWDaF 1 = Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (2003). Das einsprachige Lernerwörterbuch für Einsteiger. Völlige Neuentwicklung. Hrsg. v. Professor Dr. Dieter Götz, Professor Dr. Hans Wellmann. In Zus.arb. mit der Langenscheidt-Redaktion. Berlin u.a. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 390 LTWDaF 2 = Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (2007). Das einsprachige Lernerwörterbuch für Einsteiger. Neubearbeitung. Hrsg. v. Professor Dr. Dieter Götz, Professor Dr. Hans Wellmann. In Zus.arb. mit der Langenscheidt-Redaktion. Berlin u.a. LWB 1 = Langenscheidts Großwörterbuch Deutsch als Fremdsprache (1993). Das neue einsprachige Wörterbuch für Deutschlernende. Hrsg. v. Professor Dr. Dieter Götz, Professor Dr. Günther Haensch, Professor Dr. Hans Wellmann. In Zus.arb. mit der Langenscheidt-Redaktion. Berlin u.a. LWB 2 = Langenscheidts Großwörterbuch Deutsch als Fremdsprache (1998). Das neue einsprachige Wörterbuch für alle, die Deutsch lernen. Neubearbeitung 1998. In der neuen deutschen Rechtschreibung. Hrsg. v. Professor Dr. Dieter Götz, Professor Dr. Günther Haensch, Professor Dr. Hans Wellmann. In Zus.arb. mit der Langenscheidt-Redaktion. Berlin u.a. LWB 3 = Langenscheidt Großwörterbuch Deutsch als Fremdsprache (2003). Das neue einsprachige Wörterbuch für alle, die Deutsch lernen. Hrsg. v. Professor Dr. Dieter Götz, Professor Dr. Günther Haensch, Professor Dr. Hans Wellmann. In Zus.arb. mit der Langenscheidt-Redaktion. Berlin u.a. LWB 4 = Langenscheidt Großwörterbuch Deutsch als Fremdsprache (2008). Das neue einsprachige Wörterbuch für alle, die Deutsch lernen. Neubearbeitung. Hrsg. v. Professor Dr. Dieter Götz, Professor Dr. Günther Haensch, Professor Dr. Hans Wellmann. In Zus.arb. mit der Langenscheidt-Redaktion. Berlin u.a. Meier, Helmut (1964): Deutsche Sprachstatistik. Mit einem Geleitwort v. Lutz Mackensen. Hildesheim. Metzler Lexikon Sprache (2010). 4., aktualis. u. überarb. Aufl. Hrsg. v. Helmut Glück. Mit 40 Abb. u. 12 vierfarbigen Karten. Stuttgart/ Weimar. Morgan, Bayard Quincy (1928): German Frequency Word Book. Based on Kaeding's Häufigkeitswörterbuch. New York. MR 1 = Robert, Paul (1971): Le Micro-Robert. Dictionnaire du français primordial. Paris. MR 2 = Robert, Paul (1988): Le Micro-Robert. Langue française plus noms propres, chronologie, cartes. Hrsg. v. Alain Rey. 2. Aufl. Paris. Müller, Jutta/ Bock, Heiko (1991): Langenscheidt Grundwortschatz Deutsch. Übungsbuch. Berlin u.a. OALD 1 = A Learner's Dictionary of Current English (1948). Hrsg. v. Albert Sydney Hornby, Edward Vivian Gatenby u. Hugh Wakefield. London. OALD 2 = The Advanced Learner's Dictionary of Current English (1963). Hrsg. v. Albert Sydney Hornby, Edward Vivian Gatenby u. Hugh Wakefield. London. OALD 3 = Oxford Advanced Learner's Dictionary of Current English (1974). Hrsg. v. Albert Sydney Hornby, Anthony Paul Cowie u. Jack Windsor Lewis. Oxford. Literatur 391 OALD 4 = Oxford Advanced Learner's Dictionary of Current English (1989). Hrsg. v. Albert Sydney Hornby u. Anthony Paul Cowie. Oxford. OALD 5 = Oxford Advanced Learner's Dictionary of Current English (1995). Hrsg. v. Albert Sydney Hornby u. Jonathan Crowther. Oxford. OALD 6 = Oxford Advanced Learner's Dictionary of Current English (2000). Hrsg. v. Albert Sydney Hornby u. Sally Wehmeier. Oxford. OALD 7 = Oxford Advanced Learner's Dictionary of Current English (2005). Hrsg. v. Albert Sydney Hornby u. Sally Wehmeier. Oxford. OED = The Oxford English Dictionary (1989). 2. Aufl. Prepared by John Andrew Simpson and Edmund Simon Christopher Weiner. 20 Bde. Oxford. Ortmann, Wolf Dieter (1975): Hochfrequente deutsche Wortformen I. 7 995 Wortformen der Kaeding-Zählung, rechnersortiert in alphabetischer und rückläufiger Folge, nach Häufigkeit und Hauptwortarten. Hrsg. vom Goethe-Institut, Arbeitsstelle für wissenschaftliche Didaktik, Projekt Phonothek. München. Ortmann, Wolf Dieter (1976): Hochfrequente deutsche Wortformen II. 7 995 Wortformen der Kaeding-Zählung, rechnersortiert nach Wortartzugehörigkeit und Homographie. Hrsg. vom Goethe-Institut, Arbeitsstelle für wissenschaftliche Didaktik, Projekt Phonothek. München. Ortmann, Wolf Dieter (1978): Hochfrequente deutsche Wortformen IV. 7 695/ 9 566 Wortformen der Kaeding-Zählung, rechnersortiert nach Textsorten-Distribution. Hrsg. vom Goethe-Institut, Arbeitsstelle für wissenschaftliche Didaktik, Projekt Phonothek. München. Ortmann, Wolf Dieter (1979): Hochfrequente deutsche Wortformen III. 7 995 Wortformen der Kaeding-Zählung, zu Grundformen zusammengefaßt und mit fünf neueren Häufigkeitslisten verglichen. Hrsg. vom Goethe-Institut, Arbeitsstelle für wissenschaftliche Didaktik, Projekt Phonothek. München. Palmer, Harold Edward (1964): A Grammar of English Words. One thousand English words and their pronunciation, together with information concerning the several meanings of each word, its inflections and derivatives, and the collocations and phrases into which it enters. London. Palmer, Harold Edward/ Hornby, Albert Sydney (1937): Thousand-Word English. What it is and what can be done with it. London. Pfeffer, Jay Alan (1964): Grunddeutsch. Basic (Spoken) German Word List. Grundstufe. Englewood Cliffs, NJ. Pfeffer, Jay Alan (1970a): Grunddeutsch. Basic (Spoken) German Dictionary. Englewood Cliffs, NJ. Pfeffer, Jay Alan (1970b): Grunddeutsch. Basic (Spoken) German Word List. Mittelstufe. Englewood Cliffs, NJ. Pons Basiswörterbuch Deutsch als Fremdsprache (1999). Das einsprachige Lernerwörterbuch. Vollständige Neuentwicklung 1999. Stuttgart. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 392 Pons Großwörterbuch Deutsch als Fremdsprache (2004). Stuttgart u.a. Pons Kompaktwörterbuch Deutsch als Fremdsprache (2007). Rund 42.000 Stichwörter und Redewendungen. Stuttgart u.a. Rosengren, Inger (1972): Ein Frequenzwörterbuch der deutschen Zeitungssprache. Bd. 1. Die Welt, Süddeutsche Zeitung. (= Lunder germanistische Forschungen 41). Lund. Rosengren, Inger (1977): Ein Frequenzwörterbuch der deutschen Zeitungssprache. Bd. 2. (= Lunder germanistische Forschungen 43). Lund. Ruoff, Arno (1981): Häufigkeitswörterbuch gesprochener Sprache. Gesondert nach Wortarten alphabetisch, rückläufig alphabetisch und nach Häufigkeit geordnet. Unt. Mitarb. v. Harald Fuchs, Bernhard Gersbach, Rainer Graf u. Simone Thiers. (= Idiomatica 8). Tübingen. Swenson, Rodney Newcomb (1967): A frequency count of contemporary German vocabulary based on three current leading newspapers. Minneapolis. Wahrig Großwörterbuch Deutsch als Fremdsprache (2008). Von Renate Wahrig- Burfeind. Gütersloh/ München. West, Michael Philip (1960): A general service list of English words. With semantic frequencies and a supplementary word-list for the writing of popular science and technology. 5. photolit. Aufl. London. [Erstaufl. 1936 als Part V, The general service list, of the interim report on vocabulary selection. Durchges. u. erw. Aufl. zuerst veröff. 1953]. West, Michael Philip (1971): An International Reader's Dictionary. Explaining the meaning of over 24,000 items within a vocabulary of 1,490 words. Phonetic transcriptions by Roger Kingdon. With illustrations. 16. Aufl. London. West, Michael Philip/ Endicott, James Gareth (1961): New Method Dictionary. Explaining the meaning of over 24,000 items within a vocabulary of 1,490 words. 4. Aufl. London. Zertifikat Deutsch (1999). Lernziele und Testformat. Hrsg. v. Weiterbildungs-Testsysteme GmbH, Goethe-Institut, Österreichisches Sprachdiplom Deutsch, Schweizerische Konferenz der kantonalen Erziehungsdirektoren. Frankfurt a.M. Das Zertifikat Deutsch als Fremdsprache (1991). Hrsg. vom Deutschen Volkshochschul-Verband e.V. und vom Goethe-Institut zur Pflege der deutschen Sprache im Ausland und zur Förderung der internationalen kulturellen Zusammenarbeit e.V. 4., völlig neu bearb. und erg. Aufl. O.O. Literatur 393 5.2 Forschungsliteratur Agricola, Erhard/ Schildt, Joachim/ Viehweger, Dieter (Hg.) (1982): Wortschatzforschung heute. Aktuelle Probleme der Lexikologie und Lexikographie. Leipzig. AILA81 proceedings (1981). 1. sections and workshops. Abstracts of section papers and workshop summaries edited by Bengt Sigurd and Jan Svartvik for the Sixth International Congress of Applied Linguistics, Lund, August 9-15, 1981. Lund. Aitchison, Jean (1997): Wörter im Kopf. Eine Einführung in das mentale Lexikon. (= Konzepte der Sprach- und Literaturwissenschaft 56). Tübingen. Albert, Ruth/ Koster, Cor J. (2002): Empirie in Linguistik und Sprachlehrforschung. Ein methodologisches Arbeitsbuch. Tübingen. " « $ # {ƒ-§~- ®‹ } – ‚€ ž } Erarbeitung. In: Sprachstatistik. Mit zahlreichen Skizzen, Tabellen, und Schemata im Text. (= Sammlung Akademie-Verlag 22). Berlin, S. 86-88. " « $ # {ƒ„†~- ^ ˜ ¯ _ “ °‘  stellung und Anwendung von Frequenzwörterbüchern. Lehrbuch. Übersetzt v. Werner Lehfeldt. (= Quantitative Linguistics 22). Bochum. " « $ # `±±|~-  ² ‘ _ ! - <– " « otrowski (Hg.), S. 312-324. Algeo, John (1989): Dictionaries as seen by the educated public in Great Britain and the USA. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 28-34. Altmann, Hans/ Ziegenhain, Ute (2002): Phonetik, Phonologie und Graphemik fürs Examen. (= Linguistik fürs Examen 3). Wiesbaden. Ammon, Ulrich (1993): Über die Geschichte und derzeitige Situation von Deutsch als Fremdsprache in der Welt. In: Deutsch als Fremdsprache 30, 1, S. 10-17. Andersen, Henning (1989): Markedness theory - the first 150 years. In: Mišeska ° ´ ¥ ® _~- $ ‘ ‘ ‘_ µ ° ˜ tics, Studies and Monographs 39). Berlin/ New York, S. 11-46. Andrews, Edna (1990): Markedness theory. The union of asymmetry and semiosis in language. Durham/ London. Antor, Heinz (1994): Strategien der Benutzerfreundlichkeit im modernen EFL -Wörterbuch. In: Fremdsprachen lehren und lernen 23, S. 65-83. Apresjan, Juri (2000): Systematic lexicography. Oxford. Atkins, Beryl T. (1985): Monolingual and bilingual learners' dictionaries. A comparison. In: Ilson (Hg.), S. 15-24. Atkins, Beryl T./ Varantola, Krista (1997): Monitoring dictionary use. In: International Journal of Lexicography 10, 1, S. 145. [In leicht veränderter Form veröffentlicht in: Atkins, Beryl T. Sue (Hg.): Using dictionaries. studies of dictionary use by language learners and translators. (= Lexicographica; Series Maior 88). Tübingen, S. 83-122]. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 394 Ayto, John (1983): On specifying meaning. Semantic analysis and dictionary definitions. In: Hartmann (Hg.), S. 89-98. Ayto, John (1984): The vocabulary of definition. In: Götz/ Herbst (Hg.), S. 50-62. Bald, Wolf-Dietrich (2002): Defining vocabularies. In: Gymnich, Marion/ Nünning, Ansgar/ Nünning, Vera (Hg.): Literature and linguistics: Approaches, models, and applications. Studies in honour of Jon Erickson. Trier, S. 189-222. Baldinger, Kurt (1960): Alphabetisches oder begrifflich gegliedertes Wörterbuch? In: Zeitschrift für Romanische Philologie 76, 1-2, S. 521-536. Bamberg, Günter/ Baur, Franz (2002): Statistik. 12., überarb. Aufl. (= Oldenbourgs Lehr- und Handbücher der Wirtschafts- und Sozialwissenschaften). München u.a. Barz, Irmhild (1995): Komposita im Großwörterbuch Deutsch als Fremdsprache. In: Pohl, Inge/ Ehrhardt, Horst (Hg.): Wort und Wortschatz. Beiträge zur Lexikologie. Tübingen, S. 13-24. Barz, Irmhild (2001): Wörterbücher. In: Helbig/ Götze/ Henrici/ Krumm (Hg.), S. 204- 214. Barz, Irmhild/ Schröder, Marianne (1994): Das andere Wörterbuch. In: Deutsch als Fremdsprache 31, 3, S. 131-138. Barz, Irmhild/ Schröder, Marianne (1996): Einleitung. In: Barz/ Schröder (Hg.), S. III-VIII. Barz, Irmhild/ Schröder, Marianne (Hg.) (1996): Das Lernerwörterbuch Deutsch als Fremdsprache in der Diskussion. (= Sprache - Literatur und Geschichte 12). Heidelberg. Battenburg, John D. (1991): English monolingual learners' dictionaries. A user-oriented study. (= Lexicographica; Series Maior 39). Tübingen. Battenburg, John D. (1994): Pioneer in English lexicography for language learners: Michael Philip West. In: Dictionaries 15, S. 132-148. Baxter, James (1980): The dictionary and vocabulary behavior. A single word or a handful? In: Tesol Quarterly 14, 3, S. 325-336. Beckmann, Susanne/ König, Peter-Paul/ Wolf, Georg (Hg.) (2000): Sprachspiel und Bedeutung. Festschr. für Franz Hundsnurscher zum 65. Geburtstag. Tübingen. Béjoint, Henri (1981): The foreign student's use of monolingual English dictionaries. A study of language needs and reference skills. In: Applied Linguistics 2, 3, S. 207-222. Béjoint, Henri (1994): Tradition and innovation in modern English dictionaries. (= Oxford Studies in Lexicography and Lexicology). Oxford. [Später veröff. als: Béjoint, Henri (2000): Modern lexicography. An introduction. Oxford]. Béjoint, Henri/ Moulin, André (1987): The place of the dictionary in an EFL programme. In: Cowie (Hg.), S. 97-114. Literatur 395 Benson, Morton/ Benson, Evelyn/ Ilson, Robert (1986): Lexicographic description of English. (= Studies in Language Companion Series 14). Amsterdam/ Philadelphia. Bergenholtz, Henning (2005): Falsche und richtige lexikographische Definitionen. In: Gottlieb, Henrik/ Mogensen, Jens Erik/ Zettersten, Arne (Hg.): Symposium on Lexicography XI . Proceedings of the Eleventh International Symposium on Lexicography May 2-4, 2002 at the University of Copenhagen. (= Lexicographica; Series Maior 115). Tübingen, S. 125-132. Bergenholtz, Henning/ Tarp, Sven (1995): Manual of specialised lexicography. The preparation of specialised dictionaries. With contributions by Grete Duvå, Anna- Lise Laursen, Sandro Nielsen, Ole Norling-Christensen, Jette Pedersen. (= Benjamins Translation Library 12). Amsterdam/ Philadelphia. Berlin-Brandenburgische Akademie der Wissenschaft (2010): Textbasis. Internet: www.dwds.de/ textbasis (Stand: 28.10.2010). Best, Karl-Heinz (1998): Zur Interaktion der Wortarten in Texten. In: Papiere zur Linguistik 58, 1, S. 83-95. Bibliographisches Institut & F.A. Brockhaus AG (2008): Duden-Hueber - Wörterbuch Deutsch als Fremdsprache. Deutsch für die Grund- und Mittelstufe. Internet: www.duden.de/ produkte/ detail.php? nid=33&isbn=3-411-70511-6 (Stand: 10.12.2008). Bibliographisches Institut & F.A. Brockhaus AG (2010): Duden-Hueber - Wörterbuch Deutsch als Fremdsprache. Der Inhalt kurz und knapp. Internet: www.duden. de/ produkte/ detail.php? id=205&nid=&marg= (Stand: 28.10.2010). Bogaards, Paul (1991): Dictionnaires pédagogiques et apprentissage du vocabulaire. In: Cahiers de Lexicologie 59, 2, S. 93-107. Bogaards, Paul (2002): The use of the de Gruyter Wörterbuch Deutsch als Fremdsprache for receptive purposes. In: Wiegand (Hg.), S. 647-660. Boguraev, Bran/ Briscoe, Ted (Hg.) (1989): Computational lexicography for natural language processing. London/ New York. Bongers, Herman (1947): The history and principles of vocabulary control. As it affects the teaching of foreign languages in general and of English in particular. Woerden. Bosque, Ignacio (1982): Sobre la teoría de la definición lexicográfica. In: Verba 9, S. 105-123. Bredemeier, Jürgen/ Jansen, Louise M./ Petöfi, János Sandor (1977): Überlegungen zu den syntaktischen und semantischen Informationen im Wörterbuch einer natürlichen Sprache. In: Petöfi, János Sandor/ Bredemeier, Jürgen (Hg.): Das Lexikon in der Grammatik - die Grammatik im Lexikon. 1. Halbbd. (= Papiere zur Textlinguistik 13, 1). Hamburg, S. 65-88. Bright, John A./ McGregor, Gordon P. (1970): Teaching English as a second language. Theory and techniques for the secondary stage. London. Brown, Keith (Hg.) (2006): Encyclopedia of language & linguistics. 2. Aufl. Amsterdam u.a. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 396 Cambridge University Press (2010): Cambridge international corpus. Internet: http: / / www.cambridge.org/ de/ elt/ catalogue/ subject/ custom/ item3637700/ Cambridge- International-Corpus-Cambridge-International-Corpus (Stand: 28.10.2010). Carnegie Corporation of New York (2010): About Carnegie Corporation. Internet: http: / / www.carnegie.org/ sub/ about/ index.html (Stand: 28.10.2010). Carstensen, Broder (1980): Besprechungen. Dictionary of Contemporary English. In: Amerikastudien 25, 1, S. 102-106. Carstensen, Broder (1988): Ein wichtiges neues einsprachiges englisches Wörterbuch. In: Neusprachliche Mitteilungen aus Wissenschaft und Praxis 41, 1, S. 43-47. Carter, Ronald (1989): Review articles. LDOCE and COBUILD. In: International Journal of Lexicography 2, 1, S. 30-43. Carter, Ronald (1998): Vocabulary. Applied linguistic perspectives. 2. Aufl. London/ New York. Carter, Ronald/ McCarthy, Michael (1988): Vocabulary and language teaching. (= Applied Linguistics and Language Study 9, 3). London/ New York. Chmela, Holli (2006): Using fewer words to deliver the news. In: Süddeutsche Zeitung. 14. August 2006, S. 4. [Artikel übern. aus New York Times]. Corino, Elisa/ Marello, Carla/ Onesti, Cristina (Hg.) (2006): Proceedings of the 12th EURALEX International Congress. (Atti del XII Congresso Internazionale di Lessicografia). EURALEX 2006, Turin, Italy, September 6-9, 2006. Bd. 1. Turin. Couturat, Louis (1961): Opuscules et fragments inédits par Leibniz. Extraits des manuscrits de la Bibliothèque Royale de Hanovre. Unveränd. reprograf. Nachdr. der Ausgabe Paris 1903. Hildesheim. Cowie, Anthony Paul (1983a): On specifying grammar. On specifying grammatical form and function. In: Hartmann (Hg.), S. 99-107. Cowie, Anthony Paul (1983b): The pedagogical/ learner's dictionary. 1. English dictionaries for the foreign learner. In: Hartmann (Hg.), S. 135-144. Cowie, Anthony Paul (Hg.) (1987): The dictionary and the language learner. Papers from the EURALEX seminar at the university of Leeds, 1-3 April 1985. (= Lexicographica; Series Maior 17). Tübingen. Cowie, Anthony Paul (1989): Learners' dictionaries. Recent advances and developments. In: Tickoo (Hg.), S. 42-51. Cowie, Anthony Paul (1990): Language as words. Lexicography. In: Collinge, Neville E. (Hg.): An encyclopaedia of language. London/ New York, S. 671-700. Cowie, Anthony Paul (1999a): Learners' dictionaries in a historical and a theoretical perspective. In: Herbst/ Popp (Hg.), S. 3-13. Cowie, Anthony Paul (1999b): English dictionaries for foreign learners. A history. Oxford. Literatur 397 Cruse, David Alan (1986): Lexical semantics. (= Cambridge Textbooks in Linguistics). Cambridge. Cruse, David Alan (2002): Paradigmatic relations of inclusion and identity III. Synonymy. In: Lexikologie - Lexicology. Ein internationales Handbuch zur Natur und Struktur von Wörtern und Wortschätzen. Hrsg. v. David Alan Cruse, Franz Hundsnurscher, Michael Job, Peter Rolf Lutzeier. 1. Halbbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft 21.1). Berlin/ New York, S. 485-497. Crystal, David (1986): The ideal dictionary, lexicographer and user. In: Ilson (Hg.), S. 72-81. D'Alembert, Jean Le Rond (1997): Einleitung zur Enzyklopädie. Durchgesehen und mit einer Einleitung hrsg. v. Günther Mensching. (= Philosophische Bibliothek 473). Hamburg. Derrida, Jacques (1990): Die différance. In: Engelmann, Peter (Hg.): Postmoderne und Dekonstruktion. Texte französischer Philosophen der Gegenwart. Stuttgart, S. 76-113. Diab, Turki (1990): Pedagogical lexicography. A case study of Arab nurses as dictionary users. (= Lexicographica; Series Maior 31). Tübingen. Diekmann, Andreas (2010): Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. (= rowohlts enzyklopädie 55678). Reinbek. [= 4. Aufl. der vollst. überarb. u. erw. Neuausg. v. August 2007]. Dörflinger, Johannes (1976): Die Geographie in der „Encyclopédie“. Eine wissenschaftsgeschichtliche Studie. (= Österreichische Akademie der Wissenschaften, Philosophisch-historische Klasse, Sitzungsberichte 304, 1. Abhandlung; Veröffentlichungen der Kommission für Geschichte der Mathematik, Naturwissenschaften und Medizin 17). Wien. Drosdowski, Günther/ Henne, Helmut/ Wiegand, Herbert Ernst (1977): Nachdenken über Wörterbücher. Korr. Nachdr. Mannheim u.a. Ek, Jan Ate van/ Trim, John Leslie Melville (1984): Across the threshold. Readings from the modern languages projects of the council of Europe. Oxford u.a. Ek, Jan Ate van/ Trim, John Leslie Melville (1998): Threshold 1990. Cambridge. Ellegård, Alvar (1978): On dictionaries for language learners. In: Moderna Språk 72, S. 225-242. Engelberg, Stefan/ Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4., überarb. u. erw. Aufl. (= Stauffenburg Einführungen 14). Tübingen. Ernst, Gerhard (1979): Das Frequenzwörterbuch - ein Hilfsmittel der vergleichenden Sprachcharakteristik? In: Ernst, Gerhard/ Stefenelli, Arnulf (Hg.): Sprache und Mensch in der Romania. Heinrich Kuen zum 80. Geburtstag. Wiesbaden, S. 21-43. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 398 Europarat, Rat für kulturelle Zusammenarbeit (2001): Gemeinsamer europäischer Referenzrahmen für Sprachen: lernen, lehren, beurteilen. Council for Cultural Cooperation, Education Committee, Modern Language Division, Strasbourg. Übersetzt v. Jürgen Quetz in Zusammenarbeit mit Raimund Schieß u. Ulrike Sköries. Übersetzung der Skalen: Günther Schneider. Hrsg. vom Goethe-Institut, Inter Nationes, der Ständigen Konferenz der Kulturminister der Länder in der Bundesrepublik Deutschland ( KMK ), der Schweizerischen Konferenz der Kantonalen Erziehungsdirektoren ( EDK ) u. dem österreichischen Bundesministerium für Bildung, Wissenschaft und Kultur ( BMBWK ). Berlin u.a. Fandrych, Christian/ Thurmair, Maria (1994): Ein Interpretationsmodell für Nominalkomposita: linguistische und didaktische Überlegungen. In: Deutsch als Fremdsprache 31, 1, S. 34-45. Finkenstaedt, Thomas/ Schröder, Konrad (1992): Sprachen im Europa von morgen. Berlin u.a. Fleischer, Wolfgang (1997): Grundsatzfragen der Wortbildung aus germanistischer ^ _ ! - ¶ # · ž · ® _~ ^_ †`¦¸±_ Fox, Gwyneth (1989): A vocabulary for writing dictionaries. In: Tickoo (Hg.), S. 153-171. Friederich, Wolf (1980): Rezensionen. Dictionary of Contemporary English. In: Zielsprache Englisch 10, 2, S. 30-31. Fries, Charles Carpenter/ Alice Aileen Traver (1950): English word lists. A study of their adaptability for instruction. Prepared for the committee on modern languages of the American Council on Education. Ann Arbor. Frumkina, Reveka M. (1964): Allgemeine Probleme der Häufigkeitswörterbücher. In: IRAL - International Review of Applied Linguistics in Language Teaching II, 4, S. 235-247. Fuhrhop, Nanna (2006): Orthografie. 2. aktual. Aufl. Heidelberg. Galisson, Robert (1987): De la lexicographie de dépannage à la lexicographie d'apprentissage. Pour une politique de rénovation des dictionnaires monolingues de FLE à l'école. In: Cahiers de Lexicologie 51, S. 95-118. Geeraerts, Dirk (2003): Chapter 2. Descriptive lexicography. 2.2 meaning and definition. In: Sterkenburg (Hg.), S. 83-93. Goddard, Cliff (1989a): Issues in natural semantic metalanguage. In: Quaderni di Semantica 10, 1, S. 51-64. Goddard, Cliff (1989b): The goals and limits of semantic representation. In: Quaderni di Semantica 10, 2, S. 297-308. Goddard, Cliff (1998): Semantic analysis. A practical introduction. Oxford. Goddard, Cliff/ Wierzbicka, Anna (1994): Semantic and lexical universals. Theory and empirical findings. (= Studies in Language Companion Series 25). Amsterdam/ Philadelphia. Literatur 399 Goethe-Institut (2010): Zertifikat Deutsch. Internet: www.goethe.de/ lrn/ prj/ pba/ bes/ gzd/ deindex.htm (Stand: 28.10.2010). Gordon, William Terrence (1994): Introduction. In: Ogden, Charles Kay: From significs to orthology. (= C.K. Ogden and Linguistics 1). London, S. VII-XXVI. Götz, Dieter (1999): On some differences between English and German (with respect to lexicography). In: Herbst/ Popp (Hg.), S. 221-228. Götz, Dieter/ Haensch, Günther (1998): Langenscheidts Großwörterbuch Deutsch als Fremdsprache: Ein-, Aus-, Rückblick. In: Wiegand (Hg.), S. 345-357. Götz, Dieter/ Herbst, Thomas (Hg.) (1984): Theoretische und praktische Probleme der Lexikographie. 1. Augsburger Kolloquium, Professor Dr. Günther Haensch zum 60. Geburtstag gewidmet. München. Gougenheim, Georges/ Michéa, René/ Rivenc, Paul/ Sauvageot, Aurélien (1956): L'élaboration du français élémentaire. Paris. Gougenheim, Georges/ Michéa, René/ Rivenc, Paul/ Sauvageot, Aurélien (1964): L'élaboration du français fondamental (1 er Degré). Étude sur l'établissement d'un vocabulaire et d'une grammaire de base. Nouvelle édition refondue et augmentée. Paris. Greenberg, Joseph H. (2005): Language universals. With a special reference to feature hierarchies. With a preface by Martin Haspelmath. Berlin/ New York. Haensch, Günther (1991): Die mehrsprachigen Wörterbücher und ihre Probleme. In: Hausmann, Franz Josef/ Reichmann, Oskar/ Wiegand, Herbert Ernst/ Zgusta, Ladislav (Hg.): Wörterbücher - Dictionaries - Dictionnaires. Ein internationales Handbuch zur Lexikographie. 3. Teilbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft 5.3). Berlin/ New York, S. 2909-2937. Haensch, Günther (1997): Los diccionarios del español en el umbral del siglo XXI . Problemas actuales de la lexicografía - Los distintos tipos de diccionarios; una guía para el usario - Bibliografía de publicaciones sobre lexicografía. (= Obras de referencia 10). Salamanca. Hallsteinsdóttir, Erla (2000): Aspekte des Verstehens okkasioneller Wortbildungsprodukte in der Fremdsprache Deutsch. In: Barz, Irmhild/ Schröder, Marianne/ Fix, Ulla (Hg.): Praxis- und Integrationsfelder der Wortbildungsforschung. (= Sprache - Literatur und Geschichte 18). Heidelberg, S. 187-197. Hanks, Patrick (1979): To what extent does a dictionary definition define? In: Hartmann, Reinhard Rudolf Karl (Hg.): Dictionaries and their users. Papers from the 1978 B.A.A.L. Seminar on Lexicography. (= Exeter Linguistic Studies 4). Exeter, S. 32-38. Hanks, Patrick (1987): Definitions and explanations. In: Sinclair, John (Hg.): Looking up. An account of the COBUILD project in lexical computing and the development of the Collins COBUILD English Language Dictionary. London/ Glasgow, S. 116-136. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 400 Harkin, Duncan (1957): The history of word counts. In: Babel 3, 3, S. 113-124. Harras, Gisela (1977): Überlegungen zur Anlage von Artikeln in einsprachigen Wörterbüchern. Grundsätzliches und ein Beispiel: ein Wörterbuchartikel für das Lemma gut. In: Germanistische Linguistik 5, 6, S. 153-188. Harras, Gisela (1986): Bedeutungsangaben im wörterbuch. Scholastische übungen für linguisten oder verwendungsregeln für benutzer? In: Schöne, Albrecht (Hg.): Kontroversen, alte und neue: Akten des VII. Internationalen Germanisten-Kongresses, Göttingen 1985. Bd. 3: Textlinguistik contra Stilistik? Wortschatz und Wörterbuch. Grammatische oder pragmatische Organisation von Rede? Hrsg. v. Walter Weiss, Herbert Ernst Wiegand, Marga Reis. Tübingen, S. 134-143. Harras, Gisela (Hg.) (1988): Das Wörterbuch. Artikel und Verweisstrukturen. Jahrbuch 1987 des Instituts für Deutsche Sprache. (= Sprache der Gegenwart 74). Düsseldorf. Hartmann, Reinhard Rudolf Karl (Hg.) (1983): Lexicography. Principles and practice. The language centre, University of Exeter, UK. (= Applied Language Studies 5). London u.a. Hartmann, Reinhard Rudolf Karl (Hg.) (1984): LEXeter '83. Proceedings. Papers from the International Conference on Lexicography at Exeter, 9-12 September 1983. (= Lexicographica; Series Maior 1). Tübingen. Hartmann, Reinhard Rudolf Karl (1988): The Learner's dictionary: Traum oder Wirklichkeit? In: Hyldgaard-Jensen, Karl/ Zettersten, Arne (Hg.): Symposium on Lexicography III . Proceedings of the Third International Symposium on Lexicography May 14-16, 1986 at the university of Copenhagen. (= Lexicographica; Series Maior 19).Tübingen, S. 215-235. Hartmann, Reinhard Rudolf Karl (1994): Vier Aspekte der Wörterbuchforschung und ihre Relevanz für die zweisprachige Lexikographie. In: Hyvärinen/ Klemmt (Hg.), S. 9-27. Hausmann, Franz Josef (1974): Was ist und was soll ein Lernwörterbuch? In: Zeitschrift für französische Sprache und Literatur 84, 2, S. 97-129. Hausmann, Franz Josef (1984): Diderot lexicographe. In: Heidenreich, Titus (Hg.): Denis Diderot. 1713-1784. Zeit - Werk - Wirkung. Zehn Beiträge. (= Erlanger Forschungen, Reihe A Geisteswissenschaften 34). Erlangen, S. 53-61. Hausmann, Franz Josef (1985): Lexikographie. In: Schwarze/ Wunderlich (Hg.), S. 367-411. Hausmann, Franz Josef (1989a): Die gesellschaftlichen Aufgaben der Lexikographie in Geschichte und Gegenwart. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 1-19. Hausmann, Franz Josef (1989b): Das Wörterbuch im Urteil der gebildeten Öffentlichkeit in Deutschland und den romanischen Ländern. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 19-28. Literatur 401 Hausmann, Franz Josef (1989c): Die Markierung im allgemeinen einsprachigen Wörterbuch: eine Übersicht. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 649-657. Hausmann, Franz Josef (1989d): Kleine Weltgeschichte der Metalexikographie. In: Wiegand, Herbert Ernst (Hg.): Wörterbücher in der Diskussion. Vorträge aus dem Heidelberger Lexikographischen Kolloquium. (= Lexicographica; Series Maior 27). Tübingen, S. 75-109. Hausmann, Franz Josef (1989e): Wörterbuchtypologie. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 968-981. Hausmann, Franz Josef (1990): La définition est-elle utile? Regard sur les dictionnaires allemands, anglais et français. In: Chaurand, Jacques/ Mazière, Francine (Hg.): La définition. Actes du colloque ‘la définition’, organisé par le CÈLEX (Centre d'Études du Lexique) de l'Université Paris-Nord à Paris, les 18 et 19 novembre 1988. Paris, S. 225-235. Hausmann, Franz Josef/ Reichmann, Oskar/ Wiegand, Herbert Ernst/ Zgusta, Ladislav (Hg.) (1989): Wörterbücher - Dictionaries - Dictionnaires. Ein internationales Handbuch zur Lexikographie. 1. Teilbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft 5.1). Berlin/ New York. Hausmann, Franz Josef/ Reichmann, Oskar/ Wiegand, Herbert Ernst/ Zgusta, Ladislav (Hg.) (1990): Wörterbücher - Dictionaries - Dictionnaires. Ein internationales Handbuch zur Lexikographie. 2. Teilbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft 5.2). Berlin/ New York. Heath, David/ Herbst, Thomas (1988): Longman Dictionary of Contemporary English (new edition). In: English Language Teaching Journal 42, 4, S. 315-317. Heimbecher, Jessica (2007): Reanalyse fremdsprachlicher Elemente und ihre Integration in das Wortbildungssystem des Deutschen. Diss., Univ. Leipzig. CD-ROM. Helbig, Gerhard/ Götze, Lutz/ Henrici, Gert/ Krumm, Hans-Jürgen (Hg.) (2001): Deutsch als Fremdsprache. Ein internationales Handbuch. 1. Halbbd. (= Handbücher zur Sprach- und Kommunikationswissenschaft 19.1). Berlin/ New York. Henne, Helmut (1972): Semantik und Lexikographie. Untersuchungen zur lexikalischen Kodifikation der deutschen Sprache. (= Studia Linguistica Germanica 7). Berlin/ New York. Henne, Helmut (1976): Prinzipien einsprachiger Lexikographie. In: Probleme der Lexikologie und Lexikographie, S. 95-117. Henne, Helmut (1977): Nachdenken über Wörterbücher: Historische Erfahrungen. In: Drosdowski/ Henne/ Wiegand, S. 7-49. Henne, Helmut (1980): Lexikographie. In: Althaus, Hans Peter/ Henne, Helmut/ Wiegand, Herbert Ernst (Hg.): Lexikon der Germanistischen Linguistik. 2., vollständig neu bearb. u. erw. Aufl. Tübingen, S. 778-787. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 402 Herbst, Thomas (1986): Defining with a controlled defining vocabulary in foreign learners' dictionaries. In: Lexicographica 2, S. 101-119. Herbst, Thomas (1990): Dictionaries for foreign language teaching: English. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 1379-1385. Herbst, Thomas (1996): On the way to the perfect learners' dictionary: a first comparison of OALD5, LDOCE3, COBUILD2 and CIDE. In: International Journal of Lexicography 9, 4, S. 321-357. Herbst, Thomas (1998): Langenscheidts Großwörterbuch Deutsch als Fremdsprache und die britische Lernerlexikographie. In: Wiegand (Hg.), S. 20-33. Herbst, Thomas/ Klotz, Michael (2003): Lexikographie. (= UTB 8263). Paderborn u.a. Herbst, Thomas/ Popp, Kerstin (Hg.) (1999): The perfect learners' dictionary (? ). (= Lexicographica; Series Maior 95). Tübingen. Herbst, Thomas/ Stein, Gabriele (1987): Dictionary-using skills. A plea for a new orientation in language teaching. In: Cowie (Hg.), S. 115-127. Hernández, Humberto (1989): Los diccionarios de orientación escolar. Contribución al estudio de la lexicografía monolingüe española. With an English summary. (= Lexicographica; Series Maior 28). Tübingen. Heusinger, Siegfried (2004): Die Lexik der deutschen Gegenwartssprache. Eine Einführung. (= UTB 2491). München. Hippmann, Hans-Dieter (2003): Statistik. Lehrbuch für Wirtschaft- und Sozialwissenschaftler. 3., überarb. u. erw. Aufl. Stuttgart. Hoffmann, Hans G. (1979): Mindestens ein Jahrzehntwerk. In: Zielsprache Englisch 9, 2, S. 11. Howatt, Anthony Philip Reid (1984): A history of English language teaching. Oxford. Hufeisen, Britta (2001): Deutsch als Tertiärsprache. In: Helbig/ Götze/ Henrici/ Krumm (Hg.), S. 648-653. Huneke, Hans-Werner/ Steinig, Wolfgang (2005): Deutsch als Fremdsprache. Eine Einführung. 4., aktual. u. erg. Aufl. (= Grundlagen der Germanistik 34). Berlin. Hurk, Inge van den/ Meijs, Willem (1986): The dictionary as corpus. Analyzing LDOCE's definition-language. In: Aarts, Jan/ Meijs, Willem (Hg.): Corpus linguistics II. New studies in the analysis and exploitation of computer corpora. (= Costerus, New Series 57). Amsterdam, S. 99-125. Hyldgaard-Jensen, Karl/ Zettersten, Arne (Hg.) (1985): Symposium on lexicography II. Proceedings of the Second International Symposium on Lexicography May 16- 17, 1984 at the university of Copenhagen. (= Lexicographica; Series Maior 5). Tübingen. Literatur 403 Hyvärinen, Irma/ Klemmt, Rolf (Hg.) (1994): Von Frames und Slots bis Krambambuli. Beiträge zur zweisprachigen Lexikographie. Referate der zweiten internationalen Lexikographiekonferenz Jyväskyla, Finnland 24.-26.3.1994. (= Studia Philologica Jyväskyläensia 34). Jyväskyla. Ilson, Robert (1985): Introduction. In: Ilson (Hg.), S. 1-6. Ilson, Robert (Hg.) (1985): Dictionaries, lexicography and language learning. (= English Language Teaching Documents 120). Oxford u.a. Ilson, Robert (1986): General English dictionaries for foreign learners: Explanatory techniques in dictionaries. In: Lexicographica 2, S. 214-222. Ilson, Robert (Hg.) (1986): Lexicography. An emerging international profession. (= The Fulbright Papers Proceedings of Colloquia 1). Manchester. Ilson, Robert (1987): Towards a taxonomy of dictionary definitions. In: Ilson (Hg.), S. 61-73. Ilson, Robert (Hg.) (1987): A spectrum of lexicography. Papers from AILA Brussels 1984. The survey of English usage, university college London. Amsterdam/ Philadelphia. Institut für Deutsche Sprache (2006): Deutsche Rechtschreibung. Regeln und Wörterverzeichnis. Entsprechend den Empfehlungen des Rats für deutsche Rechtschreibung. Überarbeitete Fassung des amtlichen Regelwerks 2004. Internet: www.ids -mannheim.de/ reform/ regeln2006.pdf (Stand: 28.10.2010). Institut für Deutsche Sprache (2007a): Korpora der geschriebenen Sprache. Bonner Zeitungskorpus (bzk). Internet: www.ids-mannheim.de/ kl/ projekte/ korpora/ archiv/ bzk. html (Stand: 28.10.2010). Institut für Deutsche Sprache (2007b): Korpora der geschriebenen Sprache. Mannheimer Korpus 1 (mk1) und Mannheimer Korpus 2 (mk2). Internet: www.ids-mannheim. de/ kl/ projekte/ korpora/ archiv/ mk.html (Stand: 28.10.2010). Institut für Deutsche Sprache (2008): Projekte des IDS . Internet: www.ids-mannheim.de/ projekte (Stand: 28.10.2010). Jackendoff, Ray (1983): Semantics and cognition. (= Current Studies in Linguistics Series 8). Cambridge, MA. Jackendoff, Ray (2002): Foundations of language. Brain, meaning, grammar, evolution. Oxford. Jain, Mahavir P. (1978): Review article. In: Indian Journal of Applied Linguistics 4, 1, S. 86-104. Jain, Mahavir P. (1981): On meaning in the foreign learner's dictionary. In: Applied Linguistics 2, 3, S. 274-286. Jansen, Jacques/ Mergeai, Jean-Paul/ Vanandroye, Jocelyne (1987): Controlling LDOCE's controlled vocabulary. In: Cowie (Hg.), S. 78-94. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 404 Jehle, Günter (1990a): Das englische und französische Lernerwörterbuch in der Rezension. Theorie und Praxis der Wörterbuchkritik. (= Lexicographica; Series Maior 30). Tübingen. Jehle, Günter (1990b): Grammatik und Kollokationen im Longman Dictionary of Contemporary English. In: Die Neueren Sprachen 89, 5, S. 498-507. Jendreyzik, Dietmar (2003): Lehrer Alfred Haase. Internet: www.fabryaner.de/ memories/ zeitung/ haase.htm (Stand: 28.10.2010). Kachru, Braj Behariv/ Kahane, Henry (Hg.) (1995): Cultures, ideologies, and the dictionary. Studies in honor of Ladislav Zgusta. (= Lexicographica; Series Maior 64). Tübingen. Kempcke, Günter (1982): Lexikologie, lexikographische Theorie und lexikographische Praxis. In: Agricola/ Schildt/ Viehweger (Hg.), S. 42-61. Kempcke, Günter (1983): Aktuelle theoretische Probleme der lexikographischen Praxis. In: Schildt/ Viehweger (Hg.), S. 157-165. Kempcke, Günter (1992): Organisationsprinzipien und Informationsangebote in einem Lernerwörterbuch. In: Brauße, Ursula/ Viehweger, Dieter (Hg.): Lexikontheorie und Wörterbuch. Wege der Verbindung von lexikologischer Forschung und lexikographischer Praxis. (= Lexicographica; Series Maior 44). Tübingen, S. 165-243. Kempcke, Günter (1996): Zur Makro- und Mikrostruktur in Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In: Barz/ Schröder (Hg.), S. 115-128. Kernerman, Ali (2006): Summing up two decades of pedagogic lexicography. In: Corino/ Marello/ Onesti (Hg.), S. 1263-1269. Kharma, Nayef N. (1985): Wanted - a brand-new type of learner's dictionary. In: Multilingua 4, 2, S. 85-90. Kiefer, Ferenc/ Sterkenburg, Piet van (2003): Chapter 7. Examples of design and production criteria for major dicitionaries. 7.3 Design and production of monolingual dictionaries. In: Sterkenburg (Hg.), S. 350-365. Kirkpatrick, Betty (1985): A lexicographical dilemma. Monolingual dictionaries for the native speaker and for the learner. In: Ilson (Hg.), S. 7-13. Klare, Johannes (1988): Zur Problematik der Wortexplikationen im einsprachigen französischen Wörterbuch. In: Theorie und Praxis der ein- und mehrsprachigen romanischen Lexikographie, S. 22-26. Klein, Eberhard/ Randow, Elise von (1990): Die Darstellung von Verben in neueren einsprachigen Lernerwörterbüchern des Englischen. In: Die Neueren Sprachen 89, 4, S. 374-388. Klosa, Annette (2004): Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache und Duden Wörterbuch Deutsch als Fremdsprache. Ein kritischer Vergleich. In: Lexicographica 20, S. 271-303. Literatur 405 Knowles, Francis (1987): Möglichkeiten des Computereinsatzes in der Sprachlexikographie. In: Wiegand, Herbert Ernst (Hg.): Theorie und Praxis des lexikographischen Prozesses bei historischen Wörterbüchern. Akten der Internationalen Fachkonferenz Heidelberg, 3.6.-5.6.1986. Im Auftrag des Forschungsschwerpunktes Lexikographie an der Neuphilologischen Fakultät der Universität Heidelberg. (= Lexicographica; Series Maior 23). Tübingen, S. 11-33. Köhler, Reinhard (2005): Statistische Methoden in der Lexikologie. In: Cruse, David Alan/ Hundsnurscher, Franz/ Job, Michael/ Lutzeier, Peter Rolf (Hg.): Lexikologie - Lexicology. Ein internationales Handbuch zur Natur und Struktur von Wörtern und Wortschätzen. (= Handbücher zur Sprach- und Kommunikationswissenschaft 21.2). 2. Halbbd. Berlin/ New York, S. 953-963. Köhler, Reinhard/ Altmann, Gabriel/ Piotrowski, Rajmund G. (Hg.) (2005): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. (= Handbücher zur Sprach- und Kommunikationswissenschaft 27). Berlin/ New York. Kolde, Gottfried (2000): „Hunde(artige? ) werden in der Gefangenschaft rasch zahm“. Über Schwierigkeiten der lexikographischen Definition trivialer Alltagskonzepte. In: Beckmann/ König/ Wolf (Hg.), S. 81-92. Kolde, Gottfried (2001): Zur Geschichte der lexikographischen Definition im allgemeinen einsprachigen Wörterbuch des Deutschen. In: Schierholz, Stefan J. (Hg.): Die deutsche Sprache in der Gegenwart. Festschr. für Dieter Cherubim zum 60. Geburtstag. In Zus.arb. mit Eilika Fobbe, Stefan Goes u. Rainer Knirsch. Frankfurt a.M. u.a., S. 279-289. Konerding, Klaus-Peter/ Lehr, Andrea (Hg.) (1997): Linguistische Theorie und lexikographische Praxis. Symposiumsvorträge, Heidelberg 1996. (= Lexicographica; Series Maior 82). Tübingen. Köster, Lutz/ Neubauer, Fritz (1994): Langenscheidts Großwörterbuch Deutsch als Fremdsprache und seine Benutzer. In: Fremdsprachen lehren und lernen 23, S. 221-234. Kostrzewa, Frank (1994): Worterklärungen durch Beispiele. Merkmale verstehens- und behaltensfördernder kontextueller Bedeutungserklärungen. (= Deutsche Hochschulschriften 1039). Egelsbach/ Frankfurt a.M./ Washington. Krohn, Dieter (1992): Grundwortschätze und Auswahlkriterien. Metalexikographische und fremdsprachendidaktische Studien zur Struktur und Funktion deutscher Grundwortschätze. (= Göteborger Germanistische Forschungen 34). Göteborg. Kromann, Hans-Peder (1992): Wörterbücher und ihre Benutzer. Wörterbücher mit Deutsch als Objektsprache. In: Ágel, Vilmos/ Hessky, Regina (Hg.): Offene Fragen - offene Antworten in der Sprachgermanistik. (= Reihe Germanistische Linguistik 128). Tübingen, S. 151-164. Kromann, Hans-Peder (1995): Deutsche Wörterbücher aus der Perspektive eines fremdsprachigen Benutzers. In: Popp (Hg.), S. 501-512. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 406 Kühn, Peter (1979): Der Grundwortschatz. Bestimmung und Systematisierung. (= Reihe Germanistische Linguistik 17). Tübingen. Kühn, Peter (1989): Typologie der Wörterbücher nach Benutzungsmöglichkeiten. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 111-127. Kühn, Peter (1998): Langenscheidts Großwörterbuch Deutsch als Fremdsprache und die deutschen Wörterbücher. In: Wiegand (Hg.), S. 34-60. Kühn, Peter (2001): Blume: ist Kind von Wiese. Bedeutungserläuterungen in der Lernerlexikographie. In: Lehr, Andrea/ Kammerer, Matthias/ Konerding, Klaus-Peter/ Storrer, Angelika/ Thimm, Caja/ Wolski, Werner (Hg.): Sprache im Alltag. Beiträge zu neuen Perspektiven in der Linguistik. Herbert Ernst Wiegand zum 65. Geburtstag gewidmet. Berlin/ New York, S. 547-561. Landau, Sidney I. (2001): Dictionaries. The art and craft of lexicography. 2. Aufl. Cambridge. Langacker, Ronald W. (1987): Foundations of cognitive grammar. Bd. 1. Theoretical prerequisites. Stanford. Latzel, Sigbert (1993): Wortschatz = Sprachschatz. Zur Wortschatzarbeit im Bereich „Deutsch als Fremdsprache“. In: Nouveaux Cahiers d'Allemand 11, 2, S. 169-217. Laufer, Batia/ Kimmel, Michael (1997): Bilingualised dictionaries. How learners really use them. In: System 25, 3, S. 361-369. Lemberg, Ingrid (1998): Lexikographische Erläuterungen im Deutschen Rechtswörterbuch: Gestaltungsmuster in einem Wörterbuch der älteren deutschen Rechtssprache. In: Wiegand, Herbert Ernst (Hg.): Wörterbücher in der Diskussion III. Vorträge aus dem Heidelberger Lexikographischen Kolloquium. (= Lexicographica; Series Maior 84). Tübingen, S. 133-154. Lemnitzer, Lothar/ Zinsmeister, Heike (2010): Korpuslinguistik. Eine Einführung. 2. durchges. u. aktualis. Aufl. Tübingen. Lenz, Barbara (1993): Probleme der Kategorisierung deutscher Partizipien. In: Zeitschrift für Sprachwissenschaft 12, 1, S. 39-76. Lenz, Susanne (2000): Korpuslinguistik. (= Studienbibliographien Sprachwissenschaft 32). Tübingen. Lerchner, Gotthard (1996): Informationen über die kulturspezifisch-pragmatische Markiertheit von lexikalischen Ausdrücken im Lernerwörterbuch. In: Barz/ Schröder (Hg.), S. 129-146. Löbner, Sebastian (2003): Semantik. Eine Einführung. Berlin/ New York. Lorge, Irving (1938): Semantic count of English words. New York: The Institute of Educational Research, Teachers College, Columbia University. Columbia. Lorge, Irving (1949): A semantic count of the 570 commonest words. With the assistance of the staff of the Institute of Psychological Research, Teachers College, Columbia University. Columbia. Literatur 407 Lutzeier, Peter Rolf (1985): Linguistische Semantik. (= Sammlung Metzler; Abt. C, Sprachwissenschaft 219). Stuttgart. Lutzeier, Peter Rolf (1995): Lexikologie. Ein Arbeitsbuch. (= Stauffenburg Einführungen 1). Tübingen. Mackey, William Francis/ Savard, Jean-Guy (1967): The indices of coverage. A new dimension in lexicometrics. In: IRAL - International Revue of Applied Linguistics in Language Teaching 5, S. 71-121. MacFarquhar, Peter D./ Richards, Jack C. (1983): On dictionaries and definitions. In: RELC Journal 14, 1, S. 111-124. Martin, Willy (1985): Reflections on learner's dictionaries. In: Hyldgaard-Jensen/ Zettersten (Hg.), S. 169-181. Martin, Willy (1990): The frequency dictionary. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 1314-1322. Mayerthaler, Willi (1981): Morphologische Natürlichkeit. (= Linguistische Forschungen 28). Wiesbaden. McArthur, Tom (1978): The vocabulary-control movement in the English language. 1844-1953. In: Indian Journal of Applied Linguistics 4, 1, S. 47-68. [Zugl. veröff. in: McArthur, Tom (1998): Living words. Language, lexicography, and the knowledge revolution. Exeter, S. 50-74]. McArthur, Tom (1989): The background and nature of ELT learners' dictionaries. In: Tickoo (Hg.), S. 52-64. McEnery, Tony/ Wilson, Andrew (2001): Corpus linguistics. An introduction. 2. Aufl. Edinburgh. McEnery, Tony/ Xiao, Richard/ Tono, Yukio (2006): Corpus-based language studies. An advanced resource book. London/ New York. Meibauer, Jörg/ Demske, Ulrike/ Geilfuß-Wolfgang, Jochen/ Pafel, Jürgen/ Ramers, Karl Heinz/ Rothweiler, Monika/ Steinbach, Markus (2007): Einführung in die germanistische Linguistik. 2., aktual. Aufl. Stuttgart/ Weimar. $ +# ! " # {ƒ„ƒ~- ^ } } meaning-text linguistic theory. In: Quaderni di Semantica 10, 1, S. 65-102. Michéa, René (1950): Vocabulaire et culture. In: Les Langues Modernes 3, 44, S. 187-192. Michéa, René (1974): Les vocabulaires fondamentaux dans l'enseignement des langues vivantes. In: Le Français dans le Monde 103. Número spécial en hommage à Georges Gougenheim, S. 11-13. Michiels, Achibal/ Noël, Jacques (1984): The pro's and con's of a controlled defining vocabulary in a learner's dictionary. In: Hartmann (Hg.), S. 385-394. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 408 Motsch, Wolfgang (1988): On inactivity, productivity and analogy in derivational processes. In: Motsch, Wolfgang: The contribution of word-structure-theories to the study of word formation. (= Linguistische Studien, Reihe A; Arbeitsberichte 179). Berlin, S. 1-30. Motsch, Wolfgang (1999): Deutsche Wortbildung in Grundzügen. (= Schriften des Instituts für Deutsche Sprache 8). Berlin/ New York. Muller, Charles (1974): Les verbes les plus fréquents du français. In: Le Français dans le Monde 103. Número spécial en hommage à Georges Gougenheim, S. 14-17. Müller, Wolfgang (1980): Bedeutungserklärungen in deutschen Wörterbüchern. Wie sie sind und wie sie sein sollten. Ein Beitrag zur Pragmatik der Lexikographie. In: Rupp, Heinz/ Roloff, Hans-Gert (Hg.): Akten des VI. Internationalen Germanisten- Kongresses Basel 1980. Teil 2. (= Jahrbuch für Internationale Germanistik; Reihe A; Kongressberichte 8). Bern u.a., S. 38-44. Müller, Wolfgang (1984): Zur Praxis der Bedeutungserklärung ( BE ) in (einsprachigen) deutschen Wörterbüchern und die semantische Umkehrprobe. In: Germanistische Linguistik 3-6, S. 359-461. Müllich, Harald (1990): „Die Definition ist blöd! “. Herübersetzen mit dem einsprachigen Wörterbuch. Das französische und englische Lernerwörterbuch in der Hand der deutschen Schüler. (= Lexicographica; Series Maior 37). Tübingen. Munske, Horst Haider (1988): Ist das Deutsche eine Mischsprache? In: Munske/ Polenz/ Reichmann/ Hildebrandt (Hg.), S. 46-74. Munske, Haider, Horst/ Polenz, Peter von/ Reichmann, Oskar/ Hildebrandt, Reiner (Hg.) (1988): Deutscher Wortschatz. Lexikologische Studien. Ludwig Erich Schmitt zum 80. Geburtstag von seinen Marburger Schülern. Berlin/ New York. Munske, Horst Haider (1997): Orthographie als Sprachkultur. Frankfurt a.M. u.a. Nation, Ian Stephen Paul (2001): Learning vocabulary in another language. Cambridge. Nesi, Hilary (2000): The use and abuse of EFL dictionaries. How learners of English as a foreign language read and interpret dictionary entries. (= Lexicographica; Series Maior 98). Tübingen. Neubauer, Fritz (1980): Die Struktur der Explikationen in deutschen einsprachigen Wörterbüchern. Eine vergleichende lexiko-semantische Analyse. (= Papiere zur Textlinguistik 27). Hamburg. Neubauer, Fritz (1984): The language of explanation in monolingual dictionaries. In: Hartmann (Hg.), S. 117-123. Neubauer, Fritz (1987): How to define a defining vocabulary. In: Ilson (Hg.), S. 49-59. Neubauer, Fritz (1989): Vocabulary control in the definitions and examples of monolingual dictionaries. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 899-905. Literatur 409 Neubauer, Fritz (1991): Beobachtungen zu den deutschen Bedeutungsangaben zu nennlexikalischen Ausdrücken im Deutschen Wörterbuch. In: Kirkness, Alan/ Kühn, Peter/ Wiegand, Herbert Ernst (Hg.): Studien zum Deutschen Wörterbuch von Jacob Grimm und Wilhelm Grimm. Bd. 2. (= Lexicographica; Series Maior 34). Tübingen, S. 519-534. Neubauer, Fritz (1998): Kompetenzbeispiele im Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In: Wiegand (Hg.), S. 247-255. Neubauer, Fritz/ Petöfi, János Sandor (1981): Word semantics, lexicon systems, and text interpretation. In: Eikmeyer, Hans-Jürgen/ Rieser, Hannes (Hg.): Word, worlds, and contexts. New approaches in word semantics. (= Research in Text Theory/ Untersuchungen zur Texttheorie 6). Berlin/ New York, S. 343-377. Neuner, Gerhard (2007): Vermittlungsmethoden: Historischer Überblick. In: Bausch, Karl-Richard/ Christ, Herbert/ Krumm, Hans-Jürgen (Hg.): Handbuch Fremdsprachenunterricht. 5., gegenüber d. 4. unveränd. Aufl. Tübingen/ Basel, S. 225-234. Ogden, Charles Kay/ Richards, Ivor Armstrong (1974): Die Bedeutung der Bedeutung. (The meaning of meaning). Eine Untersuchung über den Einfluß der Sprache auf das Denken und die Wissenschaft des Symbolismus. Frankfurt a.M. Oxford University Press (2008): Oxford Advanced Learner's Dictionary. 7. Aufl. Internet: www.oup.com/ elt/ catalogue/ isbn/ 6712? cc=global (Stand: 10.12.2008). Palmer, Harold Edward (1968): The scientific study and teaching of languages. Hrsg. v. David Harper. (= Language and Language Learning 18). London. Pfeffer, Jay Alan (1975): Grunddeutsch. Erarbeitung und Wertung dreier deutscher Korpora. Ein Bericht aus dem ‘Institute for Basic German’ - Pittsburgh. (= Forschungsberichte des Instituts für Deutsche Sprache Mannheim 27). Tübingen. Piotrowski, Tadeusz (1989): Monolingual and bilingual dictionaries. Fundamental differences. In: Tickoo (Hg.), S. 72-83. Polenz, Peter von (2000): Deutsche Sprachgeschichte vom Spätmittelalter bis zur Gegenwart. Bd. 1. Einführung, Grundbegriffe, 14. bis 16. Jahrhundert. 2., erg. u. überarb. Aufl. Berlin/ New York. Popp, Heidrun (Hg.) (1995): Deutsch als Fremdsprache. An den Quellen eines Faches. Festschr. für Gerhard Helbig zum 65. Geburtstag. München. Probleme der Lexikologie und Lexikographie (1976). Jahrbuch 1975 des Instituts für deutsche Sprache. (= Sprache der Gegenwart 39). Düsseldorf. Quasthoff, Uta M./ Hartmann, Dietrich (1982): Bedeutungserklärungen als empirischer Zugang zu Wortbedeutungen. Zur Entscheidbarkeit zwischen holistischen und konzeptionellen Bedeutungskonzeptionen. In: Deutsche Sprache 10, 2, S. 97-118. Quemada, Bernard (1974): Remarques de méthode sur une recherche d'indices d'utilité du vocabulaire. In: Le Français dans le Monde 103. Número spécial en hommage à Georges Gougenheim, S. 18-24. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 410 Rautmann, Karin (2010): Wie kommt ein Wort in den Duden? Internet: www.duden.de/ deutsche_sprache/ wort_in_den_duden.php (Stand: 28.10.2010). Rey-Debove, Josette (1971): Étude linguistique et sémiotique des dictionnaires français contemporains. (= Approaches to Semiotics 13). Den Haag/ Paris. Richards, Ivor Armstrong (1939): Basic English and its applications. In: Journal of the Royal Society of Arts 87, 4515, S. 735-747. Ripfel, Martha (1989): Ergebnisse einer Befragung zur Benutzung ein- und zweisprachiger Wörterbücher. In: Lexicographica 5, S. 178-201. Rosengren, Inger (1976): Der Grundwortschatz als theoretisches und praktisches Problem. In: Probleme der Lexikologie und Lexikographie, S. 313-333. Rosengren, Inger (1985): Welt und Sprache im Spiegel des Frequenzwörterbuchs. In: Stedje, Astrid (Hg.): Die Brüder Grimm. Erbe und Rezeption. Stockholmer Symposium 1984. (= Acta Universitatis Stockholmiensis 32). Stockholm, S. 155-170. Rothenhöfer, Andreas (2004): Struktur und Funktion im einsprachigen Lernerwörterbuch. Das de Gruyter Wörterbuch Deutsch als Fremdsprache und Langenscheidts Großwörterbuch Deutsch als Fremdsprache im Vergleich. (= Germanistische Linguistik 177). Hildesheim u.a. Rundell, Michael (1998): Recent trends in English pedagogical lexicography. In: International Journal of Lexicography 11, 4, S. 315-342. Schafroth, Elmar/ Zöfgen, Ekkehard (1998): Langenscheidts Großwörterbuch Deutsch als Fremdsprache und die französische Lernerlexikographie. In: Wiegand (Hg.), S. 3-19. Scherer, Carmen (2006): Korpuslinguistik. (= Kurze Einführungen in die germanistische Linguistik 2). Heidelberg. Scherfer, Peter (1985): Lexikalisches Lernen im Fremdsprachenunterricht. In: Schwarze/ Wunderlich (Hg.), S. 412-440. Schildt, Joachim/ Viehweger, Dieter (Hg.) (1983): Die Lexikographie von heute und das Wörterbuch von morgen. Analysen - Probleme - Vorschläge. Als Ms. vervielfältigt. (= Linguistische Studien, Reihe A; Arbeitsberichte 109). Berlin. Schlobinski, Peter (1996): Empirische Sprachwissenschaft. (= WV studium 174). Opladen. Schmidt, Wilhelm (1955): Zum Grundwortschatz und Wortbestand der deutschen Sprache. In: Deutschunterricht 8, 9, S. 530-540. Schnell, Rainer/ Hill, Paul P./ Esser, Elke (2008): Methoden der empirischen Sozialforschung. 8., unveränd. Aufl. München u.a. Schnelle, Helmut (1997): Logische Semantik eines Wörterbuchs vom Cobuild Typ. In: Konerding/ Lehr (Hg.), S. 139-153. Literatur 411 Schnörch, Ulrich (2002): Der zentrale Wortschatz des Deutschen. Strategien zu seiner Ermittlung, Analyse und lexikografischen Aufarbeitung. (= Studien zur Deutschen Sprache 26). Tübingen. Schröder, Marianne (1997): Nominale Konversionsprodukte in Langenscheidts ¤ – ‚ \  _ ! - ¶ # · ž · ® _~ S. 138-146. Schumann, Siegfried (2006): Repräsentative Umfrage. Praxisorientierte Einführung in empirische Methoden und statistische Analyseverfahren. 4., überarb. u. erw. Aufl. München u.a. Schwarze, Christoph/ Wunderlich, Dieter (Hg.) (1985): Handbuch der Lexikologie. Königstein. ¶ # · " ž · $ ® _~ {ƒƒ-~- ‚ _ ° " dung. Prag. Snell-Hornby, Mary (Hg.) (1988): ZüriLEX '86 Proceedings. Papers read at the EU- RALEX International Congress, University of Zürich, 9-14 September 1986. Tübingen. StADaF = Ständige Arbeitsgruppe Deutsch als Fremdsprache (2005/ 2006): Deutsch als Fremdsprache weltweit. Datenerhebung 2005. Internet: www.goethe.de/ mmo/ priv/ 1459127-STANDARD.pdf (Stand: 28.10.2010). Standop, Ewald (1981): Neue englische Wörterbücher. In: Die Neueren Sprachen 80, 3, S. 240-259. Stegmüller, Wolfgang (1989): Hauptströmungen der Gegenwartsphilosophie. Eine kritische Einführung. Bd. 1. 7. Aufl. (= Kröners Taschenausgabe 308). Stuttgart. Stein, Gabriele (1979): The best of British and American lexicography. In: Dictionaries 1, S. 1-23. Stein, Gabriele (1989): Recent developments in EFL dictionaries. In: Tickoo (Hg.), S. 10-41. Stein, Gabriele (2002): Developing your English vocabulary. A systematic new approach. Tübingen. Stepanowa, Marija D./ Fleischer, Wolfgang (1985): Grundzüge der deutschen Wortbildung. Leipzig. Sterkenburg, Piet van (Hg.) (2003): A practical guide to lexicography. (= Teminology and lexicography research and practice 6). Amsterdam/ Philadelphia. Strevens, Peter (1987): The effectiveness of learners' dictionaries. In: Burchfield, Robert (Hg.): Studies in lexicography. Oxford, S. 76-93. Stubbs, Michael (1986): Educational linguistics. Oxford. Summers, Della (1988): English language teaching dictionaries. Past, present, and future. In: English Today 14, S. 10-16. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 412 Svensén, Bo (1993): Practical lexicography. Principles and methods of dictionarymaking. Translated from Swedish by John Sykes and Kerstin Schofield. Oxford u.a. Sweet, Henry (1964): The practical study of languages. A guide for teachers and learners. (= Language and Language Learning 1). London. Theorie und Praxis der ein- und mehrsprachigen romanischen Lexikographie (1988). Konferenz „Problemstellungen der Lexikologie und Lexikographie der romanischen Sprachen“. 2. u. 3. Oktober 1986 in Greifswald (DDR). (= Wissenschaftliche Zeitschrift der Ernst-Moritz-Arndt-Universität Greifswald; Gesellschaftswissenschaftliche Reihe 37, 2). Greifswald. Thom, René (1975): Structural stability and morphogenesis. An outline of a general theory of models. Translated from the French edition, as updated by the author, by D.H. Fowler, University of Warwick. With a foreword by C.H. Waddington. Reading u.a. Thorndike, Edward Lee (1921): The teacher's word book. New York. Thorndike, Edward Lee/ Lorge, Irving (1944): The teacher's word book of 30,000 words. New York. Tickoo, Makhan Lal (1988): Michael West in India. A centenary salute. In: ELT Journal 42, 4, S. 294-300. Tickoo, Makhan Lal (1989): Which dictionary and why? Exploring some options. In: Tickoo (Hg.), S. 184-203. Tickoo, Makhan Lal (Hg.) (1989): Learners' dictionaries. State of the art. (= Anthology Series 23). Singapore. Tognini-Bonelli, Elena (2001): Corpus linguistics at work. (= Studies in Corpus Linguistics 6). Amsterdam/ Philadelphia. Tomaszczyk, Jerzy (1979): Dictionaries. Users and uses. In: Glottodidactica 12, S. 103-119. Tomaszczyk, Jerzy (1983): On bilingual dictionaries. The case for bilingual dictionaries for foreign language learners. In: Hartmann (Hg.), S. 41-51. Tschirner, Erwin (2005): Korpora, Häufigkeitslisten, Wortschatzerwerb. In: Heine, Antje/ Hennig, Mathilde/ Tschirner, Erwin (Hg.): Deutsch als Fremdsprache - Konturen und Perspektiven eines Faches. Festschr. für Barbara Wotjak zum 65. Geburtstag. München, S. 133-149. Tschirner, Erwin (2006): Häufigkeitsverteilungen im Deutschen und ihr Einfluss auf den Erwerb des Deutschen als Fremdsprache. In: Corino/ Marello/ Onesti (Hg.), S. 1277-1288. Underhill, Adrian (1985): Working with the monolingual learners' dictionary. In: Ilson (Hg.), S. 103-114. Literatur 413 Universität Oxford (2005): What is the BNC ? Internet: www.natcorp.ox.ac.uk/ corpus/ index.xml (Stand: 28.10.2010). Universität Tübingen (2008): Informationsblatt: Stuttgart-Tübingen Tagset ( STTS ). Internet: www.sfb441.uni-tuebingen.de/ a5/ codii/ info-stts-de.xhtml (Stand: 28.10.2010). University of Cambridge ESOL Examinations (2010): Cambridge English first. First certificate in English (FCE). Internet: www.cambridgeesol.org/ exams/ general-english/ fce.html (Stand: 28.10.2010). Viehweger, Dieter (1982): Semantiktheorie und praktische Lexikographie. In: Zeitschrift für Germanistik 2, S. 143-155. Viehweger, Dieter (1987): Semantiktheorie und praktische Lexikographie. Ein Plädoyer für die Revision semantiktheoretischer Grundlagen der einsprachigen Lexikographie. In: Welke/ Neurath (Hg.), S. 29-45. Voice of America (2008): Helping people understand their world. Internet: http: / / voanews.com/ specialenglish/ about_special_english.cfm (Stand 28.10.2010). Vossen, Piek/ Meijs, Willem/ den Broeder, Marianne (1989): Meaning and structure in dictionary sefinitions. In: Boguraev/ Briscoe (Hg.), S. 171-192. Walpole, Hugh (1937): The theory of definition and its application to vocabulary limitation. In: The Modern Language Journal 21, 6, S. 398-402. Walpole, Hugh (1939): Teaching language as logic. The articulation of a definition vocabulary with a teaching system based upon syntactic development. In: The Modern Language Journal 23, 7, S. 500-505. Waugh, Linda R./ Lafford, Barbara A. (2006): Markedness. In: Brown (Hg.), S. 491-498. Weber, Nico (1996): Formen und Inhalte der Bedeutungsbeschreibung. Definition, Explikation, Repräsentation, Simulation. In: Weber, Nico (Hg.): Semantik, Lexikographie und Computeranwendungen. (= Sprache und Information 33). Tübingen, S. 1-46. Weber, Nico (1999): Die Semantik von Bedeutungsexplikationen. (= Sprache, Sprechen und Computer 3). Frankfurt a.M. u.a. Wegner, Immo (1989): Lexikographische Definition und Frame-Theorie im allgemeinen einsprachigen Wörterbuch. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 893-899. Weinreich, Uriel (1967): Lexicographic definition in descriptive semantics. In: Householder, Fred Walter/ Saporta, Sol (Hg.): Problems in lexicography. 2. erg. u. korr. Aufl. (= Indiana University Research Center in Anthropology, Folklore and Linguistics 21). Bloomington, S. 25-44. Weinrich, Harald (1976): Die Wahrheit der Wörterbücher. In: Probleme der Lexikologie und Lexikographie, S. 347-371. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 414 Wekker, Herman/ Hyams, Phil (1979): De Longman Dictionary of Contemporary English. Review article. In: Levende Talen 342, S. 406-417. Welke, Klaus/ Neurath, Renate (Hg.) (1987): Lexikologie und Lexikographie. Vorträge der 4. sprachwissenschaftlichen Konferenz DDR - Finnland. Humboldt-Universität zu Berlin, 3.-5. September 1986. (= Linguistische Studien, Reihe A; Arbeitsberichte 160). Berlin. Wellmann, Hans (1984): Stand und Aufgaben der wissenschaftlichen Lexikographie des heutigen Deutsch - einsprachige Wörterbücher. In: Götz/ Herbst (Hg.), S. 350-381. Wellmann, Hans (1993): Die Bedeutungen der Nominalkomposita. In: Synchrone und diachrone Aspekte der Wortbildung im Deutschen. Hrsg. v. Hans Wellmann. (= Sprache - Literatur und Geschichte 8). Heidelberg, S. 147-168. Wellmann, Hans (2001): Die Sprache der Definitionen, insbesondere ihre Syntax. Ein Plädoyer für die stärkere Vernetzung der Definitionen mit ihrer „Umgebung“ im Wörterbuch und ein Beitrag zur Metakritik der Lexikographie. In: Korhonen, Jarmo (Hg.): Von der monozur bilingualen Lexikografie für das Deutsche. (= Finnische Beiträge zur Germanistik 6). Frankfurt a.M. u.a., S. 181-198. Wellmann, Hans (2002): Vernetzung(en). Zur Weiterentwicklung des Lernerwörterbuchs. In: Barz, Irmhild/ Fix, Ulla/ Lerchner, Gotthard (Hg.): Das Wort in Text und Wörterbuch. (= Abhandlungen der Sächsischen Akademie der Wissenschaften zu Leipzig, Philologisch-historische Klasse 76, 4). Stuttgart/ Leipzig, S. 127-138. Wellmann, Hans (2004): Der Definitionswortschatz des einsprachigen Wörterbuchs. In: Herbst, Thomas/ Lorenz, Gunter/ Mittmann, Brigitta/ Schnell, Martin (Hg.): Lexikografie, ihre Basis- und Nachbarwissenschaften. (Englische) Wörterbücher zwischen ‘common sense’ und angewandter Theorie. (= Lexicographica; Series Maior 118). Tübingen, S. 89-105. Werner, Reinhold (1982): Das Bild im Wörterbuch. Funktionen der Illustration in spanischen Wörterbüchern. In: Linguistik und Didaktik 49, 50, S. 62-94. Werner, Reinhold (1984): Semasiologische und enzyklopädische Definition im Wörterbuch. In: Götz/ Herbst (Hg.), S. 382-407. West, Michael Philip (1963): Teaching English in difficult circumstances. Teaching English as a foreign language with notes on the techniques of textbook construction. 3. Aufl. London. [Erstveröff. 1960]. Whitcut, Janet (1986): The training of dictionary users. In: Ilson (Hg.), S. 111-122. Whitcut, Janet (1988): Lexicography in simple language. In: International Journal of Lexicography 1, 1, S. 49-55. Wiegand, Herbert Ernst (1976): Synonymie und ihre Bedeutung in der einsprachigen Lexikographie. In: Probleme der Lexikologie und Lexikographie, S. 118-180. Wiegand, Herbert Ernst (1977): Nachdenken über Wörterbücher: Aktuelle Probleme. In: Drosdowski/ Henne/ Wiegand, S. 51-102. Literatur 415 Wiegand, Herbert Ernst (1981): Pragmatische Informationen in neuhochdeutschen Wörterbüchern. Ein Beitrag zur praktischen Lexikographie. In: Germanistische Linguistik 3-4, 79, S. 139-171. Wiegand, Herbert Ernst (1988a): Was eigentlich ist Fachlexikografie? Mit Hinweisen zum Verhältnis von sprachlichem und enzyklopädischen Wissen. In: Munske/ Polenz/ Reichmann/ Hildebrandt (Hg.), S. 729-790. Wiegand, Herbert Ernst (1988b): Wörterbuchartikel als Text. In: Harras (Hg.), S. 30-120. Wiegand, Herbert Ernst (1989a): Aspekte der Makrostruktur im allgemeinen einsprachigen Wörterbuch: alphabetische Anordnungsformen und ihre Probleme. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 371-409. Wiegand, Herbert Ernst (1989b): Der Begriff der Mikrostruktur: Geschichte, Probleme, Perspektiven. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 409-462. Wiegand, Herbert Ernst (1989c): Die lexikographische Definition im allgemeinen einsprachigen Wörterbuch. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 530-588. Wiegand, Herbert Ernst (1995): Lexikographische Texte in einsprachigen Lernerwörterbüchern. Kritische Überlegungen anläßlich des Erscheinens von Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In: Popp (Hg.), S. 463-499. Wiegand, Herbert Ernst (Hg.) (1998): Perspektiven der pädagogischen Lexikographie des Deutschen. Untersuchungen anhand von Langenscheidts Großwörterbuch Deutsch als Fremdsprache. (= Lexicographica; Series Maior 86). Tübingen. Wiegand, Herbert Ernst (2000a): Einige grundlegende semantisch-pragmatische Aspekte von Wörterbucheinträgen. Ein Beitrag zur praktischen Lexikologie. In: Wiegand (2000c), S. 174-236. [Ebenf. veröff. in: Kopenhagener Beiträge zur germanistischen Linguistik 12, 1977, S. 59-149]. Wiegand, Herbert Ernst (2000b): Über die gesellschaftliche Verantwortung der wissenschaftlichen Lexikographie. In: Wiegand (2000c), S. 1410-1427. [Ebenf. veröff. in: Hermes 18/ 1997, S. 177-202]. Wiegand, Herbert Ernst (2000c): Kleine Schriften. Eine Auswahl aus den Jahren 1970 bis 1999 in zwei Bänden. Hrsg. v. Matthias Kammerer und Werner Wolski. Bd. 1: 1970-1988. Berlin/ New York. Wiegand, Herbert Ernst (Hg.) (2002): Perspektiven der pädagogischen Lexikographie des Deutschen. Untersuchungen anhand des de Gruyter Wörterbuch Deutsch als Fremdsprache. (= Lexicographica; Series Maior 110). Tübingen. Wierzbicka, Anna (1972): Semantic primitives. (= Linguistische Forschungen 22). Frankfurt a.M. Wierzbicka, Anna (1985): Lexicography and conceptual analysis. Ann Arbor. Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 416 Wierzbicka, Anna (1989a): Semantic primitives and lexical universals. In: Quaderni di Semantica 10, 1, S. 103-121. Wierzbicka, Anna (1989b): Semantic primitives - the expanding set. In: Quaderni di Semantica 10, 2, S. 309-332. Wierzbicka, Anna (1992a): Semantics, culture, and cognition. Universal human concepts in culture-specific configurations. New York u.a. Wierzbicka, Anna (1992b): The search for universal semantic primitives. In: Pütz, Martin (Hg.): Thirty years of linguistic evolution. Studies in honour of René Dirven on the occasion of his sixtieth birthday. Amsterdam/ Philadelphia, S. 215-242. Wierzbicka, Anna (1995): Universal semantic primitives as a basis for lexical semantics. In: Folia Linguistica 29, 1-2, S. 149-169. Wierzbicka, Anna (1996): Semantics. Primes and universals. New York u.a. Wierzbicka, Anna (1997): Understanding cultures through their key words. English, Russian, Polish, German, and Japanese. New York u.a. Wierzbicka, Anna (2003): Semantic primitives. In: Frawley, William J. (Hg.): International encyclopedia of linguistics. 2. Aufl. Oxford u.a., S. 12-13. Wierzbicka, Anna (2006): Semantic primitives. In: Brown (Hg.), S. 134-137. Wilks, Yorick (1977): Good and bad arguments about semantic primitives. In: Communication and Cognition 10, 3-4, S. 181-221. Wilks, Yorick/ Fass, Dan/ Guo, Cheng-Ming/ McDonald, James/ Plate, Tony/ Slator, Brian (1989): A tractable machine dictionary as a resource for computational semantics. In: Boguraev/ Briscoe (Hg.), S. 193-228. Wingate, Ursula (1999): Schwierigkeiten beim Gebrauch eines einsprachigen Lernerwörterbuchs. In: Info DaF. Informationen Deutsch als Fremdsprache 26, 5, S. 441-457. Wingate, Ursula (2002): The effectiveness of different learner dictionaries. An investigation into the use of dictionaries for reading comprehension by intermediate learners of German. (= Lexicographica; Series Maior 112). Tübingen. Wolski, Werner (1989): Das Lemma und die verschiedenen Lemmatypen. In: Hausmann/ Reichmann/ Wiegand/ Zgusta (Hg.), S. 360-371. Wolski, Werner (2002): Das de Gruyter Wörterbuch Deutsch als Fremdsprache und Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In: Wiegand (Hg.), S. 3-34. Wotjak, Gerd (1988): Wie könnte ein optimaler Wörterbuchartikel aussehen? In: Theorie und Praxis der ein- und mehrsprachigen romanischen Lexikographie, S. 18-22. Wurzel, Wolfgang Ullrich (1981): 7. Phonologie. Segmentale Struktur. In: Grundzüge einer deutschen Grammatik. Von einem Autorenkollektiv unt. der Leitung v. Karl Erich Heidolph, Walter Flämig u. Wolfgang Motsch. Berlin, S. 898-990. Literatur 417 “ ˜ {ƒ-{~- $ } ˜ ¯ ‘_ ! ž ¹ º “ ® » ·¦™ · _ _ µ @ ˜ ¼ ^ $ §ƒ~_ \ Haag/ Paris. Zgusta, Ladislav (2006): Lexicography then and now. Selected essays. Hrsg. v. Frederic S.F. Dolezal u. Thomas B.I. Creamer. (= Lexicographica; Series Maior 129). Tübingen. Zöfgen, Ekkehard (1985a): Zur Einführung. Wörterbuchdidaktik in Theorie und Praxis. In: Bielefelder Beiträge zur Sprachlehrforschung. Wörterbücher und ihre Didaktik 14, 1-2, S. 3-9. Zöfgen, Ekkehard (1985b): Lernerwörterbücher auf dem Prüfstand oder: Was ist ein Lernwörterbuch? In: Bielefelder Beiträge zur Sprachlehrforschung. Wörterbücher und ihre Didaktik 14, 1-2, S. 10-87. Zöfgen, Ekkehard (1986): Was ist ein Lernwörterbuch? In: Kühlwein, Wolfgang (Hg.): Neue Entwicklungen der Angewandten Linguistik. Kongreßbeiträge zur 15. Jahrestagung der Gesellschaft für Angewandte Linguistik, GAL e.V. (= Forum Angewandte Linguistik 9). Tübingen, S. 69-71. Zöfgen, Ekkehard (1994a): Lernerwörterbücher in Theorie und Praxis. Ein Beitrag zur Metalexikographie mit besonderer Berücksichtigung des Französischen. (= Lexicographica; Series Maior 59). Tübingen. 6. Verzeichnis der Abkürzungen und Symbole Auf die Verzeichnung der im Band 1 der Duden-Reihe (Rechtschreibduden) enthaltenen Abkürzungen wird hier verzichtet. Die vollständigen bibliografischen Angaben der verzeichneten Wörterbücher finden sich im Literaturverzeichnis (vgl. Kap. 5). Wörterbuchtitel ohne Auflagenziffer beziehen sich (bei mehreren Auflagen) auf keine spezielle Auflage. A Advanced (= fortgeschritten, im CALD verwendet); Österreich A 1 erste Stufe der Kompetenzskala des Gemeinsamen europäischen Referenzrahmens für Sprachen A 2 zweite Stufe der Kompetenzskala des Gemeinsamen europäischen Referenzrahmens für Sprachen abbr. abbreviation (= Abkürzung) Abk Abkürzung (im LTWDaF verwendet) ad advertisement (= Anzeige) Adj Adjektiv (im LTWDaF verwendet) Adv Adverb (im LTWDaF verwendet) adv adverbiell (im LTWDaF verwendet) ALD Oxford Advanced Learner ' s Dictionary of Current English (1974) B 1 dritte Stufe der Kompetenzskala des Gemeinsamen europäischen Referenzrahmens für Sprachen bearb. bearbeitet bes besonders (im LTWDaF verwendet) bibl. biblisch BIFAB Bibliographisches Institut & F.A. Brockhaus AG BNC British National Corpus (= Britisches Nationalkorpus) BrE British English (= britisches Englisch) BYU Brigham Young University (Utah) bzw beziehungsweise (im LTWDaF verwendet) CALD Cambridge Advanced Learner's Dictionary Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 420 CDCC Council for Cultural Co-operation (= Rat für kulturelle Zusammenarbeit) CIC Cambridge International Corpus (= Internationales Cambridge-Korpus) CIDE Cambridge International Dictionary of English COBUILD Collins COBUILD English Language Dictionary COBUILD 1 Collins COBUILD English Language Dictionary (1987) COBUILD 2 Collins COBUILD English Dictionary (1995) C. R. E. D. I. F. Centre de Recherche et d'Étude pour la Diffusion du Français (= Forschungs- und Untersuchungszentrum zur Verbreitung des Französischen) CV controlled vocabulary (= kontrollierter Definitionswortschatz) DaF Deutsch als Fremdsprache DCE Longman Dictionary of Contemporary English (1978) DHWDaF Duden/ Hueber Wörterbuch Deutsch als Fremdsprache DHWDaF 1 Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (2003) DHWDaF 2 Duden/ Hueber Wörterbuch Deutsch als Fremdsprache (2007) DPF Dictionnaire Pratique du Français DSWDaF Duden Standardwörterbuch Deutsch als Fremdsprache DV defining vocabulary (= Definitionswortschatz) DWDS Digitales Wörterbuch der deutschen Sprache des 20. Jahrhunderts E Essential (= wesentlich, im CALD verwendet) EFL English as Foreign Language (= Englisch als Fremdsprache) erg. ergänzt erw. erweitert fnhd. frühneuhochdeutsch Fs. Festschrift Gen Genitiv (im LTWDaF verwendet) Verzeichnis der Abkürzungen und Symbole 421 geschr geschrieben (im LTWDaF verwendet) gespr gesprochen (im LTWDaF verwendet) GWDS Duden - das große Wörterbuch der deutschen Sprache hum humorvoll (im LTWDaF verwendet) I Improver (= Fortgeschrittener, im CALD verwendet) ID idiomatische Wendung IDS Institut für Deutsche Sprache IPA internationales phonetisches Alphabet IRET Institute for Research in English Teaching (= Institut zur Erforschung des Unterrichtens von Englisch) j-d jemand (im LTWDaF verwendet) j-m jemandem (im LTWDaF verwendet) jmd. jemand (im DHWDaF verwendet) jmdm. jemandem (im DHWDaF verwendet) jmdn. jemanden (im DHWDaF verwendet) jmds. jemandes (im DHWDaF verwendet) j-n jemanden (im LTWDaF verwendet) j-s jemandes (im LTWDaF verwendet) k.A. keine Angabe KLM-Liste Bongers eigene Wortliste KVP Konversionsprodukt KWB Kurzwortbildung L 2 second language (= Zweitsprache, Nichtmuttersprache) LDOCE Longman Dictionary of Contemporary English LDOCE 1 Longman Dictionary of Contemporary English (1978) LDOCE 2 Longman Dictionary of Contemporary English (1987) LDOCE 3 Longman Dictionary of Contemporary English (1995) LDOCE 4 Longman Dictionary of Contemporary English (2003) LGDaF Langenscheidts Großwörterbuch Deutsch als Fremdsprache (1993) lit. literarisch LTWDaF Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 422 LTWDaF 1 Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (2003) LTWDaF 2 Langenscheidt Taschenwörterbuch Deutsch als Fremdsprache (2007) LWB Langenscheidt Großwörterbuch Deutsch als Fremdsprache LWB 1 Langenscheidts Großwörterbuch Deutsch als Fremdsprache (1993) LWB 2 Langenscheidts Großwörterbuch Deutsch als Fremdsprache (1998) LWB 3 Langenscheidt Großwörterbuch Deutsch als Fremdsprache (2003) LWB 4 Langenscheidt Großwörterbuch Deutsch als Fremdsprache (2008) Med Medizin (im LTWDaF verwendet) Mitarb. Mitarbeit MR Le Micro-Robert MR 1 Le Micro-Robert (1971) MR 2 Le Micro-Robert (1988) NAmE North American English (= nordamerikanisches Englisch) NDef new definitions (= neue Definitionen) No., no. number NSM Natural Semantic Metalanguage (= natürliche semantische Metasprache) OALD Oxford Advanced Learner ' s Dictionary of Current English OALD 1 A Learner ' s Dictionary of Current English (1948) OALD 2 The Advanced Learner ' s Dictionary of Current English (1963) OALD 3 Oxford Advanced Learner ' s Dictionary of Current English (1974) OALD 4 Oxford Advanced Learner ' s Dictionary of Current English (1989) OALD 5 Oxford Advanced Learner ' s Dictionary of Current English (1995) Verzeichnis der Abkürzungen und Symbole 423 OALD 6 Oxford Advanced Learner ' s Dictionary of Current English (2000) OALD 7 Oxford Advanced Learner ' s Dictionary of Current English (2005) OED The Oxford English Dictionary (1989) poet. poetisch präd prädikativ (im LTWDaF verwendet) PVB Partikelverbbildung Sg Singular (im LTWDaF verwendet) StADaF Ständige Arbeitsgruppe Deutsch als Fremdsprache STTS Stuttgart-Tübingen-Tagset südd süddeutsch (im LTWDaF verwendet) Syn. Synonym zum Lemma (im DHWDaF verwendet) T-level Threshold Level unt. unter unveränd. unverändert verb. verbessert zeitungsspr. zeitungssprachlich Zus. Zusammensetzung zum Lemma (im DHWDaF verwendet) < weniger als ½ ^ zurückgeführt auf [ ] phonetische Umschrift < > Graphem; Kollokation (im LTWDaF verwendet) ’ “ } LTWDaF verwendet) š ^‘ ‘ LTWDaF verwendet) › " ‘ LTWDaF verwendet) || Hinweis (im LTWDaF verwendet) ŸŸ - ž LTWDaF verwendet) || ¡ Verweis auf die Wortfamilie (im LTWDaF verwendet) || hierzu Derivat (im LTWDaF verwendet) || ID Redewendung (im LTWDaF verwendet) Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 424 || K- Kompositum, Lemma als Bestimmungswort (im LTWDaF verwendet) || -K Kompositum, Lemma als Grundwort (im LTWDaF verwendet) (x) zu weit von der ursprünglichen Bedeutung entfernte Sememe oder Wortverbindungen (im Interim Report verwendet) (*) sinnvolle Kombinationen für die Wortschatzvermittlung (im Interim Report verwendet) 7. Abbildungsverzeichnis Abb. 1: Ausschnitt aus A Grammar of English Words (Palmer 1964, S. 81).................................................................... 41 Abb. 2: Ausschnitt aus Basic English (Horst 1946, S. 151)..................... 43 Abb. 3: Ausschnitt aus dem Interim Report (1936, S. 269) ..................... 48 Abb. 4: Ausschnitt aus A General Service List of English Words (West 1960, S. 237) ............................................. 50 Abb. 5: Ausschnitt aus The New Method Dictionary (West/ Endicott 1961, S. 158) .................................... 52 Abb. 6: Ausschnitt aus A Learner ' s Dictionary of Current English (1948, S. 601f.)............................................................... 54 Abb. 7: Ausschnitt aus Gougenheim (1958, S. 137) ................................ 56 Abb. 8: Ausschnitt aus Englisches Arbeitswörterbuch (Haase 1961, S. 116).................................................................... 59 Abb. 9: Ausschnitt aus Grunddeutsch. Basic (Spoken) German Word List. Grundstufe (Pfeffer 1964, S. 21).................. 61 Abb. 10: Ausschnitt aus Grunddeutsch. Basic (Spoken) German Dictionary (Pfeffer 1970a, S. 51) ................................................ 62 Abb. 11: Ausschnitt aus Cambridge English Lexicon (Hindmarsh 1980, S. 71)................................................ 64 Abb. 12: Ausschnitt aus dem kontrollierten Definitionswortschatz des LDOCE 1 (1978, S. 1286)................................................... 117 Abb. 13: Die Entwicklung des Umfangs des kontrollierten Definitionswortschatzes im LDOCE 1-4................................... 118 Abb. 14: Ausschnitt aus dem LDOCE 4 (2003, S. 781f.) ........................ 120 Abb. 15: Ausschnitt aus dem kontrollierten Definitionswortschatz des OALD 5 (1995, S. 1424) ..................................................... 122 Abb. 16: Die Entwicklung des Umfangs des kontrollierten Definitionswortschatzes im OALD 5-7 ..................................... 123 Abb. 17: Ausschnitt aus dem OALD 7 (2005, S. 748f.) ........................... 125 Abb. 18: Ausschnitt aus dem kontrollierten Definitionswortschatz des CIDE (1995, S. 1424) ......................................................... 129 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 426 Abb. 19: Der Umfang des kontrollierten Definitionswortschatzes im CIDE .................................................................................... 130 Abb. 20: Ausschnitt aus dem CALD (2005, S. 615)................................. 131 Abb. 21: Ausschnitt aus dem LTWDaF 2 (2007, S. 121)......................... 152 Abb. 22: Ausschnitt aus dem DHWDaF 2 (2007, S. 216) ....................... 165 Abb. 23: Die Verteilung der Wortartengruppen bei den Types (a) und bei den Tokens (b) im LTWDaF 2 ...................................... 206 Abb. 24: Die Verteilung der Wortarten bei den Types (a) und bei den Tokens (b) im LTWDaF 2 ...................................... 209 Abb. 25: Die wortartenspezifische Verwendungshäufigkeit im LTWDaF 2............................................................................ 213 Abb. 26: Die Verteilung der Wortartengruppen bei den Types (a) und bei den Tokens (b) im DHWDaF 2..................................... 214 Abb. 27: Die Verteilung der Wortarten bei den Types (a) und bei den Tokens (b) im DHWDaF 2..................................... 215 Abb. 28: Die wortartenspezifische Verwendungshäufigkeit im DHWDaF 2 .......................................................................... 220 Abb. 29: Die Abweichung der nicht nativen Lexeme auf den einzelnen Ebenen des Sprachsystems im LTWDaF 2................................ 225 Abb. 30: Die Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Types (a) und bei den Tokens (b) im LTWDaF 2............................................................................ 226 Abb. 31: Die Verwendungshäufigkeit nach Herkunft im LTWDaF 2 ................................................................................. 227 Abb. 32: Die Abweichung der nicht nativen Lexeme auf den einzelnen Ebenen des Sprachsystems im DHWDaF 2 .............................. 228 Abb. 33: Die Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Types (a) und bei den Tokens (b) im DHWDaF 2 .......................................................................... 229 Abb. 34: Die Verwendungshäufigkeit nach Herkunft im DHWDaF 2 .......................................................................... 230 Abb. 35: Das Vorgehen bei der Bestimmung der Wortbildungsarten ..................................................................... 231 Abbildungsverzeichnis 427 Abb. 36: Die Verteilung der autosemantischen Types nach Wortgebildetheit (a) und die Verteilung der Wortbildungsarten bei den motivierten autosemantischen Types (b) im LTWDaF 2 .............................. 233 Abb. 37: Die Verteilung der autosemantischen Tokens nach Wortgebildetheit (a) und die Verteilung der Wortbildungsarten bei den motivierten autosemantischen Tokens (b) im LTWDaF 2 ............................ 235 Abb. 38: Die Verwendungshäufigkeit der Autosemantika nach Wortgebildetheit im LTWDaF 2 ................................................ 236 Abb. 39: Die Verwendungshäufigkeit der motivierten Autosemantika nach Wortbildungsarten im LTWDaF 2 ........... 236 Abb. 40: Die Verteilung der autosemantischen Types nach Wortgebildetheit (a) und die Verteilung der Wortbildungsarten bei den motivierten autosemantischen Types (b) im DHWDaF 2............................. 237 Abb. 41: Die Verteilung der autosemantischen Tokens nach Wortgebildetheit (a) und die Verteilung der Wortbildungsarten bei den motivierten autosemantischen Tokens (b) im DHWDaF 2........................... 239 Abb. 42: Die Verwendungshäufigkeit der Autosemantika nach Wortgebildetheit im DHWDaF 2............................................... 240 Abb. 43: Die Verwendungshäufigkeit der motivierten Autosemantika nach Wortbildungsarten im DHWDaF 2 .......... 241 Abb. 44: Die Verteilung der Wortbildungsarten im LTWDaF 2 - nicht verzeichnete Types (a) und bei der Wortfamilie verzeichnete Types (b)............................................................... 243 Abb. 45: Die Verteilung der Wortbildungsarten im LTWDaF 2 - nicht verzeichnete Tokens (a) und bei der Wortfamilie verzeichneten Tokens (b)........................................................... 245 Abb. 46: Die Verteilung der Wortbildungsarten im DHWDaF 2 - nicht verzeichnete Types (a) und Tokens (b) ............................. 253 Abb. 47: Die lemmatypspezifische Sememanzahl der Lemmata im LTWDaF 2............................................................................ 260 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 428 Abb. 48: Die lemmatypspezifische Wortanzahl der Definitionen im LTWDaF 2............................................................................ 261 Abb. 49: Die lemmatypspezifische Verwendungshäufigkeit im LTWDaF 2............................................................................ 262 Abb. 50: Die lemmatypspezifische Verteilung der Lemmata mit verzeichnetem und nicht verzeichnetem Definitionswortschatz im LTWDaF 2 ......................................................... 263 Abb. 51: Die lemmatypspezifische Verteilung der Definitionen mit verzeichnetem und nicht verzeichnetem Definitionswortschatz im LTWDaF 2 ......................................................... 264 Abb. 52: Die lemmatypische Sememanzahl der Lemmata im DHWDaF 2 .......................................................................... 265 Abb. 53: Die lemmatypspezifische Wortanzahl der Definitionen im DHWDaF 2 .......................................................................... 267 Abb. 54: Die lemmatypspezifische Verwendungshäufigkeit im DHWDaF 2 .......................................................................... 268 Abb. 55: Die lemmatypspezifische Verteilung der Lemmata mit verzeichnetem und nicht verzeichnetem Definitionswortschatz im DHWDaF 2 ........................................................ 270 Abb. 56: Die lemmatypspezifische Verteilung der Definitionen mit verzeichnetem und nicht verzeichnetem Definitionswortschatz im DHWDaF 2 ........................................................ 271 Abb. 57: Die lemmatypspezifische Verteilung der Wortarten bei den Types im LTWDaF 2........................................................... 274 Abb. 58: Die lemmatypspezifische Verteilung der Wortartengruppen bei den Types im LTWDaF 2....................... 276 Abb. 59: Die lemmatypspezifische Verteilung der Wortarten bei den Tokens im LTWDaF 2......................................................... 278 Abb. 60: Die lemmatypspezifische Verteilung der Wortartengruppen bei den Tokens im LTWDaF 2..................... 282 Abb. 61: Die lemmatypspezifische Verteilung der Wortarten bei den Types im DHWDaF 2 ......................................................... 284 Abb. 62: Die lemmatypspezifische Verteilung der Wortartengruppen bei den Types im DHWDaF 2 ..................... 286 Abb. 63: Die lemmatypspezifische Verteilung der Wortarten bei den Tokens im DHWDaF 2 ....................................................... 289 Abbildungsverzeichnis 429 Abb. 64: Die lemmatypspezifische Verteilung der Wortartengruppen bei den Tokens im DHWDaF 2 ................... 291 Abb. 65: Die lemmatypspezifische Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Types im LTWDaF 2............................................................................ 293 Abb. 66: Die lemmatypspezifische Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Tokens im LTWDaF 2............................................................................ 295 Abb. 67: Die lemmatypspezifische Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Types im DHWDaF 2 .......................................................................... 296 Abb. 68: Die lemmatypspezifische Verteilung des nativen und nicht nativen Definitionswortschatzes bei den Tokens im DHWDaF 2 .......................................................................... 297 Abb. 69: Die lemmatypspezifische Verteilung der autosemantischen Types nach Wortgebildetheit im LTWDaF 2................. 299 Abb. 70: Die lemmatypspezifische Verteilung der autosemantischen Tokens nach Wortgebildetheit im LTWDaF 2............... 300 Abb. 71: Die lemmatypspezifische Verteilung der Wortbildungsarten bei den motivierten autosemantischen Types im LTWDaF 2............................................................................ 301 Abb. 72: Die lemmatypspezifische Verteilung der Wortbildungsarten bei den motivierten autosemantischen Tokens im LTWDaF 2............................................................................ 303 Abb. 73: Die lemmatypspezifische Verteilung der autosemantischen Types nach Wortgebildetheit im DHWDaF 2 ............... 306 Abb. 74: Die lemmatypspezifische Verteilung der autosemantischen Tokens nach Wortgebildetheit im DHWDaF 2 ............. 308 Abb. 75: Die lemmatypspezifische Verteilung der Wortbildungsarten bei den motivierten autosemantischen Types im DHWDaF 2 .......................................................................... 310 Abb. 76: Die lemmatypspezifische Verteilung der Wortbildungsarten bei den motivierten autosemantischen Tokens im DHWDaF 2 .......................................................................... 313 Abb. 77: Ausschnitt aus dem Langenscheidt Basic German Vocabulary (1991, S. 139) ......................................................... 322 Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen 430 Abb. 78: Die Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Types (a) und Tokens (b) im LTWDaF 2............................................................................ 324 Abb. 79: Die lemmatypspezifische Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Types im LTWDaF 2............................................................................ 325 Abb. 80: Die lemmatypspezifische Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Tokens im LTWDaF 2 ............................................................... 326 Abb. 81: Die Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Types (a) und Tokens (b) im DHWDaF 2 .......................................................................... 327 Abb. 82: Die lemmatypspezifische Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Types im DHWDaF 2......................................... 329 Abb. 83: Die lemmatypspezifische Verteilung der im Grundwortschatz verzeichneten und nicht verzeichneten Tokens im DHWDaF 2 .............................................................. 330 Abb. 84: Ausschnitt aus dem Frequency Dictionary (Jones/ Tschirner 2006, S. 109)................................ 337 Abb. 85: Die Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Types (a) und Tokens (b) im LTWDaF 2................................................... 339 Abb. 86: Die lemmatypspezifische Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Types im LTWDaF 2 ................................................................. 340 Abb. 87: Die lemmatypspezifische Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Tokens im LTWDaF 2 ............................................................... 341 Abb. 88: Die Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Types (a) und Tokens (b) im DHWDaF 2 .......................................................................... 342 Abb. 89: Die lemmatypspezifische Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Types im DHWDaF 2 ................................................................ 343 Abbildungsverzeichnis 431 Abb. 90: Die lemmatypspezifische Verteilung der im Frequenzwortschatz verzeichneten und nicht verzeichneten Tokens im DHWDaF 2 .............................................................. 344 Abb. 91: Die Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Types (a) und Tokens (b) im LTWDaF 2............ 352 Abb. 92: Die lemmatypspezifische Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Types im LTWDaF 2 .................... 353 Abb. 93: Die lemmatypspezifische Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Tokens im LTWDaF 2 .................. 354 Abb. 94: Die Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Types (a) und Tokens (b) im DHWDaF 2 .......... 357 Abb. 95: Die lemmatypspezifische Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Types im DHWDaF 2................... 359 Abb. 96: Die lemmatypspezifische Verteilung der im Zertifikatswortschatz als Haupt- und Nebeneintrag verzeichneten und der nicht verzeichneten Tokens im DHWDaF 2................. 360 8. Tabellenverzeichnis Tab. 1: Der offiziell angegebene und der im Anhang aufgelistete Definitionswortschatz in den englischsprachigen Lernerwörterbüchern ................................................................................ 133 Tab. 2: Die deutschen Wörterbücher für Deutsch als Fremdsprache ......... 135 Tab. 3: Die Verteilung der Wortarten in der deutschen Sprache ................ 177 Tab. 4: Die Anzahl der untersuchten Lemmata pro Buchstabe .................. 178 Tab. 5: Die Merkmale des LTWDaF 2 - Länge der Definitionen, Umfang des untersuchten Definitionswortschatzes und Anteil des nicht verzeichneten Definitionswortschatzes .......................... 199 Tab. 6: Die Merkmale des DHWDaF 2 - Länge der Definitionen, Umfang des untersuchten Definitionswortschatzes und Anteil des nicht verzeichneten Definitionswortschatzes ............... 200 Tab. 7: Die Diasysteme der Markiertheit (adaptiert nach Hausmann 1989c, S. 651) .............................................................. 207 Tab. 8: Die Deckung des untersuchten Definitionswortschatzes mit den pädagogischen Wortschätzen ............................................ 361