Szókincsméretek összehasonlító listája
A Wikipédiából, a szabad enciklopédiából
Ez a szócikk általános és speciális szótárak, valamint anyanyelvi és idegen nyelvi beszélők szókincsének méretét veti össze a lexémákat tekintve. (Nem kerülnek be tehát ide azok az adatok, amelyek a webkorpuszok méretét jelölik, azaz hogy hány szót dolgoztak fel, csak az, hogy hányféle szót találtak, nem számítva egy szó különböző előfordulásait és különböző alakjait.)
Ahol a szókincs értelme nincs megadva, ott az ún. aktív szókincset jelöli (tehát amit a beszélő nemcsak felismer, hanem használ is). A szótáraknál legalább hat tényező van, amelyek döntően befolyásolják az eredményt:
- külön vesszük-e az összetett szavakat, ill. az állandósult (szó értékű) szókapcsolatokat (még akkor is, ha az adott nyelvben egy adott forma különíródik),
- külön vesszük-e a képzett szavakat (külön kérdés a produktív és az improduktív képzőké),
- külön vesszük-e a homonimákat és az egyes szavak más szófajú jelentéseit, amelyek akár jelentősen eltávolodhatnak egymástól,
- külön vesszük-e az egyes szavak szuppletív (más tőalakú) származékait,
- beleszámítjuk-e a kulturálisan jelentős tulajdonneveket (városok, mitológiai alakok neve stb.), és mit teszünk például azokkal a terméknevekkel, amelyek az egyik nyelvben tulajdonnevek, a másikban köznevek,
- hogyan kezeljük a ragokat és a funkciószavakat (az egyik nyelvben ugyanazt a jelentést kifejezheti rag, míg a másikban önálló elöljárószó).
Ezek fényében az egyes adatok tényleges jelentése számottevően eltérhet.
Tartalomjegyzék |
[szerkesztés] 1000 alatt |
|
| 15 | Egy szöveg leggyakoribb szavai közül ennyi adja ki annak 25%-át.[1] |
| 100 | Egy szöveg leggyakoribb szavai közül ennyi adja ki annak 60%-át.[1] |
| 300 | Kb. egy 2 éves gyerek szókincse[2] |
| 500 | Kb. egy 2,5 éves gyerek szókincse[2] |
| 850 | Az Ogden-féle egyszerű angol nyelv (Basic English) szókincse[3] |
| 920 | Kb. ennyi szógyököt tartalmazott az eszperantónak a Zamenhof által kidolgozott alapszókincse, amelyből több tízezer további szó képezhető (pl. a ’jó’ szóból ’rossz’, ’jóság’, ’javulni’ stb.).[4] |
[szerkesztés] 1000 – 10 000 |
|
| 1000 | Kb. egy 3 éves gyerek szókincse[2] |
| Az 1000 leggyakoribb szó adja ki egy szöveg szavainak 85%-át.[1] | |
| Az 1000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 64%-át fedi le.[5] | |
| A Közös Európai Referenciakeret A2-es fokozatának, az ún. alapszintnek megfelelő szókincs (ez a B1-nek megfeleltetett alapfokú nyelvtudásnál eggyel alacsonyabb szint).[6] | |
| 1500 | Kb. egy 4 éves gyerek szókincse[2] Ez hátrányos helyzetű családok négyéves gyerekeinél csupán 600 is lehet, míg diplomás szülők azonos korú gyerekeinél a 2100-at is elérheti,[7] tehát a gyerekek szókincsére vonatkozó adatok csak tájékoztató jellegű középértékek, amelyek erősen függenek a családi körülményektől. |
| 2000 | Kb. egy 5 éves gyerek szókincse[2] |
| Ennyi szót használnak az első osztályosok olvasástanításában.[8] | |
| Az élő-aktív szókincs legszerényebb alsó határa épelméjű felnőtt embereknél[9] | |
| A Longman Dictionary of Contemporary English angol egynyelvű szótár ennyi szót használ fel szótári definícióiban.[10] | |
| Nation és Waring tanulmánya szerint a 2000 leggyakoribb szóval egy szöveg 90%-át megértjük; ekkora szókinccsel és a tulajdonnevek ismeretével pedig 93,7%-ot.[11] | |
| J. Milton tanulmánya szerint a 2000 leggyakoribb szóval egy átlagos szöveg 80%-át értjük meg; a források szerint ennyire van szükség egy szöveg lényegének megértéséhez.[6] | |
| A 2000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 72%-át fedi le.[5] | |
| A Közös Európai Referenciakeret B1-es fokozatának, az ún. küszöbszintnek megfelelő szókincs; ez a magyarországi rendszerben az alapfokú nyelvtudásnak felel meg.[6] | |
| 2500 | Kb. egy 6 éves gyerek szókincse[2] |
| Nation és Waring tanulmánya szerint egy szöveg leggyakoribb szavai közül ennyivel (pontosabban 2600-zal) szavainak 96%-át megértjük.[11] | |
| 3000 | Kb. egy 7 éves gyerek szókincse[2] |
| Nation és Waring tanulmánya szerint a 3000 leggyakoribb szóval egy szöveg 95%-át megértjük, s ez az arány szükséges ahhoz, hogy a kontextusból a többire is következtetni tudjunk.[11] | |
| A 3000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 77%-át fedi le.[5] | |
| Megközelítőleg Katona József Bánk bán c. művének szókincse (egész pontosan: 2882).[8] | |
| Arany János Toldi c. művében felhasznált szókincse (egész pontosan: 3059).[8] | |
| Jean Racine összes tragédiáját állítólag ennyi szó felhasználásával írta.[12][13] | |
| 3000– 5000 |
Az átlagember aktív szókincse (élő-aktív és szunnyadó-aktív)[9] |
| 3500– 3900 |
A Közös Európai Referenciakeret által Görögországban és Magyarországon B2-ként értékelt, az ún. középszintnek megfelelő szókincs; ez a magyarországi rendszerben a középfokú nyelvtudásnak felel meg.[6] |
| 4000 | Kb. egy 9 éves gyerek szókincse[2] |
| A 4000 leggyakoribb szó adja ki egy szöveg szavainak 97,5%-át.[1] | |
| 4353[14][15] 4735[15] |
Balassi Bálint műveiből kimutatható szókincse |
| 5000 | Kb. egy 11 éves gyerek szókincse[2] |
| Nation és Waring tanulmánya szerint az 5000 leggyakoribb szóval egy szöveg 98,5%-át megértjük.[11] | |
| Az 5000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 82%-át fedi le.[5] | |
| 5000– 10 000 |
Az átlagember passzív szókincse[9] |
| 6000 | J. Milton prezentációja szerint ennyi szóval a Shreket 95%-ban megértjük.[16] |
| 6000– 8000 |
J. Milton tanulmánya szerint a leggyakoribb szavak közül ennyivel egy átlagos szöveg 95-98%-át értjük meg; a források szerint ennyire van szükség egy szöveg lényegében teljes megértéséhez.[6] |
| 6882[8] 7824[15] |
Zrínyi Miklós összes műveiből kimutatható szókincse |
| 8000– 9000 |
J. Milton prezentációja szerint ennyi szó szükséges a 20. századi angol próza megértéséhez.[16] |
| 8000– 10 000 |
A klaszikus vagy bibliai héber nyelv szókincse, a gyökök számolásától függően.[17] |
| 9812 | Csokonai Vitéz Mihály színműveiből kimutatható szókincse[18] |
[szerkesztés] 10 000 – 100 000 |
|
| 10-12 ezer | J. Milton prezentációja szerint ennyi szóval a tankönyveket 95%-ban megértjük.[16] |
| 10-20 ezer | Az egyes nyelvek beszélői legfeljebb ennyi szót használnak[19] |
| 10-30 ezer | Egy kétnyelvű kisszótár terjedelme (címszók)[20] |
| 11 606 | Juhász Gyula verseiből kimutatható szókincse[19] |
| 16 000 | Az ókori egyiptomi nyelv legteljesebb szótárának, a Wörterbuch der ägyptischen Sprachénak a terjedelme |
| 18 és 25 ezer között | Shakespeare (műveiben felhasznált) szókincsét ennyire becsülik (a konkrét érték attól függ, melyik kutató mit számít önálló szótári szónak; a kiindulás 29 066 különböző szóalak)[21] |
| 22 719[8] 23 ezernél több[14][15] |
Petőfi Sándor verseiből kimutatható szókincse |
| 25 ezer | Arany János (műveiben felhasznált) szókincsét kb. ekkorára becslik[14][22] |
| 25-30 ezer | Egy átlag értelmiségi egyévi beszédét gondolatban rögzítve kb. ennyiféle szó fordulna elő.[23] |
| 35-80 ezer | Egy kétnyelvű kéziszótár terjedelme (címszók)[24] |
| 40-45 ezer | Jókai Mór (műveiben felhasznált) szókincsének becsült mérete[14][15] |
| 50-60 ezer | Igen művelt embereknél a passzív szókincs nagysága[9] |
| 60-100 ezer | Kb. ennyi mai magyar szót tartanak számon.[23] |
| 75 ezer | Ennyi szó jelentését magyarázza meg az új Magyar értelmező kéziszótár (ezek között már szakszavak és rétegnyelvi szavak is szerepelnek).[19][25] |
| 87 000 | A Grand Larousse terjedelme (címszók, 2005-ös kiadás)[26] |
| 88 431 | A Spanyol Királyi Akadémia hivatalos értelmező szótára 22. kiadásának terjedelme (címszók).[27] |
[szerkesztés] 100 000 – 1 000 000 |
|
| 100 ezer | A francia Trésor de la langue française informatisé terjedelme (címszók)[28] |
| 110 ezer | A 18 kötetesre tervezett A magyar nyelv nagyszótára tervezett terjedelme (címszók)[29] |
| 120 ezer[19][30] 130 ezer[31] 135 ezer[32] 190 ezer[33] |
Egy kétnyelvű nagyszótár terjedelme (címszók) |
| 171 476 | A 20 kötetes Oxford English Dictionary 2. (nyomtatott) kiadásából (1989) a ma is használt szavak száma[34] |
| 291 500 | A 20 kötetes Oxford English Dictionary 2. (nyomtatott) kiadásának (1989) terjedelme (címszók)[35] |
| 350 ezer | A 33 kötetes Deutsches Wörterbuch terjedelme (1960-as kiadás, címszók)[36] |
| több mint 450 000 | A Webster’s Third New International Dictionary, Unabridged terjedelme (címszók)[37] |
| 615 100 | A 20 kötetes Oxford English Dictionary 2. (nyomtatott) kiadásának (1989) terjedelme (definiált szóalakok száma)[35] |
| 750–800 ezer | Az 1772 és 2000 közötti időszak magyarul publikált szókészlete, amelynek szűréséből A magyar nyelv nagyszótára anyagát összeállítják.[38] |
[szerkesztés] 1 000 000 és fölötte |
|
| 1 millió | A magyar nyelvben kb. ennyi szó (lexéma!) van (túlnyomórészt elavult vagy rendkívül speciális szavak)[19] |
| 7,2 millió | Az 1,48 milliárd szövegszót (v. szóelőfordulást) tartalmazó magyar webkorpusz 4%-os hibatűréssel készült metszetéből kinyert szókincs mérete (lexémák, ill. szótári szavak), kézi ellenőrzés nélkül[39] |
[szerkesztés] Jegyzetek
- ^ a b c d David Crystal: A nyelv enciklopédiája, Osiris, Bp. 2003, ISBN 9633894816 (újabb kiadás: 2006, ISBN 9789633894811), 115. o.
- ^ a b c d e f g h i David Crystal: A nyelv enciklopédiája, Osiris, Bp. 2003, ISBN 9633894816 (újabb kiadás: 2006, ISBN 9789633894811), 290. o. és 308. o. adatai, ill. azok interpolálása
- ↑ Basic English szócikk az angol Wikipédiában
- ↑ A Fundamento de Esperanto (’az eszperantó alapjai’) egyik fejezete az Universala Vortaro (’általános szókészlet’), amelynek előzménye az 1887-es Unua Libro (’első könyv’). Források a számértékhez: en:Esperanto, en:Esperanto vocabulary: 900, de:Fundamento de Esperanto: 920, eo:Universala Vortaro: 900, eo:Unua Libro: 947, ebből 11 tulajdonnév.
- ^ a b c d The frequency dictionary for Russian
- ^ a b c d e A francia mint idegen nyelv és a Közös Európai Nyelvi Referenciakeret (James Milton cikkének kivonata, Swansea-i Egyetem); a WebCite archívumának linkje
- ↑ Építeni kell a gyerekek szókincsét (Nyest, 2011. március 23.)
- ^ a b c d e Gyakorisági szótárak – Magyarországi helyzetkép (Lengyelné Molnár Tünde, Könyvtári Figyelő, 52. évf., 2006/1. sz.)
- ^ a b c d Nádasdy Ádám: Egy átlag angol munkás (Magyar Narancs, 2007/08/02, 31. szám)
- ↑ Longman Dictionary of Contemporary English Updated Edition, Longman Catalogue
- ^ a b c d Paul Nation és Robert Waring: Szókincsméret, szöveglefedettség és szójegyzékek, Hirsh és Nation kutatása; a WebCite archívumának linkje
- ↑ „En étudiant le vocabulaire des écrivains classiques on a pu constater que Racine a écrit toutes ses tragédies avec seulement 3 000 vocables.” Recherches sur une chaîne de caractères
- ↑ Langue sauce piquante » Blog Archive » Mots défunts
- ^ a b c d Balassi Bálint szép szavainak szótára, Holmi, 2005. június
- ^ a b c d e Irodalmi szemle, 2005. április, 81. o. skk. (PDF)
- ^ a b c Szókincsfelmérések a Nyelvi Referenciakeretben (James Milton, Swansea-i Egyetem), HTML-változat
- ↑ BDB: The New Brown–Driver–Briggs–Gesenius Hebrew and English Lexicon 1906, repr. 1979, Hendrickson Publishers, Peabody, Massachusetts, ISBN 1-56563-206-0 (Wikisource: Repr. 1936)
- ↑ Csokonai-szókincstár I. Előszó (a Debreceni Egyetem Magyar Nyelvtudományi Tanszéke)
- ^ a b c d e A nyelv és a nyelvek, 4. és 5. fejezet, szerk.: Kenesei István, Akadémiai, Bp. 2004, ISBN 9630579596, 76–77., 84. és 86. o., 4. fejezet, 5. fejezet (PDF)
- ↑ Akadémiai Kiadó: Magyar–angol kisszótár (ISBN 9789630583589, 18 000 címszó), Angol–magyar kisszótár (ISBN 9789630583572, 18 000 címszó), Angol–magyar–angol kisszótár egybekötve (ISBN 9789630584838, 18‑18 000 címszó), Magyar–német kisszótár (ISBN 9630584158, 30 000 címszó), Német–magyar kisszótár (ISBN 963058414X, 30 000 címszó), Magyar–francia kisszótár (ISBN 9630581760, 25 000 címszó), Francia–magyar kisszótár (ISBN 9789630583268, 22 000 címszó), Magyar–olasz, olasz–magyar kisszótár (ISBN 9789630955072, 10 000 címszó)
- ↑ How many in the language and how many does any one person know? (World Wide Words)
- ↑ Hajdanócok kora – Kövületekről és kövült szavakról (Székely Nemzeti Múzeum)
- ^ a b Nádasdy: A magyar nem nehéz (az Origo Vendégszoba interjúja, 2003. november 26.)
- ↑ Eckhardt Sándor: Magyar–francia kéziszótár (Akadémiai): 35 000 címszó; Halász Előd: Magyar–német kéziszótár (Akadémiai, Bp. 1995): 40 000 címszó; Magyar–angol kéziszótár (Akadémiai): 50 000 címszó, Magyar–spanyol kéziszótár (Terra, Bp. 1992): 50 000 címszó, Magyar–német kéziszótár (Akadémiai): 60 000 címszó; Aquila Kiadó: Varga György és Lázár A. Péter: Magyar–angol szótár: 72 ezer, Héra István: Magyar–német szótár: 72 ezer, Lázár A. Péter és Varga György: Angol–magyar szótár: 76 ezer, Héra István: Német–magyar szótár: 80 ezer.
- ↑ Ingyenesen elérhető elektronikus nagyszótárak, lexikonok és nyelvvizsgára előkészítő anyagok (Akadémiai Kiadó)
- ↑ Le Grand Larousse illustré - dictionnaire encyclopédique en 3 volumes + CD-ROM - habillé par Starck (Dicoland.com)
- ↑ Spanyol Királyi Akadémia: 22.a edición del DRAE – Datos comparados con la edición anterior
- ↑ Trésor de la langue française informatisé szócikk a francia Wikipédiában
- ↑ Hír az MTA honlapján (2007. november 7.), Hír az MTA honlapján (2007. november 14.) A szótár, amire 200 évet várunk – Interjú Ittzés Nóra lexikográfussal (Index, 2007. április 20.)
- ↑ Akadémiai Kiadó: Magyar–angol nagyszótár
- ↑ Akadémiai Kiadó: Magyar–német nagyszótár
- ↑ Akadémiai Kiadó: Francia–magyar nagyszótár, Magyar–francia nagyszótár
- ↑ Magyar–német klasszikus nagyszótár CD-vel, Magyar–német nagyszótár CD-vel
- ↑ How many words are there in the English language? (AskOxford.com, Frequently Asked Questions)
- ^ a b Szótári tények
- ↑ Deutsches Wörterbuch szócikk a német Wikipédiában
- ↑ Webster's Third New International
- ↑ [1] (megközelítőleg 750 ezer szó), [2] (mintegy 800 ezer szó)
- ↑ Hungarian webcorpus (ismertető angolul; BME Szociológia és Kommunikáció Tanszék - Médiaoktatási és Kutatóközpont), értelmezéséhez l. Mártonfi Attila hozzászólása az Index egyik fórumában
[szerkesztés] Külső hivatkozások
- Egy átlag angol munkás (Nádasdy Ádám cikke, Magyar Narancs, 2007/08/02, 31. szám)
- Magyar webkorpusz: magyar szavak gyakoriság szerinti listája (szóalakok, nem lemmák!)
- Hamarosan megszületik az egymilliomodik angol szó (Index, 2009. április 29.) – az utolsó két bekezdés az egyes emberek szókincséről más vonatkozásban is kapcsolódik a szócikkhez
- Több mint egymillió angol szó van (Index, 2010. december 19.), a szókincs bővülésének változó mértékéről is
- Végtelen szótárak – Melyik nyelvnek van a legnagyobb szókincse? (Nyest.hu, 2010. június 28.)
- Kérdés-válasz a magyar és a finn szókincs viszonyáról és átfedéséről (Nyest.hu, 2011. január 3.)
- (angolul) How many words? (David Crystal cikke arról, hány szó van az angolban és hogyan állapíthatjuk meg saját szókincsünk méretét, English Today, 1987. október, 12. sz.)

