Rozmiar słownictwa użytkowników języka polskiego
Przedstawiamy wstępne wyniki testu słownictwa polskiego, przeznaczonego zarówno dla rodzimych użytkowników języka, jak i uczących się. Szczegółowe informacje o metodologii testu są dostępne na stronie opisu testu.
Uczestnicy
Do tej pory 2045 respondentów ukończyło test, w tym 1121 rodzimych użytkowników języka oraz 924 uczących się polskiego. Przyjrzyjmy się ich rozkładowi wiekowemu:
Obie grupy są zdominowane przez młodszych uczestników w wieku od szkoły średniej do studiów, ponieważ test był głównie promowany wśród nich.
Rozmiar słownictwa
Przyjrzyjmy się teraz rozmiarom słownictwa rodzimych użytkowników języka i uczących się.
Dla rodzimych użytkowników języka:
- Mediana rozmiaru słownictwa wynosi 79 700 słów. Oznacza to, że połowa rodzimych użytkowników języka zna mniej słów, a druga połowa zna więcej.
- 25. percentyl wynosi 55 900 słów. Innymi słowy, 25% rodzimych użytkowników języka osiągnęło wynik poniżej tego poziomu, a pozostałe 75% uzyskało wyższy wynik.
- 75. percentyl wynosi 99 900 słów. Oznacza to, że tylko 25% rodzimych użytkowników języka posiada słownictwo większe niż ta wartość.
- Na poziomie 90. percentyla, tylko 10% rodzimych użytkowników języka zna więcej niż 112 200 słów. To górny zakres rozmiaru słownictwa w naszym zbiorze danych.
Dla uczących się:
- Mediana wielkości słownictwa wynosi 8 200 słów. Oznacza to, że połowa testowanych uczących się zna mniej słów, a druga połowa zna ich więcej.
- 25. percentyl wynosi 2 800 słów. Innymi słowy, 25% uczących się uzyskało wynik poniżej tego poziomu, a 75% osiągnęło wynik wyższy.
- 75. percentyl wynosi 18 000 słów. Oznacza to, że tylko 25% uczących się ma większy zasób słownictwa.
- W 90. percentylu tylko 10% uczących się zna więcej niż 31 900 słów. To reprezentuje górny zakres wielkości słownictwa wśród uczestników testu.
Oto porównanie rodzimych użytkowników języka i uczących się na tym samym wykresie:
Wielkość słownictwa a wiek
Przyjrzyjmy się teraz dokładniej temu, jak wielkość słownictwa zależy od wieku. Na kolejnym wykresie każdy punkt reprezentuje pojedynczego uczestnika testu:
Dane wyglądają dość przytłaczająco. Pogrupujmy uczestników według wieku i wykonajmy analizę statystyczną, aby dostrzec trendy. Zacznijmy od rodzimych użytkowników języka.
Jest to wykres pudełkowy, gdzie każde pudełko odpowiada grupie uczestników w określonym przedziale wiekowym (5-9, 10-14, 15-19 itd.). Środkowa linia pudełka pokazuje medianę dla danej grupy, dolna linia oznacza 25. percentyl, a górna 75. percentyl; pudełko obejmuje połowę wszystkich uczestników w grupie. Wąsy wykresu pokazują 1,5-krotność rozstępu międzykwartylowego. Dane poza wąsami są często traktowane jako wartości odstające. Pojedyncze obserwacje przedstawione są jako punkty.
Przedstawienie danych w ten sposób pozwala nam od razu dostrzec trend. W przypadku rodzimych użytkowników języka wielkość słownictwa rośnie wraz z wiekiem. Rosnąca tendencja utrzymuje się do około 25. roku życia (okres formalnej edukacji), a następnie nadal rośnie, ale wolniej. Podobne badania często wskazują na spadek zasobu słownictwa po około 55. roku życia; w naszych danych nie widzimy tego efektu. Oto konkretne liczby:
- 12-latek zna średnio 40 000 słów.
- 17-latek zna średnio 56 000 słów.
- 22-latek zna średnio 66 000 słów.
- W okresie aktywnego wzrostu słownictwa uczniowie przyswajają około 2 600 słów rocznie.
- Większość dorosłych zna średnio 91 000 słów.
Przejdźmy teraz do uczących się.
Dla uczących się:
- Mediana wielkości słownictwa uczących się w wieku szkolnym i akademickim (15-24 lata) wynosi 6 800 słów.
- Mediana wielkości słownictwa dorosłych uczących się (>25 lat) wynosi 10 500 słów.
Najczęściej zadawane pytania
Czy mogę porównać te wyniki z wynikami innych testów słownictwa w języku polskim?
Niestety nie. Porównanie wyników różnych testów słownictwa jest niemożliwe. Po pierwsze, każdy test stosuje inną metodologię, mierząc nieco inne aspekty słownictwa. Po drugie, testy różnie definiują, co liczy się jako słowo – niektóre uwzględniają wyrazy pochodne, inne nie. Po trzecie, każdy test stosuje inną definicję tego, co oznacza „znać” słowo. Wreszcie, nie wszystkie testy dostępne w internecie są rzetelne – tylko niewielka ich część opiera się na rygorystycznych metodach naukowych.
Jak średnia wielkość słownictwa rodzimych użytkowników i uczących się w języku polskim wypada w porównaniu z innymi językami?
Porównanie wielkości słownictwa między językami jest niemal niemożliwe.
- Wiele języków ma silnie rozwiniętą fleksję, przez co pojedynczy rdzeń może generować liczne formy. W łacinie np. czasownik „amare” (kochać) tworzy formy takie jak „amo” (kocham), „amavi” (kochałem) i „amatus” (kochany).
- Niektóre języki, jak niemiecki, często tworzą długie złożenia, np. „Donaudampfschifffahrtsgesellschaftskapitän” (kapitan firmy żeglugi parowej na Dunaju).
- Wiele języków ma bogatą morfologię derywacyjną – np. z angielskiego „happy” powstają „happiness”, „unhappiness”, „happily”, „unhappily”.
- Języki często zapożyczają słowa, np. angielski „déjà vu” (fr.), „tsunami” (jap.), „emoji” (jap.).
Ile słów liczy język polski?
Trudno dokładnie określić liczbę słów w języku polskim, ale Słownik Języka Polskiego PWN zawiera około 140 000 słów.
Ostatnia aktualizacja: 2 lutego 2025