Словарный запас носителей русского языка
Задачей исследования было определить объём пассивного словарного запаса носителей русского языка. Измерение проводилось с помощью теста, в котором респондентам предлагалось отметить знакомые слова из специальным образом составленной выборки. По правилам теста слово считалось «знакомым», если респондент мог дать определение хотя бы одному его значению. Методика теста подробно описана здесь. Чтобы повысить точность теста и выявить респондентов, проходящих его неаккуратно, в тест были добавлены несуществующие слова. Если респондент отмечал хотя бы одно такое слово как знакомое, его результаты не учитывались. В исследовании приняло участие более 150 тысяч человек (из них прошло тест аккуратно — 123 тысячи).
Для начала, проанализируем влияние возраста на словарный запас.
На графике показаны перцентили полученного распределения. Например, самая нижняя кривая (10-ый перцентиль) для 20 лет даёт 40 тысяч слов. Это означает, что 10% респондентов этого возраста имеют словарный запас ниже этого значения, а 90% — выше. Выделенная синим центральная кривая (медиана) соответствует такому словарному запасу, что половина респондентов соответствующего возраста показали результат хуже, и половина — лучше. Самая верхняя кривая — 90-ый перцентиль — отсекает результат, выше которого показали только 10% респондентов с максимальным словарным запасом.
Из графика видно следующее:
- Словарный запас растет с практически постоянной скоростью до примерно 20 лет, после чего скорость его набора уменьшается, сходя на нет к 45 годам. После этого возраста словарный запас уже практически не меняется.
- Во время обучения в школе подросток учит по 10 слов в день. Эта величина кажется неестественно большой, но объясняется тем, что в тесте производные слова учитывались отдельно, как самостоятельные.
- К моменту выпуска из школы подросток в среднем знает 51 тысячу слов.
- За время обучения в школе словарный запас увеличивается примерно в 2.5 раза.
- После выпуска из школы и до достижения среднего возраста человек в среднем узнаёт 3 новых слова а день.
- После достижения 55 лет словарный запас начинает несколько снижаться. Это может быть связано с забыванием слов, которые не используются достаточно долго. Интересно, что этот возраст примерно совпадает с выходом на пенсию.
Теперь разделим всех респондентов на группы по уровню образования. На следующем графике изображены медианы словарного запаса этих групп. Кривые начинаются и заканчиваются в разных местах из-за того, что статистика по всем группам разная — например, респондентов с неоконченным средним образованием старше 45 было недостаточно много, чтобы результаты были статистически значимы, поэтому пришлось оборвать соответствующую кривую так рано.
Из графика можно узнать, что
- Возможно, насыщение словарного запаса наступает в разном возрасте в зависимости от образования. Так, у респондентов со средним специальным образованием насыщение можно определить в районе 43 лет, с высшим — в 51 год, у кандидатов и докторов — в 54 года. Это можно было бы объяснить спецификой работы респондентов — скорее всего, обладатели ученой степени продолжают штудировать различную литературу даже в зрелом возрасте. Или постоянная жизнь в университетской среде, с ее обилием общения с образованными людьми разных специализаций, постоянно подбрасывает новые слова. Однако с технической точки зрения такие выводы пока делать не стоит — получившиеся кривые достаточно шумные, и очень сложно определить точно, где же начинается насыщение. Возможно, дальнейший набор статистики позволит увидеть зависимость возраста насыщения от уровня образования (если она есть) более чётко.
- Разницы в словарном запасе между теми, кто поступил в университет, но не доучился, и теми, кто прошел этот путь до конца, практически нет (студентам: это не значит, что можно не ходить на лекции).
Теперь исключим влияние возраста, оставив в выборке только респондентов старше 30 лет. Это позволит сконцентрироваться на образовании.
Из графика мы видим следующее:
- Закончившие только школу респонденты знают в среднем на 2-3 тысячи слов больше, чем не закончившие ее в своё время.
- Словарный запас у получивших среднее или среднее специальное образование практически не отличается и составляет в среднем 75 тысяч слов.
- Учившиеся в университетах и институтах (и необязательно закончившие их) знают в среднем 81 тысячу слов.
- Кандидаты и доктора наук знают в среднем 86 тысяч слов. Таким образом, ученая степень прибавляет около 5 тысяч единиц словарного запаса по сравнению с высшим образованием.
- Образование, конечно, влияет на размер словарного запаса. Однако разброс внутри каждой группы с одинаковым образованием значительно больше, чем разница между средними значениями групп. Иными словами, не закончивший школу человек вполне может знать больше слов, чем кандидат наук. Вот конкретные цифры — 20% респондентов с незаконченным средним образованием, показавшие лучший результат для своей группы, имеют словарный запас, превышающий словарный запас половины респондентов с ученой степенью. Скорее всего, они больше читают на разные темы, интересуются и разбираются в большем количестве областей.
Получившиеся в результате исследования величины словарного запаса — десятки тысяч слов — кажутся довольно большими. Этому есть две причины. Во-первых, измерялся пассивный словарный запас (слова, которые человек узнаёт в тексте или на слух), а не активный словарный запас (слова, которые человек использует в речи или на письме). Эти запасы отличаются в разы — пассивный всегда значительно больше. Подсчитанные словарные запасы писателей, например, являются именно активными. Во-вторых, в тесте все производные слова учитывались отдельно (например, «работа» и «работать», или «город» и «городской»).
Отдельно хочется заметить, что полученные результаты не дают представление о словарном запасе «среднестатистического» (если такой вообще существует) носителя русского языка. Например, уровень образования респондентов, прошедших тест, значительно выше общероссийского — 65% респондентов имеют высшее образование, тогда как в России таких только 23% (по данным всероссийской переписи населения 2010 года). Затем, очевидно, что респонденты, прошедшие интернет-тест, в основном являются активными пользователями интернета, и это также делает выборку специфичной (в основном для пожилых людей). В конце концов, далеко не всем интересно определить свой словарный запас, среди наших же респондентов таких — 100%. Логично предположить, что полученные по такой особенной выборке результаты словарного запаса должны быть несколько выше «среднестатистических».
Итак, полученные данные выявили сильную зависимость словарного запаса от возраста, и более слабую — от уровня образования. Очевидно, что есть и другие факторы, влияющие на словарный запас — чтение, общение, работа, хобби, образ жизни. Всё это — темы для следующих исследований.
Дата последней правки: 2 августа, 2014