Размер словарного запаса носителей и изучающих иврит
Мы представляем предварительные результаты теста на словарный запас на иврите, разработанного как для носителей языка, так и для изучающих его. Подробная информация о методике теста доступна на странице описания теста.
Участники
На данный момент тест прошли 1 064 участника, включая 386 носителей языка и 678 изучающих иврит. Ниже представлено распределение их возраста:


Среди носителей языка преобладают молодые участники, с неожиданным пиком в возрастной группе 15–20 лет. Среди изучающих большинство участников старше, с небольшим пиком в возрастной группе 40–50 лет. Мы увидим, что эти особенности выбори респондентов проявят себе в результатах.
Словарный запас
Рассмотрим размеры словарного запаса носителей языка и изучающих.

Размер словарного запаса носителей языка варьируется от 0 до 70 000 слов (cогласно Академии языка иврит, общее количество слов в иврите составляет около 80 000). На гистограмме можно выделить три основные компоненты:
- Широкое распределение по Гауссу в диапазоне от 30 000 до 70 000 слов, соответствующее взрослым носителям языка.
- Вторичный пик около 20 000 слов, связанный с пиком в возрастной группе 15–20 лет.
- Небольшой хвост ниже 10 000 слов, скорее всего, из-за участников, которые ошибочно указали себя как носителей языка.
Вот конкретные данные для носителей языка:
- Медиана: 39 100 слов. Половина участников знает меньше этого количества, половина — больше.
- 25-й перцентиль: 19 800 слов. 25% участников знают меньше, 75% — больше.
- 75-й перцентиль: 51 000 слов. 25% участников знают больше, 75% — меньше.
- 90-й перцентиль: только 10% участников знают больше 58 700 слов.
Эти данные включают носителей языка всех возрастов. Далее мы рассмотрим, как размер словарного запаса зависит от возраста.
Теперь перейдём к изучающим.

Скорее всего, среди прошедших тест изучающих иврит есть две основные группы. Первая группа значительно больше и охватывает результаты ниже примерно 13 000 слов. Вторая группа меньше, но показывает гораздо более высокие результаты, около 25 000 слов и выше, что сопоставимо с носителями языка.
Вот конкретные данные для изучающих:
- Медиана: 4 250 слов. Половина участников знает меньше, половина — больше.
- 25-й перцентиль: 1 200 слов. 25% участников знают меньше, 75% — больше.
- 75-й перцентиль: 17 800 слов. 25% участников знают больше, 75% — меньше.
- 90-й перцентиль: только 10% участников знают больше 35 600 слов.
Эти данные включают изучающих всех возрастов.
Ниже приведено сравнение носителей языка и изучающих на одном графике:

Словарный запас и возраст
Теперь рассмотрим, как размер словарного запаса зависит от возраста. На следующем графике каждая точка представляет одного участника:

Сгруппируем участников по возрасту и вычислим статистику, чтобы выявить тенденции. Начнём с носителей языка.

На коробчатой диаграмме (она же еще называется "ящик с усами", вот такое лингвистическое открытие) каждая коробка представляет группу участников определённого возраста (10–14, 15–19, 20–24 и т. д.). Средняя линия коробки показывает медиану, нижняя — 25-й перцентиль, верхняя — 75-й перцентиль. Усы показывают 1,5 межквартильного размаха. Данные за пределами усов часто считаются выбросами. Отдельные наблюдения отображаются в виде точек.
Построение данных таким образом сразу позволяет нам увидеть тенденцию: у носителей языка размер словарного запаса растёт с возрастом. Он быстро увеличивается примерно до 25 лет (период формального образования), затем медленно растёт и достигает насыщения около 55 лет. После 55 лет у нас недостаточно данных, чтобы сделать выводы. Вот конкретные цифры:
- 12-летний ребёнок знает, в среднем, 18 000 слов.
- 22-летний человек знает, в среднем, 40 000 слов.
- Во время обучения в школе (средняя, старшая школа, колледж/университет) словарный запас увеличивается на 2200 слов в год.
- Максимальный средний словарный запас достигает 49 000 слов. Это происходит примерно в возрасте 55 лет.
Теперь перейдём к изучающим.

Размер словарного запаса у изучающих язык не зависит от их возраста. Он зависит от того, как долго человек изучает язык, сколько усилий он вкладывает в обучение, окружён ли он носителями языка или использует новый язык в работе. Поэтому то, что мы видим на графике - это аномалия нашей выборки прошедших тест. На коробчатой диаграмме видно две группы участников. Первая, более многочисленная, охватывает весь возрастной диапазон и имеет меньший размер словарного запаса. Эти участники преобладают в возрасте до 40 лет, и их средний словарный запас составляет около 2400 слов. Вторая группа начинает доминировать среди участников старше 40 лет, и её словарный запас значительно больше. Именно поэтому на графике наблюдается резкое изменение словарного запаса в возрасте 40 лет. Мы уже видели избыток участников в возрастной группе старше 40 лет на гистограмме возраста — это был тот же самый набор участников.
Часто задаваемые вопросы
Могу ли я сравнить эти результаты с результатами других тестов на словарный запас?
К сожалению, нет. Невозможно сравнить результаты двух разных тестов на словарный запас. Во-первых, все тесты используют разные методологии, поэтому они измеряют немного разные аспекты словарного запаса. Во-вторых, в каждом тесте по-разному определяется, что считается "словом". Например, одни тесты учитывают производные слова, а другие — нет. В-третьих, у каждого теста есть своё определение того, что значит "знать" слово. Наконец, не все онлайн-тесты одинаково полезны. Только небольшая их часть основана на строгих научных методах.
Как сравнить средний словарный запас носителей языка и изучающих иврит с другими языками?
Сравнивать размеры словарного запаса между языками практически невозможно.
- Во многих языках существует развитая система словоизменения, где от одного корня может образовываться множество форм. Например, в латыни глагол "amare" (любить) образует формы "amo" (я люблю), "amavi" (я любил) и "amatus" (любимый). Включение всех таких форм может значительно увеличить общее количество слов в языке.
- В некоторых языках, таких как немецкий, часто встречаются составные слова. Например, "Donaudampfschifffahrtsgesellschaftskapitän" считается одним словом и означает "капитан Дунайской пароходной компании". Решение, считать ли составные слова отдельными единицами или комбинацией существующих слов, может быть сложной задачей.
- Некоторые языки имеют богатую систему словообразования, что значительно увеличивает их словарный запас. Например, в английском языке от слова "happy" (счастливый) образуются такие формы, как "happiness" (счастье), "unhappiness" (несчастье), "happily" (счастливо) и "unhappily" (несчастливо). Следует ли считать такие слова как одно или как отдельные единицы?
- Многие языки заимствуют слова из других языков, расширяя свой словарный запас. Например, в английском языке есть заимствования: "déjà vu" из французского, "tsunami" из японского и "emoji" также из японского. Определение того, когда заимствованное слово становится полноценной частью языка, добавляет ещё больше сложности.
Сколько слов в иврите?
Согласно данным Академии языка иврит, в иврите насчитывается около 80 000 слов, и это число продолжает расти.
Последнее обновление: 25 января 2025 г.