• Русский язык за полтора века утратил каждое третье исконно русское слово


    Burenstam
    http://diletant.media/upload/resize_cache/iblock/7be/285_300_1/7be3d892c5d84785126c8b3f1f8293fc.jpg
    Сто пятьдесят лет назад был впервые полностью опубликован словарь Даля. Он прославился как словарь именно живого, повседневного языка, на котором говорили в России в середине XIX века. Мы решили посмотреть, насколько сильно с тех пор изменился язык, и сравнили слова из словаря Даля с теми, которые используют люди в поисковых запросах. За год Яндекс отвечает примерно на 70 миллиардов запросов из России. Если по пробелам и специальным символам разделить эти запросы на словоформы, выбрать только те, которые состоят из кириллических букв, и автоматически привести их к начальной форме, получается больше 285 миллионов разных слов. На самом деле далеко не все из них настоящие русские слова: в поиске люди часто пишут с ошибками — [детский мир отзовы], [турагенство] — и в неправильной раскладке — [нщгегиу], а иногда просто вводят непонятные последовательности букв — [аааааааааааааау]. Даль даёт толкование примерно двухсот тысяч слов. Из них почти одна пятая (18%) за год ни разу не встретилась в поисковых запросах к Яндексу. Примерно 38% слов упоминались в запросах, но отсутствовали в корпусе русского языка. В пересечение поиска и корпуса попали 44% слов.
    Подробнее »



    Обратная связь


    Комментариев нет



    Гость
    Закрыто для дальнейших комментариев