Шайкевич Анатолий Янович
Все книги автораStudia philologica, Языки славянских культур 2021, ISBN: 978-5-907290-61-7
2876руб Купить
Том 3 Монографии посвящен янализу среднего интервала текста. Исследуемый корпус прозы автоматически членится на фрагменты по 40 слов. Если совместная встречаемость двух слов во фрагментах существенно превышает величину, подсчитанную на основе нулевой гнпотезы, делается вывод о наличии связи между этими словами. В результате возникает огромная сеть теекстуальных связей слов. Показан способ выявления кластеров в этой сети.
Полную сеть текстуальных связей слов (26 тысяч слов и 500 тысяч связей) представлена на компакт диске.
Языки славянских культур 2016, ISBN: 978-5-9907947-7-1
1365руб Купить
В соответствии с двояким характером исследования в целом настоящий том включает две части. В части 4 дистрибутивно-статистический анализ (ДСА) проводится на материале 15 миллионов слов, непосредственно примыкающих друг к другу в текстах русской прозы 1850-1870-х гг. Тот же формальный метод прилагается к английскому корпусу (4 миллиона слов романов Диккенса). И в том, и в другом случае ДСА приводит к открытию дистрибутивных классов и некоторых грамматических конструкций. Часть 5 представляет собой частотный словарь русского корпуса, показывающий распределение слов по основным жанрам, по микрожанрам и по текстам 25 писателей.
В существенно расширенном виде том 2 представлен на компакт-диске.
Языки славянских культур 2014, ISBN: 978-5-9551-0668-7
1591руб Купить
Цель дистрибутивно-статистического анализа состоит в открытии структуры языка на основе большого корпуса текстов. В настоящей трехтомной монографии этот формальный метод в полной мере прилагается к текстам русской прозы 1850-1870 гг. (около 15 млн словоупотреблений); а частично (в виде иллюстраций) к текстам на других языках.
Первый том включает три части:
Очерк развития метода;
Открытие регулярной морфологии в рамках графического слова;
Частотный словарь языка русской прозы 1850-1870 гг.
Первые две части адресованы лингвистам, особенно тем, кто интересуется лингвостатистикой. Частотный словарь будет интересен филологам-русистам. В существенно расширенном виде он представлен на компакт-диске.
Studia philologica, Языки славянских культур 2008, ISBN: 978-5-9551-0279-5
888руб Купить
Настоящий словарь представляет собой композицию трех частотных словарей, за каждый из которых стоит свой корпус текстов: 1) тексты девяти московских и петербургских газет за 1997 г., 2) комплект «Независимой газеты» за 1996-2000 гг., 3) Корпус газетных заголовков 1991-2000 гг. Общий объем трех корпусов составляет 50 млн. слов текста. В печатной версии словаря представлено 52 тыс. разных слов, в электронной версии словник превышает 140 тыс. разных слов, там же читатель найдет и соответствующий обратный словарь.
Во втором томе словаря будут даны таблицы распределения лексики по газетам, жанрам и темам; электронная версия включит таблицы бинарных словосочетаний.