Соберите коллекцию из 10 текстов в формате txt. Назовите их в формате “год название статьи”. - Откройте его в AntConc, посмотрите самые частотные слова. - Добавьте список стоп-слов, повторите операцию. - Кликнув на 3 любых интересных для вас слова, посмотрите их конкордансы. - Постройте частотный список двух-, трех- и т.д. -словных словосочетаний (вкладка Cluster/N-Grams, поставьте галочку на N-Grams, укажите, сколько слов в ngram-е вы хотите видеть, например, Min:3, Max:3, установите порог вхождений в корпусе, например, 10). Кликнув на n-грам, вы также можете попасть в его конкорданс. - Постройте списки коллокатов выбранного вами слова (вкладка Collocates), указав границы окна справа / слева. Должно получиться несколько фаи?лов: 1. Из окна Word - частотныи? список до применения стоп-фильтра и после (2 фаи?ла). 2. Из окна Concordance - достаточно 1 фаи?л. 3. Из окна N-gram - 1 фаи?л. 4. Из окна Collocate - 1 фаи?л. 3. В Voyant Tools используйте те же 10 документов, что и на предыдущем этапе. 1. Выведите топ-50 слов по всему корпусу (Cirrus - облако слов); добавьте новые стоп-слова (обратите внимание на формы глаголов речи, вспомогательные глаголы и сокращения неинформативные сокращения-аббревиатуры, «слова» без алфавитных символов); обновляйте список стоп-слов, пока топ-50 не покажется вам информативным. Сохраните изображение и добавьте в .docx. 2. Какой документ самый длинный? Какой самый короткий? Сколько в них словоупотреблений? 3. Назовите три документа с наименьшей лексической плотностью. Сколько она составляет? 4. Выберите на основе Cirrus три слова и проследите их динамику для всех документов.
Максим
ИрНИИТУ
Спасибо за работу, хочу вас отметить как лучшего исполнителя, компетентного в своём деле, ...
Максим
ИрНИИТУ
Большое спасибо за проделанную работу, хочу вас порекомендовать как оперативного эксперта ...
Элеонора
РГГУ
Работа выполнена без замечаний, быстро, качественно и цена справедливая к данной работе!
Мансур
НГАУ
Все круто, сделал в ворде, так же отправил дополнительно фото, рекомендую