Программа Анализатор текста v. 1.0. Пример работы с романом С. Кинга «Оно»
компьютерная программа
Аннотация. В статье представлено описание программного обеспечения для автоматизированного контент-анализа художественных текстов, разработанного на языке Python с использованием библиотеки Tkinter. Программа предназначена для лингвистических и литературоведческих исследований и включает следующие функциональные возможности: анализ контекстного окружения ключевых слов, частотный анализ распределения лексики по частям текста, выявление совпадений ключевых слов с именами персонажей, а также сбор базовой статистики текста. Практическая ценность разработки демонстрируется на примере анализа репрезентации концепта "Страх" в романе С. Кинга "Оно". Показаны возможности программы в выявлении закономерностей распределения эмоционально-оценочной лексики, установлении связей между ключевыми словами и персонажами, а также в получении общей статистической информации о тексте.
Предлагаемое мною простое ПО (рис. 1) ориентироовано на тех, кто занимается контент-анализом художественных текстов в лингвистических / литературоведческих целях. Оно было подготовлено на языке Python для научной работы автора, доработано с помощью Алисы Про и снабжено оконным интерфейсом благодаря библиотеке Tkinter.

Рис. 1. Начальный вид программы
Основные вкладки интерфейса:
- Контексты — показывает окружение заданных слов в тексте (по 3 слова справа и слева от рассматриваемого).
- Частота слов — отображает процентное распределение ключевых слов по частям текста (текст делится на 10 относительно равных частей).
- Совпадения — показывает количество абзацев и предложений, содержащих одновременно имена персонажей и ключевые слова.
- Общие данные — выводит базовую статистику текста (количество символов, слов, предложений, среднюю длину предложения и слова).
Принцип работы:
- Пользователь вводит ключевые слова и имена персонажей через запятую.
- Пользователь загружает текстовый файл через диалоговое окно. (Именно в этом порядке!)
- Программа автоматически проводит анализ по обозначенным выше параметрам.
- Результаты отображаются на соответствующих вкладках. Их можно выделять и копировать, используя Ctrl + C.
NB! Это не исполняемый файл. Запускать код нужно в какой-либо среде разработки. Я это делаю в Wing 101. На ПК должен быть установлен Python.
Как с этим можно работать?
Проанализируем репрезентанты концепта "Страх" в романе С. Кинга "Оно". Возьмем слова-существительные, обозначающие страх в английском языке. В демонстрационных целях ограничимся выборкой: fear, alarm, horror, fright, panic, terror, dread.
1. Внесем слова в программу (рис. 2), а в качестве персонажа обозначим слово clown. Загрузим в программу файл Кинг.txt.

Рис. 2. Работа с романом С. Кинга "Оно"
2. Для каждого слова, обозначающего страх, мы получаем список контекстов (рис. 2). Их можно проанализировать как самостоятельно, так и с помощью ИИ. В примере (рис. 3) я отправил контексты Алисе Про. Результат ее работы представляет собой, по сути, план анализа для будущей статьи.

Рис. 3. Анализ контекстов в Алисе Про
NB! Алису стоит перепроверять!
3. Также получаем распределение слов, обозначающих страх по частям текста (рис. 4).

Рис. 4. Распределение слов, обозначающих страх, по тексту
Можем построить на основе этих данных график (рис. 5), например, в LibreOffice.

Рис. 5. Распределение слов, обозначающих страх, по тексту (график)
Какие выводы можно сделать из графика? Например:
Пики употребления лексики страха представлены во второй (0.10%) и девятой (0.09%) частях, что подтверждает их связь с кульминационными моментами. В Части 2 страх материализуется через первые столкновения детей с Оно: атака Пеннивайза в подвале, анимированные кровью фотографии, голос из сливного отверстия. Эти эпизоды маркируют переход от абстрактной тревоги к физической угрозе. В Части 9, несмотря на незначительное снижение (с 0.10% до 0.09%), частота остается второй по величине, отражая нарастание экзистенциального ужаса перед финалом — герои осознают, что их возвращение в Дерри было предопределено цикличностью зла. Снижение в частях 5–7 (0.03–0.05%) подчеркивает сдвиг от сверхъестественного ужаса к психологическому... и т. д.
4. Используя закладку "Совпадения", мы получаем следующие данные:
- Абзацев с совпадениями: 11
- Предложений с совпадениями: 7
О чем это может сказать нам? О том, что страх присутствует в тех же отрезках текста, что и персонаж "клоун" (Оно). К слову, для слова "Пеннивайз" таких совпадений практически нет. Получается, что в моменты, когда Оно пугает, персонажи и рассказчик не называют его по имени.
5. Закладка "Общие данные" позволяет нам получить такую информацию, как:
- Длина текста в символах без пробелов: 2012184
- Длина текста в словах: 460740
- Длина текста в предложениях: 33265
- Средняя длина предложения: 13.85 слов
- Средняя длина слова: 4.09 символов
Скачать:
| Вложение | Размер |
|---|---|
| 3.13 КБ |
По теме: методические разработки, презентации и конспекты

Ассоциативный анализ текста в школе. На примере стихотворения М.И.Цветаевой «Август – астры». 11 класс
Важным условием постижения стихотворного текста в школе является ассициативное мышление учащихся, способное проникнуть в идейный замысел поэта. Наш урок можно назвать уроком филологического прочтения ...

Рабочая программа спецкурса для 8-9 классов "Комплексная работа с текстом.Создание вторичных текстов."
Рабочая программа спецкурса по русскому языку для 8- 9-х классов составлена на основе Федерального компонента государственного стандарта основного общего образования, с учётом целей и задач Прог...

Интеграция ИЗО с уроком по развитию речи « Работа с текстом». Урок в 7 классе: Иллюстрация к роману Ирины Измайловой «Собор. Роман о петербургском зодчем»
Интеграция урока ИЗО с уроком по развитию речи « Работа с текстом». Урок в 7 классе: по теме "Слово и изображение. Искусство иллюстрации"...

Павлуцкая Е.В., учитель русского языка и литературы "ФОРМИРОВАНИЕ ЧИТАТЕЛЬСКОЙ ГРАМОТНОСТИ НА УРОКАХ РУССКОГО ЯЗЫКА НА ПРИМЕРЕ РАБОТЫ С НЕСПЛОШНЫМ ТЕКСТОМ"
Павлуцкая Е.В., учитель русского языка и литературыФОРМИРОВАНИЕ ЧИТАТЕЛЬСКОЙ ГРАМОТНОСТИНА УРОКАХ РУССКОГО ЯЗЫКА НА ПРИМЕРЕРАБОТЫ С НЕСПЛОШНЫМ ТЕКСТОМ Читательская грамотность - один и...

Статья: "Обучение чтению в средней школе на уроках английского языка на примере работы с текстом «Harvest time around the world» из УМК Spotlight 5."
В статье описана важность развития чтения как вида речевой деятельности в средней школе. Приведены рекомендации по эффективной работе над техникой чтения с разноуровневыми классами. В качестве образца...

Методическая разработка «Разработка заданий по читательской грамотности» (на примере урока по роману А.С. Пушкина «Дубровский»)
Методическая разработка составлена в рамках курса ПК "Школа современного учителя" и содержит задания трёх уровней по формированию читательской грамотности. Может пригодиться при проведении у...

Развитие речи в 7 классе на примере работы с научным текстом
Повторение типов речи и стилей речи, знакомство с биографией Л.Решетова...
