К основному контенту

Автоматизированный контент-анализ с категориями

 




Общей темой анализируемых статей был выход Турции из Стамбульской конвенции по защите прав женщин. 
Для анализа я выбрала следующие категории: женщина, борьба, отношение и защита. Данные слова неоднократно употребляются во всех трех материалах, они отражают суть проблемы. Это и сыграло ключевую роль в выборе категорий. 
Первое место по частоте употребления занимает слово "женщина". Во всех материалах акцентируется внимание именно на нем, так как конвенция занимается защитой прав женщин. 
Второе место занимает слово "борьба". Все три материала подчеркивают серьезность положения, в котором находятся женщины.
Третье место занимает слово "защита", так как тоже входит в название конвенции и выделяет ее основную функцию.
И последнее, четвертое место занимает слово "отношение". Турция вышла из конвенции и тем самым поставила под вопрос свое отношение к проблемам женщин в целом.


Комментарии

Популярные сообщения из этого блога

Простой кластерный анализ

Анализировались различные статьи по теме возвращения фильму "Аватар" титула самого кассового фильма в истории.  По данным анализа видно, что 1) все статьи связаны между собой общей темой; 2) в 1, 3, 4 и 5 материалах большое внимание уделяется показателям кассовых сборов; 3) 2 и 6 статьи уделены реакции Marvel на новость; 4) в 1, 3 и 5 материалах упоминаются даты премьер предстоящих кинокартин; 5) в отличие от 5 статьи, 1 и 3 материалы не содержат цитирование и упоминание лидера кассовых сборов 2015 года.

Sentiment analysis на платформе Orange

 

Парсинг текстовых данных