Сообщения

Сообщения за май, 2025

Практика 2

Изображение
Для анализа я выбрала два текста песен. Первый текст нежный и добрый, так как рассказывает про  любовь к жене и детям. Он умиротворенный и менее эмоциональный. Второй текст более грустный, даже местами агрессивный, так как в нем рассказывается о расставании. Он более эмоциональный. 1. Анализ первого текста про любовь к семье и детям. Результаты анализа: Feature Statistics распределение эмоций по абзацам текста.  MDS доминирующая тональность и контрастные ей типы тональности. ACM карта эмоциональных полей. 2. Анализ второго текста про расставание. Результаты анализа: Feature Statistics распределение эмоций по абзацам текста.  MDS доминирующая тональность и контрастные ей типы тональности. ACM карта эмоциональных полей. Вывод: второй текст действительно более негативный, но более эмоциональный, чем первый. Наиболее точную оценку, на мой взгляд, даёт модель MDS.

Практика 3

Изображение
 1. Monetochka Соотношение позитивных упоминаний к негативным 4:1. Больше всего нейтральный упоминаний (250). Общее количество упоминаний: 278. Преобладают фото (36 %), затем идут ссылки (26%). Большая часть ключевых слов не связана с исполнительницей Монеточкой, но по некоторым можно понять, что её упоминают в контексте её творчества и политических убеждений. 2. Noize MC Соотношение позитивных упоминаний к негативным 7:3. Больше нейтральных (248). Всего: 267. Преобладает фото (41%) и видео (34%). Ключевые слова говорят о том, что пользователи интересуются музыкой, и выходом нового альбома исполнителя. 3. Zemfira Соотношение позитивных упоминаний к негативным 7:3. Больше всего нейтральных (290). Всего: 332. Преобладает видео (40%) и фото (32%). Ключевые слова не связаны с исполнительницей Земфирой. Вывод: у Noize MC и Земфиры равное соотношение позитивных упоминаний к негативным, у Монеточки соотношение позитивных к негативным выше. Предполагаю, что это связано с тем, что имена Noi...

Практика 4

Изображение
 Для анализа я выбрала тексты Noize MC "+-0" и "Ты не считаешь". Текст 1 "+-0"  Текст 2 "Ты не узнаешь" По модели Word Cloud легче определить о чём текст. Большими буквами выделены часто повторяющиеся слова - по ним можно догадаться о теме текста, а по более маленьким словам - чуть подробнее понять о чём будет текст. В случае первого текста по модели Topic Modeling можно догадаться о чём текст, но по анализу второго текста через эту же модель - этого сделать не удаётся, программа выделяет, в основном, предлоги. По Word cloud определить тему текста легче.

Практика 1

Изображение
Для анализа я выбрала тексты песен Noize MC. текст 1 "+-0" текст 2 "Yes future!" текст 3 "Вселенная бесконечна" текст 4 "Грабли" текст 5 "Ты не считаешь" 1) Отличается ли эмоциональная составляющая в рассмотренных вами текстах?  Да, один из текстов оказался добрым и безопасным, другой был холодным и большим, ещё два оказались не только большими и холодными, но и страшными и мужественными. Ещё один текст вовсе не обладал выраженными фоносемантическими характеристиками.  2) Какие шкалы вы использовали для оценки? Почему вы считаете их наиболее удачными?  Для оценки я использовала шкалы: Грубый, мужественный, холодный, добрый, безопасный. Я считаю их более удачными, так как они являются самыми ярко выраженными в представленных текстах. 3) Можете ли вы выделить среди рассмотренных самый эмоциональный и самый неэмоциональный текст? Чем они отличаются?  Самый неэмоциональный текст - текст 3 "Вселенная бесконечна", так как даже несмо...

Практика 6

Изображение
Для анализа я выбрала 10 фото котов. 1) Все модели разделили фото по цветовой палитре. Image grid также разделила по расположению котов на фото и формату фото. Модель MDS оказалась не совсем точной, она не разделила изображения на четкие группы, только объединила фото двух рыжих котов.  Модель Image Grid мне показалась точнее и нагляднее, так сами картинки есть на схеме. 2) Для анализа я выбирала фото котиков разных пород: сфинксы и шотландские вислоухие; котов в смешных шапках, двух рыжих котов. Модели разделили фото не совсем по той же логике, поэтому я не до конца согласна с логикой разделения моделей. 

Практика 5

Изображение
 Я выбрала тексты про корейский шоубизнес. Тексты разделились на 3 группы:  1) Скандал связанный с Ким Су Хеном Вторая и третья группа про участников группы BTS. 2) Про лидера группы и про главного танцора BTS 3) Про Ви - вокалиста группы BTS Число групп меняется при изменении уровня кластеризации. При перемещении разделителя масштаба анализа вправо - количество групп увеличивается, влево - уменьшается.

Практика 8

Изображение
 Я выбрала для анализа lastfm.net. В качестве параметра был выбран album count (количество альбомов). Наиболее важные связи: rock (зелёный), punk (розовый), pop (изумрудный), other (серый). Основное ядро данных: rock (зелёный). Наиболее удобной является Network Explorer. Наглядно демонстрирует преобладающий тип контента.

Практика 7

Изображение
 Для анализа я выбрала фото котов. Все модели разделили фото по цветовой палитре. Image grid также разделила по расположению котов на фото. Наиболее эффективной оказалась кластеризация, она разделила фото по принципу того, что на них изображено.  Для анализа я выбирала фото котиков разных пород: сфинксы и шотландские вислоухие; котов в смешных шапках, двух рыжих котов. Примерно по той же логике модели разделили фото.

Практическое задание 9

Изображение
Для анализа я выбрала данные о браках и разводах в России. Вывод: анализ взаимосвязи двух групп данных показал, что взаимосвязь между ними достаточно низкая, но она есть. Тематика выбранных данных предполагает некую взаимосвязь, но в созданной мной таблице ее нет.  Наиболее эффективной моделью я считаю Linear Projection и Polynomial Regression. Они наиболее наглядно показывают данные на схеме. Все модели отражают, что мои данные почти никак не связаны и почти никак не пересекаются.