Счастливее или печальнее сегодняшние популярные песни, чем 50 лет назад? Теперь, когда у нас есть доступ к большим данным, которые достаточно просто обработать, мы можем дать точные и содержательные ответы на подобные вопросы. Очевидный способ измерить эмоциональное содержание текста — просто подсчитать, сколько в нем слов, означающих различные эмоции. Сколько раз используются слова с негативными эмоциями — «боль», «ненависть» или «печаль»? Сколько слов, связанных с положительными эмоциями — «любовь», «радость» или «счастье»? Как бы просто это ни звучало, этот метод работает довольно хорошо при определенных условиях (например, чем длиннее текст, тем лучше можно оценить его настроение). Это одна из методик для так называемого «анализа настроений». Анализ настроений часто применяется к сообщениям в социальных сетях или современным политическим сообщениям, но также может быть использован в более длительных временных рамках, например, для изучения газетных статей за несколько десятков лет или литературных произведений в заданном столетии.
Этот же метод можно использовать при работе с текстами песен. Для нашего анализа мы использовали два набора данных. Один из них содержал песни из чартов Billboard Hot 100. Это песни, которые достигли большого успеха, по крайней мере, в Соединенных Штатах, от Satisfaction «Роллинг Стоунз» (1965 год — первый год, который мы рассматривали) до Uptown Funk Марка Ронсона (2015 год, последний год нашего исследования). Второй набор данных был основан на текстах, опубликованных на сайте Musixmatch. Благодаря этому набору данных мы смогли проанализировать тексты более 150 тысяч англоязычных песен со всего мира — довольно широкая и разнообразная выборка. И здесь мы обнаружили те же тенденции, что и в наборе данных Billboard, поэтому мы уверены, что результаты касаются не только хитов.
Популярные песни на английском языке стали более негативными. Использование слов, связанных с негативными эмоциями, увеличилось более чем на треть. Взять набор данных Billboard. Предположим, в среднем в песне бывает около 300 слов, а значит, каждый год в текстах 100 хитов набирается 30 тысяч слов. В 1965 году около 450 из этих слов были связаны с отрицательными эмоциями, а в 2015 году — уже больше 700. А количество слов, связанных с положительными эмоциями, уменьшилось. В песнях 1965 года было более 1750 слов с положительными эмоциями, а в 2015 году — около 1150. Обратите внимание, что в абсолютном выражении слов, связанных с положительными эмоциями, всегда больше, чем слов с отрицательными. Это универсальная особенность человеческого языка, также известная как принцип Поллианны (по имени безупречно оптимистичной главной героини одноименного романа), и вряд ли стоит ожидать, что это изменится: что важно, так это движение трендов.
Эффект виден, даже если посмотреть на отдельные слова: например, использование слова «любовь» сократилось практически вдвое за 50 лет, примерно с 400 до 200 случаев. И напротив, слово «ненависть», которое до 1990-х годов даже не упоминалось ни в одной из песен топ-100, теперь используется от 20 до 30 раз в год.
Наши результаты согласуются с другими, независимыми анализами песен, которые использовали совершенно разные методологии и рассматривали другие характеристики. Например, исследователи проанализировали набор данных из 500 тысяч песен, выпущенных в Великобритании в период с 1985 по 2015 годы, и обнаружили аналогичное уменьшение того, что они определяют как «счастье» и «яркость», плюс небольшое увеличение «грусти». Эти результаты были получены при помощи алгоритмов, анализирующих акустические характеристики, такие как темп или тональность. Также были изучены темп и тональность топ-100 песен Billboard. Оказалось, песни стали медленнее, а минорные тональности стали появляться чаще. Минорные тональности воспринимаются как более мрачные по сравнению с мажорными. Проверьте сами — послушайте на YouTube любую песню, которая была переложена с мажорной тональности на минорную или наоборот, и посмотрите, как это выглядит: неутомимо радостная мажорная версия «Losing My Religion» REM (1991) периодически появляется в социальных сетях.
Что же происходит? Конечно, обнаружить и описать тенденции важно, но нужно попытаться понять и объяснить их. Другими словами, большие данные нуждаются в большой теории. Одна такая большая теория — культурная эволюция. Как следует из названия, теория гласит, что культура развивается со временем, частично следуя принципам дарвиновского естественного отбора. То есть при наличии вариации, отбора и воспроизводства в популяции закрепятся более успешные культурные черты, тогда как другие отомрут.
Под культурой мы подразумеваем любую черту, которая передается социально, а не генетически. Это, к примеру, язык, на котором мы говорим, в зависимости от того, где мы родились, рецепты, по которым мы готовим, и, собственно, музыка, которая нам нравится. Эти черты передаются социально, так как человек обучается им, наблюдая за другими людьми и подражая им. А вот цвет волос и глаз передаются от родителей к потомству на генетическом уровне.
Тот факт, что многие виды поведения передаются социально, не так уж удивителен. Однако чтобы быть адаптивным — то есть увеличивать вероятность выживаемости и размножения людей, — социальное обучение должно быть избирательным. Лучше учиться у взрослого, который умеет хорошо готовить, чем у братьев и сестер, которые только пытаются это делать. Копирование поведения преимущественно успешных людей в языковой эволюции культуры называется «передача с предвзятостью к успеху». Есть и другие предубеждения, которые могут сыграть свою роль, как то: предвзятость соответствия, предвзятость престижа или предвзятость содержания. Предрассудки в обучении использовались, чтобы понять множество культурных черт как у людей, так и у животных на протяжении многих лет. Это плодотворная возможность понять сложные культурные модели. Чтобы попытаться понять, почему в текстах песен со временем становится больше негатива и меньше позитива, мы использовали теорию культурной эволюции и попытались объяснить этот феномен с помощью предвзятости в социальном обучении.
Мы проверили предвзятость успеха, изучив, становилось ли в песнях больше негативной лирики, если лидирующая десятка песен предыдущих нескольких лет содержала негативную лирику: иными словами, влияло ли на авторов песен содержание ранее успешных композиций? Предвзятость престижа мы проверили, посмотрев, не было ли в песнях престижных исполнителей предыдущих лет негативной лирики. Престижными артистами мы считали тех, кто появлялся в чартах Billboard непропорционально много раз, например, Мадонна, у которой в Billboard Hot 100 было 36 песен. Предвзятость содержания проверялась так: занимали ли песни с негативной лирикой более высокие места в чартах. Если бы это было так, то можно было предположить, что негативная лирика почему-то делала песни более привлекательными и, следовательно, более популярными.
Хотя мы обнаружили небольшие доказательства влияния предвзятости успеха и престижа, самое большое влияние, как оказалось, оказывала предвзятость содержания. Это подтверждается другими открытиями в культурной эволюции, говорящими, что негативная информация запоминается и передается больше, чем нейтральная или позитивная. Также мы обнаружили, что включение непредвзятой передачи в наши аналитические модели значительно снижает появление эффектов успеха и престижа, и, похоже, имеет решающее значение при объяснении феномена. «Непредвзятая передача» здесь может рассматриваться как генетический дрейф, при котором характеристики, по-видимому, закрепляются в результате случайных колебаний и при очевидном отсутствии какого-либо давления отбора. Как выяснилось, этот процесс объясняет популярность других культурных черт, от украшений на неолитической глиняной посуде до современных детских имен и пород собак. И есть важный момент. Мы нашли доказательства «непредвзятой передачи», но это не означает, что эти шаблоны не имеют объяснения или преимущественно случайны. Вероятно, существует целое множество процессов, объясняющих шаблон, но те, что мы изучили, недостаточно мощны, чтобы быть главным объяснением.
Рост негативной лирики в популярных англоязычных песнях — захватывающее явление, и мы показали, что это может быть связано с тем, что негативный контент в целом больше любят повсеместно. Вероятно, есть и другие, еще не выявленные причины. Учитывая эти предпочтения, нам нужно объяснить, почему тексты популярных песен до 1980-х годов были более позитивными, чем сегодня. Возможно, более централизованная звукозаписывающая индустрия больше контролировала, какие песни производились и продавались. Подобный эффект может быть также вызван возросшей популярностью более персонализированных каналов распространения (от пустых кассет до алгоритма Spotify «Made For You»). И другие, более широкие социальные изменения могли стать причиной того, что выражение негативных чувств стало более желанным и даже вознаграждаемым. Все эти гипотезы могут быть проверены с использованием данных, описанных здесь, в качестве отправной точки.