Я всегда очень заинтересован в поиске новой музыки. Всегда. В колледже я часто ходил в мультимедийную библиотеку, подходил к библиотекарю, отвечающему за аудио компакт-диски, и просил их пойти и выбрать любой из них. Несколько библиотекарей были в замешательстве. Некоторые видели, что я задумал, и ухмылялись. Другие смотрели на меня как на идиота.
Конечно, я бы получил все виды вещей. Альбом милых польских песен, несколько концертов для скрипки, саундтрек из «Парка Юрского периода», еще один концерт для скрипки. В лучшем случае это была быстрая доза спонтанности в моей жизни, а в худшем я забывал, что проверил это, и получал штраф в размере 2 долларов.
В настоящее время значительно более половины слушателей потребляют музыку онлайн. Spotify, YouTube и другие потоковые сервисы отвечают за показ пользователям новой музыки. Учитывая популярность таких функций, как Discover Weekly от Spotify, мне стало любопытно, что происходит с программными рекомендациями музыки слушателям.
Как Spotify рекомендует музыку
Совместная фильтрация
Первый и самый распространенный метод — это коллаборативная фильтрация. Одним из первых примеров является Netflix, позволяющий пользователям оценивать программы, чтобы сравнивать и сопоставлять различные оценки пользователей или модели потребления. Эти рейтинги определяют предпочтения пользователя и создают предложения, основанные на предпочтениях других пользователей.
С тех пор Spotify избавился от рейтингов, поэтому в их случае пользовательские шаблоны создаются на основе данных об использовании, нажав кнопку воспроизведения. К сожалению, из-за этого совместная фильтрация является своего рода конкурсом популярности, поскольку песни, которые чаще всего воспроизводятся, накапливают больше всего данных и, следовательно, с большей вероятностью будут воспроизведены снова.
Обработка естественного языка
В этой модели рекомендаций служба рекомендаций просматривает Интернет в поисках любых слов или фраз, находящихся в непосредственной близости от ссылок в ее каталоге. Скажем, речь идет о песне «Life is a Highway» Раскала Флаттса. Чтобы лучше понять, кому понравится эта песня, Spotify ищет любую ссылку на эту песню в Интернете и находит все связанные термины. Среди этих данных наиболее часто используемые термины будут иметь больший вес. Подобно совместной фильтрации, он сопоставляет эту информацию с пользовательскими данными, чтобы найти самые сильные корреляции.
Глубокое обучение
Последние два метода также очень похожи в том, что они используют данные «о» музыке. Количество воспроизведений или обзоров — это не то же самое, что реальное прослушивание музыки. Третий способ, которым Spotify создает рекомендации для пользователей, — это сверточные нейронные сети и глубокое обучение.
Существует большой разрыв между звуковыми данными в музыке и атрибутами музыки, влияющими на предпочтения слушателя. Такие качества, как жанр или инструменты, используемые в музыкальном произведении, довольно легко извлечь из аудиоданных. Другие аспекты, такие как настроение или год создания музыки, гораздо сложнее.
Несмотря на трудности, делать выводы, основанные на фактическом звучании музыки, полезно, потому что это позволяет обойти предвзятость популярности, представленную в первых двух методах, и само собой разумеется, что фактический звук определенно играет роль в определении того, понравится ли вам произведение. музыки.
Пути, по которым музыкальные рекомендации и эстетическое моделирование развивались на протяжении многих лет, поразительны. Меня, например, вдохновляют новые инструменты, позволяющие открывать для себя прекрасную музыку и соединяться с ней.
Но есть одна вещь, которую я не могу воссоздать с помощью Spotify прямо сейчас. Я не могу подойти к «библиотекарю» и попросить случайный выбор. Возможно когда-нибудь…