Spotify- és YouTube-slágerek szövegelemzése

Közzétéve: 2023. július 10.

Egy 2023-ban tinédzserkorú fiatal nyugdíjba vonulásáig – az alvásidőt nem számítva – közel hat évet fog zenét hallgatni. A legnépszerűbb műfaj a pop, amely egybegyűjti a zenei világot domináló stílusok jelentős részét. A popzenészek művei hatással vannak az érzelmi világra, csoportképző hatásukkal generációkat fűznek össze, adnak nekik közös élményt. A hallgatók évekkel, évtizedekkel később is visszatérnek a kedvenc számaikhoz, melyek repetitív módon, a refrénjeiken és szövegükön keresztül adják át üzeneteiket a befogadóknak. A dalok hatása a könyvek, filmek vagy reklámok szerepével vetekszik. Jelen összegzés célja az internetes világban aktív népesség kedvenc slágereiben előforduló témák feltárása és a felfedezett topikok jellemzőinek megismerése, bemutatása.

Zenehallgatási szokások

A zene az ember életének csaknem minden mozzanatában megjelenik, nem úgy, mint a zenelejátszó eszközök elterjedésének korszaka előtt, amikor különleges alkalmakhoz volt kötött – koncertekre, bálokba, táncházakba kellett menni a zeneszóért. Az online világ bővülésével és a digitalizáció elterjedésével már jelentősebb eszközpark sem szükséges a zenehallgatáshoz és a helyhezkötöttség sem szempont. A streaming-szolgáltatóknak köszönhetően nem kellenek lemezek, CD-k, kazetták, nincs szükség a dalok letöltésére, csupán néhány kattintásra a telefonon. A fej- és fülhallgatók lehetővé teszik, hogy a hallgatókat körülvevőket ne zavarják a dallamok, így az emberek kedvenc előadói akár az utcán sétálva, akár a tömött villamoson is a fülükbe énekelhetnek. Ma is a rádió a legnépszerűbb eszköz a zenehallgatás során: a világ lakosainak 73 százalékának ez az elsődleges zeneforrása. A rádióhallgatók 84 százaléka keresne másik platformot, ha nem játszanának többé zenét, 63 százaléka pedig örökre kikapcsolná ezt az eszközt. A streaming-szolgáltatások emellett egyre elterjedtebbek. Ma már a világ internetezőinek 46 százaléka ezen a platformon is hallgat zenét, ami a fiatalabb korosztályoknál még népszerűbb. A 16-24 évesek 54 százaléka használ streaming-szolgáltatást, a 25-34 évesek 56 százaléka, a 35-44 évesek 44 százaléka, a 45-54 évesek 36 százaléka és az 55-64 évesek 26 százaléka. Az IFPI statisztikái szerint egy átlagos felhasználó heti szinten 20,1 óra zenét hallgat. Ha a 2022-es tendenciák nem változnának, egy most 16 éves tinédzser 65 éves korára 51.215 zenehallgatási órán esne túl, ami megegyezik alvás nélkül öt év 309 nappal.

A popzene

A popzene a populáris zene rövidítése. Amilyen árulkodó a neve, annyira kedvelt műfaj és olyan széles körben elterjedt. A tömegkultúra részeként jelenik meg. Jellemzői a könnyen emészthető, egyszerű, közérthető, fülbemászó dallamok és szövegek, valamint az általában 3-5 perces zeneszámok. Megannyi stílust és zenei irányzatot ötvöz és olvaszt össze, szinte minden műfaj vonásai megtalálhatók benne. Vannak azonban olyan stílusok, melyek elválasztódnak a popzenétől és csak kisebb körökben, társadalmi rétegekben népszerűek. Ilyen például a jazz, a heavy metál, a country, a folk, az elektronikus zene vagy a reggae, bár ezek is hatással vannak a popra. Az emberek életében a zene érzelmi, kulturális és közösségi szerepet tölt be párhuzamosan. A zenéknek általánosságban az a képessége, célja és feladata, hogy érzelmeket váltson ki az egyénből, a csoportból, a közösségből és a teljes társadalom egészéből. Közös élményt teremt egyes generációknak, összeköti a hasonló ízlésűeket, segít a közösség épülésében. A popzene által közvetített üzenetek és értékek hatással vannak mind az egyéni, mind a kollektív értékrendekre, identitásra és kulturális hovatartozásra. Ugyanakkor a változékony ízlések, értékrendek, társadalmi fordulatok, világtörténések visszahatnak az előadókra és a zenei piacra. Ennek köszönhetően a slágerek vizsgálatával lencsevégre kaphatók többek közt a társadalmi változások és konfliktusok is. A szórakoztatóiparban a popnak elsöprő erejű a gazdasági és piaci jelentősége, befolyással van a zenei trendekre, a reklám- és médiavállalatok marketingjére és ezer más területre. A népszerű előadókat és a nagy kiadókat a kereskedelmi siker hajtja, céljuk a szerzemények minél szélesebb körű értékesítése, így főként a közönség igényeire és a piaci trendekre összpontosítanak, kevésbé a művészeti innovációra. A popzenei előadók gyakran többek, mint zenei művészek, hiszen sokan sztárokként, divatikonokként, médiaszemélyiségekként, vagy influenszerekként tekintenek rájuk, mindemellett gyakorta széleskörű, saját követői bázissal rendelkeznek. A világon az egyik legnagyobb befolyással bíró üzenetek a popzenék soraiban rejlenek. Az előadókra sokan példaképként tekintenek és szavaik, cselekedeteik, vásárlási szokásaik ösztönzik a rajongókat. Refrénjeiket, dalaikat, üzeneteiket akár éveken, évtizedeken keresztül is hallgatják az emberek milliói. Míg egy kedvenc filmet ritkán néz meg újra és újra az ember, egy kedvenc könyvet ritkán olvas többször, addig egy kedvenc zenekar gyakran a mindennapi életéhez is hozzátartozik. Míg egy reklámkampány üzenetével minden nap találkozik az ember, de az csak néhány hónapig tart, addig a popzenészek üzenetei sok év után is visszhangoznak.

A vizsgált dalok

A dolgozat célja a magyarok által hallgatott, magyar nyelven írott slágerek szövegeinek vizsgálata, a dalokban rejlő témák feltárása. A legnépszerűbb dalok kiválasztásakor célszerűnek tűnt az online platformok lejátszási listái alapján felállítani egy rangsort, s így a Spotify és a YouTube, a két leglátogatottabb felület toplistáit elemezni. A kutatás ennek köszönhetően kifejezetten azon felhasználók ízlését vizsgálja, akik az online zeneközvetítő platformokon vannak jelen. A nyilvános Spotify-os napi toplisták historikus adatai egészen 2014. augusztus 10-ig nyúlnak vissza, a YouTube-os heti listák pedig 2019. május 14-ig. Web scraping-es adatgyűjtési eljárások alkalmazásával, majd a külföldi zeneszámok kiszűrésével végezetül 2.366 dal került be az elsődleges dallistába, melyek közül 629 csak a Spotify-on jelent meg a chart-okon, 1.160 csak a YouTube-on és 577 mindkét platformon. Ennyi magyar, nyilvánosan elérhető, toplistás sláger született 2023 márciusáig a két platformon.

A 2.366 slágerhez hallgatottsági adatokat és standardizált kontaktusszámokat rendeltünk annak érdekében, hogy a későbbiekben a legnépszerűbb témák is beazonosíthatók legyenek. A Spotify-os listákon elérhető a streamek, a YouTube-oson pedig a megtekintések száma. A standardizált kontaktusszám esetében mind a Spotify-os hallgatottságot, mind a YouTube-os nézettséget elosztottuk a listák legmagasabb értékeivel, így az első helyezettek értéke 1-1 lett mindkét platform esetében (hiszen önmaguk értékével lettek elosztva). Az első helyezetteket követő dalok standardizált kontaktusszámai ezután arányosan csökkentek, közelítve a nulla felé. A teljes, standardizált elérésszámot egy dal esetében a két platform standardizált kontaktusszámának összege adja, így a maximum 2 lehetne, ha egy dal mindkét platformon első lenne. Azok a zeneszámok, amelyek csak az egyik oldalon értek el sikereket, hátrányból indultak. A leghallgatottabb dal – mely Azahriah & Desh Mind1 című száma volt – első lett a Spotify-on 11 millió stream-mel és negyedik a YouTube-on 21 millió megtekintéssel, s ezzel összesen 1,7-es generált kontaktusszámot ért el.

Topikmodellezés látens Dirichlet allokáció segítségével

A látens Dirichlet allokáció (LDA) egy valószínűségi nyelvi modell, mely a topikmodellezés egy formája. Segítségével nagy mennyiségű szöveges adatokban látens tematikus és szemantikai struktúrák fedezhetők fel hierarchikus (többszintű) bayesi elemzéssel. Az utóbbi néhány évtizedben, a digitális technológiák és eszközök fejlődésével, egyre nagyobb népszerűségnek örvend ez a módszer, mert hatalmas szöveggyűjteményekben (korpusz) is képes struktúrákat felfedezni. A kvalitatív topikmodellezésekkel szemben az LDA használatával jelentős mértékben csökken az emberi munka befektetése és a financiális hozzájárulás mértéke, sokkal gyorsabbá válik az eredmények kinyerése, automatizáltabbá tehetők a munkafolyamatok, elősegíti a reprodukálhatóságot és nagymértékben csökkenti a szubjektivitás okozta félreértelmezések lehetőségét. Az LDA segítségével több ezer zeneszöveg elolvasása nélkül meghatározható, hogy milyen témák dominálnak bennük és az egyes témákhoz mely dalok és mely szavak kapcsolódnak a legerősebben. Ez egy valószínűségi modell, így egy dal nem kifejezetten egy témához kapcsolódhat csupán, hanem különböző erősséggel többhöz is kötődhet. Így például egy művész énekelhet arról, hogy egy buliban táncolás közben megismerkedett egy lánnyal és szerelembe esett. Ebben az esetben ez egyszerre egy bulizó és egyszerre egy szerelmes dal. Ha az utolsó versszakban még megemlíti a szakítást és az azt követő keserűséget is, akkor egy harmadik, szomorú témához is kötődni fog. Bonyolult statisztikai számításokkal meghatározható, hogy mennyi a korpuszt lefedő optimális topikszám. Minden egyes topiknál meghatározható a rá leginkább jellemző dal(ok) és a sajátos szóhasználat.

Korpuszépítés

Annak érdekében, hogy a slágereknél szövegelemzést végezhessünk, szükségünk volt a dalok szövegeire, azonban nem minden zeneszám szövege érhető el online. Ez jellemzően a kevésbé hallgatott zenéknél fordul elő. A Spotify esetében az 1.206 toplistás dal közül 18 nem volt fellelhető a neten, ami az elemek csupán 1,5 százalékát teszi ki. Hallgatottságarányosan pedig még kevesebbet: összesen 598 millió streamet értek el a toplistás dalok, melyből 513 ezret a dalszöveg nélküliek, ami mindössze 0,09 százaléknak felel meg. A YouTube esetén kissé magasabbak az arányok, de ugyanúgy figyelmen kívül hagyhatók. Az 1.737 zenéből 198-nál (11,4%) nem volt fellelhető leirat, ami nézettségarányosan a 2,2 milliárd összes views-számhoz képes 109 millió (5%). Az összevont ranglista 2.366 eleméből 214-hez (9%) nem tudtunk szöveget kapcsolni, ami a generált kontaktusszám 2,9 százaléka. A teljes korpusz a 2.152 dokumentumával így közel teljesen lefedi a népszerű dalokat. Néhány marginális szubkultúra elemei vesznek csak el, melyek közt leginkább rapperek és cigányzenét játszó muzsikusok művei találhatók. A 214 dal előadói közt olyan nevek szerepelnek, mint az Aranyszemek, Bódi Csabi, Escobar, G.w.M. és Kis Grófo (utóbbi kettő kevésbé ismert számai), Ginoka, Martin Laurent, Merci B vagy Roland. Ezek között a „slágerek” között sok olyan is előfordul, melyeket egy születésnapra írattak a dalszerzővel, vagy annyira érthetetlen az ének, hogy a rajongók se tudták legépelni a zavaros sorokat.
Tolsztoj Háború és békéjének eredeti, orosz nyelvű változata körülbelül 3,1 millió karaktert és 560 ezer szót tartalmaz. A 2.152 dalszöveg összesen 3.392.943 karaktert, 600.761 szót és 55.854 egyedi szót. Átlagosan egy zeneszöveg 1.577 karakter hosszú és 279 szó, valamint 138 egyedi szó található meg benne. Fontos megjegyezni, hogy ez a nyers szöveg még semmiféle tisztítási eljáráson nem esett át. Benne vannak még többek közt a speciális karakterek, így például a mondat végén található szó a pont miatt különbözik a mondatközi formájától. A kisbetűzés fogja csak azonos formára hozni a mondatkezdő vagy sorkezdő nagybetűs formát a mondatközi kisbetűssel.

Annak érdekében, hogy a topikelemzés megbízhatóbb eredményeket adjon, a modelljavítás érdekében további 78 dal szövege kikerült a korpuszból (zeneszöveggel rendelkezők 3,6 százaléka), melyből 39 csak a Spotify-on, 21 csak a YouTube-on és 18 mindkét platformon toplistás volt. A kimaradók a mintába került zeneszámok Spotify-os hallgatottság négy százalékáért, a YouTube-os nézettség 2,5 százalékáért és az egyesített kontaktusok 3,3 százalékáért feleltek. Így végezetül 2.072 dokumentum maradt a modellben, ennyi sláger alapján határozhattuk meg az egymástól elkülönülő témákat.

Szövegtisztítás

A szövegtisztítás roppant fontos lépés az elemzés előtt. A nyers szövegadatok rengeteg fölösleges karaktert, nem releváns információt tartalmaznak, melyek torzítják az eredményeket. A szövegtisztítás során eltávolításra kerülnek a nem kívánt információk és egységes, jól feldolgozható korpusszá formálódik a zajos szövegtest. Ennek főbb lépései a következők: kisbetűzés, speciális karakterek eltávolítása, tokenizálás, szótövezés/lemmatizálás, stopszavak és zajszavak eltávolítása.
A végleges, modelljavítás érdekében történt másodlagos adattisztítást követően a 2.072 dokumentumban összesen 1.223.552 karakter maradt (a kezdeti 3.392.943 helyett), 198.341 szó (a 600.761 helyett) és 4.659 egyedi szó (az 55.854 helyett). A Háború és béke háromkötetes kiadásából tehát kettő olvasatlan maradt úgy, hogy a történet egésze mégis feltárult. Átlagosan egy zeneszöveg 590 karakter hosszú lett (az 1.577 helyett) és 96 szó (a 279 helyett) illetve 58 egyedi szó (a 138 helyett) alkotja. A teljes korpusz így a karakterek számában a 36 százalékára, a szavak számában a 33 százalékára és az egyedi szavak számában a 8 százalékára csökkent. A dokumentumok egyedi szavainak száma átlagosan 42 százalékra csökkent. Ez a változás jól mutatja, mennyire fontos az adattisztítás és mennyi zaj kísérte volna a modellépítést, ha a nyers szövegek kerültek volna az LDA-ba.

A slágerek szövegeiben felfedezett topikok

Az LDA hét, egymástól jól elválasztható, karakterisztikus topikra osztotta a 2.072 vizsgált dalszöveget. Mindegyik fantázianevet kapott a legjellemzőbb szavak és dalok vizsgálata után, így a következő témákra oszlott a korpusz:

  • Szerelem
  • Vágyakozó
  • Álmodozó
  • Hagyomány
  • Gengszterélet
  • Utcakölykök
  • Bulizó

A Szerelem témában megjelenik a párkapcsolat, a kötődés, a szerelmi csalódás, a féltés, de leginkább a szerelem érzete és az érzés kifejezése, a szerelemhez kapcsolódó cselekmények sora. A Vágyakozó téma fő eleme a hiány és az üresség. A dalok a múltba révednek, borongós érzéseket írnak le, fájdalmakról és problémákról szólnak. A szövegekben megjelenik a délibáb, az elérhetetlen szerelem és a tehetetlenség is. Az Álmodozó téma leginkább a természet motívumait használja: a Földet és az univerzumot, az időt, az ünnepeket és az időjárás elemeit. A Hagyomány téma Isten, a család és a haza köré épül. Megjelennek benne a bűnök, a gonosz, a béke eszménye, a teremtés, a vallás, a misztikum, az Isten-ember kapcsolat, a születés és a magyarság. A Gengszterélet legfőbb kifejezőeszközei a trágár szavak. A sorok a csapodár élet élvezeteit próbálják kifejezni, a nemi kapcsolatot, az alkoholfogyasztást, a cigarettázást, a drogok használatát, a pénz szórását. Gyakran utalnak bennük – a maguk módján – a női nem szépségére és az aktuálpolitika is megjelenik a mellékvágányon. Az Utcakölykök topikban a trágár szavak tárháza szintén kimeríthetetlen, azonban ebben a csoportban inkább az egyén, az én áll a középpontban. Legfeljebb egy-egy közeli barát, családtag kerül be a képbe. Fő mondanivalója a zenélés (főként rappelés) és annak velejárói: a dalok, a koncertek, a kiadók, a pénz és mások véleménye. Az utolsó kategória a Bulizó, melynek legfőbb eleme a szórakozás, az éjszakai élet, a tánc, az ivás, a hétvége, a nők és a csajozás.
Az egyes témák közelségét a nyelvi távolságok fejezik ki. A számítás során kiderül, mely témák hasonlítanak egymásra és melyek különböznek. Három páros fedezhető fel, melyek nagyon közel állnak egymáshoz, a Szerelem – Vágyakozó, a Gengszterélet – Utcakölyök és az Álmodozó – Hagyomány. A Bulizó leginkább a trágár szavakat használó páros felé húz. Az értékeket és az érzéseket kifejező párosok egymáshoz sokkal közelebb állnak, mint a másik háromhoz.

A topikok leggyakrabban használt szavai

A topikok legnépszerűbb szavai megmutatják, mely kifejezések jelennek meg legtöbbször az egyes témákhoz tartozó dalok szövegeiben. Egy-egy szó több topikban is feltűnik, de leginkább az egymáshoz közel álló témák közt van átfedés.

A topikokban megjelenő leggyakoribb szavak listája
Sorszám Szerelem Vágyakozó Álmodozó Hagyomány Gengszterélet Utcakölykök Bulizó
#1 szeret él szép Isten gang pénz gyere
#2 kér semmi szél anya fasz szar lány
#3 akar út fény ember kurva csinál bébi
#4 érez érez nap föld tesó testvér este
#5 fáj soha száll soha csaj vág jól
#6 érte senki álom úr baszik vér iszik
#7 téged nap nyár haza top fasz akar
#8 hagy rég csillag sír cigi akar baba
#9 soha hagy világ apa tele év táncol
#10 hozzá vég föld vigyáz eszik nála szép
#11 enged idő tél bűn nap rap érez
#12 félni egyedül ég szó dik leszar megint
#13 szó baj éjszaka fiú megint gyerek csaj
#14 szerelem tart él magyar száj tesó kér
#15 gondol régen együtt béke hall él száj
#16 lélek rossz hang ajtó money kap kicsit
#17 világ jól hajnal láb pénz nyom buli
#18 senki számít út vég szar fék rossz
#19 mellette ember messze születik geci baszik éjszaka
#20 szép év csend otthon kicsi csaj tölt

Topikok hallgatottsága

A topikok felfedezése után mind a „kínálati”, mind a „keresleti” oldal átvizsgálásra került, vagyis az, hogy a slágergyártók hány dalt szereztek egyes témákban, illetve a befogadók melyeket hallgatták leginkább. A legtöbb sláger a Szerelem témában született, 434, az összes tétel 21 százaléka, melyet a Vágyakozó követett 20,8 százalékkal. Legritkábban a Gengszterélet témában írtak, a dalok csupán 7,8 százaléka került ide, majd a Hagyomány következett a sorban 8,8 százalékkal.

Topikokhoz tartozó dalok száma (a színskála zölddel jelöli a magas, pirossal az alacsony értékeket)
Téma A témához tartozó dalok száma
Szerelem 434
Vágyakozó 430
Álmodozó 310
Hagyomány 181
Gengszterélet 162
Utcakölykök 307
Bulizó 247

A Spotify-on a Vágyakozó dalokat hallgatták a legtöbbet: 123 milliószor stream-elték az ebbe a kategóriába tartozó számokat, s ezzel az összes stream 21,9 százalékát tudhatta magáénak. Legkevésbé a Hagyomány dalaira voltak fogékonyak a Spotify felhasználói. A YouTube-on viszont a szerelmes számok a legnézettebbek: 490 millió views jutott rájuk, az összes 24,5 százaléka, míg a Hagyomány itt is a sor végére került 6,5 százalékkal. A kontaktusszám azt hivatott bemutatni, hogy a két platformon összességében milyen sikereket értek el a topikok. Ennek tekintetében a Vágyakozó vezet, ami 0,3 százalékponttal előzte meg a Szerelmet.

A topikok összhallgatottsága Spotify-on (ezerben), YouTube-on (ezerben) és standardizált kontaktusok megoszlása
Kategória Szerelem Vágyakozó Álmodozó Hagyomány Gengszterélet Utcakölykök Bulizó
Spotify-hallgatottság (ezerben) 94215 123366 61780 36445 57141 98364 92482
YouTube-nézettség (ezerben) 490163 424865 224768 130854 135268 300888 296519
Kontaktusszám (%) 21,10% 21,40% 11,10% 6,50% 8,20% 16,10% 15,50%

Az egy dalra jutó átlagos hallgatottsági statisztikák eltérnek az előbb bemutatott mintázattól. Mindenhol a Bulizó zenék vezetnek: a Spotify-os stream-ek 19,2 százalékát, a YouTube-os views 18,3 százalékát zsebelték be, 130,1 százalékkal meghaladva a várt kontaktusszámot. Ha egy előadó ír egy dalt a szórakozásról, és az felkerül a toplistákra, várhatóan 375 ezerszer fogják meghallgatni a Spotify-on és 1,2 milliószor a YouTube-on. Ezzel ellentétben, ha az Álmodozó témát választja, csak 199 ezerszer fogják stream-elni és 724 ezerszer megtekinteni a videómegosztón. Markáns különbség figyelhető meg a két platform között a Szerelem és a Gengszterélet topik tekintetében. Az előbbi a YouTube-on népszerű, a Spotify-on viszont nem, míg az utóbbi éppen ellenkezőleg. Az obszcén kifejezéseket használó dalokat inkább a zenei streaming-szolgáltatón fogyasztják a felhasználók. Legkevésbé az Álmodozó számok érnek el népszerűséget, majd a Hagyományhoz tartozó szerzemények.

A topikok összhallgatottsága Spotify-on (ezerben), YouTube-on (ezerben) és a várt standardizált kontaktusszámtól való eltérés
Kategória Szerelem Vágyakozó Álmodozó Hagyomány Gengszterélet Utcakölykök Bulizó
Spotify-hallgatottság (ezerben) 216891 286867 199049 200969 352467 320411 374830
YouTube-nézettség (ezerben) 1128400 987953 724178 721563 834383 980112 1201792
Kontaktusszám-eltérés (%) 100,80% 103,60% 74,10% 74,30% 104,90% 108,40% 130,10%

A topikok részletes bemutatása

A következőkben röviden ismertetjük a topikokat. Bemutatásra kerül a legjellemzőbb dal és a leghallgatottabb dal, melyek meghatározása mögött számítások állnak, valamint a témát legjobban leíró dal, ami egy szubjektív választás eredménye.

Szerelem

  • Dalok száma: 434 (21%)
  • Legjellemzőbb dal: Carson Coma – Én még sohasem (témához tartozás: 96,1%)
  • Leghallgatottabb dal: Rácz Gergő & Orsovai Reni – Mostantól
  • Témát legjobban leíró dal: Bagossy Brothers Company – Olyan Ő
  • Stream-elések száma a Spotify-on: 94,2 millió, átlagos: 217 ezer
  • Megtekintések száma a YouTube-on: 490,2 millió, átlagos: 1,1 millió

A slágerlistákra felkerülő zenék témái között a Szerelem dominál. 434 dal, az összes vizsgált 21 százaléka került ebbe a topikba. A slágerek a szerelem érzetére és a velejáró cselekményekre összpontosítanak, legyenek azok negatív, vagy pozitív töltetűek, ámbár a beteljesült szerelem jóval nagyobb szerepet tölt be. Népszerű előadói közt megjelennek a raptől a rockon át a cigány zenéig szinte minden stílus alkotói. A hét téma közül ez éri el a második legmagasabb hallgatottságot, összességében minden ötödik (21,1%) elért kontaktus ide kötődik. A YouTube a népszerűbb felület ezeknél a számoknál, összesen 490 millió views-t könyvelt el magának, az összes megtekintés majdnem negyedét (24,5%). A Spotify-on „mindössze” 94 millió stream-et sikerült begyűjtenie, a teljes hallgatottság hatodát (16,7%). Az egy dalra jutó átlagos YouTube-os nézettség 1,1 millió, ami viszonylag magasnak mondható. A Spotify-on nem teljesített olyan jól, átlagosan 217 ezer stream-et ért el a legmagasabb kategória (Bulizó) 375 ezrével szemben.

Vágyakozó

  • Dalok száma: 430 (20,8%)
  • Legjellemzőbb dal: DJ Parafa – Polkka (feat. Zelena) (témához tartozás: 90,6%)
  • Leghallgatottabb dal: Azahriah & Desh – Mind1
  • Témát legjobban leíró dal: AWS – Emlékszem
  • Stream-elések száma a Spotify-on: 123,4 millió, átlagos: 287 ezer
  • Megtekintések száma a YouTube-on: 424,9 millió, átlagos: 988 ezer

A Vágyakozó témába tartozik a második legtöbb dal: 430, az összes 20,8 százaléka. A számok hangulata borongós, problémákról és főként lelki fájdalmakról szólnak. A múltba révednek, hiányról és tehetetlenségről énekelnek a zenészek. Pesszimizmus jellemzi a dalokat, reménytelenség és üresség. Főként olyan zenészek művei tartoznak ide, akik komolyabb érzések kifejezésére is képesek. Gyakori a hangszeres kíséret, míg az elektronikus, digitális aláfestés inkább a háttérbe szorul. Érdekes módon megjelenik néhány rapper is, akik ezen kívül a néhány számukon kívül inkább a Gengszterélet vagy az Utcakölykök topikokban mutatkoznak. A Spotify-on a legtöbb lejátszást ez a téma érte el (123 millió) és a YouTube-on is a második helyre került (425 millió), ami főként a sok dalnak köszönhető. Az egy számra jutó stream-elések száma (287 ezer) és a megtekintések száma (988 ezer) is a középmezőnyben helyezkedik el.

Álmodozó

  • Dalok száma: 310 (15%)
  • Legjellemzőbb dal: Pogány Induló – Hajnal (témához tartozás: 95,4%)
  • Leghallgatottabb dal: Bagossy Brothers Company – Visszajövök
  • Témát legjobban leíró dal: NOX – A tél dala
  • Stream-elések száma a Spotify-on: 61,8 millió, átlagos: 199 ezer
  • Megtekintések száma a YouTube-on: 224,8 millió, átlagos: 724 ezer

Az Álmodozó témába közepes mennyiségű dal tartozik: 310, a teljes paletta 15 százaléka. A legfőbb motívum a természet. Az előadók a tájról, a természeti elemekről, az idő, a hónapok és évszakok körforgásáról énekelnek, és a pillanat örömét próbálják megragadni, álomszerű képet festve a jelenről, a Földről, az univerzumról, az ünnepekről és az időjárásról. Sok előadó az idősebb generációk kedvence volt, akik az online platformokon nincsenek olyan nagy számban jelen. Az idősebb felhasználók kedvencei nem generálnak magas hallgatottságot például a Neoton Família, TNT, Republic, Zámbó Jimmy vagy Rúzsa Magdolna szerzeményeivel. A középkorú és fiatal felnőtt generációk népszerűbb előadói is szívesen énekelnek a témában, mint például ByeAlex, Margaret Island, vagy Bagossy Brothers Company. Az átlagnál kevesebb hallgatottságot ér el mind a Spotify-on (62 millió), mind a YouTube-on (225 millió). Az összesített kontaktusszám 11,1 százalékát szerezte meg magának .A hallgatókat ez a téma fogja meg legkevésbé, egy dalt átlagosan csak 199 ezren hallgatnak meg a Spotify-on és 724 ezren tekintenek meg a YouTube-on.

Hagyomány

  • Dalok száma: 181 (8,8%)
  • Legjellemzőbb dal: Punnany Massif – Partizán, Pt. 1 (témához tartozás: 97,6%)
  • Leghallgatottabb dal: Tankcsapda – Mennyország Tourist
  • Témát legjobban leíró dal: 4S Street – Mesélek a bornak
  • Stream-elések száma a Spotify-on: 36,4 millió, átlagos: 201 ezer
  • Megtekintések száma a YouTube-on: 130,9 millió, átlagos: 722 ezer

A Hagyomány témába tartozik a második legkevesebb dal: 181, a teljes lista 8,8 százaléka. Fő kulcsszavai: Isten, család és haza. Jellemző, hogy a zenészek az Isten-ember kapcsolatról, spiritualitásról, bűnökről és gonoszról, a családi kötelékekről, születésről, bajtársiasságról, valamint a hazáról, hazaszeretetről, magyarságról, történelemről énekelnek akár negatív, de inkább pozitív értelemben. Több XIX-XX. századi magyar költő versének feldolgozása is bekerült a gyűjteménybe. Az előadók minden műfajból megjelennek. Azok mellett, akik a hagyományos értékrendeket tartják átadásra méltónak, megjelennek a gúnyos előadók is, akik csak paródiának szánják dalaikat, azonban ők kisebbségben maradnak. A témába sorolt slágerek alacsony száma miatt a legkevesebb megtekintést éri el Spotify-on (36,4 millió), körülbelül a harmadát a legnépszerűbb Vágyakozó kategóriával szemben és a YouTube-os megtekintései is a legalacsonyabbak (131 millió). A kontaktusok számának 6,5 százalékáért felelősek. Az egy dalra jutó Spotify-os stream-elések száma a második legalacsonyabb (201 ezer), a YouTube-os pedig a legalacsonyabb (722 ezer).

Gengszterélet

  • Dalok száma: 162 (7,8%)
  • Legjellemzőbb dal: Mirror Glimpse – Camouflage Freestyle (témához tartozás: 90,5%)
  • Leghallgatottabb dal: Azahriah és Desh – Pullup
  • Témát legjobban leíró dal: BSW – Csöcsök És Segg
  • Stream-elések száma a Spotify-on: 57,1 millió, átlagos: 352 ezer
  • Megtekintések száma a YouTube-on: 135,3 millió, átlagos: 834 ezer

A Gengszterélet és a következő két topik erősen elválik az előző négytől. A legkevesebb dal ide tartozik: 162 szám, az összes 7,8 százaléka. Általánosságban jellemző rá, hogy a használt szavakat nem válogatják meg a zenészek, trágár kifejezések és káromkodások uralják a legtöbb számot. Az énekesek az élet (főként alantas vagy könnyelmű) élvezeteit, a bűnözést és a függőségeket jelenítik meg a szövegeikben, a szexuális kapcsolatot, az alkohol, a cigaretta és a drogok használatát. A legfontosabb motívumok a pénz és a jólét, akár autókról, akár ruhákról, akár nyaralásról szólnak a sorok. A női nem és a másodlagos nemi jellegek különös figyelmet kapnak, ugyancsak az irántuk mutatott beteljesült és beteljesületlen vágyakozás. Előadói főként a rap és a hip-hop stílusokban tevékenykednek. Az összhallgatottságuk a második legalacsonyabb a Spotify-on (57 millió) és YouTube-on (135 millió) is, amit az alacsony számú zenei termés okoz. Az egy számra jutó hallgatottságuk azonban a Spotify-on (352 ezer) a második helyen áll, a YouTube-on (834 ezer) pedig a középmezőnyben helyezkedik el.

Utcakölykök

  • Dalok száma: 307 (14,8%)
  • Legjellemzőbb dal: Pamkutya – Testvérem (témához tartozás: 87,4%)
  • Leghallgatottabb dal: BSW – YAAY
  • Témát legjobban leíró dal: ALEE – Irigyeim
  • Stream-elések száma a Spotify-on: 98,4 millió, átlagos: 320 ezer
  • Megtekintések száma a YouTube-on: 300,9 millió, átlagos: 980 ezer

Az Utcakölyök topik közel áll a Gengszterélethez, itt is kimeríthetetlen a trágár szavak tárháza, azonban a középpontban az egyén, az énekes áll és legfeljebb a barátokra, testvérekre, tesókra, gyerekekre, öccsökre és crew-ra (csapat, brigád), valamint az egyénnel szemben álló irigyekre, férgekre és kutyákra terjed ki az említett személyek sora (a haragosaikat, vagy akik nem mutatják feléjük az általuk elvárt tiszteletet, sűrűn hasonlítják állatokhoz, leggyakrabban kutyákhoz és férgekhez). Az átlagnál kicsit több szám került ebbe a kategóriába: 307, a választék 14,8 százaléka. A legfőbb téma a zenélés és az azzal járó magasélet (jólét): siker, népszerűség, fellépések, koncertek, kiadók, nők, pénz, valamint drága italok, lépők (cipő), órák és kocsik. Az előadók szinte csak a rap és a hip-hop stílusokból kerülnek ki. A második legtöbb stream-et az Utcakölykök zsebeli be a Spotify-on, 98 milliót, ugyanakkor a YouTube-on csak a középmezőnybe kerül a 301 millió views-zal. Az egy zenére jutó stream-ek száma 320 ezer, a videólejátszások száma 980 ezer – mindkettő átlag feletti. A dalokban megénekelt siker valóban jellemző a tartalomgyártókra, az egy dalra jutó kontaktusokat illetőleg ez a második legnépszerűbb topik.

Bulizó

  • Dalok száma: 247 (11,9%)
  • Legjellemzőbb dal: Nótár Mary – Rázd Meg (témához tartozás: 93,1%)
  • Leghallgatottabb dal: VALMAR – Úristen (feat. Szikora Robi)
  • Témát legjobban leíró dal: VALMAR & Fluor & Pixa – Partyarc
  • Stream-elések száma a Spotify-on: 92,5 millió, átlagos: 375 ezer
  • Megtekintések száma a YouTube-on: 296,5 millió, átlagos: 1,2 millió

Az utolsó kategória a Bulizó, melybe viszonylag kevés szerzemény tartozik: 247, a teljes paletta 11,9 százaléka. Közelebb áll a Gengszterélethez és az Utcakölykökhöz, mint a másik négy topikhoz. Sokszor nem veti el az obszcén kifejezéseket, de mégsem igazán jellemző rá, s ha egy-egy számban meg is jelennek ezek a szavak, nem olyan durván vagy közönségesen, mint az előző két téma esetében. Legfőbb eleme a szórakozás: hétvége, éjszaka, koncert, diszkó, buli, tánc, alkohol, nők, csajozás. Nincs egy kifejezett stílus sem, ami uralná a topikot, a rockerektől kezdve a rappereken át az alternatív zenészeket is megihleti. A teljes hallgatottsági és nézettségi számok a középmezőnybe juttatták a Bulizó műveket: 92 millió a Spotify-on és 297 millió a YouTube-on, az összevont kontaktusszám 15,5 százaléka. Azonban a befogadó közönség erre a témára a legfogékonyabb. Az egy dalra jutó lejátszások száma szerinti ranglistán első lett mindkét platformon: a Spotify-on 375 ezerszer, a YouTube-on pedig 1,2 milliószor játszottak le egy slágert, azaz a dalszerzők tudják: amennyiben ebben a témában írják a slágereiket, akkor ez hozza majd nekik a legtöbb kattintást is.

Lábjegyzetek, hivatkozások

  1. Az adatok az IFPI 2022-es jelentéséből származnak, mely a globális médiapiac bevételeinek 89 százalékáért felelős 22 ország 44 ezer internetezőinek válaszain nyugszik. Engaging with Music 2022
  2. Az IFPI másik 2022-es jelentése: Global Music Report 2023 (ifpi.org)
  3. Az NMHH 2022-es, 15 ezer fős kutatása szerint: Internethasználati szokások, digitális média- és tartalomfogyasztás
  4. A listából (nyelvelemzési korlátok miatt) a külföldi dalok kimaradtak, így a magyar előadók nem magyarul énekelt számai is. Azon zeneszámok sem képezték az elemzés részét, melyekben tíznél kevesebb egyedi magyar szó szerepelt, vagy csak instrumentális részeket tartalmaztak.
  5. A korpusz ténylegesen előforduló írott, vagy lejegyzett beszélt nyelvi adatok gyűjteménye, a zeneszövegek összessége.
  6. Egyedi szó: más néven szóforma. Azokat a szavakat jelenti, melyek egyszer vagy többször is előfordulnak, de mindig ugyanabban a formában. Például a ház, a házak és a házban három különböző egyedi szó, de ismétlődésükkel nem gyarapszik az egyedi szavak száma.
  7. A nyelvi távolságokat egyfajta hierarchikus klaszterezési folyamat segítségével lehet kiszámolni, az úgynevezett Ward-módszerrel.
  8. A témákhoz tartozó dalok számának, hallgatottság és nézettség számításának módszertana a következő: minden egyes dalhoz hét, nulla és egy közötti feltételes valószínűség került kiszámításra, melyek megmutatják, hogy az egyes slágerek hány százalékban tartoznak a hét különböző topikhoz. Ha például egy szám leginkább az Álmodozóhoz húz, akkor a feltételes valószínűsége az Álmodozó topiknál magas lesz, akár 0,9 (90%) és a maradék 0,1 (10%) a többi hat téma közt oszlik el. Ez a feltételes valószínűség adja a statisztikai súlyt, melynek segítségévél kiszámolható a témákhoz tartozó dalok száma és a témák Spotify-os hallgatottsága, YouTube-os nézettsége.
  9. A várt kontaktusszám, százalékos érték mutatja, hogy az egyes topikok átlagos összevont kontaktusszáma mennyiben tér el a teljes, 2.072 dalból álló slágerlista átlagos étékétől.)