Publicerat av Markus Amalthea Magnuson den 26 juli 2011
Kategorier: Internet · Media · Mjukvara · Musik

Svanslängd på Spotify

Som noterats av många genom åren saknar Spotify den långa svans som utmärker fildelningsnätverken och andra betydligt friare platser för kulturellt utbyte. Denna kuperade skugga av ett rikligt musikutbud är resultatet av spotifiering, ett begrepp som myntades och sedan dess utforskats av Fredrik Edin i en rad oerhört intressanta texter. Han skrev för en tid sen:

En av de riktigt bra sakerna med internet har varit mångfalden. Visst, det finns problem med den också, men uppsvinget för olika nischprodukter och extremt smala företeelser har gjort världen till en betydligt bättre plats. All den kultur som tidigare sålt för lite för att platsa i vanliga affärer hittar sina fans på nätet.

Spotifieringen innebär att den här svansen klipps av. Vi är tillbaka där vi var innan internet. Sist jag kollade saknade Spotify – och i shit you not – 97% av den musik jag lyssnat på den senaste månaden. Återigen är det bara musik som har en potentiellt stor publik som tillhandahålls. Någon annan har bestämt innehållet utifrån ett affärsmässigt, inte kvalitativt, perspektiv. Det är inte fråga om bra eller dålig kultur utan om kulturen går att sälja i stora volymer eller inte. Det är inte längre du som väljer utan en ekonom som gjort en målgruppanalys.

Jag har till och från funderat över hur en mer empirisk studie av detta förhållande skulle kunna ske, går det på ett mer mätbart sätt faktiskt avgöra till vilken utsträckning svansen på Spotify är avhuggen? Rasmus Fleischer gjorde en mindre studie av sådan sort förra året, vars slutsats var att musik utanför mittfåran är relativt sällsynt både på Spotify och liknande tjänster (t.ex. Grooveshark). De senaste dagarna har jag experimenterat lite med hur ett mer storskaligt tillvägagångssätt skulle kunna se ut och kan nu presentera detta arbete.

Manuella metoder var redan från början helt uteslutna. För att kunna genomföra några som helst omfattande sökningar genom utbudet på Spotify krävs autmatisering. Jag upptäckte glädjande nog att Rune Halvorsen skrivit kodstycket spotimeta som gör det enkelt att anropa Spotifys sök-API, mycket ändamålsenligt för nästa steg i planen: ett eget python-skript som går igenom alla artister det matas med och kollar om de får några sökträffar på Spotify. spotify-long-tail.py tar en textfil med en artist per rad som input och skriver ut om några träffar fanns på respektive artist och i sådant fall vilka träffar detta var.

Utgångspunkten för mina sökningar har varit mitt eget iTunes-bibliotek. Genom att markera huvudbiblioteket och välja Arkiv > Bibliotek > Exportera spellista… kunde jag spara hela mitt bibliotek som vanlig textfil, för att därefter öppna den i Excel och kopiera ut kolumnen ”Artist” till ett eget textdokument. Efter att ha rensat och sorterat lite i denna lista innehöll den till slut de 1 455 unika artister som finns i mitt bibliotek. Några av dessa kan mycket väl vara felaktiga på grund av dålig metadata men min generellt pedantiska inställning ger ett så gott som välfungerande testmaterial.

Nu till första sökningen. De artister som får noll träffar finns definitivt inte på Spotify och markeras i enlighet med detta:

Searching for '22 pistepirkko' (6 of 1455) [not found]

Men sedan finns också ett antal träffar som egentligen inte motsvarar det som söktes:

Searching for 'earth island' (342 of 1455)
    Found:
    This Island Earth

Tills jag skrivit en bättre version av skriptet har jag valt att bortse från dessa fall och räkna dem som träffar. Slutresultatet av första sökningen är att runt 70% av artisterna i mitt musikbibliotek också finns på Spotify:

Found 1032 out of 1455 artists (70.93%)

Andra sökningen rör sig mer mot ett verkligt fall. Jag har några få gånger försökt mig på att göra Spotify-spellistor åt andra, med stor frustration just eftersom massor av min musik saknas där. Med detta i åtanke har jag därför försökt återskapa en sökning som visar på mina möjligheter att göra en spellista med musik jag gillar. Detta definieras här som alla artister i mitt bibliotek med minst en låt som jag betygsatt med en fyra eller femma, en lista jag tagit fram genom att helt enkelt skapa en dynamisk, betygsbaserad spellista i iTunes och kopiera ut artisterna därifrån på samma sätt som tidigare. Resultatet av andra sökningen är att runt 75% av mina 473 ”favoritartister” finns på Spotify:

Found 364 out of 473 artists (76.96%)

Tredje sökningen är snarlik, men jag har istället valt ut de 100 artister jag har flest låtar av, som något slags popularitetsrepresentation av min musik. Resultatet är att 93 av dessa 100 artister finns på Spotify, alltså betydligt större andel än tidigare sökningar:

Found 93 out of 100 artists (93.00%)

Den fjärde sökningen är inte baserad på iTunes utan istället på statistik över mitt musiklyssnande hämtad från min profil på Last.fm. Jag konstruerar en lista över alla artister jag lyssnat på de senaste tre månaderna vilket kan tänkas vara ett relativt realistiskt urval för en spellista jag vill göra till någon. Resultatet är att ungefär 75% av dessa 332 artister finns på Spotify:

Found 248 out of 332 artists (74.70%)

Jag avslutar med en femte sökning baserad på iTunes-spellistan ”The Best of Psykedeliskt” som samlar alla högt betygsatta låtar i denna breda men ändå mer specifika ”genre”. Av de 148 artisterna i denna lista fanns runt 70% på Spotify:

Found 107 out of 148 artists (72.30%)

Detta får konkludera denna övning för den här gången. Samtliga siffror har visat sig vara högre än vad jag möjligen skulle ha gissat, men faktum kvarstår att jag i sökandet efter min favoritmusik på Spotify får välja bort omkring en fjärdedel helt och hållet. Jag fortsätter blanda listor på 8tracks istället, för att inte tala om .zip-filens utmärkta förmedlingsform av musiksamlingar.

Undersökningen har förstås varit långt ifrån så omfattande som den skulle kunna vara, framför allt då jag utgått från artister snarare än enskilda låtar. Mer finkorniga men lika automatiska sökningar är möjliga, kanske ett projekt för framtiden eller för någon annan.

3 svar till “Svanslängd på Spotify”

  1. […] Markus Amalthea Magnuson har gjort den första empiriska studien av spotifiering. Åtminstone som jag känner till. […]

  2. Morsan skriver:

    Ambitiöst och intressant! Det skulle vara kul om det fanns någon allmänt tillgänglig tjänst där man anger sitt last.fm-användarnamn och får svar på hur stor andel av den musik man lyssnar på som finns på Spotify. Det borde gå att knacka ihop med spotimeta och last.fm:s API (men är bortom vad jag klarar av).

    • Markus Amalthea Magnuson skriver:

      God idé. Det är nog en ganska lätt uppgift, själv har jag dock inte tiden för tillfället.