Category Archives: twitter

Twitter, statistisk och mer från Almedalen 2014

Under politikerveckan i Almedalen samlade vi (Intellecta) data och gjorde ett dagligt nyhetsbrev (Almedalsbrevet) med mängder av grafer och statistik från dagen. Brevet skickades ut direkt efter talet.  Sedan 2012 har vi också samlat allt som skrevs på Twitter om Almedalen. Praktiskt har det gått till så att vi har en bevakning via Twitters streaming API på ordet “ almedalen”. Det innebär att alla tweets som innehåller ordet hämtas hem och lagras i en databas (oavsett om de det är skrivet som #almedalen eller inte). I denna databas går det att göra olika typer av sökningar. Som backup byggde vi även en lösning som använder Twitters sök-API för att hämta tweetsen, om den första skulle fallera.

Förra årets analys av Almedalen hittar du här.

Statistik och övergripande resultat på Almedalen

Under 2014 skrevs  199 932 tweets  under perioden 29:e (söndag) klockan 15.00 till den 6:e (söndag) 23:59. Under 2013 skrev 136 671 tweets och 2012 var 109 419. En ökning med 46%. Nästa mått att titta på är antalet unika konton som skrivit tweets om Almedalen, för att få en uppfattning om hur spritt twittrandet var. Totalt skrev 28 505  olika konton på hashtaggen, en ökning från 19 397 (2013) respektive 15 092 (2012). Rådata från 2012-2013 finns här.

Twitter över dygnet

Det högsta aktiviteten syns i samband med talen: 19.00-20.00 har twitter som mest aktivitet.

Antalet twittermeddelande på #almedalen under Almedalsvecken.
Antalet twittermeddelande som omnämner “almedalen” under Almedalsvecken.

Fördelningen per tal (räknar från 19.00-20.00) ser ut så här, i fallande ordning.

Söndag – socialdemokraterna 4650
Torsdag – moderaterna 4483
Tisdag – sverigedemokraterna 3458
Fredag – vänsterpartiet 2603
Måndag – kristdemokraterna 2490
Onsdag – miljöpartiet 2184
Lördag – svenskarnas parti 1320
Lördag – folkpartiet 306
Söndag – centerpartiet 244

Vi passade också på att hämta ut de twittermeddelande som hade geokodning. Kartan visar var i Visby som flest tweets skickades från. Klicka på kartan för att komma till en zoombar version som visar Almedalens hetaste platser (vad det gäller att skicka tweets åtminstone…).

Heatmap över Tweet från Almedalen
Heatmap över Tweet från Almedalen

Mest retweetat på Twitter

Här är listan över de 10 mest retweetade tweetsen som nämner Almedalen. I linje med tidigare år är det anti-SD-tweets som toppar. Faktum är att de första sex alla handlar om Sverigedemokraterna eller SvP. Precis som tidigare är det humoristiska tweets som får störst spridning.  En lustig detalj är att tweet nummer tio, från @sockerpappan är ett meddelande som skickades 2013 och som fick ny spridning under årets Almedalsvecka.

Vanligaste #taggar i Almedalen

Även om vi bevakat allt som skrivs om Almedalen, inte bara det som har en explicit tagg (dvs #almedalen) så har vi tagit fram en lista på de hashtaggar som mest frekvent fanns tillsammans med ordet Almedalen.

#almedalen 85426
#svpol 12730
#Almedalen2014 3658
#val2014 1543
#dinröst 766
#funkpol 686
#bopol 673
#skolan 650
#afkAlmedalen 548
#skolanförst 526
#swgreen 503
#svtdebatt 454
#utbpol 448
#jobbvalet 418
#oresundshuset 409
#hejdigitalt 393
#alliansen 387
#skola 383
#EUiAlmedalen 376
#SRAlmedalen 364
#Visby 358
#SVT 355
#gma14 311
#tv4val 310
#Hetast 304
#sverigebygget 292
#Gotland 282
#vardpol 273

En mer omfattande lista över alla hashtags som nämndes mer än 10 gånger kan du hittar här.

Ge mig all data!!!

Precis som tidigare ger vi också ut den samlade datan fritt för den som vill grotta djupare ner i twitterfloden. Tweetsen ligger i en mysql-databas, men kan (på förfrågan) konverteras till andra format.

Här är MYSQL-dump på alla tweets från politikerveckan som nämner ordet almedalen.

Du får använda data helt fritt, men det finns regler från Twitter kring hur du får exponera datan. Läs på och följ dem!

Webbdagarna 2013 (och lite om fjärrkontroller)

Jag pratade på webbdagarna i Göteborg häromdagen. Själv är jag mest nöjd med tekniken – att fjärrstyra inte bara powerpointpresentationen utan själva kartan.

För er som är intresserade; de flesta fjärrkontroller identifierar sig som tangentbord (jag använder en Logotech R400). När man klickar på “nästa” så skickas en pg-down, föregående är pg-up. Knappen för att starta bildspel alternerar mellan att skicka escape och F5 och slutligen knappen för att blanka bildspelet skickar en punkt. Jag ville mappa om dessa till att göra helt andra saker – något som inte låter sig göras med någon programvara för fjärrkontrollen. Men lösning finns och heter KeyRemap4MacBook som helt sonika interceptar valfri inputenhet (ex tangentbord) och kodar om, i mitt fall vill jag kunna växla program. På så sätt kan jag stå där på scenen utan dator och köra live.

Twitterstatistik #almedalen [uppdaterad]

Så här twittras det om almedalen, uppdelat i 10minutersperioder. Jämförelse mellan 2013 och 2012. Själva datan finns i ett google spreadsheet du kan hitta här.

En lite mer färgglad version ser ut så här:

Chrome extension för Twittercensus

Helgen tillbringade jag på en minikonferens tillsammans med en lång rad rejält begåvade och trevliga personer. Men förutom prat om allt från zombieapocalyps till systemteori så blev det lite hackat. Jag slängde upp ett API och @peppelorum satte ihop ett Chrome-extension för Twittercensus. Resultatet gör det möjligt att se vilket kluster en given person tillhör, direkt i flödet på twitter.com. Alltså ett enkelt verktyg för att se vilka som twittrar om ett ämne.

Vila muspekaren över rutan för att se vad klustret heter och ett klick på den lilla fyrkanten leder dig direkt till aktuellt konto i den stora twittercensuskartan.

Twittercensus chrome extension

Tillägget funkar även i sök – vilket innebär att du snabbt kan få en uppfattning om i vilka grupper ett ämne diskuteras. Användbart vid en rad olika tillfällen.

En sökning på #BästaBeatrice ger en snabb bild av spridningen.

 Chrome extensionet finns att ladda hem här. Koden finns i Github.

Varför blir det inte fler Twittercensus?

Twitter håller på att stänga ner sitt API 1.0 till förmån för version 1.1. Men det handlar inte bara om en uppgradering – samtidigt gör de om själva “rate limit”-systemet, alltså hur ofta och hur många gånger varje klient eller app får ställa frågor till Twitter. Sanningen är att det är flera år sedan de började strypa tillgången till API:t, och den typen av vitlistade konton som vi har (och som möjliggör att ställa 20 000 frågor per timme) har inte har delats ut på flera år. Så egentligen är det inte själva API-uppgraderingen som är problemet, utan snarare att samtidigt som Twitter fasar ut API1.0 så försvinner alla vitlistade konton.

Vad är det så som är så speciellt med behoven i Twittercensus? Jo, till skillnad från andra mätningar tittar inte Twittercensus alls på realtidsdata (det Twitter erbjuder via sitt “streaming API”). Istället fokuserar Twittercensus på relationer, och följer ett kontos alla relationer för att söka efter ytterligare svenskspråkiga konton. Det spelar alltså ingen roll om en person inte har skrivit sedan 2006 eller tweetar under tiden vi gör mätningen – har kontot skrivit på svenska ska den fångas in. Oavsett om vi har tillgång till alla Tweets som skrivs i hela världen så hjälper inte det, vi behöver fortfarande hämta alla relationer och de senaste tweetsen för alla konton från REST API:t. Det innebär minst två frågor till Twitter per konto (och många fler om konton har många följare eftersom maximalt 5000 relationer kan hämtas per fråga). Det går att köpa data från olika återförsäljare som samlar. Men de är alla fokuserade på realtidsdata eller tweets – och ännu har jag inte hittat någon som kan sälja den informationen som behövs för Twittercensus (alltså relationsdata).

De nya begränsningarna som införs kommer alltså att gälla för oss. Det innebär att varje timme kan vi ställa 60 frågor om följare, 60 frågor om följer och hämta tweets för 720 konton. Förutsatt att kontona i fråga följer och följs av mindre än 5000  kan vi scanna 60 svenska konton per timme, samt göra språkanalyser av 720 konton. Med tanke på att senaste Twittercensus sammanlagt scannade  analysera 6 171 929 twitterkonton och hämtade relationer från 475 474 konton skulle datainsamlingen ta 357 dagar.

Men en tanke har redan börjat gro [och som föreslogs av @beantin]: vad sägs om att vi distribuerar ut själva datainsamlingen på SETI-vis? På kvällen surfar ni in på en webbplats och lämnar datorn på. En dator skickar information om vilka konton som ska scannas och klienterna rapporterar in resultaten.

Eller så hjälper någon till med en kontakt på Twitter som förstår varför Twittercensus är ett häftigt projekt som borde få fortsätta! Eller så tar vi gärna mot andra tips och idéer!

Var twittras det? [uppdaterad]

Från twitter (och min twittercensus-data) kan man dra ut geo-kodning för enskilda tweets (alltså de som använt GPS:en i telefonen och lagt till den informationen till tweetet) för att se exakt var person skickat twittermeddelande. I ärlighetens namn bör man nog poängtera att bara en liten minoritet av twitteranvändarna har geokodning av tweets aktiverat så de flesta tweetmeddelande dyker inte upp på en sådan här karta (eller andra liknande lösningar, som den här coola realtidskartan).

Här Twittras det i Stockholm
Var skickas det twittermeddelande i Sverige?
Malmö!
På förekommen anledning. Twittras det på Gotland?

Vem följs du av, egentligen?

En ny funktion på Intellecta Corporates Twittercensus gör det möjligt att visualisera vem som följer ett visst konto och tvärtom. Tanken är inte primärt att identifiera exakt vilka personer det är – det är enklare att göra på Twitter självt. Istället är det intressanta att titta på inom vilka kluster man har följare och följer konton. Resultaten torde vara intressanta utifrån diskussioner om representativitet, bubblor, elitism såväl affärsnytta för företag. Jag har valt ut några olika typer av twitterkonton för att dels förklara funktionaliteten, dels visa på intressanta aspekter. Jag har inte själv gjort så mycket analys i det här läget – det finns gott om tid för det. Men jag gör några korta reflektioner på slutet.

Självklart kan du själv använda tjästen – men om du tittar på personer med väldigt många följare (>10 000) så kommer sidan att ladda och rendera långsamt. Jag rekommenderar Chrome för att göra upplevelsen så smärtfri som möjligt.

Först, några korta förklaringar. “Kartan”, “blobben”, “amöban” är en visualisering av de mest aktiva twittrarna som skriver på svenska. Drygt 50 000 är med på kartan och kriteriet är att kontot skrivit minst lika många tweets som det är dagar gammalt. Alltså en snittproduktion på minst 1 tweet om dagen.

Dessa konton har sedan visualiserats med en kraft-baserat algoritm som enkelt uttryckt gör konton som följer varandra dras samman, medan konton som inte följs skjuts bort. Mycket mer utförlig beskrivning finns här. Färgerna representerar olika kluster som är statistiskt framräknande. Totalt finns 23 sådana kluster i kartan. Vad ett kluster “är” blir en subjektiv tolkning, men när man tittar på personerna i respektive grupp är det ofta väldigt enkelt att sätta ett namn på gruppen. Christofer Laurin gått igenom alla och gett dem namn. Det är hans bild du ser här.

 

Vem följer mig?

Nästa steg är att titta på vilka som följer ett visst konto (eller tvärtom). I bilden syns de som följer mig (@hampusbrynolf) och du kan se livegrafen här.

Som synes är mina följare nästan uteslutande befinner sig i det norra delen av grafen – och i det orangea klustret. Jag är rätt jämt fördelad mellan det västra (teknik, “bubblan”) och östra (politik, ledarskribenter, media) delen av den orangea klustret. Det stämmer också ganska bra med min egen bild. I det lila vänstra klustret (sport) finns det i stort sett ingen som följer mig, och inga i de södra regionerna.

Vem följer Göran Hägglund?

Som synes har Göran en väldig dominans i det nordöstra delen av kartan. Sen glesas följarna ut i alla riktningar. I de södra delarna är det ingen som följer honom, i det lila sportklustret är det väldigt få och så vidare.

Om man jämför med Sanna Kallur så är skillnaden uppenbar.

Få i politik/media/journalist-kretsen följer Sanna Kallur, medan hon har höga följartal i sportklustret.

Det går även att titta på vilka konton en person följer, här är Göran Hägglunds följarprofil.

Några snabba reflektioner…

Det första och uppenbara insikten är att de olika klusten är ganska separerade från varandra. Tittar man på personer i endera kluster så följs de av person från samma område eller närliggande. Det gäller mig, det gäller Karin Pettersson eller Peter Wolodarski. Det finns alltså inte ett Twitter i Sverige, det finns fler olika. Kittet som håller samman verkar vara kändisarna, personer som följs av alla oavsett: Magnus Betner, Adam Alsing, Jonas Gardell, men även sportstjärnor av olika slag. Men även där finns tydliga skillnader i vilka kluster de är tyngst.

Vad gäller företag, såsom SJ eller ComHem, har de ganska ickerepresentativa följareprofiler. Men mer om det i ett senare inlägg.

Vem åker till Almedalen?

I samband med Almedalen 2011 byggde makthavare.se en tjänst för att låta personer registrera sitt deltagande under politikerveckan. Syftet var att erbjuda en möjlighet att se vilka andra i ens kontaktnät som skulle till Almedalen. Med hjälp av den insamlade datan över anmälda deltagare och den data som Intellecta Corporate samlade in i Twittercensus 2012 har vi kunnat visualisera vilka besökare på Almedalen som även finns med i kartan över de mest aktiva användarna på twitter. Resultatet är slående. Utan undantag är almedalsbesökarna från den norra delen av grafen, och nästan uteslutande kommer de från det orangea klustret av politiker, media och den så kallade “bubblan” – teknik och socialamedierintresserade. För den som är mer intresserad av twitter- och almedalsgrafen går den att hitta här. Läs också om hur twitter grafen är uppbyggd.

Almedalsbesökare på Twitter

Som metod betraktat finns det vissa problem när det gäller vilka som anmält sig till Almedalen. Många kan ha varit där utan att för den sakens skull ha anmält sitt deltagande. Man ska därför akta sig för att dra allt för långtgående slutsatser av grafen.