Rød blok diskuterer især klima, blå blok diskuterer flygtninge - men vælgerne diskuterer andre emner
Rød blok laver hyppigst opslag om miljø, klima, landbrug og sundhed. Blå blok går mere op i flygtninge og skat, viser analyse fra IT-Universitetet i København, der bygger på store mængder af data fra sociale medier. Men hvilke emner diskuterer vælgerne?
Leon Strømberg-Derczynski
Adjunkt, ITULeon Strømberg-Derczynski, adjunkt på IT-Universitetet (ITU). Han leder et forskningsprojekt om Natural Language Processing (NLP), som er et område inden for datalogi, der beskæftiger sig med analyse og forståelse af talt og skrevet sprog, ofte med brug af machine learning.
Denne artikel er den anden i en serie af NLP-analyser af diskursen på sociale medier omkring folketingsvalget 2019.
LÆS OGSÅ: Analyse: Sådan fordeler vælgerne sig på de sociale medier
Partierne får lettere ved at ramme ned i den politiske debat på sociale medier, når de ved, hvad vælgerne allerede taler om. Ved hjælp af NLP-teknologi (Natural Language Processing) kan vi automatisk identificere de statistisk mest omtalte emner online. I denne artikel, som er den anden i en serie af datadrevne artikler om folketingsvalget 2019, ser vi på de mest omdiskuterede emner for henholdsvis partierne og vælgerne.
Første skridt er at identificere ord og sætninger, som karakteriserer forskellige emner eller temaer, ud fra hvad partierne og deres vælgere skriver på Facebook, Instagram og Twitter. Til dette bruger vi et low bias-værktøj kaldet “authorless TM". Værktøjet identificerer og isolerer ord som ofte bliver brugt i sammenhæng med hinanden.
Flere generelle emner udspringer af denne proces. For eksempel findes forskellige udtryk for sårbarhed ofte i samme kontekst som ord som “børn”, “flygtninge”, “kvinde” og “syge”.
Et andet overordnet tema omhandler eksempelvis “pension”, “arbejde” og “nedslidte” - sidstnævnte et ellers sjældent ord, men et ord, som Socialdemokratiet bruger i forbindelse med deres valgkampagne.
Et tredje tema dannes over ord som “skatter”, “lavere”, “skattestop” og “afgifter”, som er en del af et sammenhængende narrativ. Andre hyppigt diskuterede emner er vigtigheden af en god og ordentlig valgkampagne.
Mette Frederiksen er hyppigst nævnt
Når man ser på den del af debatten, som ikke er emnespecifik, er Mette Frederiksen den hyppigst nævnte politiker. Hun bliver som regel omtalt enten neutralt, eller i forbindelse med en tekst som indikerer, at forfatteren synes godt om hende.
Vi identificerer ord. som kendetegner hvert af disse emner ved hjælp af en teknologi med navnet word embeddings. De dominerende emner er uddannelse, miljø og klima, landbrug, sundhed, flygtninge og skat. Hvert emne består af en gruppe nøgleord baseret på, hvordan danskere diskuterer emnet på sociale medier.
Der er for eksempel en interessant forekomst af nøgleord omkring ‘uddannelse’, men hvor hverken ‘investering’, ‘besparelse’, ‘skåret’, ‘nedskæringer’ eller ‘omprioriteringsbidraget’ er direkte relateret til emnet, men er semantisk forbundet med emnet ‘uddannelse’.
- Uddannelse
- Videregående
- Investering
- Forskning
- Besparelse
- Skåret
- Studerende
- Udd
- Nedskæringer
- Omprioriteringsbidraget
Kilde: IT-Universitetet i København
Klima er et dominerende emne
Klima er det dominerende emne i begge de to blokkes opslag. Emnet er til stede i 50 procent af partierne i rød bloks offentlige opslag og 26 procent af partierne i blå bloks opslag. Dette mønster svarer nogenlunde til, hvad vælgerne selv skriver om.
Rød blok diskuterer klima og miljø, landbrug og sundhed mere end blå blok. Blå blok diskuterer til gengæld oftere flygtninge og skat og i begrænset grad uddannelse. Faktisk kan vi se, at partierne i blå blok omtaler emner relateret til skat dobbelt så ofte som partierne fra rød blok.
Vælgerne diskuterer generelt et væsentligt bredere udvalg af emner end partierne. Mens 82 procent af blå bloks partiers opslag handler om et af de ovenstående emner, handler kun 32 procent af deres partivælgeres samtaler om samme emner. Dette er, hvad man vil forvente af offentlig debat, med mindre der er tale om decideret manipulation af enten vælgere eller medier.
De andre emner, som vælgerne diskuterer, er meget varierede. Der er finkornede politiske forslag, såsom hvor en politistation skal placeres eller holdninger til minimumsalder - og maksimumsalder - for valgret. Der er diskussioner om offentlige personer, som burde eller ikke burde fyres, og ros af gode forslag og mennesker over hele det politiske landskab.
Når det kommer til debatten om Rasmus Paludan ser man, at næsten ingen af de politisk aktive brugere tager den seriøst, og de fleste reaktioner består af jokes.
Partier påvirker vælgernes måde at tale på
I analysen har vi også kigget på, hvordan partierne med deres ordvalg påvirker vælgernes måde at tale på. For at påvise en sådan effekt identificerer vi først de emner, som er vigtige for vælgerne, ud fra hovedemner.
Det er muligt at skønne den indflydelse, et parti har på deres vælgere, ved at identificere hvilke fraser, et bestemt parti bruger på sociale medier. Det vil sige ordbrug, som ofte bliver gentaget, og som andre partier undgår. Disse fraser bliver brugt væsentligt oftere end i typisk dansk, så de udgør et specifikt “sprog” for det parti, eller er i det mindste en stilistisk markør for partiets medieteam.
Enhedslisten: "et nyt flertal", "Pernille Skipper", "en grøn omstilling"
Liberal Alliance: "Mette Bock", "hvor pengene skal komme fra", "de grænseoverskridende", "Væk med"
SF: "mere personale", "ro på", "i hverdagen", "i børnehaven", "tid til omsorg"
Dansk Folkeparti: "Dansk Folkeparti", "mindre EU", "skal bestemme", "langt flere"
Radikale: "en ny retning", "se med live", "lyt til"
Konservative: "Søren Pape", "Rasmus Jarlov", "Pernille Skipper", "styrke det"
Stram Kurs: "Stram Kurs", "Rasmus Paludan", "April 2019", "Blågards Plads"
Klaus Riskær Pedersen: "Bruges til", -- og hashtags
Venstre: "kr. til", "i vores nye", "Lars Løkke Rasmussen", "[Vi har] den bedste statsminister"
Socialdemokratiet: "Lad os samle danmark", "en ny statsminister", "vil indføre", "for de nedslidte"
Alternativet: "klimavalg", "Alternativet vil", "end systemet", "at bremse"
Nye Borgerlige: "Nye Borgerlige", "vores egne", "stram udlændingepolitik", "ikke-vestlige indvandrere", "muslimske lande"
Kilde: IT-Universitetet i København
Nogle partier har en mere organiseret og målretttet mediestrategi. Nogle fokuserer primært på sig selv, og nogle fokuserer primært på andre partier. Nogle fokuserer på emner inden for den politiske dagsorden, og andre har et tydeligt budskab. Socialdemokratiet og Venstre fokuserer for eksempel begge på den kommende statsminister frem for andre dele af deres partiers budskaber.
De partier, som har haft mest succes med at påvirke eller matche deres vælgeres ordvalg, er Alternativet, Dansk Folkeparti, Nye Borgerlige og Stram Kurs.
Alternativets “klimavalg” bliver hyppigt brugt af deres vælgere. Dansk Folkeparti, Nye Borgerlige og Stram Kurs har primært haft succes med at videregive budskabet om deres navn, selvom mange følgere af Nye Borgerlige også bruger “vores egne”, og Dansk Folkepartis vælgere er begyndt at bruge fraser som “mindre EU” og at skrive tekst om, hvem der “skal bestemme” hvad. Når man ser på de vælgere, der stemmer på Stram Kurs, så er det eneste sprog, de har til fælles, ordene “Rasmus Paludan” og “Stram Kurs”, hvilket indikerer, at partiets kommunikation ikke er godt organiseret.
Radikale Venstres “ny retning” er også blevet adapteret af deres vælgere, ligesom Venstres vælgere ofte skriver om allokering af penge (“kr. til”). Liberal Alliances vælgere stiller ligeledes spørgsmålet “hvor pengene skal komme fra”. SF’s vælgere er rimelig tilbøjelige til at diskutere, hvad der skal “ro på”.
Socialdemokratiet har tydelige budskaber og en stærk marketingkampagne, men de fraser, de bruger, er ikke trængt ind i vælgernes sprog, De Konservative og Enhedslisten viser ligeledes begrænset indflydelse på deres vælgeres sprog. Enhedslistens “et nyt flertal” og “en grøn omstilling” bliver flittigt brugt af Enhedslistens vælgere. De Konservative har især fokuseret på navne frem for et ensrettet, politisk budskab.
Indvandring er ikke et populært emne hos vælgerne
Når vi sammenligner partiernes og vælgernes sprog med politiske emner, har især Alternativet, Liberal Alliance, Venstre, og Dansk Folkeparti haft succes med at influere (eller matche) deres vælgeres sprog, specielt indenfor temaerne klima, budgetter og forholdet til EU. Indvandring har ikke været så populært et emne blandt vælgerne, men er i højere grad er et narrativ omtalt i offentligheden af partierne alene.
I analysen ser vi også, hvilke emner partierne fra henholdsvis rød og blå blok tager op på sociale medier sammen med den offentlige debat i løbet af de seneste måneder. Vi sammenligner derefter med den offentlige debat i perioden midt-januar til midt-marts.
Interessant nok kan vi se, at opslag om de ovenstående emner er faldet over de sidste måneder.
Ifølge de 224.000 #dkpol-opslag på Twitter fra 2019 ses en lille nedgang i omtalen af disse emner. For eksempel skriver vælgerne i de seneste to måneder 20 procent mindre om skatterelaterede emner og 11 procent mindre om flygtninge end i de foregående måneder. Disse emner er formodentlig erstattet af de mange andre historier, som kommer op i løbet af et folketingsvalg.
Et eksempel på en sådan historie er videoen fra den 13. maj af Lars Løkke Rasmussen, som rider på en hest ved navn Ib. Videoen blev italesat som “klimavenlig transport”, og signalerer, at Venstre tager del i klimadebatten.
I kølvandet på videoen sker et skifte i Venstres vælgeres sprog, som resulterer i en femdobling af antallet af ord relateret til klima, miljø og natur i dagene umiddelbart efter, at videoen blev lagt op.
Analysen er udarbejdet af Leon Strømberg-Derczynski, adjunkt på IT-Universitetet (ITU), med bidrag fra Torben Oskar Albert-Lindqvist, Marius Venø Bendsen, Nanna Inie, Jens Egholm Pedersen, Viktor Due Pedersen og Troels Runge, der alle indgår i NLP-forskerteamet på ITU.
- Data er indsamlet fra offentligt tilgængelige opslag på Facebook og Instagram, samt API-adgang (premium access) til Twitter.
- I materialet indgår de seneste op til 200 opslag fra hvert parti og deres støttere.
- ’Støttere’ defineres som brugere af sociale medier, der deler tekster og indhold fra de forskellige partiers egne sider på Facebook og Twitter.
- Citerede retweets indgår ikke i datasættet, da disse betragtes som upålidelige indikatorer i forhold til at fastslå, hvorvidt en twitterbruger støtter det parti, som står bag tweetet.
- Instagram skiller sig ud fra de øvrige platforme. Dels indeholder det sociale medie ikke mulighed for at dele opslag, dels er Instagram designet til at fremme positive interaktioner. Det er blandt andet årsagen til, at ’støttere’ af bestemte partier på Instagram defineres, som brugere, der kommenterer et partis opslag.
- Et mindretal af retweets og delinger falder i kategorien ironiske eller sarkastiske. De er vanskelige for både computere og mennesker at identificere korrekt. Selvom der eksisterer uenighed om, hvilke beskeder der er ironiske eller sarkastiske, viser flere undersøgelser, at der er generelt bred enighed om, hvornår de ikke-ironiske beskeder simpelthen ikke er hverken ironiske eller sarkastiske. Derfor har ironiske eller sarkastiske retweets og delinger en meget lille indflydelse på det generelle dataset.
- Med store datasæt bliver fejlene udlignet. For eksempel vil omfanget af sarkastiske delinger fra støttere af et bestemt parti normalt svare til omfanget af sarkastiske delinger fra støttere af et andet parti.
- Ligesom analyser lavet af mennesker, vil datadrevne kvantitative analyser også være behæftet med en given usikkerhed.
Analysen er udarbejdet af Leon Strømberg-Derczynski, adjunkt på IT-Universitetet (ITU), med bidrag fra Torben Oskar Albert-Lindqvist, Marius Venø Bendsen, Nanna Inie, Jens Egholm Pedersen, Viktor Due Pedersen og Troels Runge, der alle indgår i NLP-forskerteamet på ITU.