Effekten af store gruppemøder på spredningen af COVID-19 er et emne, der har tiltrukket sig betydelig opmærksomhed under pandemien. Et af de mest markante eksempler på denne type møder er de valgkampe, som Donald Trump afholdt i 2020. Disse rallyer havde flere særlige kendetegn, der gør dem velegnede til at analysere, hvordan store forsamlinger kan bidrage til øget smitte. Dette studie undersøger præcist denne forbindelse ved at analysere 18 rallyer afholdt af Trump-kampagnen mellem juni og september 2020. Formålet er at belyse, hvordan sådanne store møder kan fungere som "superspreader-events" og dermed forværre pandemiens udvikling.

En central udfordring i denne type analyse er at kunne adskille de effekter, som rallyerne forårsager, fra de øvrige faktorer, der påvirker smitteniveauerne i samfundene. Vores metode til at vurdere effekten er baseret på at sammenligne smitteniveauet i de counties, hvor rallyerne fandt sted, med et udvalg af sammenlignelige counties, som ikke havde rallyer. Denne tilgang giver os mulighed for at estimere, hvordan COVID-19-situationen i rallydeltagerne kunne have udviklet sig uden rallyerne.

I vores analyse indsamler vi data om COVID-19-situationens udvikling i disse counties både før og efter rallyerne. Derefter benytter vi regressionsteknikker til at analysere, hvordan smitteniveauet ændrede sig i forhold til de demografiske faktorer og den eksisterende smittetrend før rallyet. I langt de fleste tilfælde viser vores analyser, at de 18 rallyer førte til en stigning i bekræftede COVID-19-tilfælde med mere end 250 pr. 100.000 indbyggere. Når vi estimerer effekten af alle rallyerne, når vi frem til, at der sandsynligvis blev tilføjet mere end 30.000 ekstra bekræftede smittetilfælde i kølvandet på rallyerne. Hvis vi også ser på dødsfald, viser analysen, at rallyerne sandsynligvis førte til mere end 700 dødsfald, ikke nødvendigvis blandt deltagerne, men i de berørte samfund generelt.

Det er vigtigt at bemærke, at vores metode adskiller sig fra de mere traditionelle epidemiologiske modeller, da vi bruger data fra sammenlignelige counties til at forudsige, hvordan smittesituationen ville have udviklet sig uden rallyerne. De traditionelle modeller forudsiger fremtidige resultater baseret på data, der kun dækker op til det nuværende tidspunkt. Vores tilgang er anderledes, da vi anvender data fra de perioder, der går forud for rallyet i andre sammenlignelige counties, hvilket giver os en mere præcis vurdering af den potentielle effekt af rallyerne.

En vigtig observation i vores studie er, at der er en markant forskel mellem de faktiske rallyer og placebo-events, som vi også testede. Disse placebo-events, som vi gennemførte for at sikre, at vores resultater ikke blev forvrænget af eksterne faktorer, viste kun små og statistisk ubetydelige effekter. Dette underbygger pålideligheden af vores resultater.

Rallyerne med Trump-kampagnen fandt sted i en periode, hvor mange mennesker stadig var modvillige over for at følge sundhedsmyndighedernes retningslinjer om maskebrug og social afstand. Denne lavere grad af overholdelse forstærkede sandsynligheden for, at disse store samlinger kunne blive "superspreader-events". Eftersom mange af rallyerne fandt sted i områder med høj smitte, blev det klart, at sådanne samlinger kunne spille en rolle i at accelerere den lokale spredning af virusset.

Det er dog også vigtigt at forstå, at de store stigninger i smitten, som vi har observeret, ikke nødvendigvis kun skyldes rallyernes direkte indvirkning på de deltagende individer. I stedet kan det også afspejle en bredere smittespredning, som opstår, når store forsamlinger af mennesker mødes, og virussen får større muligheder for at sprede sig til personer, der ellers ikke ville være blevet udsat for den.

For at kunne forstå de dybere konsekvenser af store grupper og deres indvirkning på smittespredning i samfundet, er det nødvendigt at se på, hvordan de sociale og økonomiske strukturer i disse områder også spiller en rolle. Mange af de counties, som var involveret i vores studie, havde højere befolkningstætheder og lavere socioøkonomisk status, hvilket kan have forstærket virkningen af rallyerne. Derudover er det vigtigt at tage højde for den langvarige effekt af sådanne begivenheder, som måske ikke umiddelbart bliver synlig, men kan have betydelige konsekvenser på lang sigt, både med hensyn til sundhed og økonomi.

Hvordan Trump-rallier påvirkede COVID-19 spredning: En analyse af effektmåling

Analysen af Trump-ralliernes indflydelse på COVID-19 spredning i USA er en kompleks og sammensat opgave, da virkningerne af sådanne begivenheder ikke kun afhænger af rallyernes karakteristika, men også af de dynamiske forhold, der eksisterer i de berørte områder før og efter begivenhederne. En vigtig observation er, at de langsigtede virkninger af sådanne begivenheder kan være betydelige, da infektionsraterne ikke nødvendigvis stiger umiddelbart, men over tid, når personer smittet ved rallyerne interagerer med andre. Det betyder, at de negative effekter ved rallyerne kan akkumuleres, hvilket gør det vanskeligt at isolere og analysere effekten i en kortere tidsramme.

En afgørende udfordring er, at virkningerne af rallyerne sandsynligvis vil variere afhængigt af en række faktorer. For eksempel vil det have stor betydning, om rallyet blev afholdt indendørs eller udendørs, hvor mange deltagere der var til stede, og i hvilken grad deltagerne overholdt sundhedsforanstaltninger som brugen af masker eller social afstand. Desuden kan det også være relevant at overveje, hvilken type deltagere der deltog i rallyet, da enkelte grupper kunne være mere tilbøjelige til at sprede virusset baseret på deres interaktioner og adfærd.

I denne analyse blev der valgt at fokusere på rallyer, der fandt sted mellem 20. juni og 22. september 2020. Dette valg blev truffet af to hovedårsager: For det første blev der krævet mindst fire uger med data efter hvert rally for at kunne måle den potentielle smittespredning, og for det andet blev det vurderet, at sundhedsforanstaltninger som brug af masker kunne være blevet bedre håndteret på de senere rallyer. Dette valg var nødvendigt for at undgå forvrængninger i målingerne, da bedre overholdelse af retningslinjer kunne have reduceret smitterisikoen ved senere rallyer.

De data, der blev brugt i analysen, stammer fra flere kilder, herunder Johns Hopkins University’s COVID-19 Database, som giver opdaterede oplysninger om antal smittede og døde i de enkelte amter. For at reducere støj i dataene blev den oprindelige daglige opgørelse ændret til ugentlige målinger. Dette gjorde det muligt at isolere effekten af rallyerne fra andre dag-til-dag variationer i smittespredning. En vigtig parameter i analysen var afstanden mellem rallyer og nærliggende amter. For at minimere risikoen for fejl blev alle amter, der lå inden for 50 km fra et rally, udelukket fra analysen.

En stor udfordring i studiet var at isolere den specifikke virkning af rallyerne på smittespredningen. COVID-19 spredningen varierede markant mellem forskellige amter, hvilket gjorde det vanskeligt at anvende standard økonometriske modeller til at analysere dataene. I stedet benyttedes en metode, hvor hvert rally blev analyseret individuelt, og "lignende" amter blev identificeret baseret på præ-existing smitteniveauer, demografiske faktorer og politiske foranstaltninger. Ved at sammenligne smittespredningen efter rallyet i et givent amt med en forudsigelse af smittespredningen i det samme amt, baseret på de identificerede lignende amter, kunne effekten af rallyet estimeres.

En vigtig del af analysen var brugen af placebo-events. Disse placebo-events blev anvendt til at sikre, at de målte virkninger ikke skyldtes forudgående tendenser i smittespredning i amterne. Placebo-events bestod af begivenheder, der blev placeret 10 uger før det faktiske rally og blev brugt til at vurdere, om de målte effekter kunne være forårsaget af forhold, der eksisterede før rallyet. På denne måde kunne analysen identificere og kontrollere for de underliggende faktorer, der kunne have påvirket smittespredningen, selv uden rallyerne.

For at forstå effekten af rallyerne på en mere præcis måde, er det nødvendigt at overveje ikke blot de direkte konsekvenser af rallyet, men også de indirekte effekter, som kan manifestere sig over længere tid. For eksempel kan et rally i et område med høj smittespredning forårsage en bølge af smitte i ugerne efter begivenheden, da deltagerne, der er blevet smittet, interagerer med deres lokalsamfund. Derfor er det vigtigt at have en bredere forståelse af smittespredningens dynamik og den tidsmæssige udstrækning af effekterne.

Samtidig er det nødvendigt at reflektere over, at selv om rallyerne utvivlsomt bidrog til en stigning i smittespredning, kan der have været mange andre faktorer, som også spillede en rolle i smittespredningen i denne periode. Forskellige politiske tiltag, som f.eks. nedlukninger, restriktioner på offentlige samlinger og krav om masker, kan have haft en betydelig indvirkning på virussets spredning. Derfor er det vigtigt at forstå, at effekten af rallyerne ikke nødvendigvis kan ses isoleret fra de øvrige politiske og sociale faktorer, der var i spil på det tidspunkt.

Virkningen af store, offentlige begivenheder som Trump-rallier på smittespredningen understreger også nødvendigheden af nøje at overveje, hvordan sådanne begivenheder organiseres og hvilke forholdsregler der tages. Det er ikke kun rallyets størrelse eller placering, der betyder noget, men også hvordan deltagerne interagerer med hinanden, og hvilke sundhedsforanstaltninger der er på plads for at minimere risikoen for smitte.

Hvordan man skaber pålidelige sammenligninger i epidemiologiske analyser: Metoder og robusthedstest

For hver begivenhed (i, t) ∈ E ∪ P definerer vi mængden Sit som de amter med de M mindste værdier af sijt, undtagen j ∈ T. Med andre ord består Sit af de M amter, der er mest sammenlignelige med amt i i uge t ifølge den valgte lighedsmåling. I vores empiriske analyse undersøger vi M ∈ {100, 200}. Derved repræsenterer vores matchede prøver med M = 100 cirka 3,2 % af alle amter, og de med M = 200 repræsenterer cirka 6,4 %. Vi udforsker robustheden med hensyn til flere måder at måle lighed på. Den vigtigste dimension for sammenlignelighed er den præ-begivenhedsmæssige udvikling af COVID-19 tilfælde. Hvis vi betegner yit som de nye tilfælde i amt i på tidspunkt t, definerer vi følgende klasse af lighedsmålinger:

k=1Ls\rhoijt=ρk12(yi,tkyj,tk)\sum_{k=1}^{L} s_{\rhoijt} = \rho^{k-1} 2 (y_{i,t-k} - y_{j,t-k})

I det særlige tilfælde hvor ρ = 1, svarer denne måling til den (kvadrerede) euklidiske afstand mellem (y_{i,t-1}, ..., y_{i,t-L}) og (y_{j,t-1}, ..., y_{j,t-L}). For ρ < 1 vægtes de mere nylige udfald tungere. Vi undersøger robustheden med hensyn til følgende værdier: ρ ∈ {0.25, 0.5, 0.75, 0.9, 1} og L ∈ {5, 10}. Vi undersøger også effekten af at inkorporere yderligere dimensioner af sammenlignelighed. Antag, at vi ønsker at sikre sammenlignelighed på tværs af et sæt variabler (x1it, ..., xRit). Disse variabler kunne f.eks. fange demografiske karakteristika som befolkningens uddannelsesniveau, eller de kunne repræsentere tidsvarierende karakteristika. For eksempel kunne vi have xrit = yi,t−r, hvor de matchede variabler blot er de første r efterslæb af nye tilfælde, som beskrevet tidligere.

Vores generelle strategi er at bruge lighedsmålinger af følgende form:

r=1Rsijt=αrit(xritxrjt)\sum_{r=1}^{R} s_{ijt} = \alpha_{rit} (x_{rit} - x_{rjt})

hvor αrit er vægte. Vi konstruerer vægtene som følger:

αrit=jN\T((xritxrjt)2)1\alpha_{rit} = \sum_{j∈N\T} \left( (x_{rit} - x_{rjt})^2 \right)^{ -1}

Intuitivt set er denne måling et vægtet gennemsnit af de kvadrerede forskelle, hvor vægten for forskellen i hver matchet variabel er omvendt proportional med dens prøvetvarians på tværs af alle amter (undtagen begivenhedsamtterne). Dette sikrer, at vi lægger lige vægt på en forskel på én standardafvigelse mellem amt i og amt j for hver matchet variabel. Denne metode er inspireret af lignende procedurer som dem beskrevet af Rubin (2006).

På grund af de ufuldkomne matchende enheder i Sit estimerer vi regressioner for at justere for deres forskelle. Specifikt, for hver begivenhed (i, t) ∈ T ∪ P og de matchede sæt Sit, bruger vi amterne i Sit til at estimere en OLS-regression, der relaterer en udfaldsvariabel til en samling af prædiktorer. For amtet j udfald måles antallet af nye tilfælde efter begivenheden eller placebo-begivenheden (i, t) inden for et udfaldsvindue, t gennem t + wit:

Yijt=w=0wityj,t+wY_{ijt} = \sum_{w=0}^{w_{it}} y_{j,t+w}

For de faktiske begivenheder svarer varigheden af udfaldsvinduet (wit) til antallet af uger, hvor vi har data, afkortet ved 10. For placebo-begivenheder sætter vi wit = 10, så Yjt måler det samlede antal nye tilfælde i de ti uger mellem placebo-begivenheden og den faktiske begivenhed. Potentielle prædiktorer inkluderer blandt andet: yj,t−k (nye bekræftede COVID-19 tilfælde), nye COVID-19 dødsfald i perioderne t−k, indikatorer for restriktive politikker (maskebeslutninger, krav om ophold på stedet) i perioder t−k og demografiske variabler som befolkning, procentdel kvinder, procent over 65 år, procent yngre end 29 år, samt diverse racemæssige og politiske karakteristika.

Da regressionerne for begivenhederne med 100 eller 200 observationer potentielt kan være problematiske med hensyn til overfitting, bruger vi LASSO-regressioner for at justere for disse risici. LASSO-regressionen justerer sig selv med en penalty parameter for at vælge de mest relevante prædiktorer (10 for 100 observationer og 20 for 200). Disse justerede prædiktorer danner grundlaget for de videre analyser af behandlingseffekter.

For hver begivenhed (i, t) og de matchende amter Sit bruger vi de resulterende regressioner til at beregne den estimerede værdi af de kumulative nye tilfælde i udfaldsvinduet for amt i, Ŷ iit. Derefter beregner vi standardfejlen af forudsigelsen ved hjælp af den konventionelle formel:

σfit=σ1+xi,it(XitTXit)1xi,itT\sigma_{fit} = \sigma \sqrt{1 + x_{i,it} (X_{it}^T X_{it})^{ -1} x_{i,it}^T}

Slutresultatet er beregningen af den gennemsnitlige behandlingseffekt for de faktiske begivenheder, µA, som vægtes i forhold til præcisionen af forudsigelserne for de enkelte amter.

For eksempel, i den grafiske fremstilling af vores resultater for en base-case variant af vores metode (blå) og en af de varianter vi har udforsket (rød), ser vi, at de estimerede gennemsnitlige behandlingseffekter for de faktiske begivenheder (til venstre) og placebo-begivenheder (til højre) adskiller sig markant. For base-casen viser estimaterne en behandlings-effekt på 332 nye tilfælde pr. 100.000 indbyggere, mens placebo-effekten er negativ (-49,7) og statistisk uadskillelig fra nul.

Vigtigt at forstå er, at selvom de valgte målemetoder skaber stærke indikatorer for behandlings-effekterne, er det afgørende at anerkende, at sammensætningen af de valgte variabler og de statistiske metoder kan påvirke resultaterne. Det er ikke blot afgørende at vælge de rette variabler og metoder, men også at sikre at resultaterne holdes pålidelige ved hjælp af passende justering for potentielle fejl.

Hvordan Trump-møderne påvirkede COVID-19-tilfælde og dødsfald: En statistisk analyse af rallyernes indvirkning på Wisconsin

De seneste analyser af COVID-19-relaterede data viser en markant stigning i de bekræftede tilfælde og en potentielt farlig stigning i dødsfald efter de såkaldte Trump-rallyer i flere amerikanske stater, herunder Wisconsin. Denne analyse fokuserer på counties som Winnebago og Marathon i Wisconsin, som viste sig at være stærkt påvirket af rallyernes effekt. Det er vigtigt at forstå den statistiske metodologi bag beregningerne af behandlingseffekterne og de efterfølgende dødsfald, som potentielt kunne være en konsekvens af rallyerne.

Behandlingsindvirkningerne blev målt ved hjælp af forskellige matchende algoritmer, der blev anvendt på 18 counties, som havde mindst fire uger med data efter rallyet. Dataene blev sammenlignet med de 100 nærmeste kontrolcounty-matches, hvilket giver et solidt grundlag for at vurdere rallyernes effekt. De statistiske resultater viste en klar stigning i antallet af bekræftede COVID-19-tilfælde i de rally-ramte counties. For hver behandlingseffekt blev den gennemsnitlige stigning i bekræftede tilfælde beregnet ud fra data om de seneste 10 uger efter rallyet og sammenlignet med placebo-effekter, der blev estimeret for et lignende tidsrum før rallyet.

Det samlede resultat viste, at rallyerne resulterede i mere end 30.000 ekstra bekræftede COVID-19-tilfælde og potentielt førte til over 700 dødsfald i de påvirkede counties. Denne effekt blev målt ved at multiplicere antallet af bekræftede tilfælde med dødeligheden for de pågældende counties, hvilket gav en estimate for de totale dødsfald. Denne beregningsmetode viste sig at være meget pålidelig i de fleste tilfælde, men det er stadig muligt, at rallyerne ikke nødvendigvis resulterede i en direkte stigning i dødsfald, men kunne være relateret til ændringer i testfrekvensen. Hvis rallyerne havde ført til en øget testkapacitet, kunne det have medført en stigning i bekræftede tilfælde uden nødvendigvis at øge dødsraten.

Yderligere analyse af counties som Winnebago og Marathon viste, at testfrekvensen og positiviteten af testene steg markant efter rallyet. I de uger op til rallyet var der ingen mærkbar stigning i testene eller i andelen af positive prøver. Dette ændrede sig dog hurtigt efter rallyerne, og en markant stigning i positivitet blev registreret. Dette kan indikere, at rallyerne muligvis har haft en indirekte effekt på antallet af testede personer og på den generelle opfattelse af pandemiens omfang i disse regioner.

En vigtig bemærkning i denne analyse er, at selvom rallyerne resulterede i øgede testniveauer og bekræftede tilfælde, var der ingen tegn på en betydelig placebo-effekt, som kunne have forvrænget resultaterne. I samtlige af de anvendte modeller kunne vi udelukke muligheden for, at rallyerne havde en positiv placebo-effekt på antallet af COVID-19-tilfælde.

Den statistiske metode, der blev anvendt, inkluderede også forskellige demografiske variabler, som kunne have påvirket sammenligningen mellem de forskellige counties. For eksempel blev andelen af kvinder, personer født i udlandet og personer under 29 år taget med i modellen, hvilket kan have haft en vis effekt på de samlede resultater. Der blev også testet forskellige vægtningsteknikker for at justere for forskelle i befolkningsstørrelse og demografiske træk, hvilket resulterede i meget konsistente resultater på tværs af alle modeller.

Det er nødvendigt at understrege, at den potentielle stigning i dødsfald ikke nødvendigvis skyldes en direkte virkning af rallyerne på sundhedssystemet eller en øget smittefare. En af de mulige forklaringer er, at rallyerne kan have bidraget til en ændring i teststrategien, hvilket gjorde det muligt at opdage flere smittede personer, men ikke nødvendigvis flere alvorligt syge patienter.

Det er også vigtigt at overveje den overordnede virkning på samfundet, hvor rallyerne kan have haft en effekt på befolkningens adfærd og deres opfattelse af pandemiens alvor. Øgede offentlige arrangementer og politiske signaler kunne have bidraget til en ændring i både teststrategier og offentlig sundhedsinformation, hvilket kunne forklare de målte stigninger i tilfælde og dødsfald.

Endelig viser disse analyser, hvor komplekse de sociale og sundhedsmæssige konsekvenser af store politiske begivenheder kan være, og understreger nødvendigheden af grundige dataanalyser for at forstå de fulde effekter af sådanne begivenheder på folkesundheden.