Vild med dans analyse

I Vild Med Dans, har du nogensinde tænkt på hvor stor er chancen for at ryge i omdans, hvis et par er nummer 1, 3 eller 7 ved dommerne? Nå, ikke… men det har jeg! Ja, det er lige et lille afbræk fra det normale finansanalyser, men jeg ser vild med dans og det gør en million andre også, så bær over med mig. Det har ikke pokkers meget med finanser at gøre, men om ikke andet så er der noget at lære omkring random sampling og data mining af Wikipedia.

Vild med hvad?

Anyway, i vild med dans er der 12, mere eller mindre kendte personer der skal lære at danse sammen med en professionel danser. De skal så hver fredag vise hvad de har lært foran dommere, publikum og seere. Efter hver dans får parret karakterer af dommerne på en skala fra 1 til 10, og deres samlet karakterer i forhold til de andre par afgør så hvor mange point parret får. Det par med højest karakterer får lige så mange point som der er par tilbage, og det par med næsthøjest karakterer får et point mindre og så fremdeles til det par med lavest karakterer får 1 point. Seerne kan så stemme på deres yndlingspar og på præcis samme måde får alle par point fra seerne. De to par med færrest samlet point (uafgjort afgøres af færrest seerstemmer) ryger så i farezonen (omdans) og risikere ryge ud af programmet.

Og det er så her, når alle parrene står og ser, åh så spændte ud, at min hjerne ryger over i sandsynligheder. For hvor nervøse skal det par der har fået flest dommer-point faktisk være? Er de ikke sikret at gå videre? Nej, faktisk ikke helt sikker viser det sig.

Jeg har prøvet at give tilfældige point fra seerstemmer, 1 million gange og så talt hvor mange gange hver par med de forskellige dommer-placeringer er røget i teoretisk omdans. 1 million lyder måske af ok mange, men det er på ingen måde utømmeligt når der er 10 eller flere par i konkurrence. For det er muligt at kombinere tallene fra 1 til 12 (dvs. der er 12 par tilbage) på 479.001.600 (næsten 500 millioner) måder og det ville tage for lang tid for min computer at udregne for samtlige muligheder. Men når der er 9 par tilbage, er der ”kun” 362.880 måder at kombinere tallene 1 til 9 på, så der burde de fleste muligheder være dækket af med en million tilfælde udtrækninger.

Procent risiko for omdans i forhold placering hos dommerne (til højre) alt efter hvor mange par der er tilbage (bunden).

Så på fredag, når de 8 par der er tilbage, er færdige med at danse og tredjepladsen hos dommerne ryger i omdans, så kan du passende påpege over for de andre i stuen at det var der faktisk kun 4.35% risiko for. Som man kan se, er der en teoretisk mulighed for at det par med flest dommerstemmer faktisk ryger i omdans selvom der er 12 par tilbage. Hvordan kan det lade sig gøre? Jo, ved at lagt de fleste får det samme antal point, og så er parret med færrest seerstemmer der ryger i omdans.

Dommer pointSeer pointTotal point
Par112113
Par211415
Par310313
Par491019
Par58513
Par67613
Par76713
Par85813
Par94913
Par1031114
Par1121214
Par12123
En mulig pointfordeling der ville resultere i at parret med flest point fra dommerne ryger i omdans

I dette tilfælde er det par 1 (13 point) og par 12 (3 point) der ryger i omdans, da lige point bliver afgjort af seerne.

Er der nogle danse der giver en fordel?

Som noget nyt i denne sæson, må den professionelle danser selv vælge hvilken dans de skal danse (bare ikke den samme dans to gange). Så det kunne måske være godt at vælge en dans der har større chance for at give en god dommerscore hvis man hænger med røven i vandskorpen så at sige.

Til det skal vi bruge noget data! Og her er Wikipedia et dejligt sted, for der findes der pointtavler for alle danse, dansere, deltagere og dommere alle de 18 sæsoner der har været. Der mangler godt nok lidt data i de første sæsoner, men det går nok. Så jeg henter alle point for alle sæsoner for alle danse ned og ser om der er nogle danse det oftest score højere end andre.

Her er det nok, som forventet freestyle dansen det får den højeste score, da den kun danses i finalen hvor der også er blevet trænet mest og det kun er de bedste der er tilbage. Til gengæld skal man holde sig fra Engelsk Vals og Cha-Cha-Cha, da de kun i gennemsnit over de 140 gange de er blevet danset, har scoret lige omkring en 5 fra hver dommer. Bedre er det med Slowfox der i gennemsnit får 6.5 fra dommerne. Og det går helt galt med Salsa, hold jer langt væk fra Salsa!

Hvilken professionel danser klare sig bedst?

Alle er jo deres favoritter, men det virker som om nogle af de professionelle dansere, bare altid kommer langt. Der har været lige omkring 230 dansere (når man tæller både professionelle og nydansere med) i de 18 sæsoner, men kun 13 har haft mere end 40 danse.

Her er det faktisk Marianne der ligger i toppen med et gennemsnit på 7,5 i karakter fra hver dommer i hendes 56 danse, skarpt forfulgt af Silas med 7,4 i gennemsnit i 117 danse. Mads og Thomas har begge danset over 150 danse og ligger med et gennemsnit på henholdsvis 6,6 og 5,9. I bunden ligger Jenna med bare 4.4 i karakter.

Men Hübbe er da sådan en flink mand!

Dommerne giver tit ret ens karakterer, men de er nogle gange lidt uenige. Jeg har taget udgangspunkt i de fem dommere der er med i denne sæson, nemlig Nikolaj Hübbe, Anne Laxholm, Britt Bendixen, Marianne Eihilt og Jens Werner. De har på Wikipedia giver point mere end 4.500 gange tilsammen, så det er et meget solidt grundlag at bedømme ud fra. Hvis man udregner deres gennemsnitskarakter over alle karakter de nogensinde har givet er der alligevel en lille forskel fra en ene ende til den anden ende af bordet.

Ja, der findes også en R-pakke til at plottet med billeder.

I gennemsnit giver Hübbe næsten et halv point lavere karakter end Werner (mon det er derfor de sidder i hver sin ende af bordet?). Men har hver dommer så også en favoritdans?

Specielt Eihilt og Hübbe giver gode karakterer for Rumba, Samba og Slowfox med et spring på næsten en hel karakter ned til Pasodoble. Her er de tre andre dommere mere lineære i deres pointgivning.

Hvorfor er det altid en skuespiller der vinder?

Jo, det kunne være fordi at der er så mange af dem (og derfor er udsat for base rate fallacy). Det er samme årsag til at vi for tiden ser så mange smittede med covid-19 selvom de er vaccineret. Der er simpelthen så mange der er vaccineret at startgrundlaget er u-intuitivt.

Men tilbage til dansen, der er nemlig lige omkring 175 forskellige professioner der har deltaget i vild med dans gennem de 18 sæsoner. Men kun 19 professioner har været med mere end én gang

ProfessionAntal gange
Bordtennisspiller2
Cykelrytter2
Fodboldspiller2
Journalist2
Model2
Radiovært2
Vært2
Komiker3
Musiker3
Sanger Og Skuespiller3
Svømmer3
Bokser4
Politiker4
Rapper4
Håndboldspiller7
Sanger8
Tv-Vært11
Sangerinde13
Skuespiller45
(Ja, der er plads til forbedringer i Wikipedias annotering)

Kun fem professioner har været repræsenteret mere end fem gange: 7 håndboldspillere, 8 sangere, 11 Tv-værter, 13 Sangerinder og hele 45 skuespillere.

Profession1. plads 2. plads 3. plads Top 3Total antalProcent i top 3
Håndboldspiller1023742.9%
Sanger0101812.5%
Sangerinde0000130%
Skuespiller656174537.8%
Tv-vært20131127.3%
Du skal danse, ikke synge!

Således er førstepladsen gået til én håndboldspiller, 6 skuespillere og 2 tv-værter. På trods af de 13 sangerinder der har været med har ingen opnået en placering i top-3 (skal Freja blive den første i år? Update: det skulle hun så ikke) og kun en enkelt sanger ud af otte har klaret det, så det er heller ikke meget bedre for mændene. Derimod har håndboldspillere 42,9% chance for at placere sig i top-3, mens skuespillere har 37,8% chance.

Der var noget med at Coco O. fik en 2. plads i sæson 16, men hun står opført som “Sanger og sangskriver”. Jeg sagde jo der var plads til forbedringer i annoteringen på Wikipedia.

Konklusion

Det er sjovt som et lille spørgsmål omkring hvad er risikoen for at ryge i omdans kan medføre sig. Men så fik jeg også downloadet en masse tabeller fra Wikipedia. Og husk, hvis der er nogen der skal danse Vals eller Cha-Cha-Cha (specielt hvis det er Janna), så hold øje med om de ikke får en dårligere placering end dem der danser Rumba og Slowfox. Og se om ham Hübbe ikke er lidt nærig med pointene.

God fornøjelse

Læs del 2 her

Kildekoden

Download alt kode der blev brug her

Leave a Reply

Your email address will not be published.