Linkshandig? Ga schermen maar niet darten

Wereldwijd is ongeveer 11% van de mensen linkshandig. Maar er zijn sporten met relatief veel of juist weinig linkshandigen aan de top. Hoe is dat te verklaren?

linkshandige_schermer

De rechtshandige Sangyoung Park tegen de linkshandige Geza Imre in de finale van het schermen (onderdeel degen) op de Olympische spelen in Rio 2016. Bron foto: www.zimbio.com

Lees verder Linkshandig? Ga schermen maar niet darten

Darts: Het voorspellen van de uitkomst van profwedstrijden

Bij darten wordt vaak het gemiddelde en het checkout percentage van spelers getoond. Op basis daarvan hebben Steffen Liebscher en Thomas Kirschstein een model ontwikkeld om te voorspellen wie een wedstrijd gaat winnen. Je kunt die voorspelling verbeteren door een andere definitie te kiezen voor het gemiddelde en het checkout percentage dan gebruikelijk. Maar kan het model ook de gokmarkt verslaan?

Dit artikel is verschenen in STAtOR. Wil je het hele artikel lezen, klik dan hier.

Twee eerdere artikelen over darts kun je hier vinden:

De wiskunde achter darts: Waar kun je het beste mikken?

De wiskunde achter darts: Het optimale dartbord en het nadeel van linkshandig zijn

darts-int

Roeien: Het meten van geleverd vermogen

Bij sporten zoals wielrennen en roeien wordt het vermogen dat de sporter levert gemeten en gebruikt voor analyses en trainingen. Normaal gesproken wordt er bij roeien alleen rekening gehouden met de kracht die de roeier uitoefent op de roeiriem. De roeier levert echter ook vermogen door kracht te zetten op het voetenbord. De impact hiervan is berekend en gemeten door Lotte Lintmeijer, Mathijs Hofmijster en een team van de VU met behulp van 13 sensoren op roeiers. Zoveel sensoren is echter duur en onpraktisch. Hun vraag aan Youssef El Bouhassani en mij: Kan het ook met minder sensoren, en zo ja, welke sensoren moet je dan selecteren? Drie sensoren lijken al een goed resultaat te geven.

Vorig jaar november organiseerde de HvA een conferentie over Sport en Data Science. Daar moest ik natuurlijk bij zijn. Youssef El Bouhassani, data scienist op de HvA, sprak daar. Hij zei tegen de zaal dat als ze een dataset hadden en een vraag, ze naar hem toe konden komen. Dat deed Lotte, en daar stond ik toevallig weer naast. En zo ontstond een mini-project op het gebied van roeien en het selecteren van sensoren.

Normaliter wordt het vermogen dat een roeier levert alleen berekend aan de hand van de kracht die hij op de roeiriem uitoefent en de snelheid van de riem. Met behulp van een gedachte-experiment laten Lotte en Mathijs in dit artikel zien dat dat niet klopt, en dat een roeier ook vermogen levert via het voetenbord. Stel je voor dat een roeier in een boot zonder roeispanen met de voeten vast aan het voetenbord naar voren en naar achteren beweegt. De boot zal dan naar achteren en naar voren bewegen. De roeier levert hierbij vermogen, want hij moet waterweerstand overwinnen. Met behulp van simulaties op basis van (bio)mechanische vergelijkingen in het artikel, laten de auteurs zien dat wanneer je het geleverde vermogen van een roeier bepaalt op basis van alleen de kracht die hij op de handen levert, je het echte geleverde vermogen met meer dan 10% onderschat. Ook laten ze zien dat de extra component berekend kan worden aan de hand van de versnelling van het massamiddelpunt van de roeier. En dat is fijn, want die is betrouwbaarder te meten dan de kracht die op het voetenbord wordt uitgeoefend. Het leuke is dat het effect met relatief eenvoudige natuurkunde aan te tonen is. Toch kostte het me wel flink wat moeite om de formules (enigszins) te doorgronden. Er komt ook al een flinke discussie over op gang in “roeiersland”. Mijn natuurkundehart ging er in ieder geval weer even sneller van kloppen. Wil je precies weten hoe het zit, open dan zeker het artikel.

De vervolgstap was om deze onderschatting van het daadwerkelijke geleverde vermogen te meten in de praktijk. Om de versnelling van het massamiddelpunt van de roeier te bepalen werden er 13 sensoren op de deelnemende roeiers geplakt. Maar voordat ze dat op een boot op het water deden, hebben ze eerst onderzocht of de sensoren hun werk goed doen door een roeiapparaat op een “krachtenplatform” te zetten. Het krachtenplatform kan precies meten welke krachten de roeier uitoefent op het apparaat. Met deze krachten kan de versnelling van het massamiddelpunt van de roeier worden bepaald. Deze gemeten versnelling werd in het experiment gezien als de “werkelijk” gemeten versnelling van het massamiddelpunt van de roeier (“de gouden standaard”). Om te kijken hoe goed de 13 sensoren de versnelling van het massamiddelpunt van een roeier kunnen meten, werd deze versnelling vergeleken met de gouden standaard.

De 13 sensoren meten de versnelling en vertraging van specifieke lichaamsdelen (hoofd, benen, armen, voeten, bekken, romp). De versnelling van het massamiddelpunt van de roeier (a_roeier) kan berekend worden door de versnelling per sensor (a_i), te wegen met de massa van het lichaamsdeel dat bij de sensor hoort:

formule roeien

Hieronder is te zien op welke plekken de sensoren zaten, en wat de gemiddelde geschatte massa is van het bijbehorende lichaamsdeel:

figuur_sensoren

Negen proefpersonen hebben met drie verschillende frequenties geroeid. De data op basis van de sensoren is vergeleken met de data van het krachtenplatform, en kwam goed overeen. De versnelling van het massamiddelpunt van de roeier kan dus goed worden bepaald met de sensoren. Hieronder is voor proefpersoon 3 te zien wat de versnelling van zijn massamiddelpunt was in de tijd. De zwarte lijn geeft de meting van het krachtenplatform weer, de rode lijn is gebaseerd op de sensoren.

figuur_pp3_allsensors

De vraag van Lotte en Mathijs aan ons was: Kun je de versnelling van het massamiddelpunt van de roeier ook nauwkeurig meten met minder sensoren? En zo ja, welke moet je dan kiezen? Het opplakken van sensoren is duur en onpraktisch. Het zou dus fijn zijn om vervolgmetingen uit te kunnen voeren met minder sensoren. Om die vraag te beantwoorden hebben we in eerste instantie gekeken naar de correlatie tussen de versnellingen van de verschillende lichaamsdelen van drie proefpersonen. Als twee sensoren een hoge onderlinge correlatie hebben, dan zou je een van de twee weg kunnen laten. De correlatie is berekend door voor de 13 sensoren de data van alle proefpersonen bij alle trials achter elkaar te plakken, en daar de correlatie tussen te berekenen. Dat leidt tot de volgende correlatiematrix:

correlatie

We zien dat er clusters zijn van sensoren die een hoge onderlinge correlatie hebben. Die zijn vaak ook niet heel verrassend. Zo bewegen de boven- en onderarmen vaak dezelfde kant op, en de boven- en onderbenen ook. De benen hebben een hoge correlatie met de romp en het hoofd. De linker- en rechtervoet hebben een lage correlatie met alle andere lichaamsdelen.

Als eerst hebben we gekeken of we uit elk cluster één sensor kunnen gebruiken zodat elke sensor nieuwe informatie toevoegt. Dat zou de optimale keuze kunnen zijn bij vier sensoren. Dat is echter niet het geval. De voeten hebben weliswaar een lage correlatie met alle andere lichaamsdelen, maar hebben ook een laag gewicht. Ze dragen daardoor weinig bij aan de versnelling van het massamiddelpunt van de roeier. De sensor op de pelvis (bekken) en de T8 (romp) hebben een hoge onderlinge correlatie, maar vertegenwoordigen beiden een relatief hoog gewicht. Het is dus niet verstandig om één van de twee zomaar weg te laten. Hoe komen we dan tot de optimale keuze? We hebben gekozen voor bruut (reken)geweld. Stel je wil een optimale keuze maken bestaande uit drie sensoren. Voor alle mogelijke manieren waarop je drie uit 13 sensoren kunt selecteren (286 combinaties), kun je een regressieanalyse uitvoeren, en bepalen hoeveel procent van de variantie in de beweging van het massamiddelpunt van de roeier verklaard wordt door de combinatie van die drie sensoren. Uit die regressie volgt ook met welke coëfficienten de versnelling van de sensoren vermenigvuldigd moeten worden om de versnelling van het massamiddelpunt van de roeier te berekenen. Als alle 13 sensoren worden gebruikt is de coëfficient in theorie gelijk aan het procentuele gewicht van het bijbehorende lichaamsdeel. Bij minder sensoren is dat niet meer het geval. De combinatie die de hoogste verklaarde variantie oplevert kiezen we als de optimale combinatie. Dit levert de volgende resultaten op:

tabel_roeien

Als je alle sensoren gebruikt, lijkt de data op basis van de sensoren erg op de gemeten versnelling via het krachtenplatform. Ruim 99% van de variantie in de data wordt verklaard door de 13 sensoren. Als je slechts één sensor gebruikt, zou je die ter hoogte van de T8 moeten plakken. Dat is een wervel ongeveer halverwege de ruggengraat. Je verklaart dan 94.1% van de variantie. Bij twee sensoren zou je ook een sensor op de arm toe moeten voegen. Uit de analyse komt dat dit de linker bovenarm moet zijn. Waarschijnlijk maakt het qua verklaarde variantie weinig uit of dit nu de linker- of rechterarm is. Bij drie sensoren komt er ook een sensor op het bekken (Pelvis) bij. Hieronder is de versnelling op basis van drie sensoren vergeleken met die van het krachtenplatform. De verklaarde variantie is iets lager dan wanneer je alle sensoren gebruikt, maar met het blote oog is het verschil met 13 sensoren bijna niet te zien. Voor het huidige onderzoek lijken 3 sensoren dus meer dan voldoende.

figuur_pp3_3sensors

De resultaten van de metingen op het water zijn gepubliceerd in dit artikel. Ook op basis van metingen blijkt dat de onderschatting van het geleverde vermogen door het versnellen en vertragen van het massamiddelpunt van de roeier rond de 12% ligt, en dus niet zomaar genegeerd kan worden. Vervolgonderzoek kan wellicht met drie sensoren. Voor het zo ver is, zou het goed zijn om de bovenstaande analyse uit te breiden. Nu zijn alle proefpersonen en trials op één hoop gegooid. Het zou interessant zijn om te kijken of er verschillen zitten in de optimale selectie als de analyse per persoon en/of per trial zou worden uitgevoerd, en hoe voorspellend deze resultaten zijn voor de andere 6 proefpersonen. Nog een interessant punt: Als je 13 sensoren gebruikt, wordt de versnelling van een sensor gewogen met het gewicht van het bijbehorende lichaamsdeel. Bij minder sensoren volgt de weging van een sensor uit de resultaten van de regressie (een soort calibratie). Daar zit dan geen directe fysische betekenis aan. Het zou interessant zijn om te kijken hoe stabiel die coefficiënten zijn, en of er een fysische betekenis aan te koppelen is.

Bronnen:

Lotte L. Lintmeijer, Mathijs J. Hofmijster, Guido A. Schulte Fischedick, Patrick J. Zijlstra & A. J. “Knoek” Van Soest (2018) Improved determination of mechanical power output in rowing: Experimental results, Journal of Sports Sciences, 36:18, 2138-2146, DOI:10.1080/02640414.2017.1367821

Mathijs J. Hofmijster, Lotte L. Lintmeijer, Peter J. Beek & A. J. Knoek van Soest (2018) Mechanical power output in rowing should not be determined from oar forces and oar motion alone, Journal of Sports Sciences, 36:18, 2147-2153, DOI:10.1080/02640414.2018.1439346

Rowingscience.nl

https://rowe.rs/the-flaw-in-current-power-output-calculations/

roeien2

roeien3.JPGTwee roeiers die deelnemen aan het onderzoek, met sensoren op hun lichaam.

 

 

 

 

De wiskunde achter darts: Waar kun je het beste mikken?

Waar kun je je dartpijl het beste op richten als je een zo hoog mogelijke verwachte score wilt? Niet op de triple 20! Tenzij je ongeveer even goed bent als Michael van Gerwen en Raymond van Barneveld. Met behulp van wiskunde kun je uitrekenen waar je het beste kunt mikken, afhankelijk van hoe nauwkeurig je kunt gooien. Voor de beginner is dat meestal de Bullseye, voor meer gevorderden de triple 19.

Bij darts gooi je om de beurt drie pijlen op een dartbord. In figuur 1 kun je zien hoe een dartbord eruit ziet en hoeveel punten je krijgt afhankelijk van waar je gooit. Een dartbord bestaat uit 20 delen, en een enkele en dubbele Bullseye. De dubbele of binnenste Bullseye is 50 punten waard, de enkele 25. Voor de zwarte en witte vakjes geldt dat je de score tussen 1 en 20 krijgt. De buitenste gekleurde ring verdubbelt het aantal punten, de binnenste gekleurde ring verdriedubbelt het aantal punten. Je krijgt dus de meeste punten als je de triple 20 raakt. Topdarters zoals Michael van Gerwen en Raymond van Barneveld mikken daar bijna altijd op.

fig4

Figuur 1: Links: Een dartbord. Rechts: De score die je krijgt afhankelijk van waar je gooit. Bron: https://en.wikipedia.org/wiki/Darts.

Het doel bij darts is om zo snel mogelijk een score van 501 te halen, dan heb je één leg gewonnen. Je moet altijd eindigen met een darts in de buitenste ring, een “dubbel”. In theorie is het mogelijk om in 9 darts uit te gooien, maar dat gebeurt bijna nooit. Op televisie is dat sinds 1984 slechts 51 keer voorgekomen. Je kunt een 9-darter gooien door bijvoorbeeld zeven keer triple 20 te gooien, één keer triple 19, en te eindigen met dubbel 12.

Stel nu dat je de eerste pijl gooit. Je wil een naar verwachting zo hoog mogelijke score gooien. Waar moet je dan mikken? Ryan Tibshirani, Andrew Price (niet Gerwyn) en Jonathan Taylor (niet Phil) van de universiteit van Stanford zochten dat uit in hun artikel “A statistician plays darts”. Dit hangt af van hoe nauwkeurig je kunt gooien. In eerste instantie gaan ze er vanuit dat je mikt op een plek μ met coördinaten  μ_x en μ_y. Ze nemen aan dat de afwijking in de x-richting en y-richting normaal verdeeld is met een gemiddelde van 0 en een standaardafwijking σ. De verwachte score hangt af van μ (waar je mikt) en σ (hoe nauwkeurig je kunt gooien). Ze berekenden de verwachte score voor drie standaarddeviaties: 5mm, 26,9mm en 64,6mm. De laatste twee standaarddeviaties zijn inschattingen van de nauwkeurigheid van twee van de schrijvers van het artikel. Een standaarddeviatie van 5 mm is heel nauwkeurig zullen we later zien. In figuur 2 is een simulatie te zien van 30 pijlen van iemand die mikt op de triple 20 met een standaarddeviatie van 26,9mm.simulatie dartsFiguur 2: Simulatie van 30 pijlen. Het doel is de triple 20, de standaarddeviatie 26,9mm.

Een dartbord heeft een straal van 170 mm, de straal van de binnenste Bullseye is 6,35mm. Stel dat een darter met een standaarddeviatie van 5mm op de Bullseye mikt. De kans dat hij de Bullseye raakt is dan 55,4%. Daar zou Michael van Gerwen best tevreden mee zijn.

Op basis van deze aannames hebben de auteurs voor elk punt op het dartbord berekend wat de verwachte score is als een darter daar op mikt. Dat kan door het dartbord op te delen in hele kleine stukjes, bijvoorbeeld van een vierkante millimeter. Voor elk van die vakjes benader je de kans dat de pijl in dat vakje terecht komt, vermenigvuldigt die met de score in dat vakje, en telt al die waardes bij elkaar op. Het resultaat is te zien in figuur 3. Bij een standaarddeviatie van 5 mm kun je het beste op de triple 20 mikken. De verwachte score van één pijl is dan van bijna 43. Voor 3 pijlen komt dat neer op een verwachte score van 129. Topspelers halen zelden een gemiddelde boven de 120. Dat is geen hele eerlijke vergelijking, want spelers mikken niet altijd op de triple 20, maar het geeft wel aan dat een standaarddeviatie van 5mm een soort ondergrens is. Als de standaarddeviatie toeneemt kun je beter op de triple 19 gooien. De scores rondom de triple 19 zijn gemiddeld hoger dan die om de triple 20. Als je je doel mist haal je toch nog wat meer punten, waardoor de verwachte score hoger is dan wanneer je op de triple 20 mikt. Als je nog onnauwkeuriger gaat gooien kun je het beste iets links onder het midden mikken. Dit is ook wel te begrijpen. Stel dat je heel erg onnauwkeurig gooit, zo erg dat je moeite hebt om het bord te raken. Dan kun je het beste in het midden mikken, omdat de kans dan het grootst is dat je het bord raakt. In figuur 4 is voor alle standaarddeviaties tussen 0 en 100mm te zien wat de optimale plek is om op te mikken.

fig1

Figuur 3: Links: Heatmap van verwachte score van één pijl bij een standaarddeviatie van 5mm (a), 26,9mm (b) en 64,6mm (c). Rechts: Plek met de hoogste verwachte score. Bron: Tibshirani, Price en Taylor (2011).

fig2

Figuur 4: Plek met de hoogste verwachte score afhankelijk van de standaarddeviatie tussen 0 en 100mm. De optimale plek start in de triple 20 bij σ=0, springt bij σ=16,4 naar de triple 19, en gaat dan richting de Bullseye. Bron: Tibshirani, Price en Taylor (2011).

Tot nu toe namen we aan dat de afwijkingen in de x-richting en de y-richting normaal verdeeld zijn met dezelfde standaarddeviatie en onafhankelijk van elkaar zijn. In de praktijk blijkt dit volgens de auteurs vaak net wat anders te liggen. De meeste spelers hebben een grotere afwijking in de y-richting dan in de x-richting. Ook zijn de afwijkingen vaak niet onafhankelijk. Voor een rechtshandige speler komt het bijvoorbeeld vaker voor dat de afwijking in de x-richting het tegengestelde teken heeft van de afwijking in de y-richting. Linksboven het doel en rechtsonder komen vaker voor dan linksonder en rechtsboven. Ook zijn er aanwijzingen dat de verdeling van de verticale afwijkingen niet normaal is, maar een zogenaamde scheve normale verdeling volgt. Er komen grotere uitschieters onder het doel voor dan boven het doel. Een voorbeeld van zo’n verdeling is te zien in figuur 5.

fig3

Figuur 5: Voorbeeld van een scheve normale verdeling met grotere uitschieters onder het doel dan boven het doel.

Bij andere verdelingen kun je nog steeds dezelfde methode gebruiken om de verwachte score te berekenen. De heatmaps uit figuur 3 veranderen dan een beetje, maar de conclusies blijven ongeveer hetzelfde. Het is bijna nooit voordelig om op de triple 20 te richten. En als je heel onnauwkeurig gooit, kun je het beste op de Bullseye mikken. Wellicht kun je deze informatie gebruiken als je zelf eens een potje darts speelt!

Bron:

Tibshirani, R. J., Price, A., & Taylor, J. (2011). A statistician plays dartsJournal of the Royal Statistical Society: Series A (Statistics in Society)174(1), 213-226.

 

De beste Formule 1-coureur aller tijden

In Formule 1 speelt het team waarvoor je rijdt een grote rol. Maar hoe groot? En wie is de beste coureur aller tijden? Wetenschapper Andrew Bell en zijn collega’s zochten het uit. Uit hun model komt Juan Manuel Fangio als beste naar voren en blijkt dat het team maar liefst 86% van de verschillen tussen coureurs verklaart. En het wordt tijd dat we ons eens gaan verdiepen in de relatief onbekende Christian Fittipaldi.

Lees verder De beste Formule 1-coureur aller tijden

Stemwijzer & statistiek

In de stemwijzer kun je zien hoe partijen denken over dertig stellingen. Met behulp van statistiek kun je groepen van vragen identificeren die vaak op dezelfde manier beantwoord worden door partijen. Zijn dit de traditionele dimensies links-rechts en conservatief-progressief? Zien we de onvrede die bij veel mensen heerst terug in de analyse? En hoe scoren de partijen op de dimensies?

Op 15 maart zijn de verkiezingen voor de Tweede Kamer. Net zoals de afgelopen verkiezingen worden er veel debatten georganiseerd, en is er ook weer een stemwijzer. De stemwijzer bestaat uit 30 vragen, en is ingevuld door 23 partijen. Bij elke vraag kun je aangeven of je het met de stelling eens bent, oneens bent, of geen mening hebt. Als je alle vragen hebt ingevuld kun je aangeven of je wilt dat bepaalde vragen zwaarder meetellen, en kun je zien met welke partijen je de meeste overeenstemming hebt.

Het is bijna niet te doen om te onthouden hoe alle partijen over alle stellingen denken. Dan zou je 30*23=690 antwoorden moeten onthouden. Daarom worden partijen vaak ingedeeld op een aantal dimensies, bijvoorbeeld links-rechts en conservatief-progressief. Zo noemt men de VVD vaak rechts en de PvdA links, de SGP conservatief en D66 progressief. Dat is een manier om overzicht te krijgen. Toch staan deze termen ook ter discussie, en is het de vraag of de indeling altijd zo duidelijk te maken is. Neem de PVV. Een aantal standpunten komt overeen met wat we als “links” zien, zoals het terugbrengen van de AOW leeftijd naar 65, maar het vluchtelingenbeleid is iets wat meer “rechts” is.

Met behulp van statistiek kun je factoren of dimensies identificeren die zoveel mogelijk van de verschillen tussen de partijen verklaren. Een techniek waarmee dat kan is principale componentenanalyse. Met principale componentenanalyse kun je clusters van vragen samenstellen die vaak door partijen op dezelfde manier worden beantwoord. Bijvoorbeeld, partijen die willen dat hoge inkomens meer belasting betalen, zijn meestal ook voor de versobering van de hypotheekrenteaftrek. Het idee is dat je op die manier niet alle 30 vragen hoeft te vergelijken, maar slechts een beperkt aantal factoren.

Welke dimensies of groepen vragen komen eruit als we deze techniek toepassen op de stemwijzer? Het grootste onderscheid tussen partijen zit in vragen die we kunnen interpreteren als “links-rechts”. Partijen die voor het kinderpardon zijn, zijn ook vaak tegen belastingverlaging voor bedrijven en voor meer geld voor ontwikkelingssamenwerking. GroenLinks en de VVD scoren het meest extreem op deze factor. Let wel, statistiek geeft wel aan welke vragen bij elkaar horen, en hoe je de partijen indeelt op die dimensie, maar de naam “links-rechts” is een interpretatie. Deze eerste factor verklaart 35% van de verschillen tussen de antwoorden van partijen.stemwijzer-2
De tweede factor die uit de analyse komt interpreteer ik als “verandering”. Sommige partijen willen veel veranderen, anderen vinden dat veel nu al goed geregeld is. Partijen die veel willen veranderen willen bijvoorbeeld de AOW leeftijd terug naar 65 jaar, uit de EU, een landelijk zorgfonds, een bindend referendum, en de wietteelt legaliseren. Je ziet dat deze factor eigenlijk een mengelmoes is van twee onderwerpen. Aan de ene kant zitten er vragen in die over “onvrede” gaan, zoals onvrede over pensioen en de zorg. Aan de andere kant zitten er onderwerpen in die meer overeenkomen met de traditionele factor “conservatief-progressief”, zoals het legaliseren van de wietteelt en het bindende referendum. De PVV zit aan de kant van “veel veranderen”, terwijl de SGP de dingen wil laten zoals ze zijn. Deze tweede factor verklaart 14% van de verschillen tussen de partijen.

stemwijzer3

We kunnen een overzicht maken van hoe de partijen scoren op deze twee dimensies. Samen verklaren deze twee dimensies ongeveer de helft van de verschillen tussen de antwoorden van de partijen op de 30 vragen. Dat is niet heel erg veel. Ter vergelijking, als je dezelfde techniek toepast om schaatsers in te delen, verklaren de eerste twee factoren 90% van de verschillen tussen de schaatsers. Om alle verschillen tussen de partijen diepgaand te analyseren zou je naar meer factoren moeten kijken. Toch geven deze twee dimensies inzicht in de belangrijkste thema’s die spelen, en zie je terug dat naast de klassieke scheiding tussen “links-rechts”, onvrede over onder andere zorg en pensioen een belangrijk thema is deze verkiezingen.

stemwijzer1

De laatste tijd lijken de nieuwe partijen als paddenstoelen uit de grond te schieten. Partij Denk ontstond uit de PvdA, trok Sylvana Simons aan, die niet veel later haar eigen partij Artikel 1 oprichtte. Het grappige is dat in deze analyse Artikel 1 en Denk bijna hetzelfde scoren op de dimensies “links-rechts” en “veel-weinig verandering”. Dit betekent niet dat deze twee partijen alle vragen hetzelfde hebben beantwoord, maar wel dat hun globale ideeën overeenkomen. Ook zien we dat D66 en de PvdA dicht bij elkaar liggen. Ook deze partijen denken over bepaalde onderwerpen anders, zoals over hoe flexibel de arbeidsmarkt zou moeten zijn. Maar op de thema’s waar nu het meeste discussie over is, liggen de standpunten redelijk bij elkaar.

De belangrijkste factor uit de analyse komt dus grotendeels overeen met de klassieke indeling “rechts-links”. De tweede factor waarop de partijen veel verschillen is de mate waarin de partijen de dingen willen laten zoals ze nu zijn. Dit gaat verder dan het traditionele “conservatief-progressief”. Onvrede speelt hier een belangrijke rol. Al met al kan statistiek iets orde in de chaos scheppen, en verklaren deze twee factoren ongeveer de helft van de verschillen tussen de partijen. Maar om alle partijen grondig te vergelijken zul je toch verder moeten kijken dan deze twee dimensies.

Zelf de stemwijzer invullen? www.stemwijzer.nl

(Beach)volleybal & tossen: muntje gooien leidt tot ongelijke kans om te winnen

Topsporters doen er alles aan om hun winkans met enkele procenten te doen stijgen. Ze willen zo min mogelijk aan het toeval overlaten. Toch heeft de ultieme vorm van toeval, het opgooien van een muntje om te bepalen wie er begint met serveren, flinke impact op de kans om de beslissende set te winnen bij (beach)volleybal. En dat is heel makkelijk te voorkomen, door om en om te serveren.

toss

De puntentelling

In elke sport moet er op de een of de andere manier een score worden bijgehouden, waarop gebaseerd wordt wie de wedstrijd heeft gewonnen, of eventueel in een gelijkspel eindigt. Je kunt daarbij verschillende groepen van sporten onderscheiden. Bij volleybal en beachvolleybal wordt een reeks van punten wordt gespeeld, net zoals bij tennis, badminton en squash. Daarnaast zijn er onder andere sporten waar een tijd of afstand wordt gemeten, zoals bij atletiek en schaatsen, sporten waarbij er een bepaalde tijd wordt gespeeld, zoals voetbal en hockey, jurysporten zoals turnen en kunstschaatsen, of combinaties daarvan.

Binnen de “puntenreekssporten” gelden er weer verschillende regels. Bij tennis serveren de spelers om en om een game, of, in een eventuele tie-break om en om twee punten. Bij volleybal en squash gaat de service naar degene die het punt gewonnen heeft. Als een speler een punt wint, blijft hij dus serveren, en serveert de tegenstander helemaal niet meer. Bij tennis is dit niet het geval, en wisselt de service, wat de uitkomst van de vorige game ook was. Wie er begint met serveren, hangt meestal af van de toss. Degene die de toss wint, mag kiezen of hij wil beginnen met serveren of ontvangen. Bij tennis is het een voordeel om te serveren. Bij volleybal is het juist een nadeel. Bij sporten waar je om en om serveert maakt het (afgezien van eventueel psychologisch voor- of nadeel) niet uit wie er begint met serveren. Als twee tennissers even goed zijn, hebben ze precies evenveel kans om de wedstrijd te winnen. Bij volleybal is dat niet het geval. Als twee ploegen precies even goed zijn, is de kans om te winnen niet 50-50 verdeeld, maar heeft degene die begint met serveren minder dan 50% kans om te winnen.

Bij volleybal wint het team dat als eerste drie sets heeft gewonnen, bij beachvolleybal gaat het om twee gewonnen sets. Een set wordt gewonnen als een team 25 (volleybal) of 21 (beachvolleybal) punten heeft behaald, met minimaal twee punten verschil. De uitslag van een set kan dus 25-3 zijn, 25-23, 27-25, 33-31, etc. Een eventuele beslissende set, de vijfde set bij volleybal en de derde set bij beachvolleybal, gaat tot 15 punten. Elk punt telt mee, en het team dat het punt heeft gewonnen serveert het volgende punt. Omdat serveren een nadeel is, is het dus moeilijk om meerdere punten achter elkaar te winnen.

WK beachvolleybal 2015

In 2015 werd het WK beachvolleybal in Nederland gehouden. Het Nederlandse duo Reinder Nummerdor en Christiaan Varenhorst haalde de finale en nam het daarin op tegen twee Brazilianen. Het was een hele spannende partij. De Nederlanders wonnen de eerste set vrij gemakkelijk met 21-12, maar verloren de tweede set ruim met 21-14. Er werd dus een beslissende derde set gespeeld. De Nederlanders waren hier in het nadeel, omdat ze moesten beginnen met serveren. De beslissende set ging erg gelijk op, en helaas trokken de Brazilianen aan het langste eind: 22-20. Over de hele wedstrijd gezien werd ongeveer 1/3 van de punten gewonnen door de serverende partij, en 2/3 door de ontvangende partij.

tabel1

nederland

Laten we nog eens naar die laatste set kijken. Nederland begint met serveren. Als Nederland zijn service houdt, moet het daarna nog een keer serveren. Nederland moet dus twee keer zijn eigen servicebeurt winnen om met 2-0 voor te komen. Brazilië hoeft echter maar één keer de service te houden. Als ze het eerste punt winnen, op de service van Nederland, staan ze 1-0 voor. Dan moeten ze zelf serveren. Als ze dat punt winnen, staan ze met 2-0 voor. Het is dus makkelijker voor Brazilië om met 2-0 voor te komen, dan voor Nederland. Een set moet met twee punten verschil worden gewonnen. Stel dat alle punten standaard worden gewonnen door het ontvangende team. Brazilië hoeft dan maar één keer de eigen servicebeurt te winnen om de set te winnen, en Nederland twee keer. Als ze om en om zouden serveren, zouden ze allebei maar één keer de eigen service te hoeven winnen om met twee punten verschil te winnen. Dat is ook het geval bij tennis. Daar winnen beide spelers de set als ze de servicegame van de tegenstander één keer breaken. Dit leidt ertoe dat als twee teams even goed zijn, de kans om de set te winnen bij beachvolleybal niet 50-50 verdeeld is. Als beide teams 1/3 van hun servicebeurt wint, wint het team dat begint met serveren in 47,3% van de gevallen de set, en het team dat begint met ontvangen in 52,7%. Dat scheelt bijna 5%!

tabel2

Ook als het ene team beter is dan het andere team, heeft de toss procenten impact op de kans om de set te winnen. Stel dat team 1 35% van de servicebeurten wint, en team 2 30%. Als team 1 begint met serveren is de kans om de set te winnen minder dan 60%, als team 2 begint meer dan 64%. Ook hier beïnvloedt de toss de kans om de set te winnen met bijna 5%. Het zou dus het meest eerlijk zijn om net als bij tennis om en om te serveren.

Terug naar de laatste set op het WK 2015. Uiteindelijk heeft Brazilië 7 keer een punt op eigen service gewonnen, en Nederland 6 keer. Maar één keer meer dus. Nederland heeft gedurende de set vaak een servicebeurt meer voorgestaan dan Brazilië. Omdat Nederland het eerste punt begon met serveren was dat echter niet genoeg. De toss heeft dus erg in het nadeel van de Nederlanders gewerkt. Als ze de toss hadden gewonnen, was Nederland er misschien wel met de wereldtitel vandoor gegaan.

tabelv2

Wetenschappelijk onderzoek naar puntentellingen

Er zijn flink wat wetenschappers die zich over de puntentelling in sport hebben gebogen. Een score-systeem wordt dan vaak benaderd als een statistische test. Ze gaan op zoek naar de meest efficiënte test om te bepalen welk team of welke speler het beste is. De meest efficiënte puntentelling moet, in wetenschappelijk termen, aan twee voorwaarden voldoen:

  1. Als twee spelers precies even goed zijn, moet de kans om te winnen voor beide spelers 50% zijn.
  2. Bij een gegeven verwachte wedstrijdduur moet de kans dat de beste wint zo groot mogelijk zijn.

Zoals we al hebben gezien voldoet volleybal niet aan de eerste eis. Tennis doet dat wel.

Dan regel 2. Je kunt er op een hele makkelijke manier voor zorgen dat je erachter komt wie de beste is: Speel gewoon heel lang door. Je zou bij tennis bijvoorbeeld niet om twee of drie gewonnen sets kunnen spelen, maar om 30 gewonnen sets. Dat geeft alleen wel praktische problemen, en is ook niet heel aantrekkelijk voor het publiek. Wel kun je er voor zorgen dat je de regels van een spel aanpast, zodat, gegeven de lengte van een wedstrijd, de kans groter is dat de beste als winnaar uit de bus komt.

Hoe ziet die optimale puntentelling er volgens de wetenschap dan uit? Nu staat altijd vast hoeveel punten een speler moet winnen, bijvoorbeeld 15 bij beachvolleybal, of 6 games bij tennis. Dat zou moeten veranderen. Het zou er om moeten gaan wie het eerst een aantal punten, bijvoorbeeld 5, méér heeft dan de tegenstander. Een wedstrijd kan dan eindigen in 5-0, 6-1 of 15-10. Deze strategie wordt in de praktijk gebruikt om medicijnen te testen. Bij proeven met medicijnen wil je testen of een medicijn wel of niet werkt. Als je genoeg informatie hebt, wil je zo snel mogelijk stoppen met de test, om patiënten niet onnodig bloot te stellen aan medicijnen die niet werken, of zelfs negatieve bijwerkingen hebben. Daarnaast zou de puntentelling wel een element uit volleybal moeten bevatten. Als de service dominant is, moet het punt naar degene gaan die het punt heeft verloren (play-the-loser). Als serveren een nadeel is moet de service gaan naar degene die het punt heeft gewonnen (play-the-winner). Echter, om niet met regel 1 in de knoei te komen, moeten er wat trucen uit de kast worden gehaald, waar het niet gemakkelijker van wordt. Je begint bijvoorbeeld allebei een keer met serveren. Degene die het eerst 5 punten meer heeft dan de tegenstander wint, en krijgt een punt. Als je allebei een keer bent begonnen met serveren is het 2-0, 1-1, of 0-2. Dit noem je een biformat en kun je vertalen in winst, gelijk spel of verlies. Degene die het eerst een van tevoren vastgesteld aantal biformats meer heeft gewonnen dan de tegenstander, wint de wedstrijd.

De meest efficiënte puntentelling volgens de wetenschap is dus vrij ingewikkeld, wat de kijkcijfers waarschijnlijk niet ten goede komt. Verder is het de vraag of we wel willen dat de beste speler met een zo groot mogelijke kans wint. Een wedstrijd is extra leuk om naar te kijken als degene die achter staat nog de mogelijkheid heeft om terug te komen. Als halverwege al duidelijk is wie er gaat winnen, kun je net zo goed ophouden met kijken. Voor (beach)volleybal is er echter een simpele aanpassing mogelijk die de sport eerlijker maakt, en net zo leuk houdt om naar te kijken. Dat is ook de oproep van Hoogleraar Frits Spieksma in Volley Techno, een blad voor volleybaltrainers. Ga om en om serveren!

Bronnen:

Spieksma, F.C.R. (2016), Eerlijke kans om beachvolleybalfinale te winnen, Volley Techno, No. 2 (http://feb.kuleuven.be/public/NDBAE03/papers/volleytechnospieksma.pdf)

Lee, K. T., and S. T. Chin. ”Strategies to serve or receive the service in volleyball.” Mathematical Methods of Operations Research 59.1 (2004): 53-67.

Miles, Roger E. ”Symmetric sequential analysis: the efficiencies of sports scoring systems (with particular reference to those of tennis).” Journal of the Royal Statistical Society. Series B (Methodological) (1984): 93-108.

Pollard, Graham H. ”The optimal test for selecting the greater of two binomial probabilities.” Australian journal of Statistics 34.2 (1992): 273284.

Kingston, J. G. ”Comparison of scoring systems in two-sided competitions.” Journal of Combinatorial Theory, Series A 20.3 (1976): 357-362.

 

Thuisvoordeel in de Nederlandse squash- en badmintoncompetitie

Naar thuisvoordeel op professioneel niveau is veel onderzoek gedaan, en het effect is aangetoond in sporten van voetbal tot schaatsen. Maar bestaat er ook zoiets als thuisvoordeel in de Nederlandse (amateur) squash- en badmintoncompetitie? En waar wordt thuisvoordeel door veroorzaakt?

De squash- en badmintoncompetitie

Zowel bij squash als bij badminton spelen teams op allerlei niveaus competitie. Bij squash worden er in de Heren Eredivisie drie, en in de overige klasses vier single partijen gespeeld. De speler die als eerste drie games wint, wint de wedstrijd. Aan het eind worden alle games bij elkaar opgeteld. Het team met de meeste games krijgt drie extra punten. Bij een gelijkspel geeft de score binnen de games de doorslag. Er is dus altijd een team dat wint. De herencompetitie kent zeven verschillende klasses, de damescompetitie vijf. De badmintoncompetitie is gemengd. Er worden acht partijen gespeeld, twee herenenkels, twee damesenkels, en vier (gemengd)dubbel partijen. De winnaar krijgt geen extra punten, het kan dus ook in een gelijk spel van 4-4 eindigen.

Op www.toernooi.nl zijn alle uitslagen uit het seizoen 2015-2016 terug te vinden. In de squashcompetitie werden 2579 teamwedstrijden gespeeld. Alleen wedstrijden zonder aanvullende opmerking bij de uitslag, zoals het niet komen opdagen van een team, zijn meegenomen. Bij de mannen won in 58% van de gevallen de thuisspelende ploeg. De kans dat dit op toeval berust als er geen thuisvoordeel zou zijn is zo goed als nul. Het thuisvoordeel is bij de mannen zelfs in alle klasses terug te zien, behalve in de Eredivisie. Bij de dames is er een klein thuisvoordeel van 53%, maar statistisch gezien kan dit ook door toeval worden veroorzaakt. Dit verschil tussen mannen en vrouwen kan door meerdere dingen komen. De competitie van de vrouwen is een stuk minder groot dan de competitie van de mannen. Hoe minder wedstrijden er worden gespeeld, moe moeilijker het is om thuisvoordeel statistisch aan te tonen. Ook zie je bij vrouwen vaak dat het niveauverschil groter is. Hoe groter het niveauverschil hoe kleiner de kans dat thuisvoordeel het verschil maakt tussen winnen en verliezen.

squashthuisvoordee2l

In de badmintoncompetitie werden het afgelopen jaar 1763 teamwedstrijden gespeeld. Elke teamwedstrijd bestaat uit 8 individuele wedstrijden. Op individueel niveau won de thuisspelende speler 54% van de wedstrijden. Op teamniveau won de thuisspelende ploeg  47% van de keren en de uitspelende ploeg 35%. De overige 18% van de wedstrijden eindigden in een gelijk spel. Ook hier is het effect statistisch significant voor alle klasses behalve de Eredivisie. Ook voor niet-professionals is er dus zoiets als thuisvoordeel!

badmintonthuisvoordeel2

De vijf factoren van thuisvoordeel

Dat er thuisvoordeel is staat dus vast, maar wat veroorzaakt het? Hier is al veel onderzoek naar gedaan, zowel door statistici als door psychologen. In 2013 hebben drie Spanjaarden een overzicht geschreven, waarin ze vijf oorzaken benoemen: Supporters, bekendheid met het veld/omstandigheden, reistijd, de scheidsrechter en territorialiteit.

Supporters:

Bij thuisvoordeel denken we vaak gelijk aan de steun van supporters. Er zijn bijna altijd meer supporters van de thuisspelende ploeg aanwezig. Maar ook zonder supporters blijkt er een thuisvoordeel te zijn. Niels van de Ven van de universiteit van Tilburg zocht dit uit, door voetbalwedstrijden te analyseren met en zonder supporters, en wedstrijden tussen teams die hetzelfde stadion als thuisbasis hebben. Sterker nog, supporters kunnen zelfs een negatief effect hebben op de prestaties, bijvoorbeeld als een speler een penalty moet nemen. Dit is een bekend fenomeen uit de sociale psychologie. Bij makkelijke taken werkt het prestatieverhogend als er mensen meekijken (sociale facilitatie), bij moeilijke taken werkt het juist prestatieverlagend (sociale inhibitie).

Bekendheid met het veld:

Elk veld of elke baan kan anders spelen, en aan je eigen veld ben je het meeste gewend. Dat kan voordeel geven. Zo speelt de ene squashbaan veel sneller dan de andere, en hangen de lampen bij badminton overal anders, waardoor je op een andere manier tegen het licht inkijkt. Uit het ene onderzoek blijkt dat het effect beperkt is, uit het andere onderzoek dat het thuisvoordeel 24% afnam als een club een nieuw veld kreeg. Wetenschappelijk onderzoek richt zich eigenlijk altijd op topsporters. Maar deze factor zou juist bij amateurs zwaarder kunnen wegen. Een professionele squasher of badmintonner speelt en traint op veel verschillende plekken. Maar de gemiddelde clubspeler speelt en traint meestal op zijn eigen club, en is minder gewend aan verschillende omstandigheden. Dit kan de reden zijn dat we het thuisvoordeel niet terugzien bij de Eredivisie, maar wel bij de lagere klasses van badminton en squash.

Reistijd:

Als je een uitwedstrijd speelt, moet je meestal verder reizen. Je komt misschien al meer moe aan, of hebt daarvoor gewoon minder zin om te spelen. Dit blijkt maar een beperkt effect te hebben.

De scheidsrechter:

Meerdere onderzoeken hebben aangetoond dat scheidsrechters licht in het voordeel van de thuisploeg fluiten of jureren. Het thuisvoordeel op Olympische Spelen is ook groter bij subjectieve jurysporten zoals turnen dan bij objectieve jurysporten zoals gewichtheffen en atletiek.

dirkjan

Territorialiteit:

Territorialiteit? Ja, territorialiteit: “een verdedigende reactie op een invasie op wat je ziet als je eigen territorium”. Het thuisvoordeel in de voetbalcompetitie op de Balkan is groter dan in bijvoorbeeld Noorwegen, zoals de figuur hieronder laat zien. Dit wordt toegeschreven aan de (historische) conflicten tussen bevolkingsgroepen in die regio.

territorialiteit

Thuisvoordeel in voetbalcompetitie, figuur uit publicatie Legaz-Arrese.

Conclusie

Thuisvoordeel is in veel sporten aangetoond, en wordt toegeschreven aan het effect van supporters, bekendheid met het veld, reistijd, de scheidsrechter en “territorialiteit”. Ook in de Nederlandse (amateur) squash – en badmintoncompetitie is er duidelijk thuisvoordeel. Juist bij amateurs zou het effect van het spelen op een bekend veld zwaarder kunnen wegen dan bij professionals.

kader2

Bronnen:

Data: www.toernooi.nl

Legaz-Arrese, Alejandro, Diego Moliner-Urdiales, and Diego Munguía-Izquierdo. “Home advantage and sports performance: evidence, causes and psychological implications.” Universitas Psychologica 12.3 (2013): 933-943.

http://www.kennislink.nl/publicaties/van-thuisvoordeel-tot-verstikking

Van de Ven, Niels. “Supporters are not necessary for the home advantage: Evidence from same‐stadium derbies and games without an audience.” Journal of Applied Social Psychology 41.12 (2011): 2785-2792.

Het binnenbaan-buitenbaan effect op de 500 meter schaatsen en het belang van een goede loting

Dit is een samenvatting van een artikel dat is verschenen in STAtOR. Ben je benieuwd naar het hele model en de formules? Kijk dan hier.

De 500 meter schaatswedstrijd is een spel van honderdsten en soms zelfs duizendsten van seconden. Daarom is er onderzoek gedaan naar de vraag of het voordelig is om te starten in de binnenbaan of de buitenbaan, of dat dit geen verschil maakt. “Ja” zegt het ene onderzoek, en dus moet de 500 meter twee keer gereden worden. “Nee” zegt het andere onderzoek, en dan is één omloop voldoende. In dit artikel werpen we nieuw licht op deze vraag door de rol van de tegenstander mee te nemen.

Bijna elke schaatsfan zal zich de 500 meter kunnen herinneren op de Olympische Spelen in Sotsji. Toen Jan Smeekens over de finish kwam waande hij zich Olympisch kampioen. Maar nadat de tijd van Michel Mulder naar beneden werd bijgesteld ging hij er met het goud vandoor. Zijn voorsprong was 0,012 seconde na twee ritten. De discussie laaide op of het wel mogelijk is om op basis van duizendsten van seconden te zeggen wie de winnaar is. Als de mogelijke fout in de tijdwaarneming groter is dan het verschil in tijd, is het niet eerlijk om een van de twee als winnaar uit te roepen, en zou er eigenlijk een gedeelde eerste plek moeten zijn. Er is al eerder onderzoek gedaan naar de eerlijkheid van de opzet van de 500 meter. Dat onderzoek ging over de vraag of de 500 meter eenmaal of tweemaal gereden zou moeten worden. Nils Hjort toonde in 1994 aan dat het uitmaakt of een schaatser in de binnenbaan of in de buitenbaan start. Schaatsers die de laatste buitenbocht reden waren in het voordeel. Het idee hierachter is dat schaatsers in de laatste bocht zo’n hoge snelheid hebben, dat het makkelijker is om de buitenbocht te rijden dan de binnenbocht. Het gebeurt dan ook regelmatig dat een schaatser in de laatste binnenbocht “uit de bocht vliegt” en in de helft van de tegenstander terecht komt. Op basis van dit onderzoek werd besloten om de 500 meter twee keer te rijden op de Olympische Spelen. Elke schaatser start een keer in de binnenbaan en een keer in de buitenbaan. In 2010 toonden Richard Kamst, Gerard Kuper en Gerard Sierksma aan dat er na de introductie van de klapschaats geen significant verschil meer was. De klapschaats biedt betere grip op het ijs, waardoor schaatsers minder moeite hebben met de bochten. De Internationale Schaatsunie heeft dan ook besloten om vanaf 2018 nog slechts één omloop te houden op de Olympische 500 meter. Machiel Smit liet echter zien dat het overall klassement van een 500 meter omloop significant vaker wordt gewonnen door een schaatser die de laatste binnenbocht heeft. In de periode 2010 tot 2014 had de winnaar van een omloop in maar liefst drie kwart van de keer de laatste binnenbocht. In het eerste onderzoek is dus de laatste buitenbocht een voordeel, later is dit effect niet significant, en het derde onderzoek vindt juist een voordeel van de laatste binnenbocht. We werpen nieuw licht op deze op het eerste oog tegenstrijdige resultaten door de rol van de tegenstander mee te nemen. Ook laten we zien dat een goede loting het verschil tussen winst en verlies kan maken.

plaatje1

plaatje2

Winst en verlies liggen dicht bij elkaar

Het modelleren van het binnenbaan buitenbaan verschil

Langebaanschaatsen gebeurt op een 400-meter baan. De 500 meter is dus een volle ronde, plus nog 100 meter. Schaatsers rijden in tweetallen, waarbij de ene schaatser in de binnenbaan start, en de andere in de buitenbaan. Na de eerste bocht wisselen ze van baan, zodat ze beiden dezelfde afstand afleggen. De schaatser die start in de buitenbaan komt, als beide schaatsers even snel openen, achter zijn tegenstander de buitenbocht uit. Hij legt immers een langere afstand af. Op de kruising kan hij dan toerijden naar zijn tegenstander. In het algemeen wordt verondersteld dat dit kunnen toerijden naar de tegenstander een voordeel oplevert. Dit voordeel kan zowel mentaal van aard zijn, als fysiek, omdat de luchtweerstand afneemt als je achter je tegenstander rijdt. Tot nu toe is dit effect niet meegenomen in onderzoeken, maar dit effect kan toegevoegd worden aan het model dat Nils Hjort heeft ontwikkeld. In zijn model gaat hij er vanuit dat de 500 meter tijd afhangt van de opening na 100 meter, of je start in de binnenbaan of in de buitenbaan, van de omstandigheden (zoals luchtdruk en kwaliteit van het ijs), natuurlijk van het niveau van de rijder, en een stukje toeval. Dit model is hier uitgebreid door het binnenbaan-buitenbaan effect te splitsen in twee delen. 1) Het voordeel van het kunnen toerijden naar de tegenstander, en 2) het nadeel van het hebben van de laatste binnenbocht, als je zonder tegenstander rijdt, of de tegenstander te ver bij je vandaan rijdt om te kunnen profiteren. We gaan er vanuit dat je kunt profiteren van je tegenstander als je start in de buitenbocht en tussen de 0,3 seconde sneller en 0,1 seconde langzamer opent op de 100 meter. Open je nog sneller, dan kruis je over je tegenstander heen. Open je langzamer, dan lig je te ver achter je tegenstander op de kruising om te kunnen profiteren.

Toerijden naar je tegenstander levert 0,05 seconde winst op.

Wat komt er uit dit model? Hier vinden we, met klapschaats en als je niet naar je tegenstander toe kunt rijden, dat het nadelig is om de laatste binnenbocht te hebben. Het geschatte nadeel is 0,05 seconde. Kunnen toerijden naar je tegenstander als je de laatste binnenbocht hebt levert een ongeveer even grote winst op van 0,05 seconde. Het nadeel van de laatste binnenbocht wordt dus ongeveer opgeheven door het kunnen toerijden naar je tegenstander. Verklaart dit de tegenstrijdige onderzoeken? Ja en nee. Het verklaart waarom het onderzoek inclusief klapschaats geen significant effect vond. Het netto effect van kunnen toerijden naar je tegenstander, en het nadeel van de laatste binnenbocht is ongeveer 0. Echter, om te kunnen verklaren dat het overall klassement van een omloop significant vaker wordt gewonnen door een schaatser die de laatste binnenbocht heeft, zou het voordeel van het toerijden groter moeten zijn dan het nadeel van de laatste binnenbocht. Toch is het aannemelijk dat het kunnen toerijden naar de tegenstander de oorzaak is van het gevonden voordeel van de laatste binnenbocht door Machiel Smit. Het is moeilijk om op basis van een 100 meter tijd precies te bepalen of je voordeel hebt van je tegenstander. De 0,3 en 0,1 seconden zijn een inschatting. Gemiddeld is dit effect 0,05 seconde, maar het zal uitmaken of je 1, 2 of 5 meter achter je tegenstander rijdt. Bij de “ideale” tegenstander kan het effect groter zijn dan 0,05 seconde, en net het verschil maken tussen winst of verlies.

Dit model kan dus aannemelijk maken waarom de 500 meter vaak wordt gewonnen door iemand die de laatste binnenbocht heeft, maar het is geen statistisch bewijs. We kunnen echter wel een andere conclusie trekken, die statistisch significant is: Een goede loting is van cruciaal belang. Als een schaatser de laatste binnenbocht heeft, maar niet naar zijn tegenstander toe kan rijden, heeft hij een nadeel van 0,05 seconde ten opzichte van iemand die wel naar zijn tegenstander toe kan rijden. Op de 500 meter gaat het om honderdsten van seconden, dus de juiste tegenstander kan het verschil tussen winst en verlies betekenen.

De loting kan het verschil tussen winst en verlies maken

Moet de 500 meter nu wel of niet twee keer gereden worden? Als je alleen het binnenbaan-buitenbaan effect modelleert, zonder tegenstander, is hier een eenduidig antwoord op te geven. Is het effect significant, dan moet de 500 meter twee keer gereden worden om een zo eerlijk mogelijk toernooi te krijgen, anders niet. Maar bij dit model ligt dat wat gecompliceerder. Het effect van de tegenstander is aanzienlijk. Maar de tegenstander is niet te sturen. Je kunt ervoor zorgen dat elke rijder een keer in de binnenbaan start en een keer in de buitenbaan start. Maar je kunt er niet voor zorgen dat de invloed van de tegenstander bij iedereen precies even groot is. De loting heeft grote invloed. De oplossing zou zijn om zonder tegenstander te rijden. Maar dat maakt de sport een stuk minder aantrekkelijk om naar te kijken. De meest praktische oplossing lijkt om de 500 meter wel twee keer te rijden, en daarbij ervoor te zorgen dat de paren zo ingedeeld worden dat de openingstijden redelijk aan elkaar gewaagd zijn. Dat is in de praktijk vaak het geval, maar het lijkt erop dat we zullen moeten accepteren dat een bepaalde mate van geluk altijd een rol zal spelen.

Dankwoord

Dank aan Gerard Sierksma en Gerard Kuper voor hun kritische blik en nuttige tips.

Referenties

Hjort, Nils Lid. Should the Olympic sprint skaters run 500 meter twice?. Institute of Mathematics, University of Oslo, 1994.

Kamst, Richard, Gerard H. Kuper, and Gerard Sierksma. “The Olympic 500‐m speed skating; the inner–outer lane difference.” Statistica Neerlandica 64.4 (2010): 448-459.

http://www.schaatsstatistieken.nl/analyse_500_meter_juni2014.pdf (Machiel Smit)

De wetenschap achter de 200 meter sprint

In het tijdschrift STAtOR heb ik een vervolgonderzoek gepubliceerd. Het artikel is hier te vinden.

Augustus vorig jaar werd Dafne Schippers wereldkampioen op de 200 meter sprint. Nu “we” meedoen op deze afstand, neemt de belangstelling toe. Zou ze deze zomer ook Olympisch kampioen kunnen worden? Ook door een natuurkundige en wiskundige bril is deze afstand interessant. De wetenschap heeft van alles te zeggen over de invloed van hoogte, luchtdruk, wind, en het effect van de laan waarin de atleten loopt.

De 200 meter

Bij baanatletiek lopen atleten op een 400 meter baan. De baan bestaat uit twee rechte stukken van ongeveer 100 meter, en twee bochten. De atleten lopen naast elkaar in 4 tot 9 lanen. De binnenste laan, laan 1, loopt een kortere bocht dan de buitenste laan. Daarom starten de atleten niet naast elkaar, maar mag de buitenste laan verder naar voren starten, zodat ze als ze over de finish komen, allemaal precies 200 meter hebben afgelegd.

Op een groot toernooi worden er eerst series gelopen, waar de sprinters zich kunnen plaatsen voor de halve finales en de finale. In de eerste serie krijgen de atleten willekeurig een laan toegewezen. Atleten die de snelste tijd hebben gelopen in de series, starten in de volgende ronde in de binnenste lanen (4 en 5). Het is voordelig om een ruimere bocht te lopen, want dit kost minder kracht. Het is dus nadelig om in laan 1 te starten. Bij indoor atletiek is de baan 200 meter in plaats van 400 meter, en lopen de atleten dus een volle ronde. Het nadeel van een krappere bocht is hier zo groot, dat deze afstand bij indoortoernooien van het programma is gehaald.

200m figuur 1

De beste tijd ooit?

Dafne Schippers werd vorig jaar niet alleen wereldkampioen, maar werd met 21,63 seconde ook de derde snelste atlete ooit. Alleen Florence Griffith-Joyner (21,34) en Marion Jones (21,62) waren sneller. Wat zijn de ideale omstandigheden om een snelle tijd te lopen? Het is vanwege de bocht dus voordelig om in de buitenste laan te starten. Maar ook de luchtdruk speelt een rol. Hoe hoger de luchtdruk, hoe hoger de luchtweerstand, en hoe moeilijker het is om een snelle tijd te lopen. Dit effect is ook heel duidelijk bij schaatsen. Daar worden wereldrecords altijd gereden op hooglandbanen zoals Calgary en Salt Lake City, waar de luchtdruk laag is. Omdat het zo goed als onmogelijk is om dezelfde tijd te rijden op een laaglandbaan, zijn hier zelfs officieuze aparte wereldrecords voor. Ook helpt het natuurlijk als je wind mee hebt. Bij atletiek is een wereldrecord daarom pas officieel als de windsnelheid minder dan 2 meter per seconde is. En vanwege het voordeel van een hoogland baan, komt er bij een baan die hoger dan 1000 meter boven zeeniveau ligt een A achter het wereldrecord te staan.

Jonas Mureika, een professor natuurkunde in Los Angeles, heeft een model ontwikkeld waarmee hij het effect van luchtdruk, mee- of tegenwind en de startlaan heeft geschat. De kern van het model is een formule die je misschien nog kent van de natuurkundelessen van de middelbare school: F=m*a. Kracht is massa keer versnelling, de beroemde tweede wet van Newton. Een sprinter oefent kracht uit, om te versnellen, en zo snel mogelijk te lopen. Er zijn ook krachten buiten de atleet die meewerken of tegenwerken. De luchtweerstand moet overwonnen worden, en hoe hoger de luchtdruk, hoe groter deze tegenkracht. Ook tegenwind kan tegenkracht geven, en meewind een extra duwtje in de rug. Als laatste is ook het effect van de bocht in een kracht te vatten. Als je de bocht ziet als een halve cirkel, moet de atleet een kracht uitoefenen richting het middelpunt van de cirkel, om de bocht te lopen, de middelpuntzoekende kracht. Hoe kleiner de straal van de cirkel is, hoe groter deze kracht is, en daarom is het nadelig om de binnenbocht te lopen. Op zijn website kun je de 200 meter tijd bepalen die corrigeert voor deze drie effecten. Op basis daarvan zou je een nieuwe ranglijst van beste atletes ooit kunnen maken. Dafne Schippers blijft dan op de derde plek staan, alleen moet Marion Jones haar tweede plek afstaan aan Merlene Ottey. Jones liep 21,62 in Johannesburg, en Ottey 21,66 in Zurich.  Ottey had meer tegenwind dan Jones, Zurich ligt op 400 meter hoogte, en Johannesburg op 1700 meter. Twee factoren waardoor de tijd van Ottey naar beneden wordt bijgesteld, en die van Jones naar boven.

200 m tabel1

  200m figuur 2

Statistiek en het effect van de startlaan

(inmiddels heb ik vervolgonderzoek gedaan naar het effect van de startlaan. De link naar dat artikel is bovenaan te vinden).

De tijd die een atleet loopt wordt dus beïnvloed door de hoogte, wind en de startlaan. De hoogte en de wind zijn voor alle atleten in een wedstrijd hetzelfde. Maar het effect van de startlaan geeft de atleet in de buitenste laan een voorsprong op de atleet die in de binnenste laan start. Is dit ook terug te zien in de resultaten op een wereldkampioenschap? In de eerste ronde krijgen de atleten willekeurig een startlaan toegewezen. Het zou dan zo moeten zijn dat atleten in laan 8 zich significant vaker voor de volgende ronde kwalificeren dan atleten in laan 1. Om dat te testen bekijken we alle series van wereldkampioenschappen atletiek outdoor vanaf 1991, en de Olympische Spelen vanaf 2000. Atleten die gediskwalificeerd werden, of de finish niet bereikten zijn weggelaten.

In de figuren hieronder is voor alle combinaties van startlaan en eindklassering te zien hoe vaak die voorkwam. Zo zijn er bijvoorbeeld 23 mannen geweest die startten in laan 5 en als eerste eindigden. En waren er 5 vrouwelijke atletes die startten in laan 5 en als 8e eindigden. Bij de meeste kwalificaties plaatsen de eerste drie atleten zich voor de volgende ronde. We kunnen nu uitrekenen hoe vaak een atleet zich kwalificeerde, afhankelijk van de startlaan. En dan zien we opmerkelijke verschillen. Bij de mannen kwalificeert maar 23% van de atleten in laan 1 zich, tegenover bijvoorbeeld 50% in laan 4. Ook bij de vrouwen valt op dat atletes in laan 1 zich minder vaak plaatsen voor de volgende ronde.

200 m tabel 2

200m figuur 3

Het kan natuurlijk zijn dat dit door toeval wordt veroorzaakt. Ook starten niet in elke serie evenveel atleten. Een manier om te testen of het verschil op toeval kan berusten is door een zogenaamd Generalized Linear Model te schatten. Hierbij corrigeren we eerst voor het aantal atleten dat meedoet aan een serie. Vervolgens schat het model de kans dat een atleet bij de eerste drie eindigt, afhankelijk van de startlaan, als er acht atleten mee zouden doen. Ook bepaalt het model hoe groot de kans is dat verschillen op toeval berusten. In de tabel hieronder zijn de resultaten te zien. Als er geen effect van startlaan was, zou de kans om bij de eerste drie te eindigen altijd ongeveer 3/8=37,5% moeten zijn. In laan 1 ligt deze kans nog steeds een stuk lager, zowel voor mannen als voor vrouwen. Ook in laan 2 en 3 ligt de kans om bij de eerste drie te eindigen onder de 37,5%. De kolom met de p-waarde berekent de kans dat verschillen tussen startlanen door toeval ontstaan. Hierbij wordt een startlaan altijd vergeleken met laan 1. Meestal wordt een grens van 5% gehanteerd. Pas als de p–waarde kleiner is dan 5%, gaan we er vanuit dat verschillen niet op toeval berusten. We noemen het effect dan statistisch significant. Voor laan 2 en 3 is de kans dat een atleet zich plaatst niet significant anders ten opzichte van laan 1. Voor laan 5 tot en met 9 wel. De startlaan heeft dus een statistisch significant effect op de kans dat een atleet zich plaatst voor de volgende ronde.

200m figuur 4

Conclusie

De tijd die een atleet loopt op de 200 meter wordt beïnvloed door wind, hoogte en de laan waarin de atleet start. Op basis van een natuurkundig model kunnen tijden op verschillende hoogtes en bij verschillende windsnelheden met elkaar vergeleken worden. Marion Jones moet haar positie als tweede snelste vrouw ooit dan afstaan aan Merlene Ottey. Starten in de binnenste laan levert een nadeel op, dat statistisch aangetoond kan worden.

Mureika, J. R. “Modeling wind and altitude effects in the 200 m sprint.” Canadian Journal of Physics 81.7 (2003): 895-910.

Mureika, J. R. “A realistic quasi-physical model of the 100 m dash.” Canadian Journal of Physics 79.4 (2001): 697-713.

200m model