Tennis: A beautiful mindgame

Speltheorie geeft wiskundige principes die je toe kunt passen op tennis om de optimale serveer- en ontvangstrategie te bepalen. Maar volgen toptennissers ook deze regels? Behoorlijk goed, blijkt uit een analyse van ruim 3000 wedstrijden op Wimbledon. En de spelers met een hoge ranking doen dit beter dan de subtoppers.

Lees verder Tennis: A beautiful mindgame

Wiskundige tip voor toptennissers: Neem meer risico met serveren

Wat pakt het beste uit bij tennis: Dubbele fouten vermijden door voorzichtig te serveren, of juist wat meer risico nemen zodat de tegenstander meer moeite heeft om de bal terug te slaan? Met behulp van wiskunde kun je de optimale servicestrategie bepalen. En dan blijkt dat we veel toppers een tip kunnen geven: Wees wat minder voorzichtig.

Djokovic tegen Federer in de finale van Wimbledon, 2019. Bron: forbes.com
Lees verder Wiskundige tip voor toptennissers: Neem meer risico met serveren

Elo-rating voorspelt: Ajax wordt met 66% kans kampioen

Dit artikel is gepubliceerd in de tweewekelijkse krant Argus.

De Elo-rating vergelijkt de sterkte van sporters en sportteams op basis van wiskundige principes. Het verschil in rating kan gebruikt worden om de uitslag van een wedstrijd te voorspellen. De gokmarkt gaat minder exact te werk. Waar kunnen we het beste op vertrouwen? 

Lees verder Elo-rating voorspelt: Ajax wordt met 66% kans kampioen

Darts: Het voorspellen van de uitkomst van profwedstrijden

Bij darten wordt vaak het gemiddelde en het checkout percentage van spelers getoond. Op basis daarvan hebben Steffen Liebscher en Thomas Kirschstein een model ontwikkeld om te voorspellen wie een wedstrijd gaat winnen. Je kunt die voorspelling verbeteren door een andere definitie te kiezen voor het gemiddelde en het checkout percentage dan gebruikelijk. Maar kan het model ook de gokmarkt verslaan?

Dit artikel is verschenen in STAtOR. Wil je het hele artikel lezen, klik dan hier.

Twee eerdere artikelen over darts kun je hier vinden:

De wiskunde achter darts: Waar kun je het beste mikken?

De wiskunde achter darts: Het optimale dartbord en het nadeel van linkshandig zijn

darts-int

De wiskunde achter darts: Waar kun je het beste mikken?

Waar kun je je dartpijl het beste op richten als je een zo hoog mogelijke verwachte score wilt? Niet op de triple 20! Tenzij je ongeveer even goed bent als Michael van Gerwen en Raymond van Barneveld. Met behulp van wiskunde kun je uitrekenen waar je het beste kunt mikken, afhankelijk van hoe nauwkeurig je kunt gooien. Voor de beginner is dat meestal de Bullseye, voor meer gevorderden de triple 19.

Bij darts gooi je om de beurt drie pijlen op een dartbord. In figuur 1 kun je zien hoe een dartbord eruit ziet en hoeveel punten je krijgt afhankelijk van waar je gooit. Een dartbord bestaat uit 20 delen, en een enkele en dubbele Bullseye. De dubbele of binnenste Bullseye is 50 punten waard, de enkele 25. Voor de zwarte en witte vakjes geldt dat je de score tussen 1 en 20 krijgt. De buitenste gekleurde ring verdubbelt het aantal punten, de binnenste gekleurde ring verdriedubbelt het aantal punten. Je krijgt dus de meeste punten als je de triple 20 raakt. Topdarters zoals Michael van Gerwen en Raymond van Barneveld mikken daar bijna altijd op.

fig4

Figuur 1: Links: Een dartbord. Rechts: De score die je krijgt afhankelijk van waar je gooit. Bron: https://en.wikipedia.org/wiki/Darts.

Het doel bij darts is om zo snel mogelijk een score van 501 te halen, dan heb je één leg gewonnen. Je moet altijd eindigen met een darts in de buitenste ring, een “dubbel”. In theorie is het mogelijk om in 9 darts uit te gooien, maar dat gebeurt bijna nooit. Op televisie is dat sinds 1984 slechts 51 keer voorgekomen. Je kunt een 9-darter gooien door bijvoorbeeld zeven keer triple 20 te gooien, één keer triple 19, en te eindigen met dubbel 12.

Stel nu dat je de eerste pijl gooit. Je wil een naar verwachting zo hoog mogelijke score gooien. Waar moet je dan mikken? Ryan Tibshirani, Andrew Price (niet Gerwyn) en Jonathan Taylor (niet Phil) van de universiteit van Stanford zochten dat uit in hun artikel “A statistician plays darts”. Dit hangt af van hoe nauwkeurig je kunt gooien. In eerste instantie gaan ze er vanuit dat je mikt op een plek μ met coördinaten  μ_x en μ_y. Ze nemen aan dat de afwijking in de x-richting en y-richting normaal verdeeld is met een gemiddelde van 0 en een standaardafwijking σ. De verwachte score hangt af van μ (waar je mikt) en σ (hoe nauwkeurig je kunt gooien). Ze berekenden de verwachte score voor drie standaarddeviaties: 5mm, 26,9mm en 64,6mm. De laatste twee standaarddeviaties zijn inschattingen van de nauwkeurigheid van twee van de schrijvers van het artikel. Een standaarddeviatie van 5 mm is heel nauwkeurig zullen we later zien. In figuur 2 is een simulatie te zien van 30 pijlen van iemand die mikt op de triple 20 met een standaarddeviatie van 26,9mm.simulatie dartsFiguur 2: Simulatie van 30 pijlen. Het doel is de triple 20, de standaarddeviatie 26,9mm.

Een dartbord heeft een straal van 170 mm, de straal van de binnenste Bullseye is 6,35mm. Stel dat een darter met een standaarddeviatie van 5mm op de Bullseye mikt. De kans dat hij de Bullseye raakt is dan 55,4%. Daar zou Michael van Gerwen best tevreden mee zijn.

Op basis van deze aannames hebben de auteurs voor elk punt op het dartbord berekend wat de verwachte score is als een darter daar op mikt. Dat kan door het dartbord op te delen in hele kleine stukjes, bijvoorbeeld van een vierkante millimeter. Voor elk van die vakjes benader je de kans dat de pijl in dat vakje terecht komt, vermenigvuldigt die met de score in dat vakje, en telt al die waardes bij elkaar op. Het resultaat is te zien in figuur 3. Bij een standaarddeviatie van 5 mm kun je het beste op de triple 20 mikken. De verwachte score van één pijl is dan van bijna 43. Voor 3 pijlen komt dat neer op een verwachte score van 129. Topspelers halen zelden een gemiddelde boven de 120. Dat is geen hele eerlijke vergelijking, want spelers mikken niet altijd op de triple 20, maar het geeft wel aan dat een standaarddeviatie van 5mm een soort ondergrens is. Als de standaarddeviatie toeneemt kun je beter op de triple 19 gooien. De scores rondom de triple 19 zijn gemiddeld hoger dan die om de triple 20. Als je je doel mist haal je toch nog wat meer punten, waardoor de verwachte score hoger is dan wanneer je op de triple 20 mikt. Als je nog onnauwkeuriger gaat gooien kun je het beste iets links onder het midden mikken. Dit is ook wel te begrijpen. Stel dat je heel erg onnauwkeurig gooit, zo erg dat je moeite hebt om het bord te raken. Dan kun je het beste in het midden mikken, omdat de kans dan het grootst is dat je het bord raakt. In figuur 4 is voor alle standaarddeviaties tussen 0 en 100mm te zien wat de optimale plek is om op te mikken.

fig1

Figuur 3: Links: Heatmap van verwachte score van één pijl bij een standaarddeviatie van 5mm (a), 26,9mm (b) en 64,6mm (c). Rechts: Plek met de hoogste verwachte score. Bron: Tibshirani, Price en Taylor (2011).

fig2

Figuur 4: Plek met de hoogste verwachte score afhankelijk van de standaarddeviatie tussen 0 en 100mm. De optimale plek start in de triple 20 bij σ=0, springt bij σ=16,4 naar de triple 19, en gaat dan richting de Bullseye. Bron: Tibshirani, Price en Taylor (2011).

Tot nu toe namen we aan dat de afwijkingen in de x-richting en de y-richting normaal verdeeld zijn met dezelfde standaarddeviatie en onafhankelijk van elkaar zijn. In de praktijk blijkt dit volgens de auteurs vaak net wat anders te liggen. De meeste spelers hebben een grotere afwijking in de y-richting dan in de x-richting. Ook zijn de afwijkingen vaak niet onafhankelijk. Voor een rechtshandige speler komt het bijvoorbeeld vaker voor dat de afwijking in de x-richting het tegengestelde teken heeft van de afwijking in de y-richting. Linksboven het doel en rechtsonder komen vaker voor dan linksonder en rechtsboven. Ook zijn er aanwijzingen dat de verdeling van de verticale afwijkingen niet normaal is, maar een zogenaamde scheve normale verdeling volgt. Er komen grotere uitschieters onder het doel voor dan boven het doel. Een voorbeeld van zo’n verdeling is te zien in figuur 5.

fig3

Figuur 5: Voorbeeld van een scheve normale verdeling met grotere uitschieters onder het doel dan boven het doel.

Bij andere verdelingen kun je nog steeds dezelfde methode gebruiken om de verwachte score te berekenen. De heatmaps uit figuur 3 veranderen dan een beetje, maar de conclusies blijven ongeveer hetzelfde. Het is bijna nooit voordelig om op de triple 20 te richten. En als je heel onnauwkeurig gooit, kun je het beste op de Bullseye mikken. Wellicht kun je deze informatie gebruiken als je zelf eens een potje darts speelt!

Bron:

Tibshirani, R. J., Price, A., & Taylor, J. (2011). A statistician plays dartsJournal of the Royal Statistical Society: Series A (Statistics in Society)174(1), 213-226.

 

Honkbal, hockey en de stelling van Pythagoras

Wil je nieuwe artikelen automatisch in je mailbox krijgen? Klik op de knop “Volg” rechts onder in je scherm. Zie je de knop niet, dan helpt helemaal naar boven scrollen.

Een beroemde formule uit het honkbal, de zogenaamde verwachting van Pythagoras, kun je gebruiken om te berekenen hoeveel procent van de wedstrijden een team naar verwachting wint. Dit percentage kun je gebruiken om te kijken of een team pech of geluk heeft gehad in de competitie. De formule is in aangepaste vorm ook te gebruiken voor andere sporten, bijvoorbeeld voor de Nederlandse Hockeycompetitie. Welke teams hadden op basis van deze formule pech en geluk?

De verwachting van Pythagoras

In 1980 heeft Bill James, een statisticus en schrijver over honkbal, een formule bedacht om te schatten hoeveel procent van de wedstrijden een honkbalteam per seizoen wint. De formule kijkt naar het aantal runs dat een team in totaal heeft gescoord, en het aantal runs dat ze tegen hebben gehad in alle wedstrijden. Het winstpercentage is volgens hem als volgt te berekenen:

formule1

Stel bijvoorbeeld dat een team in een seizoen 250 runs heeft gescoord, en 150 runs tegen kreeg. Ze zouden op basis van de formule

formule7

van de wedstrijden moeten hebben gewonnen. Hebben ze er meer gewonnen, dan hadden ze geluk, hebben ze er minder gewonnen, dan hadden ze pech volgens James. In de film Moneyball wordt deze formule ook gebruikt om met weinig geld toch een zo goed mogelijk honkbalteam neer te zetten.

moneyball

De formule heet “de verwachting van Pythagoras”, omdat hij om te schrijven is in de vorm van de beroemde stelling van Pythagoras:

pythagoras

De algemenere formule voor meer sporten

Gemiddeld genomen bleek de formule het winstpercentage van goede teams wat te overschatten en het winstpercentage van slechte teams wat te onderschatten. Daarom is er een algemenere formule opgesteld, waarbij het kwadraat is vervangen door een willekeurige macht γ. Voor honkbal wordt nu γ =1,83 gebruikt in plaats van 2. Hoe lager γ wordt, hoe meer het winstpercentage richting de 50% wordt getrokken.

formule2

Deze formule is ook op andere sporten toegepast, bijvoorbeeld op hockey en basketbal. Bij honkbal gebruik je de runs in een wedstrijd, bij basketbal en hockey kijk je naar het aantal doelpunten voor en tegen. Tot nu toe werd γ per sport puur op basis van data geschat. Onlangs hebben Edward Kaplan en Candler Rich uitgezocht waarom de exponent per sport verschilt. Ze kijken naar het gemiddelde aantal punten dat in een wedstrijd wordt gescoord, maar ook naar het gemiddelde verschil waarmee een wedstrijd wordt gewonnen. Zo scoort bij basketbal een team gemiddeld rond de 100 punten per wedstrijd. De uitslag is zelden 100-50, maar vaker 105-95. Als je gemiddeld tien procent meer punten scoort dan dat je tegen krijgt zal je dus veel wedstrijden winnen. Dat is heel anders bij bijvoorbeeld hockey. Bij hockey scoort een team gemiddeld tussen de 2,5 en 3 doelpunten. De winnende ploeg wint vaak met een of twee doelpunten verschil. Als je bij hockey gemiddeld tien procent meer scoort dan je tegenstander zal je dus minder vaak winnen dan bij basketbal. De exponent bij basketbal is daarom een stuk hoger dan bij hockey. Voor basketbal vinden Kaplan en Rich waardes rond de 13, bij hockey rond de 2.

Een probleem van deze formule is dat je er vanuit gaat dat een team wint of verliest, gelijk spel is niet mogelijk. Dit kun je oplossen door gelijk spel mee te tellen als een halve winst voor beide ploegen. Per sport verschilt de exponent γ. Je kunt de exponent schatten via de volgende benadering:

formule3

In deze benadering kijk je naar het gemiddeld aantal punten per team per wedstrijd, en naar het puntensaldo per team. Elk team heeft een puntensaldo, het gemiddeld aantal punten voor min het gemiddeld aantal punten tegen per wedstrijd. Als het puntensaldo stijgt, stijgt het winstpercentage. In een grafiek kun je voor alle teams het puntensaldo afzetten tegen het winstpercentage. Uit de helling van de lijn door die punten kun je de exponent γ bepalen. De exponent γ is gelijk aan de helling vermenigvuldigd met vier maal het gemiddelde punten per team per wedstrijd. Wil je weten waarom je deze benadering kunt gebruiken, kijk dan hier.

We passen deze methode toe op de uitslagen van de Nederlandse hockeycompetitie van de heren in 2016-2017. In die competitie deden 12 teams mee die allemaal een uit- en een thuiswedstrijd tegen elkaar hebben gespeeld. In totaal zijn er 132 wedstrijden gespeeld. Na de poulefase gaan de beste vier teams door naar de play-offs. We kijken hier alleen naar de poulefase. Voor elke ploeg kun je uitrekenen hoeveel procent van de wedstrijden ze hebben gewonnen (waarbij gelijk spel als een halve winst meetelt), en wat hun gemiddelde doelsaldo was. Zo scoorde Bloemendaal gemiddeld 2,3 doelpunten meer per wedstrijd dan de tegenstander, en won 77% van de wedstrijden. Hurley scoorde juist twee doelpunten minder en won slechts 23% van de wedstrijden. Als we dit voor alle twaalf de teams tegen elkaar afzetten krijgen we de volgende grafiek:

hockey

De helling van de lijn door de punten is 0,1306. Als het puntensaldo met één stijgt, stijgt het winstpercentage gemiddeld met 13%. In de competitie scoorden de teams gemiddeld 2,59 doelpunten per wedstrijd. De exponent γ is daarom ongeveer γ≈4*2,59*0,13=1,35. Een duidelijk stuk lager dan de waardes rond de twee die Kaplan en Rich vinden voor hockey.

In de tabel hieronder is voor de 12 clubs te zien wat hun verwachte winstpercentage en hun daadwerkelijke winstpercentage is. Volgens dit model heeft Amsterdam bijvoorbeeld geluk gehad. Ze hebben 79 punten gescoord en 45 punten tegen gehad. Volgens het model hadden ze

formule8

van de wedstrijden moeten winnen. In werkelijkheid hebben ze 77% van de wedstrijden gewonnen. Ze zijn als tweede geëindigd, maar hadden vierde moeten worden. Den Bosch heeft pech gehad, en had eigenlijk stuivertje moeten wisselen met Oranje Zwart. Maar dit had niks uitgemaakt voor de vier teams die doorgingen naar de play-offs.

hockeytabel

Vergelijking tussen teams

De verwachting van Pythagoras zegt iets over het verwachte winstpercentage in een competitie als geheel. Het is ook interessant om op wedstrijdniveau te kijken wat de kans is dat een bepaalde club wint van een andere club. Hier wordt normaliter een ander model voor gebruikt, het Bradley-Terry model, maar dit model is te koppelen aan de verwachting van Pythagoras. In het Bradley-Terry model heeft elk team i een sterkte θ_i . De kans dat team i wint van team j is als volgt te berekenen:

formule4

Dit model kun je schatten met statistische software, en op die manier krijg je de sterkte per ploeg. Het Bradley-Terry model kun je bijvoorbeeld gebruiken om ELO-ratings te berekenen. Maar de structuur van deze formule lijkt ook heel erg op die van de formule van de verwachting van Pythagoras. Christopher Long en Toby Kingsman laten in hun blogs zien dat deze twee modellen als volgt aan elkaar te koppelen zijn:

formule9.jpg

Je kunt de sterkte van een team dus heel eenvoudig bepalen, en krijgt de kans dat een team van een ander team wint cadeau! De kans dat Bloemendaal wint van Kampong is dan bijvoorbeeld

formule5

.

Het blijven kansen, in de play-offs versloeg Kampong Bloemendaal in de halve finale en werd uiteindelijk landskampioen.

Bronnen:

Dayaratna, K. D., & Miller, S. J. (2012). First Order Approximations of the Pythagorean Won-Loss Formula for Predicting MLB Teams’ Winning Percentages. arXiv preprint arXiv:1205.4750.

Kaplan, E. H., & Rich, C. (2017). Decomposing Pythagoras. Journal of Quantitative Analysis in Sports, 13(4), 141-149.

http://angrystatistician.blogspot.nl/2016/06/a-simple-estimate-for-pythagorean.html

https://tobykingsman.wordpress.com/2016/06/04/redefined-bradley-terry-models/

https://www.flashscore.nl/hockey/nederland/hoofdklasse-2016-2017/

https://en.wikipedia.org/wiki/Pythagorean_expectation

textvak

De beste Formule 1-coureur aller tijden

In Formule 1 speelt het team waarvoor je rijdt een grote rol. Maar hoe groot? En wie is de beste coureur aller tijden? Wetenschapper Andrew Bell en zijn collega’s zochten het uit. Uit hun model komt Juan Manuel Fangio als beste naar voren en blijkt dat het team maar liefst 86% van de verschillen tussen coureurs verklaart. En het wordt tijd dat we ons eens gaan verdiepen in de relatief onbekende Christian Fittipaldi.

Lees verder De beste Formule 1-coureur aller tijden

(Beach)volleybal & tossen: muntje gooien leidt tot ongelijke kans om te winnen

Topsporters doen er alles aan om hun winkans met enkele procenten te doen stijgen. Ze willen zo min mogelijk aan het toeval overlaten. Toch heeft de ultieme vorm van toeval, het opgooien van een muntje om te bepalen wie er begint met serveren, flinke impact op de kans om de beslissende set te winnen bij (beach)volleybal. En dat is heel makkelijk te voorkomen, door om en om te serveren.

toss

De puntentelling

In elke sport moet er op de een of de andere manier een score worden bijgehouden, waarop gebaseerd wordt wie de wedstrijd heeft gewonnen, of eventueel in een gelijkspel eindigt. Je kunt daarbij verschillende groepen van sporten onderscheiden. Bij volleybal en beachvolleybal wordt een reeks van punten wordt gespeeld, net zoals bij tennis, badminton en squash. Daarnaast zijn er onder andere sporten waar een tijd of afstand wordt gemeten, zoals bij atletiek en schaatsen, sporten waarbij er een bepaalde tijd wordt gespeeld, zoals voetbal en hockey, jurysporten zoals turnen en kunstschaatsen, of combinaties daarvan.

Binnen de “puntenreekssporten” gelden er weer verschillende regels. Bij tennis serveren de spelers om en om een game, of, in een eventuele tie-break om en om twee punten. Bij volleybal en squash gaat de service naar degene die het punt gewonnen heeft. Als een speler een punt wint, blijft hij dus serveren, en serveert de tegenstander helemaal niet meer. Bij tennis is dit niet het geval, en wisselt de service, wat de uitkomst van de vorige game ook was. Wie er begint met serveren, hangt meestal af van de toss. Degene die de toss wint, mag kiezen of hij wil beginnen met serveren of ontvangen. Bij tennis is het een voordeel om te serveren. Bij volleybal is het juist een nadeel. Bij sporten waar je om en om serveert maakt het (afgezien van eventueel psychologisch voor- of nadeel) niet uit wie er begint met serveren. Als twee tennissers even goed zijn, hebben ze precies evenveel kans om de wedstrijd te winnen. Bij volleybal is dat niet het geval. Als twee ploegen precies even goed zijn, is de kans om te winnen niet 50-50 verdeeld, maar heeft degene die begint met serveren minder dan 50% kans om te winnen.

Bij volleybal wint het team dat als eerste drie sets heeft gewonnen, bij beachvolleybal gaat het om twee gewonnen sets. Een set wordt gewonnen als een team 25 (volleybal) of 21 (beachvolleybal) punten heeft behaald, met minimaal twee punten verschil. De uitslag van een set kan dus 25-3 zijn, 25-23, 27-25, 33-31, etc. Een eventuele beslissende set, de vijfde set bij volleybal en de derde set bij beachvolleybal, gaat tot 15 punten. Elk punt telt mee, en het team dat het punt heeft gewonnen serveert het volgende punt. Omdat serveren een nadeel is, is het dus moeilijk om meerdere punten achter elkaar te winnen.

WK beachvolleybal 2015

In 2015 werd het WK beachvolleybal in Nederland gehouden. Het Nederlandse duo Reinder Nummerdor en Christiaan Varenhorst haalde de finale en nam het daarin op tegen twee Brazilianen. Het was een hele spannende partij. De Nederlanders wonnen de eerste set vrij gemakkelijk met 21-12, maar verloren de tweede set ruim met 21-14. Er werd dus een beslissende derde set gespeeld. De Nederlanders waren hier in het nadeel, omdat ze moesten beginnen met serveren. De beslissende set ging erg gelijk op, en helaas trokken de Brazilianen aan het langste eind: 22-20. Over de hele wedstrijd gezien werd ongeveer 1/3 van de punten gewonnen door de serverende partij, en 2/3 door de ontvangende partij.

tabel1

nederland

Laten we nog eens naar die laatste set kijken. Nederland begint met serveren. Als Nederland zijn service houdt, moet het daarna nog een keer serveren. Nederland moet dus twee keer zijn eigen servicebeurt winnen om met 2-0 voor te komen. Brazilië hoeft echter maar één keer de service te houden. Als ze het eerste punt winnen, op de service van Nederland, staan ze 1-0 voor. Dan moeten ze zelf serveren. Als ze dat punt winnen, staan ze met 2-0 voor. Het is dus makkelijker voor Brazilië om met 2-0 voor te komen, dan voor Nederland. Een set moet met twee punten verschil worden gewonnen. Stel dat alle punten standaard worden gewonnen door het ontvangende team. Brazilië hoeft dan maar één keer de eigen servicebeurt te winnen om de set te winnen, en Nederland twee keer. Als ze om en om zouden serveren, zouden ze allebei maar één keer de eigen service te hoeven winnen om met twee punten verschil te winnen. Dat is ook het geval bij tennis. Daar winnen beide spelers de set als ze de servicegame van de tegenstander één keer breaken. Dit leidt ertoe dat als twee teams even goed zijn, de kans om de set te winnen bij beachvolleybal niet 50-50 verdeeld is. Als beide teams 1/3 van hun servicebeurt wint, wint het team dat begint met serveren in 47,3% van de gevallen de set, en het team dat begint met ontvangen in 52,7%. Dat scheelt bijna 5%!

tabel2

Ook als het ene team beter is dan het andere team, heeft de toss procenten impact op de kans om de set te winnen. Stel dat team 1 35% van de servicebeurten wint, en team 2 30%. Als team 1 begint met serveren is de kans om de set te winnen minder dan 60%, als team 2 begint meer dan 64%. Ook hier beïnvloedt de toss de kans om de set te winnen met bijna 5%. Het zou dus het meest eerlijk zijn om net als bij tennis om en om te serveren.

Terug naar de laatste set op het WK 2015. Uiteindelijk heeft Brazilië 7 keer een punt op eigen service gewonnen, en Nederland 6 keer. Maar één keer meer dus. Nederland heeft gedurende de set vaak een servicebeurt meer voorgestaan dan Brazilië. Omdat Nederland het eerste punt begon met serveren was dat echter niet genoeg. De toss heeft dus erg in het nadeel van de Nederlanders gewerkt. Als ze de toss hadden gewonnen, was Nederland er misschien wel met de wereldtitel vandoor gegaan.

tabelv2

Wetenschappelijk onderzoek naar puntentellingen

Er zijn flink wat wetenschappers die zich over de puntentelling in sport hebben gebogen. Een score-systeem wordt dan vaak benaderd als een statistische test. Ze gaan op zoek naar de meest efficiënte test om te bepalen welk team of welke speler het beste is. De meest efficiënte puntentelling moet, in wetenschappelijk termen, aan twee voorwaarden voldoen:

  1. Als twee spelers precies even goed zijn, moet de kans om te winnen voor beide spelers 50% zijn.
  2. Bij een gegeven verwachte wedstrijdduur moet de kans dat de beste wint zo groot mogelijk zijn.

Zoals we al hebben gezien voldoet volleybal niet aan de eerste eis. Tennis doet dat wel.

Dan regel 2. Je kunt er op een hele makkelijke manier voor zorgen dat je erachter komt wie de beste is: Speel gewoon heel lang door. Je zou bij tennis bijvoorbeeld niet om twee of drie gewonnen sets kunnen spelen, maar om 30 gewonnen sets. Dat geeft alleen wel praktische problemen, en is ook niet heel aantrekkelijk voor het publiek. Wel kun je er voor zorgen dat je de regels van een spel aanpast, zodat, gegeven de lengte van een wedstrijd, de kans groter is dat de beste als winnaar uit de bus komt.

Hoe ziet die optimale puntentelling er volgens de wetenschap dan uit? Nu staat altijd vast hoeveel punten een speler moet winnen, bijvoorbeeld 15 bij beachvolleybal, of 6 games bij tennis. Dat zou moeten veranderen. Het zou er om moeten gaan wie het eerst een aantal punten, bijvoorbeeld 5, méér heeft dan de tegenstander. Een wedstrijd kan dan eindigen in 5-0, 6-1 of 15-10. Deze strategie wordt in de praktijk gebruikt om medicijnen te testen. Bij proeven met medicijnen wil je testen of een medicijn wel of niet werkt. Als je genoeg informatie hebt, wil je zo snel mogelijk stoppen met de test, om patiënten niet onnodig bloot te stellen aan medicijnen die niet werken, of zelfs negatieve bijwerkingen hebben. Daarnaast zou de puntentelling wel een element uit volleybal moeten bevatten. Als de service dominant is, moet het punt naar degene gaan die het punt heeft verloren (play-the-loser). Als serveren een nadeel is moet de service gaan naar degene die het punt heeft gewonnen (play-the-winner). Echter, om niet met regel 1 in de knoei te komen, moeten er wat trucen uit de kast worden gehaald, waar het niet gemakkelijker van wordt. Je begint bijvoorbeeld allebei een keer met serveren. Degene die het eerst 5 punten meer heeft dan de tegenstander wint, en krijgt een punt. Als je allebei een keer bent begonnen met serveren is het 2-0, 1-1, of 0-2. Dit noem je een biformat en kun je vertalen in winst, gelijk spel of verlies. Degene die het eerst een van tevoren vastgesteld aantal biformats meer heeft gewonnen dan de tegenstander, wint de wedstrijd.

De meest efficiënte puntentelling volgens de wetenschap is dus vrij ingewikkeld, wat de kijkcijfers waarschijnlijk niet ten goede komt. Verder is het de vraag of we wel willen dat de beste speler met een zo groot mogelijke kans wint. Een wedstrijd is extra leuk om naar te kijken als degene die achter staat nog de mogelijkheid heeft om terug te komen. Als halverwege al duidelijk is wie er gaat winnen, kun je net zo goed ophouden met kijken. Voor (beach)volleybal is er echter een simpele aanpassing mogelijk die de sport eerlijker maakt, en net zo leuk houdt om naar te kijken. Dat is ook de oproep van Hoogleraar Frits Spieksma in Volley Techno, een blad voor volleybaltrainers. Ga om en om serveren!

Bronnen:

Spieksma, F.C.R. (2016), Eerlijke kans om beachvolleybalfinale te winnen, Volley Techno, No. 2 (http://feb.kuleuven.be/public/NDBAE03/papers/volleytechnospieksma.pdf)

Lee, K. T., and S. T. Chin. ”Strategies to serve or receive the service in volleyball.” Mathematical Methods of Operations Research 59.1 (2004): 53-67.

Miles, Roger E. ”Symmetric sequential analysis: the efficiencies of sports scoring systems (with particular reference to those of tennis).” Journal of the Royal Statistical Society. Series B (Methodological) (1984): 93-108.

Pollard, Graham H. ”The optimal test for selecting the greater of two binomial probabilities.” Australian journal of Statistics 34.2 (1992): 273284.

Kingston, J. G. ”Comparison of scoring systems in two-sided competitions.” Journal of Combinatorial Theory, Series A 20.3 (1976): 357-362.

 

Thuisvoordeel in de Nederlandse squash- en badmintoncompetitie

Naar thuisvoordeel op professioneel niveau is veel onderzoek gedaan, en het effect is aangetoond in sporten van voetbal tot schaatsen. Maar bestaat er ook zoiets als thuisvoordeel in de Nederlandse (amateur) squash- en badmintoncompetitie? En waar wordt thuisvoordeel door veroorzaakt?

De squash- en badmintoncompetitie

Zowel bij squash als bij badminton spelen teams op allerlei niveaus competitie. Bij squash worden er in de Heren Eredivisie drie, en in de overige klasses vier single partijen gespeeld. De speler die als eerste drie games wint, wint de wedstrijd. Aan het eind worden alle games bij elkaar opgeteld. Het team met de meeste games krijgt drie extra punten. Bij een gelijkspel geeft de score binnen de games de doorslag. Er is dus altijd een team dat wint. De herencompetitie kent zeven verschillende klasses, de damescompetitie vijf. De badmintoncompetitie is gemengd. Er worden acht partijen gespeeld, twee herenenkels, twee damesenkels, en vier (gemengd)dubbel partijen. De winnaar krijgt geen extra punten, het kan dus ook in een gelijk spel van 4-4 eindigen.

Op www.toernooi.nl zijn alle uitslagen uit het seizoen 2015-2016 terug te vinden. In de squashcompetitie werden 2579 teamwedstrijden gespeeld. Alleen wedstrijden zonder aanvullende opmerking bij de uitslag, zoals het niet komen opdagen van een team, zijn meegenomen. Bij de mannen won in 58% van de gevallen de thuisspelende ploeg. De kans dat dit op toeval berust als er geen thuisvoordeel zou zijn is zo goed als nul. Het thuisvoordeel is bij de mannen zelfs in alle klasses terug te zien, behalve in de Eredivisie. Bij de dames is er een klein thuisvoordeel van 53%, maar statistisch gezien kan dit ook door toeval worden veroorzaakt. Dit verschil tussen mannen en vrouwen kan door meerdere dingen komen. De competitie van de vrouwen is een stuk minder groot dan de competitie van de mannen. Hoe minder wedstrijden er worden gespeeld, moe moeilijker het is om thuisvoordeel statistisch aan te tonen. Ook zie je bij vrouwen vaak dat het niveauverschil groter is. Hoe groter het niveauverschil hoe kleiner de kans dat thuisvoordeel het verschil maakt tussen winnen en verliezen.

squashthuisvoordee2l

In de badmintoncompetitie werden het afgelopen jaar 1763 teamwedstrijden gespeeld. Elke teamwedstrijd bestaat uit 8 individuele wedstrijden. Op individueel niveau won de thuisspelende speler 54% van de wedstrijden. Op teamniveau won de thuisspelende ploeg  47% van de keren en de uitspelende ploeg 35%. De overige 18% van de wedstrijden eindigden in een gelijk spel. Ook hier is het effect statistisch significant voor alle klasses behalve de Eredivisie. Ook voor niet-professionals is er dus zoiets als thuisvoordeel!

badmintonthuisvoordeel2

De vijf factoren van thuisvoordeel

Dat er thuisvoordeel is staat dus vast, maar wat veroorzaakt het? Hier is al veel onderzoek naar gedaan, zowel door statistici als door psychologen. In 2013 hebben drie Spanjaarden een overzicht geschreven, waarin ze vijf oorzaken benoemen: Supporters, bekendheid met het veld/omstandigheden, reistijd, de scheidsrechter en territorialiteit.

Supporters:

Bij thuisvoordeel denken we vaak gelijk aan de steun van supporters. Er zijn bijna altijd meer supporters van de thuisspelende ploeg aanwezig. Maar ook zonder supporters blijkt er een thuisvoordeel te zijn. Niels van de Ven van de universiteit van Tilburg zocht dit uit, door voetbalwedstrijden te analyseren met en zonder supporters, en wedstrijden tussen teams die hetzelfde stadion als thuisbasis hebben. Sterker nog, supporters kunnen zelfs een negatief effect hebben op de prestaties, bijvoorbeeld als een speler een penalty moet nemen. Dit is een bekend fenomeen uit de sociale psychologie. Bij makkelijke taken werkt het prestatieverhogend als er mensen meekijken (sociale facilitatie), bij moeilijke taken werkt het juist prestatieverlagend (sociale inhibitie).

Bekendheid met het veld:

Elk veld of elke baan kan anders spelen, en aan je eigen veld ben je het meeste gewend. Dat kan voordeel geven. Zo speelt de ene squashbaan veel sneller dan de andere, en hangen de lampen bij badminton overal anders, waardoor je op een andere manier tegen het licht inkijkt. Uit het ene onderzoek blijkt dat het effect beperkt is, uit het andere onderzoek dat het thuisvoordeel 24% afnam als een club een nieuw veld kreeg. Wetenschappelijk onderzoek richt zich eigenlijk altijd op topsporters. Maar deze factor zou juist bij amateurs zwaarder kunnen wegen. Een professionele squasher of badmintonner speelt en traint op veel verschillende plekken. Maar de gemiddelde clubspeler speelt en traint meestal op zijn eigen club, en is minder gewend aan verschillende omstandigheden. Dit kan de reden zijn dat we het thuisvoordeel niet terugzien bij de Eredivisie, maar wel bij de lagere klasses van badminton en squash.

Reistijd:

Als je een uitwedstrijd speelt, moet je meestal verder reizen. Je komt misschien al meer moe aan, of hebt daarvoor gewoon minder zin om te spelen. Dit blijkt maar een beperkt effect te hebben.

De scheidsrechter:

Meerdere onderzoeken hebben aangetoond dat scheidsrechters licht in het voordeel van de thuisploeg fluiten of jureren. Het thuisvoordeel op Olympische Spelen is ook groter bij subjectieve jurysporten zoals turnen dan bij objectieve jurysporten zoals gewichtheffen en atletiek.

dirkjan

Territorialiteit:

Territorialiteit? Ja, territorialiteit: “een verdedigende reactie op een invasie op wat je ziet als je eigen territorium”. Het thuisvoordeel in de voetbalcompetitie op de Balkan is groter dan in bijvoorbeeld Noorwegen, zoals de figuur hieronder laat zien. Dit wordt toegeschreven aan de (historische) conflicten tussen bevolkingsgroepen in die regio.

territorialiteit

Thuisvoordeel in voetbalcompetitie, figuur uit publicatie Legaz-Arrese.

Conclusie

Thuisvoordeel is in veel sporten aangetoond, en wordt toegeschreven aan het effect van supporters, bekendheid met het veld, reistijd, de scheidsrechter en “territorialiteit”. Ook in de Nederlandse (amateur) squash – en badmintoncompetitie is er duidelijk thuisvoordeel. Juist bij amateurs zou het effect van het spelen op een bekend veld zwaarder kunnen wegen dan bij professionals.

kader2

Bronnen:

Data: www.toernooi.nl

Legaz-Arrese, Alejandro, Diego Moliner-Urdiales, and Diego Munguía-Izquierdo. “Home advantage and sports performance: evidence, causes and psychological implications.” Universitas Psychologica 12.3 (2013): 933-943.

http://www.kennislink.nl/publicaties/van-thuisvoordeel-tot-verstikking

Van de Ven, Niels. “Supporters are not necessary for the home advantage: Evidence from same‐stadium derbies and games without an audience.” Journal of Applied Social Psychology 41.12 (2011): 2785-2792.

Tennis en statistiek

Kan de abc-formule je helpen om de US Open te winnen? (English version here)

In september vindt de laatste Grand Slam van het jaar plaats, de US open. Topspelers zoals Federer, Nadal en Djokovic staan uren per dag op de baan om hun spel naar een zo hoog mogelijk niveau te tillen. Dit allemaal om de kans zo groot mogelijk te maken om straks die felbegeerde beker omhoog te houden. Door slimmer te serveren kunnen de spelers hun winkansen flink laten toenemen.

Slim serveren

Tennis is de enige sport waarin er twee keer geserveerd mag worden. In toptennis is serveren, vooral bij de mannen, een groot voordeel. Met de eerste service kunnen de spelers wat meer risico nemen, en worden er veel punten gewonnen. Is de eerste service uit of in het net, volgt een tweede, wat meer voorzichtige service. Ook met een tweede service zijn topspelers vaak nog in het voordeel. Franc Klaassen en Jan Magnus hebben berekend dat zowel bij mannen als bij vrouwen ongeveer 60% van de eerste services goed zijn, en 86% van de tweede services. Als de service goed is, winnen mannen gemiddeld 74% van de rally’s op de eerste service, en 59% van de rally’s op de tweede service. Bij vrouwen zijn deze percentages 63% en 53%.

Spelers nemen dus beduidend minder risico op de tweede service. Logisch, want bij een dubbele fout heb je het punt meteen verloren. Of toch niet? De kans om de rally te winnen met een tweede service is een stuk kleiner. Is het verstandig om of safe te spelen met de tweede service en geen dubbele fout te slaan? Of kun je beter iets meer dubbele fouten slaan, maar meer punten winnen in de rally? De finales van Wimbledon en de Australian open van dit jaar laten zien dat er veel winst te halen is.

De Wimbledon finale 2015

In de Wimbledon finale van dit jaar stonden Novak Djokovic en Roger Federer tegenover elkaar. Een finale waar veel mensen op gehoopt hadden, met de nummers 1 en 2 van de plaatsingslijst. Novak Djokovic won, met 7-6 6-7 6-4 6-3. Had Roger Federer kunnen winnen door slimmer te serveren? Laten we eerst de statistieken bekijken:

Tabel1

Bij beide mannen was ongeveer 2 op de 3 eerste services goed. Als de eerste service goed was, wonnen ze 3 van de 4 punten. Het grootste verschil zat in de tweede service. Beiden sloegen bijna geen dubbele fouten. Djokovic sloeg er 1 in de hele wedstrijd, Federer 3. Maar Federer won beduidend minder punten op de tweede service dan Djokovic, 52% versus 61%.

Laten we nu eens aannemen dat de spelers kunnen variëren met de hoeveelheid risico die ze nemen. En dat ze een service kunnen slaan die ergens tussen de eerste en de tweede service in zit. De kans dat de service goed is ligt dan ergens tussen die van de eerste en de tweede service in, en de kans om de rally te winnen ook. Je kunt dan uitrekenen hoeveel risico je moet nemen op de eerste service en op de tweede service, zodat de kans zo groot mogelijk is om het punt te winnen. Graham en Geoff Pollard hebben bepaald hoe je dit moet doen, en het leuke is dat je hier niet meer dan middelbare school wiskunde voor nodig hebt. Wil je weten hoe? Klik hier. Roger Federer zijn eerste service was optimaal, maar hij had beter meer risico kunnen nemen op z’n tweede service. Hij had dan wel wat meer dubbele fouten geslagen. Maar hij had toch meer punten gewonnen, omdat zijn kansen in de rally zouden zijn gestegen. Novak Djokovic heeft tactisch zo goed als optimaal geserveerd.

Figuur 1

Stel dat Roger Federer tactisch optimaal had geserveerd. Wat zou dat voor impact hebben op zijn winkansen? Novak Djokovic won 69,2% van de punten als hij serveerde. Roger Federer won 65,8%. Door meer risico te nemen op de tweede service had hij dat percentage omhoog kunnen brengen naar 66,6%. Stel dat Djokovic en Federer straks weer tegenover elkaar staan in de US Open finale. Ze zijn allebei precies evengoed als de vorige keer, alleen Federer neemt nu meer risico op de tweede service. Hoe veranderen dan de kansen om een servicegame, een set of de wedstrijd te winnen? Djokovic zou nog steeds de beste papieren hebben, maar Federer zou zijn winkansen met ruim 4% zien stijgen! Als het niveau nog wat dichter bij elkaar ligt, kan slim serveren het verschil maken tussen winnen en verliezen.

Tabel 2

Figuur 2

Djokovic ontvangt de felicitaties van Federer. Is het de volgende keer andersom?

 De Australian Open finale 2015

In de finale van de Australian Open stonden Novak Djokovic en Andy Murray tegenover elkaar. Djokovic won ook deze wedstrijd, met 7-6 6-7 6-3 en 6-0.

Bij Djokovic gebeurde er iets geks deze wedstrijd. Hij won meer punten op zijn tweede service dan op zijn eerste service. Andy Murray had, net als Roger Federer in de Wimbledon finale, een groot verval tussen zijn eerste en tweede service. Op zijn tweede service won hij slechts 37% van de rally’s. Voor hem was het verstandiger geweest om een stuk meer risico te nemen op zijn tweede service.

Figuur 3

Als hij meer risico had genomen op de tweede service, zou de kans om een punt te winnen zijn gestegen van 54,2% naar 57,1%. Als Djokovic hetzelfde zou hebben geserveerd, zou de kans om de wedstrijd te winnen zijn gestegen van 16,6% naar 31,2%. Bijna een verdubbeling!

Tabel 3

De US Open

Bij de finale van Wimbledon en de Australian Open was er een groot verschil tussen spelers. Bij Novak Djokovic zit er relatief weinig verschil tussen zijn eerste en tweede service. Roger Federer en Andy Murray hadden tactisch beter meer risico kunnen nemen op de tweede service. Dit kan een algemeen patroon zijn, maar de optimale strategie kan ook afhangen van de vorm van de dag, en van de tegenstander. Bij de US Open zouden de spelers dus eigenlijk bij moeten houden hoeveel punten ze scoren op de eerste of tweede service. En hun strategie gedurende de wedstrijd daarop moeten aanpassen. Voor de speler is dat lastig, want hij concentreert zich op zijn spel. De coach zou dit wel kunnen doen, maar mag helaas geen tips geven. Al gebeurt dit in de praktijk wel, want de coach zit op de tribune. Petje op is meer risico, petje af minder?

Bronnen

Franc Klaassen en Jan Magnus: Analyzing Wimbledon, The power of statistics

Graham Pollard en Geoff Pollard: Optimal Risk taking on first and second serves

Geoff Pollard: What is the best serving strategy?

Paul Newton en Joseph Keller: Probability of winning at tennis. I. Theory and data

Statistieken van www.flashscore.nl

Wil je nieuwe artikelen automatisch in je mailbox krijgen? Klik op de knop “Volg” rechts onder in je scherm.