Schaatsen en Statistiek

Allround schaatsen is wiskundig gezien niet eerlijk. (English version here)

Statistiek en schaatsen: Naar een eerlijker allroundsysteem?

De Internationale Schaatsunie ISU heeft onlangs besloten dat vanaf 2016 op EK allround-schaatstoernooien de 10 kilometer voor mannen en 5 kilometer voor vrouwen worden vervangen door een 1000 meter. Sven Kramer is woedend en noemt het een “supersprint” in plaats van een allroundtoernooi. Heeft hij gelijk? Worden sprinters in het nieuwe systeem bevoordeeld? Of hebben stayers in het huidige systeem juist voordeel? Statistiek kan ons helpen om daar een uitspraak over te doen. En om een eerlijker allroundsysteem vorm te geven.

Schaatsers indelen met behulp van statistiek

Voor de ene schaatser lijkt de 500 meter soms al te lang, terwijl de andere pas op gang komt halverwege de 10 kilometer. Gevoelsmatig weten we allemaal dat er verschillende soorten rijders zijn, maar we kunnen dat ook wetenschappelijk onderbouwen. Een wiskundige methode waarmee dit kan is “principale componenten analyse”. Deze methode levert een aantal factoren op die verschillen tussen schaatsers kunnen verklaren. Ik heb deze techniek toegepast op de persoonlijke records van 2449 mannelijke schaatsers op 6 afstanden[1] (500, 1000, 1500, 3000, 5000 en 10000 meter). Uit die analyse volgen twee doorslaggevende factoren die samen 90% van de verschillen tussen de tijden van schaatsers verklaren. De eerste factor zegt iets over het algemene niveau van de schaatser. De ene schaatser is nu eenmaal sneller dan de andere, ongeacht de afstand. De tweede factor zegt iets over het feit of de schaatser een sprinter of een stayer is. Sprinters zijn relatief sneller op de korte afstanden, stayers zijn juist beter op de langere afstanden. Deze twee factoren kun je uitdrukken in een getal tussen -1 en 1. Zie onderstaande tabel met Nederlandse toppers. Ze hebben allemaal een niveau dat dicht bij 1 ligt. Kramer en Verheijen blijken in mijn analyse, niet geheel onverwacht, echte stayers, terwijl Tuitert en Wennemars aan de sprintkant van het spectrum zitten. Verweij is een relatief neutrale schaatser.    tabel1  

Is het allroundtoernooi wel eerlijk?

Nu de hamvraag: kunnen we zeggen of een bepaald type schaatser in het voordeel is op een allroundtoernooi? Als we kijken naar de top 20 van de wereld in het huidige systeem, gebaseerd op persoonlijke records (de zogenaamde adelskalender), dan zien we relatief veel stayers. Davis is de aanvoerder van deze lijst, gevolgd door Kramer. In het nieuwe systeem, waarin de 10 kilometer is vervangen door de 1000 meter, komen juist veel sprinters bovendrijven. Kramer moet genoegen nemen met een 15e plek. Geen wonder dat hij boos is! figuur1 In wiskundige termen: in het huidige allroundtoernooi is de correlatie tussen een goede uitslag en het niveau van de schaatser 96% en de correlatie met de factor “stayer” is 24%. Stayers zijn dus in het voordeel. Winnen in het nieuwe allroundtoernooi hangt voor 97% samen met het algemene niveau van de schaatser en voor 23% met de vraag of hij een sprinter is. Zowel het nieuwe als het huidige systeem bevoordeelt dus een groep schaatsers.

Naar een eerlijker allroundtoernooi?

Ik heb twee alternatieven bekeken. In het eerste alternatief wordt de 10 kilometer niet door de 1000 meter, maar door de 3 kilometer vervangen. In het tweede alternatief wordt de 10 kilometer helemaal niet vervangen door een andere afstand; hij vervalt simpelweg. Hieronder zien we weer de top 20 op basis van persoonlijke records. Bij het eerste alternatief zien we al meer sprinters, hoewel de top 10 nog steeds gedomineerd wordt door stayers. Bij het tweede alternatief is de verdeling tussen sprinters en stayers aan de top nog evenwichtiger. figuur2

Dat zien we ook als we naar de tabel met correlaties kijken. Winnen hangt nu voor maar liefst 99% samen met het algemene niveau van de schaatser en de vraag of hij een sprinter of een stayer is heeft veel minder invloed. tabel2 *Een positieve correlatie betekent dat stayers in het voordeel zijn, bij een negatieve correlatie zijn sprinters in het voordeel.

Terug nu naar de woede van Kramer. Hij had gelijk: de maatregel om de 10 kilometer te vervangen door de 1000 meter bevoordeelt de sprinters fors. Maar bij de huidige vormgeving van het allroundtoernooi zijn stayers juist erg in het voordeel. Met behulp van wiskundige technieken is het mogelijk om een eerlijker allroundtoernooi vorm te geven, waarbij het algemene niveau van de schaatser daadwerkelijk de doorslag geeft. Moge de beste winnen!

[1]http://www.sskating.com/list.php?season=2013/2014&lm=m&dist=Big6

Dit is een samenvatting van een artikel dat ik heb geschreven voor Stator, het tijdschrift van de Vereniging voor Statistiek en Operationele Research. Voor het hele artikel, klik hier.

Wil je nieuwe artikelen automatisch in je mailbox krijgen? Klik op de knop “Volg” rechts onder in je scherm.

14 gedachten over “Schaatsen en Statistiek”

  1. De optie gegeven door Ronald lijkt mij fysiek onmogelijk, de huidige grote vierkamp is eigenlijk al te veel van het goede. Verder zitten er nog wel wat haken en ogen aan de data. Veel sprinters zullen simpelweg niet in de dataset voorkomen, omdat ze geen 10km pr hebben staan. Alle stayers zullen wel opgenomen zijn, aangezien die vrijwel altijd ook wel eens de korte afstanden gereden hebben. Verder wordt er ook vanuit gegaan dat de gemiddelde schaatser in de database precies geen sprinter en geen stayer is. Dit hoeft niet per definitie juist te zijn. Op grote toernooien zijn vaak meer plekken voor sprinters dan voor stayers, daarom zullen schaatsers zich wellicht eerder toeleggen op sprinten, omdat daar simpelweg meer kans is om op topniveau te kunnen schaatsen.
    Ook hebben we inmiddels gezien dat statistieken door de jaren heen zelfs om kunnen draaien. Het genoemde verschil tussen binnen en buitenbaan op de 500m is de afgelopen jaren omgekeerd: http://schaatsstatistieken.nl/index.php?nieuws=20140601
    Ook nu is er naar erg historische data gekeken. Wat gebeurt er als er alleen naar data van bijvoorbeeld de laatste 5 jaar gekeken wordt. Zijn de resultaten dan nog altijd hetzelfde?

    Al met al een leuk artikel, maar met de pure wiskundige analyse ben ik het niet geheel eens.

    1. Hoi Sybe,

      Bedankt voor je reactie! Ik ga inderdaad uit van de schaatsers die alle afstanden een keer gereden hebben. De vraag is of je sprinters die nooit de lange afstanden rijden mee moet nemen bij het bepalen van een eerlijk allroundtoernooi. Daar kun je over discussiëren. Overigens is het niet zo dat in de analyse is aangenomen dat de gemiddelde schaatser in de set geen sprinter en geen stayer is. Sterker nog, uit de analyse komt dat er wat meer stayers in de set zitten dan sprinters, dus dat komt overeen met wat jij zegt. Ik zal eens kijken wat er gebeurt als je een kortere historie meeneemt. Maar ik verwacht niet dat de conclusie dan verandert. Ook de afgelopen jaren hebben we gezien dat juist stayers het goed doen op allroundtoernooien. Stayers hebben twee afstanden waarop ze goed kunnen presteren, de 5km en de 10km, terwijl echte sprinters alleen de 500 meter hebben om hun winst te pakken.

  2. Als ze niet (meer) voor een 10k hoeven te trainen dan kunnen de stayers meer tijd en aandacht besteden aan de kortere afstanden….. Jaarlijkse training-plannen worden dan aangepast en er wordt gewoon meer op snelheid getraind, zelfs als de 10k door de 3k wordt vervangen.
    Verder zou er ook verschil tussen binnen- en buitenbanen in de statistiek moeten worden verwerkt, evenals zee-niveau banen en hoogte-banen. Ritsma was op zee-niveau vrijwel onverslaanbaar, maar reed in Calgary nooit zo sterk. En pure stayers kunnen op buitenbanen vaak een grotere winst maken op de 5km en 10km.
    Ik zou graag een allround toernooi met een 3k ipv een 10k willen zien.
    Groeten uit Calgary, waar het toch wel spannend gaat worden dit weekend.

    1. Ik ben het ook met Arno eens er zou eens moeten worden gekeken wat het gevolg is als je in de mix geen 500-1000-1500-5000 programma meeneemt maar een programma 500-1500-3000-5000. Hier zullen naar mijn inziens inderdaad de echte sprinters uit de boot vallen maar de 1000 en 1500 meter specialisten kunnen over het algemeen ook zo’n goede 3000 rijden dat hier de mogelijkheid ontstaat om het toernooi zo eerlijk mogelijk te maken.

  3. Ik denk ook dat in de basis deze statistiek een goed inzicht zou moeten geven. Maar dat je wel last hebt van het feit dat korte afstanden door iedereen vaak gereden worden (al vanuit de jeugd). Maar de lange afstanden maar in beperkte mate. maw, het PR van kramer op de 500 is relatief gezien beter dan het PR van een Tuitert op de 10km (ik pak express Tuitert, omdat hij ooit als allrounder is begonnen, maar bij uitstek op een 500-1000-1500-5000 zou hebben gepast).
    Daar tegenover staat land van herkomst. Amerikaanse “stayers” zullen met enige regelmaat een trainingswedstrijd over korte afstand (500m) op salt lake kunnen rijden. Kramer bijv. doet dat niet. Wellicht dat dit de adlerskalendern enigszins laat vertekenen. Maar dit heeft dan met name betrekking op de grote stayers die in de top van de lijst staan, maar niet bovenaan zijn gekomen.

    Ik geloof wel dat met het huidige systeem de stayer in het voordeel is. Al is het maar vanwege de belasting in 2 dagen en het herstelvermogen van de stayer. Herstel na dag 1 om “fris” aan dag 2 te beginnen. En het herstellen van de hele zware 1500m voordat je aan de 10k begint. Dit was eerder al eens onderwerp van discussie toen het toernooi over 3 dagen stond, waarbij de heren de 1500 los op zaterdag hadden staan, terwijl de dames de 1500 moesten combineren met een 3km op 1 dag.

    Het voorstel om te allrounden over 500-1000-1500-5000 is met name opmerkelijk, in mijn ogen, omdat een logischere aanpassing was geweest om de 3km in te zetten. Het lijkt me interessant hoe de 500-1500-3000-5000 combi uit deze statistieken zou komen (of eventueel 500-1000-3000-5000)..

    Fysiologisch allround zou je iets moeten hebben van pure sprint (<15sec). Van lange sprint (<1.00min). Iets van een minuut of 4-8. en iets langs (uur ofzo). Volgens mij pak je dan alle verschillende energiezones mee, en heb je dus een allround toernooi (fysiek bekeken). Staat dan nog los van techniek/motoriek wat bij het sprinten natuurlijk extra komt kijken.

  4. Statistisch is dit een goed onderzoek echter de uitkomst is niet realistisch ten opzichte van de huidige schaatsers. 10/15 jaar geleden was specialiseren nog niet noodzakelijk hedendaags moet er worden gespecialiseerd anders haal je nimmer de top. De sprinters zullen in dit onderzoek altijd ondergeschikt naar voren komen omdat zij geen 10 km rijden en heel soms slecht een 5 km als training hebben gereden. Neem nu een hedendaagse schaatser als voorbeeld: Kjeld Nuis tegenover Sven Kramer. Kjeld, middenafstand specialist 1000/1500 met zeer groot sprintvermogen (34.85) Kjeld heeft nooit een 10km gereden en slechts in zijn juniorentijd 2x een 5km. kortom komt niet op de lijst voor. Maar als we nu een toernooi over 500-1000-1500-5000 rijden zal Kjeld zeer hoog inde lijst komen. kijk eens naar zijn pr van de 3000m (dit seizoen in Inzell 3.46) Kjeld is slechts 1 van de namen die niet op een allround lijst voorkomt maar ineen toernooi over 500-1000-1500-5000 wel een titelkandidaat zal zijn. En zo zijn er nog veel meer sprinters. Een toernooi over 500-1000-1500-5000 is GEEN allround toernooi maar een toernooi voor sprinters/middenafstanders die de 5000 moeten overleven. Stayers zijn absoluut in het nadeel. Een toernooi over 500-1500-3000-5000 is dan veel realistischer, iets meer allround maar mag zeker nog geen allround toernooi worden genoemd. In dit geval spreken we over 4 kamp maar niet over allround toernooi omdat niet alle energiesystemen maximaal moeten worden aangesproken. Een 5 km kunnen zeer veel schaatsers aan maar een 10 is andere koek. Juist de combinatie van het beheersen van de 500m en 10km is allround.
    Kortom, leuk onderzoek echter niet realistisch omdat zeer veel sprinters/middenafstanders niet in de lijst komen. Daarnaast is het lezen van namen als Hadrick, Fabris niet reëel tegenover de huidige schaatsers. Je moet kijken naar nu en niet terug in de tijd want toen was schaatsen heel anders dan nu. Ritsma kon zowel WK sprint als Allround rijden.

    1. Als je de PR’s van Kjeld en Sven neerzet in een klassement over 500-1000-1500
      Kramer 36.31 2 2,92 1.09.77 2 71,195 2 8,51 1,43,45 2 105,678
      Nuis 34.85 1 0,00 1.07.02 1 68,360 1 0,00 1.42.92 1 102,666
      Kortom een verschil van 3.012 punten = 18.072 seconden op 3000 en 30.12 seconden op een 5000. Kortom op een 5 km zou onder deze omstandigheden Sven, Nuis een ronde moten inhalen op de 5000.
      rekenen met PR’s is overigens geen maatstaf. Iedere schaatser weet dat ranglijsten, saralijsten, adelaarskalenders niets zeggen over hoe een uitslag op een wedstrijd zal zijn. Onder gelijkwaardige omstandigheden zal een klassement heel anders zijn.
      Kortom, wiskundig kan je niets voorspellen echter je kan wel aantonen dat de sprinters bij een klassement over 500-1000-1500-5000 erg in het voordeel zijn. Natuurlijk veranderd alles als je de volgorde van de afstanden zou veranderen. De 500m drukt zeer zwaar op een klassement.Misschien moeten we alles maar eens terug gaan rekenen naar een 1500 want dat is een allround afstand! je moet absolute snelheid hebben maar ook uithoudingsvermogen. Als je toch wiskundig bezig ben, maak dan eens een tabel waarbij een puntentotaal wordt omgerekend op basis van een 1500. Erg benieuwd wat dat voor effect heeft op een klassement.

  5. M.i. is het eigenlijk niet correct om je af te vragen of sprinters benadeeld worden bij de huidige opzet van allround toernooien, want sprinters zijn sprinters en die doen niet mee aan een allround toernooi (Wennemars en sprinters die goud op de 500 meter willen winnen en daarna langzaam van het toneel verdwijnen daar gelaten). We gaan toch ook geen 3,000 of 5,000 meter aan een sprint toernooi toevoegen, omdat de stayers anders in het nadeel zijn.

    Een betere vraag is, of schaatsers met primair een sprint aanleg (fast twitching muscles dominant –> korte, explosieve inspanningen) benadeeld worden t.o.v. schaatser met primair een stayers aanleg (slow twitching muscles –> langdurige, minder intensieve inspanningen).

    Je kan wereldkampioen allround worden vanuit een “sprint aanleg” en vanuit een “stayers” aanleg. Maar een pure sprinter (type Tae-bum Mo, Hiroyasu Shimizu, Kyou-hyuk Lee) zal nooit wereldkampioen allround worden en een pure stayer (type Bob de Jong, Jorrit Bergsma) ook niet. Gianni Romme is wellicht een uitzondering, maar dat was een uitzonderlijk talent en die reed ook een patente 1500 meter.
    Kortom, je moet allround zijn om wereldkampioen allround te worden (en je kan je ook afvragen of de pure sprinters worden benadeeld bij de huidige opzet van de sprintvierkamp, zou dat vanuit een puur sprint perspectief niet bijvoorbeeld 100/300/500/700 meter moeten zijn?).

    Maar, …. de meeste schaatsers met een sprint aanleg trainen niet voor een allround kampioenschap (vooral niet in deze tijd van specialisatie). En als ze dat wel doen: kijk naar Shani Davis, die heeft primair sprint aanleg (resultaat: wereldkampioen sprint), maar heeft zich ook een tijd gericht op allround en is daar ook 2 keer wereldkampioen in geworden. En twee van de beste allrounders aller tijden (Schenk, Heiden), zijn meerdere keren wereldkampioen allround geweest, vanuit een sprint aanleg.

    Dan de vraag of schaatsers met een sprint aanleg benadeeld worden bij de huidige opzet?
    De huidige opzet kent 2 afstanden die de schaatser met een stayers aanleg bevoordelen (5k en 10k) en 2 afstanden die de schaatsers met een sprint aanleg bevoordelen (500m en 1500m). Dat lijkt dus een faire verdeling.
    En “sprinters” krijgen op hun specialiteit een behoorlijk rekenkundig voordeel. Een sprinter die 1 seconde wint op de 500 meter mag 10 seconden verliezen op de 5,000 meter, dat is 130 meter en dat is een behoorlijk stuk. En na 2,5 seconde winst op de 1500 meter mogen ze 210 meter (een halve ronde) verliezen op de 10,000 meter. Dus met totaal 50 meter winst op de 2 korte afstanden, mag een “sprinter” 340 meter verliezen op de 2 lange afstanden. Geen slechte deal lijkt mij.

    Dat de “stayer” Sven Kramer nu het allrounden (nog) domineert heeft meer als verklaring dat hij een uitzonderlijk talent is, dan dat het een bewijs is dat stayers in het voordeel zijn.

    Het spannende van de huidige opzet is of de types Verwey/Youzkov op de 500/1500 voldoende voorsprong pakken om het type Kramer over alle 4 de afstanden voor te blijven (en ik verwacht dat de strijd tussen “stayer” Kramer en “sprinter” Youzkov in Calgary heel spannend gaat worden en misschien mengt “sprinter” Verweij zich ook nog in de strijd).

    Mijn conclusie, uit de huidige opzet (500/1500/5000/10000) komt de ware getrainde en geharde allrounder bovendrijven (of vanuit een sprint aanleg, of vanuit een stayers aanleg). De lijst van wereldkampioenen allround kent een behoorlijk aantal schaatsers met een sprint aanleg: Schenk, Heiden, Vergeer, Flaim, Goeljajev, Postma, Davis, Verweij.

    De discussie over de huidige opzet heeft m.i. niets te maken met de vraag welke type schaatser bevoordeeld wordt, maar met het feit dat alleen Nederlanders allrounden nog leuk vinden en omdat de ISU bobo’s ronduit een hekel hebben aan het allrounden en de 10,000 meter.

    De nieuwe opzet (500/1000/1500/5000) is natuurlijk een lachertje. Dit is geen allround toernooi. Een van de beste allrounders aller tijden, Sven Kramer heeft hier niets te zoeken. Sterker nog, ik denk dat misschien wel de helft van de huidige sprintelite hier een goede kans heeft. Deze keuze is dan ook ingegeven door de wens om het allrounden langzaam de nek om te draaien.

    Een veel logischere keuze zou natuurlijk 500/1500/3000/5000 geweest zijn, maar of dat echt allround is? Met deze opzet zou Erben Wennemars m.i. meerdere keren allround kampioen zijn geworden en Erben Wennemars (ontzettend veel respect overigens)….. is een sprinter.

    Overigens denk ik wel dat de opzet 500/1500/3000/5000 het ook internationaal voor veel meer schaatsers aantrekkelijk zou maken om te gaan allrounden en misschien worden de toernooien er een stuk spannender van (maar ik zal de klassieke vierkamp gaan missen).

  6. idd, waarom zou een sprinter een allround toernooi MOETEN kunnen winnen??? dat is de aanname uit je artikel Miriam. Ikzelf vind het altijd oneerlijk dat Bolt de tienkamp niet kan winnen. Ik stel voor dat we DAAROM de tienkamp aanpassen. met afstanden als 50m, 60m, 100m, 200m , 80m, 140 m en een 400 m en 800m Dan heeft Bolt ook een kans!
    Vind je dat absurd? Is ook zo. Sprinters kunnen… jawel het wk-sprint winnen. Als ze nu alle kans gaan maken op een soort ek-sprintplus dat we een ek-allround noemen, tsja. Wat kunnen stayers dan nog winnen?
    Dan moeten we een stayerskampioenschap erbij houden: een vierkamp met 3000, 5000 10.000 en 20.000 m?

    1. Beste Renzo,

      Sprinters hoeven wat mij betreft niet perse te winnen, maar ook niet perse te verliezen. Het zou raar zijn als Bolt de 10-kamp zou winnen, want hij is waarschijnlijk een erg slechte speerwerper, discuswerper en kogelstoter. Net zo goed zou het gek zijn als een sprinter met een erg slechte lange afstand allroundkampioen zou worden. Maar een erg goede sprinter, met een redelijke lange afstand zou wat mij betreft net zoveel kans moeten hebben om te winnen als een erg goede langeafstandsrijder met een redelijke 500 meter. En dat is nu niet zo, omdat er twee lange afstanden zijn en maar een sprintafstand. Allround betekent “van alle markten thuis”. Wat mij betreft is dat korte afstand, midden afstand en lange afstand. Het EK-sprintplus vind ik ook geen goed idee, en dat komt ook uit de analyse. Stayers kunnen prima winnen in de variant 500-1500-3000-5000. En bij de World Cups en WK afstanden.

      1. Stayers winnen niet in de 3000-5000 modus. Je kan nog zo mooi met cijfers goochelen maar in een wedstrijd met gelijke omstandigheden is alles anders. Laten we dus ophouden met deze statistische onzin maar laat er naar kijken door echte kenners. Stayers winnen een 10km Bergsma, sprinters winnen een 500 Smeekes. Allrounders winnen een grote vierkamp, kramer. En middenafstanders winnen een kleine 4 kamp 500-1500-3000-5000 Morrison, en vele anderen.

  7. Beste Miriam. Ik ben bezig met een opdracht voor mijn school (6vwo) en ik wil jouw analyse ook toepassen op tijden van junioren en onderzoeken of het tot dezelfde conclusies leidt. Ik ben zelf namelijk ook wedstrijdschaatsster. Ik heb je artikel en blog gelezen. Ik begrijp niet goed hoe je de principale componenten analyse toepast en hoe je de principal components hebt bepaald. Ik wil dit wel graag begrijpen. Heb jij voor de onderliggende berekeningen? Alvast bedankt en groetjes Robin

Laat een reactie achter op miriamenstatistiek Reactie annuleren