Het gebruik van winstkansen om de scoreregels van de competitie te bepalen
Voor mijzelf en vele anderen is fantasievoetbal een leuke hobby die grenst aan een obsessie. Ik heb het geluk lid te zijn van geweldige competities, en als gevolg daarvan ben ik elk jaar emotioneel betrokken bij mijn teams. Of het nu gaat om fantasy podcasts, het kijken naar de wedstrijden op zondag, of het analyseren van de waiver wire – ik besteed elk jaar ongeveer uren aan fantasy football. Mijn competitiegenoten, die dit al dan niet lezen, zouden op dit moment vrolijk wijzen op mijn gebrek aan kampioenschap ROI op die geïnvesteerde tijd.
Als ik niet kan deelnemen aan de geneugten van kampioenschappen, heb ik stimulans om de geneugten van de weg die uiteindelijk eindigt in teleurstelling te verbeteren. Ik denk dat een manier om dit te doen is de fantasie spelregels te verbeteren. De meeste scoringsregels zijn niet alleen arbitrair, maar komen ook uit een ander tijdperk in de NFL. Het aantal passes is bijvoorbeeld toegenomen en de rol van “workhorse” running back is verdwenen uit het tijdperk van de dodo vogel. De uitdaging is om de puntentelling in de competitie plezierig, maar ook zinvol te maken.
Het uitgangspunt
Fantasy puntentellingsregels kunnen op een spectrum worden geplaatst. Aan de ene kant kunnen de puntenregels volledig willekeurig zijn. Een competitie met volledig willekeurige puntentelling zou 3 punten kunnen hebben voor een eerste down, 2 punten voor een rush touchdown, en 6.21 punten voor het gooien van een interception. Zo’n competitie kan leuk zijn vanwege de absurditeit, en vereist ook nog steeds strategie. Ik mik echter op de andere kant van het spectrum. Ik doe dit experiment zodat ik kan weten, binnen alle redelijkheid, welk fantasie scoringssysteem het beste het winnende spel op het veld zou weergeven. Laten we zeggen dat het 3de en 1 is, en je hebt de running back. Dat is een moeilijke yard om te winnen! Als je running back een tackle breekt en de eerste down maakt met een duik van één yard, dan krijgt een fantasiespeler in traditionele formats nog steeds maar 0.1 punt. Dat is niet juist! Die yard was een zeer moeilijke yard om te winnen. In plaats daarvan kunnen we een win kans toegevoegd (WPA) gebaseerd systeem gebruiken. Wanneer teams een eerste down halen, voegen ze bijna altijd een meetbare hoeveelheid winstkansen toe! Aan de andere kant is een run van één yard op de eerste down lang niet zo voordelig.
Ik wil benadrukken dat ik niet beweer dat dit het leukste fantasie-systeem is en dat alle competities het onmiddellijk zouden moeten overnemen. Het voordeel van dit op WPA gebaseerde systeem is dat het de relatieve waarde correct meet, en dus als een kicker 5 keer een 30-yard chipshot maakt, zal hij geen spelbrekend aantal punten scoren. Een andere kicker die een 30-yard kick mist en een 55-yard kick maakt, zal correct worden geëvalueerd ten opzichte van de eerste, maar ook ten opzichte van een running back die 70 yards rent.
Player Contribution
Ultimately fantasy scoring meet de bijdrage van spelers, zij het op een slechte manier. Als Julio Jones 300 yards loopt in een wedstrijd, en geen touchdown scoort (niet bitter), helpt hij zijn team om het veld op te komen en draagt hij bij aan de waarschijnlijkheid dat het team de wedstrijd wint. Op dezelfde manier, wanneer Nathan Peterman zes interceptions gooit in de eerste helft, doet hij afbreuk aan de winstkansen van zijn team en krijgt hij negatieve fantasy-punten. Wat als we toegang hadden tot de Win Probability Added van elk spel van de laatste 10 jaar? We zouden het perfecte fantasie systeem kunnen bedenken dat de bijdrage van spelers correct meet! Oké, ik geef toe, perfect is een groot woord. Maar we hebben geluk. NflscrapR data heeft die metriek!
Ik zal snel uitleggen waarom ik heb gekozen voor Win Probability Added (WPA) in plaats van Expected Points Added (EPA). Wat is het doel van een aanval? Bijna altijd is dat punten scoren, maar het sleutelwoord is *al bijna*. EPA meet de mogelijkheid van een spel om punten toe te voegen, WPA meet de mogelijkheid van het spel om de wedstrijd te winnen. Gewoonlijk is het enige praktische verschil wanneer een ploeg laat in de wedstrijd staat en probeert de klok uit te spelen vs. punten te scoren (denk aan Todd Gurley die duikt op de one yard lijn, en niet opzettelijk in de end zone gaat). WPA zal extra krediet geven aan wedstrijden die de klok uitlopen.
Axioma’s
Het Internationaal Stelsel van Eenheden (SI) definieert één seconde als de tijd die een Cesium-133 atoom in de grondtoestand nodig heeft om precies 9.192.631.770 keer te oscilleren. Het officiële kilogramgewicht is een cilindrische platina-iridiumlegering die per definitie precies 1 kilogram weegt. Waarom begin ik hier in godsnaam over? Nou, voor elk meetsysteem, heb je een willekeurig axioma nodig dat altijd waar is. In het geval van fantasie scoring, ging ik met een rush yard = 0,1 fantasie punten. Hoewel ik ook touchdowns van 6 punten zou kunnen gebruiken, wegen mijn voorlopige experimenten touchdowns lager en dus zouden de puntentotalen kleiner zijn dan je gewoon bent te zien. Als dit resulteert in een systeem dat zuigt, veranderen we het!
Krediet verdelen
Het dilemma is hoe WPA-krediet voor elk spel te verdelen onder de 22 spelers op het veld in individuele winstkansen opgeteld. Helaas, met de gegevens die nu beschikbaar zijn, zullen we nooit in staat zijn om spelers als Hines Ward te crediteren met blokkeer-statistieken. In fantasie voetbal is dit waarschijnlijk een kenmerk en geen fout. De gewone fan geeft zeker niet om de blokkeer statistieken van de rechter guard. Waar het een probleem is in fantasie voetbal is de beslissing tussen de QB en WR (of TE) voor een pass play. Als Odell Beckham Jr. een slant 75 yards naar het huis neemt, hoeveel krediet krijgt Baker Mayfield dan?
Ik heb geen perfect antwoord op deze vraag, en het zit me dwars. Als we de punten echt goed zouden willen verdelen, zouden we waarschijnlijk ongeveer 70% van de depth of target yards aan de QB moeten geven, en 60% van de yards after catch aan de receiver. In de geest van een redelijke fantasieberekening, heb ik besloten om zelfs geen poging te doen om dat uit te zoeken. Als alternatief, als je bepaalt dat één ontvangende yard gelijk is aan één rushing yard, dan valt de rest van de score van de receiver op zijn plaats (omdat alles relatief is). Dit lost niet alleen het probleem op, maar het is ook bevredigend. In theorie zou één yard gelijk moeten zijn aan één yard voor een positiespeler, ongeacht de manier waarop de yard is verkregen.
Voor quarterbacks heb ik besloten om ze alle passing-statistieken te geven. Als een running back alle rushing statistieken krijgt, is dat dan niet logisch? In traditionele formaten worden quarterbacks erg laat opgesteld, ondanks dat ze de belangrijkste spelers op het veld zijn. In feite is het een populaire fantasie trend om twee quarterback competities te hebben, zodat QB’s ook echt een betekenisvolle waarde hebben. Kwartbacks volledige krediet geven voor alle passstatistieken is logisch, en het lost het dilemma op van het hebben van verwaarloosbare ontwerpwaarde.
Resultaten
Laten we eerst eens kijken naar de correlatie van verschillende variabelen. De volgende heat map is voor alle positie spelers statistieken op run plays of pass plays die resulteren in een completion.
De belangrijkste rij hier is de onderste. Daar kunt u zien hoe de Win Probability Added correleert met de positiestatistieken van de spelers. Zoals u kunt zien, zijn eerste downs erg belangrijk! Fumbles, zoals verwacht, zijn negatief gecorreleerd met winstkansen. Nu, hoe komen we tot een fantasie scoringssysteem op basis van dit? Wel, we kunnen Win Probability Added gebruiken als een doelvariabele. Gebruikmakend van de rest van de variabelen, zal lineaire regressie elke variabele op de juiste manier wegen om te proberen WPA te voorspellen. We kunnen die gewichten dan schalen in een fantasiesysteem dat zinvol is.
Lineaire regressieresultaten
Zulke dingen! In vergelijking met de traditionele puntentelling zijn er zware straffen voor turnovers en enorme punten voor first downs. Ik weet niet zeker waarom er minder straffen worden uitgedeeld voor fumbles dan voor interceptions! Misschien komen die vaker voor in voor de hand liggende pass-situaties, wanneer er meer pass rush is. In die gevallen zijn de vooruitzichten al somber.
Let’s Compare!
Okee, dus we hebben ons puntensysteem. Als het zo geschaald wordt dat het hetzelfde aantal fantasy punten oplevert als traditionele systemen, zouden dezelfde spelers dan naar de top stijgen? Hier zijn de top 10 positie spelers in standaard scoring versus de top 10 in afgeronde WPA. Ik heb de WPA puntentelling verdisconteerd zodat de top 50 spelers hetzelfde aantal punten scoorden als de standaard puntentelling.
Verbazingwekkend, het is een zeer vergelijkbare lijst! Ik vind het leuk dat op WPA gebaseerde scoring het mogelijk maakt dat receivers in de top 10 van fantasy scorers kunnen sluipen. Door rushing yards en reception yards hetzelfde te wegen, lijkt er een mooie balans te zijn tussen de posities. Ook heb ik, vanwege de complexiteit, geen passstatistieken toegevoegd. Ik denk dat Saquon misschien een TD heeft gehad, en dus is dat niet meegenomen in mijn WPA scores hier. Laten we nu eens quarterbacks proberen:
Opnieuw is de volgorde redelijk gelijk! Er is echter een grote discrepantie, omdat op WPA gebaseerde scoring echt een hekel had aan de Chiefs/Pat Mahomes. Dit komt omdat de Chiefs veel plays van meer dan 20 yard hadden, en daardoor niet zoveel first downs scoorden. Hoewel ik denk dat WPA de rest van de competitie beter indeelt, waren de Chiefs een explosief team en ik denk niet dat WPA hen goed indeelt. Dit zou verzacht kunnen worden met bonussen voor 20+ yard plays. Ik heb deze keer ook de ongeschaalde fantasy points erin gelaten om een punt te maken. Voor running backs en wide receivers waren de puntentotalen slechts ongeveer 15% meer dan bij de standaard scoring, en ongeveer 15% minder dan bij de PPR scoring. Met andere woorden, WPA fantasie voor positiespelers lag precies in het midden van de traditionele puntentelling. Echter, als een QB alle krediet krijgt voor het halen van WPA, dan zouden hun puntentotalen bijna 3 keer zoveel moeten zijn als de traditionele puntentelling. Dat is een enorm verschil! Ik denk dat er waarschijnlijk een gulden middenweg is tussen QB-seizoenen van 1000 punten en QB-seizoenen van 350 punten, waardoor de draft stock van QB’s toeneemt zonder dat ze overpowered worden.
Encore Graph
Hoe goed meten traditionele fantasie scoringsformaten WPA? Maken we al deze scoringswijzigingen voor een verwaarloosbare winst? Hier zijn de correlaties tussen WPA en typische scoresystemen:
WPA-gebaseerde fantasyscores correleren duidelijk meer, maar ik ben blij om te zien dat het 9% meer correleert. Ik heb deze plot laatst gemaakt, en ik zou boos zijn geweest als het maar 2% verschil was. Het correleert zelfs beter met Expected Points Added, en de marge tussen het en de dichtstbijzijnde (PPR) is nog groter op EPA. Missie volbracht!
Conclusie
Traditionele fantasie scoring formaten doen een matig werk van het weerspiegelen van veldprestaties. Als het doel is om het scoresysteem te verbeteren om de veldprestaties te weerspiegelen, dan is WPA-gebaseerd scoren beter. Aan de andere kant ga ik niet beweren dat op WPA gebaseerde puntentelling leuker zou zijn (ik wil 6 punten voor een touchdown, net als iedereen!)
Het enige type competitie dat ik zou kunnen zien om op WPA gebaseerde puntentelling in te voeren, zou een serieuze competitie met hoge inzet zijn. Ik denk dat spelers in die instellingen troost zouden vinden in het feit dat het doel is om de beste voetballer te kiezen, en niet de beste voetballer op basis van arbitraire regels die 20 jaar geleden zijn ingesteld.
Tot slot, hier is de python-code die ik heb gebruikt.