Anvendelse af vinderchancer tilføjet for at bestemme ligaens scoringsregler
For mig selv og mange andre er fantasy football en sjov hobby grænsende til besættelse. Jeg er heldig at være medlem af store ligaer, og som følge heraf er jeg følelsesmæssigt investeret i mine hold hvert år. Uanset om det er fantasy-podcasts, at se kampene om søndagen eller at overanalysere waiver wire – jeg bruger omkring timer hvert år på fantasy football. Mine ligakammerater, som måske eller måske ikke læser dette, ville på dette tidspunkt glædeligt påpege min manglende mesterskabs-ROI på denne investerede tid.
Hvis jeg ikke kan deltage i mesterskabernes glæder, har jeg incitament til at forbedre glæden ved den vej, der i sidste ende ender i skuffelse. Jeg tror, at en måde at gøre det på er at forbedre fantasy reglernes format. De fleste scoringsregler er ikke kun arbitrære, men kommer også fra en anden æra i NFL. For eksempel er passing rates steget, og rollen som “workhorse” running back er gået drontefuglens vej. Udfordringen er at gøre ligaens scoring både fornøjelig, men også fornuftig.
Forudsætningen
Fantasy scoringregler kan placeres på et spektrum. I den ene ende kan scoringsreglerne være fuldstændig arbitrære. En liga med fuldstændig arbitrær scoring kan have 3 point for et første down, 2 point for et rushing touchdown og 6,21 point for at kaste en interception. En sådan liga kan være sjov på grund af den rene absurditet, og den kræver stadig strategi. Jeg sigter dog på den anden side af spektret. Jeg laver dette eksperiment, så jeg kan vide, inden for rimelighedens grænser, hvilket fantasy pointsystem der bedst afspejler vindende spil på banen. Lad os sige, at det er 3. og 1, og du har den løbende back. Det er en hård yard at vinde! Hvis din running back bryder en tackling og konverterer første down på et dyk på én yard, får en fantasy-spiller i traditionelle formater stadig kun 0,1 point. Det er ikke rigtigt! Den yard var en meget svær yard at vinde. I stedet kan vi bruge et WPA-baseret system (Win Probability Added). Når holdene opnår en first down, tilføjer de næsten altid en målbar mængde sejrssandsynlighed! På den anden side er et løb på en yard på første down ikke nær så fordelagtigt.
Jeg vil gerne understrege, at jeg ikke hævder, at dette er det sjoveste fantasysystem, og at alle ligaer straks bør indføre det. Fordelen ved dette WPA-baserede system er, at det korrekt måler den relative værdi, og hvis en kicker laver 5 chip shots på 30 yards, vil han altså ikke score et gamebreaking antal point. En anden kicker, der misser et 30-yard-spark og laver et 55-yard-spark, vil blive vurderet korrekt i forhold til den første, men også i forhold til en running back, der løber 70 yards.
Spillerbidrag
I sidste ende måler fantasy scoring spillerbidrag, om end dårligt. Når Julio Jones løber for 300 yards i en kamp og ikke scorer et touchdown (ikke bittert), hjælper han sit hold med at bevæge sig ned ad banen og bidrager til sandsynligheden for, at holdet vinder kampen. På samme måde, når Nathan Peterman kaster seks interceptions i første halvleg, så forringer han sit holds sandsynlighed for at vinde og får negative fantasypoint. Hvad nu hvis vi havde adgang til den tilføjede vinderchancelighed for hvert spil i de sidste 10 år? Vi kunne finde på det perfekte fantasysystem, der korrekt måler spillernes bidrag! Okay, jeg vil indrømme, at perfekt er et stærkt ord. Vi er dog heldige. NflscrapR-data har den måleenhed!
Jeg vil hurtigt komme ind på, hvorfor jeg valgte Win Probability Added (WPA) i stedet for Expected Points Added (EPA). Hvad er målet med en offensiv? Næsten altid er det at score point, men nøgleordet er *næsten*. EPA måler et spils evne til at tilføje point, mens WPA måler spillets evne til at vinde kampen. Normalt er den eneste praktiske forskel, når et hold er sent oppe i kampen og forsøger at få tiden til at løbe ud i forhold til at score point (tænk på Todd Gurley, der dykker ved den ene yard-linje og ikke går ind i end zone med vilje). WPA vil give ekstra kredit til spil, der løber uret ud.
Axiomer
Det internationale enhedssystem (SI) definerer et sekund som den tid det tager et Cesium-133 atom i grundtilstanden at svinge præcis 9.192.631.770 gange. Den officielle kilogramvægt er en cylindrisk platin-iridiumlegering, som pr. definition vejer præcis 1 kilogram. Hvorfor i alverden bringer jeg dette på bane? Tja, for ethvert målesystem har man brug for et vilkårligt aksiom, der altid er sandt. I tilfælde af fantasy scoring, gik jeg med en rushing yard = 0,1 fantasy point. Jeg kunne også bruge touchdowns med 6 point, men mine foreløbige eksperimenter vægter touchdowns lavere, og derfor ville de samlede pointsummer være mindre, end du er vant til at se. Hvis dette resulterer i et system, der stinker, ændrer vi det!
Dividerer kredit
Dilemmaet er, hvordan man deler WPA-kredit for hvert spil blandt de 22 spillere på banen i individuel gevinst sandsynlighed tilføjet. Desværre vil vi med de data, der er tilgængelige i øjeblikket, aldrig kunne kreditere spillere som Hines Ward med blocking stats. I fantasy football er dette sandsynligvis en funktion og ikke en fejl. Den tilfældige fan er helt sikkert ligeglad med højre guard-blokeringsstatistikker. Det, hvor det er et problem i fantasy football, er at afgøre kredit mellem QB og WR (eller TE) i forbindelse med et pasningsspil. Hvis Odell Beckham Jr. tager en slant 75 yards til huset, hvor meget kredit får Baker Mayfield så?
Jeg har ikke et perfekt svar på dette spørgsmål, og det generer mig. Hvis vi virkelig ønskede at fordele kreditten korrekt, skulle vi sandsynligvis give ca. 70 % af dybde af target yards til QB’en og 60 % af yards efter catch til receiveren. I fantasy scoringens ånd inden for rimelighedens grænser besluttede jeg at lade være med at forsøge at regne det ud. Desuden tillader selv banebrydende fantasy-websteder ikke den slags scoring.
Alternativt, hvis du bestemmer, at en receiving yard er lig med en rushing yard, så falder resten af receiver-scoringen på plads (fordi alt er relativt). Ikke alene løser dette problemet, men det er også tilfredsstillende. I teorien burde en yard være lig med en yard for en positionsspiller, uanset hvordan den er opnået.
For quarterbacks besluttede jeg at give dem fuld kredit for alle afleveringsstatistikker. Hvis en running back får alle rushing-statistikker, giver det så ikke mening? I traditionelle formater bliver quarterbacks draftet ekstremt sent på trods af, at de er de vigtigste spillere på banen. Faktisk er det en populær fantasy-trend at have to quarterback-ligaer, så QB’erne faktisk har en meningsfuld draftværdi. At give quarterbacks fuld kredit for alle afleveringsstatistikker giver både mening, og det løser dilemmaet med at have ubetydelig draftværdi.
Resultater
Lad os først se på korrelationen mellem de forskellige variabler. Følgende heatmap er for alle positionelle spillerstatistikker på løbsspil eller afleveringsspil, der resulterer i en completion.
Den vigtigste række her er den nederste. Der kan du se, hvordan Win Probability Added korrelerer med positionelle spillerstatistikker. Som du kan se, er first downs meget vigtige! Fumbles er, som forventet, negativt korreleret med win probability. Hvordan kan vi nu komme frem til et fantasy scoringssystem ud fra dette? Jo, vi kan bruge Win Probability Added som en målvariabel. Ved hjælp af resten af variablerne vil lineær regression på passende vis vægte hver enkelt af dem for at forsøge at forudsige WPA. Vi kan derefter skalere disse vægte til et fantasysystem, der giver mening.
Lineære regressionsresultater
Resultaterne er i kolonnen yderst til højre i tabellen. For at være ærlig, er jeg ikke sikker på, at jeg nogensinde ville ønske at spille efter disse regler! Jeg synes dog, at disse regler giver mening. Touchdowns er i princippet bare glorificerede første downs, der kun er to point værd. Der vil stadig blive scoret samme antal point i alt, fordi spillerne samler så mange point ved at lave first downs på vejen til at score touchdowns. Det ødelægger dog de spillere, der spiller 80 yards touchdowns, lidt. Fantasyspillere ville samle meget flere point i midten af feltet, mellem tyverne. Fumbles er meget straffende. Jeg er ikke sikker på, at NFL RedZone-pakken ville være lige så sjov at se på, for hvem bekymrer sig om, at man lige har scoret et touchdown med 2 point! Lad os prøve quarterbacks næste gang.
Note: For QB’ernes vedkommende skulle jeg ud fra et metodisk synspunkt bare sørge for, at jeg ikke medtog receiver fumbles. Resten var bare at regressere passing stats mod WPA.
Sådan noget lignende! I forhold til traditionel scoring er der store straffe for turnovers og store point for first downs. Jeg er ikke sikker på hvorfor fumbles er mindre straffe end interceptions! Måske er fumbles mere almindelige i åbenlyse afleveringssituationer, når der er mere pass rush. I de tilfælde ville udsigterne for drive allerede være dystre.
Lad os sammenligne!
Okay, så har vi vores pointsystem. Hvis det skaleres, så det giver det samme antal fantasypoint som de traditionelle systemer, ville de samme spillere så stige til tops? Her er de 10 bedste positionsspillere i standard scoring vs. de 10 bedste i afrundet WPA. Jeg diskonterede WPA-scoringen, så de 50 bedste spillere scorede det samme antal point som standardscoring.
Fantastisk nok er det en meget ens liste! Jeg kan godt lide at WPA-baseret scoring gør det muligt for receivers at snige sig ind i top 10 af fantasy-scorere. Det virker som om, at bare ved at vægte rushing yards og receptionsyards ens, så er der en fin balance mellem positionerne. På grund af den øgede kompleksitet har jeg heller ikke tilføjet passing stats. Jeg tror, at Saquon måske har haft en passing TD, og derfor er det ikke medtaget i mine WPA-scoringer her. Lad os dernæst prøve quarterbacks:
Også her er rækkefølgen ret ens! Der er dog en stor diskrepans, fordi WPA-baseret scoring virkelig hadede Chiefs/Pat Mahomes. Det skyldes, at Chiefs havde mange 20+ yard plays, og derfor ikke fik så mange first downs. Selv om jeg synes, at WPA gør et bedre stykke arbejde med at rangere resten af ligaen, så var Chiefs et udpræget eksplosivt hold, og jeg synes ikke, at WPA gør et godt stykke arbejde med dem. Dette kunne afbødes med bonusser på 20+ yard plays. Jeg lod også de uskalerede fantasypoint være med denne gang for at gøre en pointe. For running backs og wide receivers var pointtotalerne kun ca. 15 % mere end standard scoring og ca. 15 % mindre end PPR scoring. Sagt på en anden måde var WPA-fantasy for positionsspillere lige midt i midten af de traditionelle scoringsoutput. Men hvis en QB får al kredit for at bestå WPA, så burde deres pointtotal være næsten 3 gange så højt som traditionel scoring. Det er en enorm forskel! Jeg tror, at der nok er en lykkelig middelvej mellem QB-sæsoner med 1.000 point og QB-sæsoner med 350 point, som ville øge QB-draft stock, men ikke gøre dem overpowered.
Encore Graph
Hvor godt måler traditionelle fantasy scoring-formater WPA? Foretager vi alle disse scoringsændringer for en ubetydelig gevinst? Her er korrelationerne mellem WPA og typiske scoringssystemer:
WPA-baseret fantasy-scoring korrelerer naturligvis mere, men jeg er glad for at se, at den korrelerer 9% mere. Jeg lavede dette plot sidst, og jeg ville have været pissed, hvis det var som en 2% forskel. Det korrelerer endnu bedre med Expected Points Added, og margenen mellem det og den nærmeste (PPR) er endnu større på EPA. Mission accomplished!
Konklusion
Traditionelle fantasy scoring formater gør et så-så godt stykke arbejde med at afspejle feltets præstationer. Hvis målet er at forbedre scoringssystemet til at afspejle feltpræstationer, er WPA-baseret scoring bedre. På den anden side vil jeg ikke argumentere for, at WPA-baseret scoring ville være sjovere (jeg vil have 6 point for et touchdown ligesom alle andre!).
Den eneste type liga, som jeg kunne se indføre WPA-baseret scoring, ville være en seriøs liga med høje indsatser. Jeg tror, at spillerne i disse omgivelser ville finde trøst i det faktum, at målet er at vælge den bedste fodboldspiller og ikke den bedste fodboldspiller baseret på vilkårlige regler, der blev fastsat for 20 år siden.
Sidst er her den python-kode, jeg brugte.