Användning av sannolikhet för vinst som lagts till för att bestämma ligans poängregler
För mig själv och många andra är fantasifotboll en rolig hobby som gränsar till besatthet. Jag har turen att vara medlem i bra ligor, och som ett resultat av detta är jag känslomässigt engagerad i mina lag varje år. Vare sig det handlar om fantasy-podcasts, att titta på matcherna på söndag eller att överanalysera waiver wire – jag spenderar ungefär timmar varje år på fantasy-fotboll. Mina ligakamrater, som kanske eller kanske inte läser detta, skulle vid denna tidpunkt glatt påpeka min brist på mästerskapsavkastning på den investerade tiden.
Om jag inte kan delta i mästerskapets glädjeämnen har jag incitament att förbättra glädjeämnena på den väg som i slutändan slutar i besvikelse. Jag tror att ett sätt att göra det är att förbättra fantasiernas regelformat. De flesta poängregler är inte bara godtyckliga utan kommer också från en annan epok i NFL. Till exempel har passningsfrekvensen ökat och rollen som ”workhorse” running back har gått dronofågelns väg. Utmaningen är att göra ligans poängsättning både rolig, men också meningsfull.
Premiss
Fantasy poängsättningsregler kan placeras på ett spektrum. I ena änden kan poängsättningsreglerna vara helt godtyckliga. En liga med helt godtycklig poängsättning kan ha 3 poäng för en första down, 2 poäng för en touchdown i rusning och 6,21 poäng för att kasta en interception. En sådan liga kan vara rolig på grund av den rena absurditeten, men kräver ändå strategi. Jag siktar dock på den andra sidan av spektrumet. Jag gör det här experimentet så att jag kan veta, inom rimliga gränser, vilket fantasypoängsystem som bäst skulle återspegla vinnande spel på planen. Låt oss säga att det är 3:e och 1, och du har running backen. Det är en svår yard att vinna! Om din running back bryter en tackling och omvandlar första down på en dykning på en yard får en fantasispelare i traditionella format ändå bara 0,1 poäng. Det är inte rätt! Den yarden var en mycket svår yard att vinna. Istället kan vi använda ett WPA-baserat system (win probability added). När lagen uppnår en första down lägger de nästan alltid till en mätbar mängd vinstsannolikhet! Å andra sidan är ett lopp på en yard vid första down inte alls lika fördelaktigt.
Jag vill betona att jag inte hävdar att detta är det roligaste fantasysystemet och att alla ligor omedelbart bör införa det. Fördelen med detta WPA-baserade system är att det på ett korrekt sätt mäter det relativa värdet, och om en kicker gör 5 chip shots på 30 yard kommer han alltså inte att få ett spelavgörande antal poäng. En annan kicker som missar en 30-yards spark och gör en 55-yards spark kommer att utvärderas korrekt i förhållande till den första, men också i förhållande till en running back som springer 70 yards.
Spelarbidrag
I slutändan mäter fantasy scoring spelarbidrag, om än på ett dåligt sätt. När Julio Jones går för 300 yards i en match och inte gör en touchdown (inte bittert) hjälper han sitt lag att röra sig på planen och bidrar till sannolikheten att laget vinner matchen. På samma sätt när Nathan Peterman kastar sex interceptions i första halvlek minskar han sitt lags vinstsannolikhet och får negativa fantasipoäng. Tänk om vi hade tillgång till Win Probability Added för varje spel för de senaste 10 åren? Vi skulle kunna ta fram det perfekta fantasysystemet som korrekt mäter spelarens bidrag! Okej, jag erkänner att perfekt är ett starkt ord. Vi har dock tur. NflscrapR-data har det måttet!
Jag ska snabbt ta upp varför jag valde Win Probability Added (WPA) istället för Expected Points Added (EPA). Vad är målet med ett anfall? Nästan alltid är det att göra poäng, men nyckelordet är *nästan*. EPA mäter spelets förmåga att ge poäng, WPA mäter spelets förmåga att vinna matchen. Vanligtvis är den enda praktiska skillnaden när ett lag är sent ute i matchen och försöker få ut klockan i stället för att göra poäng (tänk på Todd Gurley som dyker vid en yardlinjen och inte går in i slutzonen med flit). WPA kommer att ge extra kredit till spel som tar ut klockan.
Axiom
Internationella enhetssystemet (SI) definierar en sekund som den tid det tar för en Cesium-133-atom i grundtillståndet att oscillera exakt 9 192 631 770 gånger. Den officiella kilogramvikten är en cylindrisk platina-iridiumlegering som per definition väger exakt 1 kilogram. Varför i helvete tar jag upp det här? Jo, för varje mätsystem behöver man ett godtyckligt axiom som alltid är sant. När det gäller fantasypoäng har jag valt att använda ett rushing yard = 0,1 fantasypoäng. Även om jag också skulle kunna använda touchdowns med 6 poäng, väger mina preliminära experiment touchdowns lägre och därför skulle den totala poängsumman bli mindre än vad du är van vid att se. Om detta resulterar i ett system som suger så ändrar vi det!
Avdela kredit
Dilemmat är hur man ska dela upp WPA-krediten för varje spel bland de 22 spelarna på planen i individuell vinstsannolikhet som läggs till. Tyvärr kommer vi med de data som för närvarande finns tillgängliga aldrig att kunna tillgodoräkna spelare som Hines Ward blockeringsstatistik. I fantasy football är detta förmodligen en funktion och inte en bugg. Den vanlige fansen bryr sig inte om statistiken för blockeringsstatistik för right guard. Där det är ett problem i fantasy football är att bestämma kredit mellan QB och WR (eller TE) för ett passningsspel. Om Odell Beckham Jr. tar en slant 75 yards till huset, hur mycket kredit får Baker Mayfield?
Jag har inget perfekt svar på den här frågan och det stör mig. Om vi verkligen ville fördela krediterna på ett korrekt sätt skulle vi förmodligen behöva ge ungefär 70 % av djupet av målyards till QB:n och 60 % av yards after catch till mottagaren. För att få fantasypoäng inom rimliga gränser bestämde jag mig för att inte ens försöka försöka räkna ut detta. Dessutom tillåter inte ens avancerade fantasy-webbplatser den typen av poängsättning.
Alternativt, om du bestämmer att en mottagande yard är lika med en rusande yard, så faller resten av poängsättningen för mottagare på plats (eftersom allt är relativt). Detta löser inte bara problemet utan är också tillfredsställande. I teorin ska en yard vara lika med en yard för en positionsspelare oavsett hur den vinns.
För quarterbacks bestämde jag mig för att ge dem full kredit för all passningsstatistik. Om en running back får all rushing-statistik, är det inte rimligt? I traditionella format draftas quarterbacks extremt sent trots att de är de viktigaste spelarna på planen. Faktum är att det är en populär fantasytrend att ha två quarterback-ligor så att QB:s faktiskt har ett meningsfullt draftvärde. Att ge quarterbacks full kredit för all passningsstatistik är både vettigt och löser dilemmat att ha ett försumbart draftvärde.
Resultat
Låt oss först titta på korrelationen mellan olika variabler. Följande värmekarta är för all positionell spelarstatistik på löpspel eller passningsspel som resulterar i ett avslut.
Den viktigaste raden här är den nedersta. Där kan du se hur Win Probability Added korrelerar med positionell spelarstatistik. Som du kan se är first downs mycket viktiga! Fumbles är som väntat negativt korrelerade med win probability. Hur ska vi nu komma fram till ett fantasypoängsystem utifrån detta? Jo, vi kan använda Win Probability Added som en målvariabel. Med hjälp av resten av variablerna kommer linjär regression att på lämpligt sätt väga var och en av dem för att försöka förutsäga WPA. Vi kan sedan skala dessa vikter till ett fantasysystem som är vettigt.
Linjära regressionsresultat
Resultaten finns i den yttersta högra kolumnen i tabellen. Om jag ska vara ärlig är jag inte säker på att jag någonsin skulle vilja spela enligt dessa regler! Jag tycker dock att dessa regler är vettiga. Touchdowns är i princip bara glorifierade första downs, som bara är värda två poäng. Det totala poängantalet skulle fortfarande vara ungefär detsamma, eftersom spelarna samlar så många poäng genom att göra första downs på vägen mot touchdowns. Det är dock lite svårt för spelare som gör touchdowns på 80 yards. Fantasyspelare skulle samla mycket mer poäng i mitten av fältet, mellan tjugoåringarna. Fumbles är mycket straffbart. Jag är inte säker på att NFL RedZone-paketet skulle vara lika roligt att titta på, för vem bryr sig om man bara gör en touchdown med två poäng? Låt oss försöka med quarterbacks härnäst.
Note: För QB:s, ur metodologisk synvinkel, var jag bara tvungen att se till att inte inkludera receiver fumbles. Resten var bara att regressera passningsstatistik mot WPA.
Samma sak! I förhållande till traditionell poängsättning finns det tunga straff för turnovers och stora poäng för first downs. Jag är inte säker på varför fumbles är mindre straffade än interceptions! Kanske är fumbles vanligare i uppenbara passningssituationer, när det finns mer passningsrushen. I de fallen skulle utsikterna för drive redan vara dystra.
Let’s Compare!
Okej, så vi har vårt poängsystem. Om det skalas så att det ger lika många fantasipoäng som traditionella system, skulle samma spelare stiga till toppen? Här är de 10 bästa positionsspelarna i standardpoäng jämfört med de 10 bästa i avrundat WPA. Jag diskonterade WPA-poängen så att de 50 bästa spelarna gav samma antal poäng som standardpoängen.
Otroligt nog är det en väldigt likartad lista! Jag gillar att WPA-baserad poängsättning gör det möjligt för receivers att smyga sig in på topp 10 av fantasypoängare. Det verkar som att bara genom att väga rushing yards och reception yards lika så finns det en fin balans mellan positionerna. På grund av ökad komplexitet har jag inte heller lagt till passningsstatistik. Jag tror att Saquon kan ha haft en passing TD, så det ingår inte i mina WPA-poäng här. Låt oss sedan prova quarterbacks:
Också här är ordningen ganska likartad! Det finns dock en stor diskrepans eftersom WPA-baserad poängsättning verkligen hatade Chiefs/Pat Mahomes. Detta beror på att Chiefs hade många 20+ yard-spel och därför inte fick så många första downs. Även om jag tycker att WPA gör ett bättre jobb när det gäller att rangordna resten av ligan, var Chiefs ett explosivt lag som var ett undantag och jag tycker inte att WPA gör ett bra jobb med dem. Detta skulle kunna mildras med bonusar för spel på över 20 yards. Jag lämnade också in de oskalade fantasipoängen den här gången för att göra en poäng. För running backs och wide receivers var poängsumman bara cirka 15 % mer än standardpoängen och ungefär 15 % mindre än PPR-poängen. Med andra ord var WPA-fantasy för positionsspelare precis i mitten av traditionella poängutgångar. Men om en QB får all kredit för att passera WPA, så borde deras poängsumma vara nästan tre gånger så stor som traditionell poängsättning. Det är en enorm skillnad! Jag tror att det förmodligen finns en gyllene medelväg mellan QB-säsonger med 1 000 poäng och QB-säsonger med 350 poäng som skulle öka QB-draftstocken utan att göra dem överstyrda.
Encore Graph
Hur väl mäter traditionella fantasy-scoring-format WPA? Gör vi alla dessa ändringar i poängsättningen för en försumbar vinst? Här är korrelationerna mellan WPA och typiska poängsystem:
WPA-baserad fantasypoängsättning korrelerar uppenbarligen mer, men det gläder mig att den korrelerar 9% mer. Jag gjorde den här plotten senast, och jag skulle ha blivit förbannad om det var som en skillnad på 2 %. Den korrelerar ännu bättre med Expected Points Added, och marginalen mellan den och den närmaste (PPR) är ännu större på EPA. Uppdraget slutfört!
Slutsats
Traditionella fantasypoängformat gör ett så pass bra jobb när det gäller att reflektera över prestationer på fältet. Om målet är att förbättra poängsystemet för att reflektera över fältprestanda är WPA-baserad poängsättning bättre. Å andra sidan tänker jag inte hävda att WPA-baserad poängsättning skulle vara roligare (jag vill ha 6 poäng för en touchdown precis som alla andra!).
Den enda typ av liga som jag skulle kunna tänka mig att införa WPA-baserad poängsättning skulle vara en seriös liga med höga insatser. Jag tror att spelarna i dessa sammanhang skulle känna sig trygga med att målet är att välja den bästa fotbollsspelaren, och inte den bästa fotbollsspelaren baserat på godtyckliga regler som fastställdes för 20 år sedan.
Slutligt, här är pythonkoden som jag använde.