Použití pravděpodobnosti vítězství přidané k určení pravidel bodování ligy
Pro mě a mnoho dalších je fantasy fotbal zábavný koníček hraničící s posedlostí. Mám to štěstí, že jsem členem skvělých lig, a díky tomu jsem do svých týmů každoročně emocionálně investován. Ať už jde o fantasy podcasty, sledování nedělních zápasů nebo přehnanou analýzu waiver listu – fantasy fotbalu věnuji každý rok zhruba hodiny. Moji ligoví spoluhráči, kteří to mohou, ale nemusí číst, by mě v tuto chvíli radostně upozornili na nedostatečnou návratnost investic do šampionátu za tento investovaný čas.
Jestliže se nemohu účastnit radostí šampionátu, mám motivaci vylepšovat radosti na cestě, která nakonec končí zklamáním. Myslím, že jedním ze způsobů, jak toho dosáhnout, je zlepšit formát pravidel fantasy. Většina pravidel pro bodování je nejen svévolná, ale také pochází z jiné éry NFL. Například se zvýšil počet přihrávek a role „workhorse“ running backa šla cestou ptáka dodo. Úkolem je, aby bodování ligy bylo příjemné, ale zároveň dávalo smysl.
Předpoklad
Pravidla pro bodování ve fantasy lze zařadit do určitého spektra. Na jednom konci mohou být pravidla bodování zcela libovolná. Liga se zcela libovolným bodováním může mít 3 body za první down, 2 body za rushing touchdown a 6,21 bodu za hod interception. Taková liga může být zábavná, protože je čistě absurdní, a zároveň stále vyžaduje strategii. Já však mířím na druhou stranu spektra. Tento experiment dělám proto, abych v rámci možností věděl, jaký systém fantasy bodování by nejlépe odrážel vítězné hry na hřišti. Řekněme, že je 3. a 1 a vy máte běžícího hráče. To je těžký yard k získání! Pokud váš running back prolomí tackle a promění první down na jeden yard, v tradičních formátech fantasy hráč stále obdrží pouze 0,1 bodu. To není správné! Tento yard je velmi těžké získat. Místo toho můžeme použít systém založený na přidané pravděpodobnosti výhry (WPA). Když týmy dosáhnou prvního downu, téměř vždy přidávají měřitelné množství pravděpodobnosti výhry! Na druhou stranu běh o jeden yard na první down není zdaleka tak výhodný.“
Rád bych zdůraznil, že netvrdím, že tento systém je nejzábavnějším fantasy systémem a že by ho měly okamžitě přijmout všechny ligy. Výhodou tohoto systému založeného na WPA je to, že správně měří relativní hodnotu, a tak pokud kopáč udělá pět třicetimetrových hodů, nezíská herní množství bodů. Jiný kopáč, který mine 30yardový kop a provede 55yardový kop, bude správně ohodnocen vzhledem k prvnímu, ale také vzhledem k běžci, který uběhne 70 yardů.
Přínos hráče
V konečném důsledku měří fantasy bodování přínos hráče, i když špatně. Když Julio Jones uběhne v zápase 300 yardů a nezaznamená touchdown (není to hořké), pomáhá svému týmu pohybovat se po hřišti a přispívá k pravděpodobnosti, že tým vyhraje zápas. Stejně tak když Nathan Peterman hodí v prvním poločase šest interceptions, snižuje pravděpodobnost výhry svého týmu a dostává záporné fantasy body. Co kdybychom měli přístup k pravděpodobnosti výhry přidané ke každé hře za posledních 10 let? Mohli bychom vymyslet dokonalý fantasy systém, který by správně měřil přínos hráčů! Dobře, uznávám, že dokonalý je silné slovo. Ale máme štěstí. Data NflscrapR tuto metriku mají!“
Rychle se vyjádřím k tomu, proč jsem zvolil metodu Win Probability Added (WPA) místo Expected Points Added (EPA). Co je cílem útoku? Téměř vždy je to získávání bodů, ale klíčové slovo je *téměř*. EPA měří schopnost hry přidat body, WPA měří schopnost hry vyhrát zápas. Obvykle je jediný praktický rozdíl v tom, když tým v závěru zápasu vede a snaží se vyčerpat čas vs. získat body (vzpomeňte si na Todda Gurleyho, který se potápí na jednoyardové čáře a záměrně nejde do koncové zóny). WPA bude přidávat body hrám, které vyčerpají čas.
Axiomy
Mezinárodní soustava jednotek (SI) definuje jednu sekundu jako dobu, za kterou atom Cesia-133 v základním stavu osciluje přesně 9 192 631 770krát. Oficiální kilogramové závaží je válcová slitina platiny a iridia, která podle definice váží přesně 1 kilogram. Proč o tom sakra mluvím? Inu, pro každý systém měření potřebujete libovolné axiomy, které jsou vždy pravdivé. V případě fantasy bodování jsem se rozhodl, že jeden rushing yard = 0,1 fantasy bodu. Mohl bych sice také použít touchdown za 6 bodů, ale při mých předběžných experimentech jsem touchdownům přikládal nižší váhu, a tak by celkové bodové součty byly menší, než jste zvyklí vídat. Pokud výsledkem bude systém, který bude stát za prd, změníme ho!“
Dělení kreditů
Dilema spočívá v tom, jak rozdělit kredity WPA za každou hru mezi 22 hráčů na hřišti na jednotlivé přidané pravděpodobnosti výhry. Bohužel s údaji, které jsou v současné době k dispozici, nikdy nebudeme schopni připsat hráčům jako Hines Ward statistiky blokování. Ve fantasy fotbale je to pravděpodobně vlastnost a ne chyba. Běžného fanouška určitě nezajímají statistiky blokování pravého obránce. Problémem ve fantasy fotbale je rozhodování o zápočtu mezi QB a WR (nebo TE) při přihrávce. Pokud Odell Beckham Jr. zahraje šikmou přihrávku na 75 metrů, kolik bodů dostane Baker Mayfield?
Na tuto otázku nemám ideální odpověď a trápí mě to. Kdybychom chtěli opravdu správně rozdělit body, museli bychom asi dát zhruba 70 % yardů z hloubky cíle QB a 60 % yardů po chycení receiverovi. V duchu fantasy bodování v rozumných mezích jsem se rozhodl, že se ani nebudu pokoušet to zjistit. Navíc ani nejmodernější fantasy weby takový způsob bodování neumožňují.
Případně, pokud určíte, že jeden receiving yard se rovná jednomu rushing yardu, pak zbytek bodování receiverů zapadne na své místo (protože všechno je relativní). Nejenže to řeší problém, ale je to také uspokojivé. Teoreticky by se měl jeden yard rovnat jednomu yardu pro pozičního hráče bez ohledu na to, jakým způsobem byl získán.
U rozehrávačů jsem se rozhodl, že jim dám plný počet bodů do všech statistik přihrávek. Pokud běžící bek dostane všechny statistiky za běh, nedává to smysl? V tradičních formátech jsou rozehrávači draftováni extrémně pozdě, přestože jsou nejdůležitějšími hráči na hřišti. Ve skutečnosti je oblíbeným fantasy trendem mít ligy se dvěma quarterbacky, aby měli QB skutečně smysluplnou draftovou hodnotu. Přiznání plného počtu bodů quarterbackům za všechny statistiky přihrávek jednak dává smysl, jednak řeší dilema, že mají zanedbatelnou draftovou hodnotu.
Výsledky
Podívejme se nejprve na korelaci různých proměnných. Následující tepelná mapa se týká všech statistik pozičních hráčů při rozehrávkách nebo přihrávkách, které vedou k zakončení.
Nejdůležitější je zde spodní řádek. Tam vidíte, jak přidaná pravděpodobnost výhry koreluje s pozičními statistikami hráčů. Jak vidíte, první downs jsou velmi důležité! Fumbly podle očekávání negativně korelují s pravděpodobností vítězství. A teď, jak na základě toho vymyslíme systém fantasy bodování? No, můžeme použít přidanou pravděpodobnost výhry jako cílovou proměnnou. Pomocí ostatních proměnných lineární regrese vhodně zvážíme každou z nich a pokusíme se předpovědět WPA. Tyto váhy pak můžeme škálovat do fantasy systému, který dává smysl.
Výsledky lineární regrese
Výsledky jsou v pravém sloupci tabulky. Upřímně řečeno, nejsem si jistý, jestli bych někdy chtěl hrát podle těchto pravidel! Přesto si myslím, že tato pravidla dávají smysl. Touchdowny jsou v podstatě jen oslavované první downy, které mají hodnotu pouze dvou bodů. Stále byste měli podobný počet získaných bodů, protože hráči na cestě za touchdownem nasbírají tolik bodů za první downy. Trochu to však kazí hráčům, kteří hrají touchdowny na 80 yardů. Fantasy hráči by nasbírali mnohem více bodů ve středu pole, mezi dvacítkami. Fumbles jsou velmi trestné. Nejsem si jistý, jestli by sledování balíčku NFL RedZone bylo tak zábavné, protože koho zajímá, jestli jste právě získali touchdown za 2 body! Jako další zkusíme rozehrávače.
Poznámka: U QB jsem se z hlediska metodiky musel jen ujistit, že jsem nezapočítal fumble receiverů. Zbytek byla jen regrese statistik přihrávek vůči WPA.
Podobné věci! Oproti tradičnímu bodování jsou zde velké tresty za obraty a obrovské body za první downy. Nejsem si jistý, proč jsou fumble méně penalizovány než interceptions! Možná jsou fumble častější ve zjevných situacích při přihrávkách, kdy je větší pass rush. V těchto případech by už vyhlídky na drive byly neradostné.
Dobře, takže máme náš bodovací systém. Kdyby se škáloval tak, aby dával stejný počet fantasy bodů jako tradiční systémy, stoupali by nahoru stejní hráči? Zde je 10 nejlepších pozičních hráčů ve standardním bodování oproti 10 nejlepším hráčům v zaokrouhleném WPA. Snížil jsem bodování WPA tak, aby prvních 50 hráčů získalo stejný počet bodů jako při standardním bodování.
Úžasné, je to velmi podobný seznam! Líbí se mi, že bodování na základě WPA umožňuje přijímačům proklouznout do první desítky nejlepších fantasy střelců. Zdá se, že už jen tím, že se stejně váží yardy za běh a yardy za příjem, dochází k pěkné rovnováze mezi pozicemi. Kvůli větší složitosti jsem také nepřidal statistiky přihrávek. Myslím, že Saquon mohl mít přihrávající TD, a proto to zde není zahrnuto v mém hodnocení WPA. Dále zkusíme rozehrávače:
Opět je pořadí dost podobné! Je tu však velký rozdíl, protože bodování na základě WPA opravdu nesnášeli Chiefs/Pat Mahomes. Je to proto, že Chiefs měli hodně 20+ yardových her, a proto nenasbírali tolik prvních downů. I když si myslím, že WPA odvádí lepší práci při hodnocení zbytku ligy, Chiefs byli výbušným týmem, který se vymyká, a nemyslím si, že WPA u nich odvádí dobrou práci. To by se dalo zmírnit bonusy za hry na 20 a více yardů. Tentokrát jsem také ponechal v neškálovaných fantasy bodech, abych něco naznačil. U běžících beků a wide receiverů byly bodové součty jen asi o 15 % vyšší než standardní bodování a zhruba o 15 % nižší než bodování PPR. Jinak řečeno, fantasy WPA pro poziční hráče byla přesně uprostřed tradičních bodovacích výstupů. Pokud však QB získá všechny body za absolvování WPA, pak by jejich bodové součty měly být téměř třikrát vyšší než tradiční bodování. To je obrovský rozdíl! Myslím, že mezi sezónami QB s 1 000 body a sezónami QB s 350 body pravděpodobně existuje šťastný střed, který by zvýšil draftové akcie QB, a přitom je neudělal příliš silnými.“
Graf jádra
Jak dobře měří tradiční formáty fantasy bodování WPA? Děláme všechny tyto změny ve skórování kvůli zanedbatelnému zisku? Zde jsou korelace mezi WPA a typickými skórovacími systémy:
Skórování fantasy založené na WPA samozřejmě koreluje více, ale jsem rád, že koreluje o 9 % více. Tenhle graf jsem dělal naposledy a byl bych naštvaný, kdyby to byl tak 2% rozdíl. Ještě lépe koreluje s Expected Points Added a rozdíl mezi ním a nejbližším (PPR) je u EPA ještě větší. Mise splněna!“
Závěr
Tradiční formáty fantasy bodování tak-tak odrážejí výkon na hřišti. Pokud je cílem zlepšit systém bodování tak, aby odrážel výkon v poli, je lepší bodování založené na WPA. Na druhou stranu nebudu tvrdit, že bodování založené na WPA by bylo zábavnější (chci 6 bodů za touchdown stejně jako všichni ostatní!).
Jediný typ ligy, u kterého bych si dokázal představit přijetí bodování založeného na WPA, by byla seriózní liga s vysokými sázkami. Myslím, že hráči v těchto podmínkách by se utěšovali tím, že cílem je vybrat nejlepšího fotbalistu, a ne nejlepšího fotbalistu na základě libovolných pravidel stanovených před 20 lety.
Nakonec, zde je kód v Pythonu, který jsem použil.