Zrozumieć 'Four Factors' w koszykówce: Głęboka analiza metryk, które wygrywają mecze
Każdy fan koszykówki ma intuicję dotyczącą tego, co wygrywa mecze. Punkty, to oczywiste. Może zbiórki. Być może supergwiazda przejmująca kontrolę w czwartej kwarcie. Te przeczucia nie są błędne, ale są niepełne. W 2004 roku statystyk Dean Oliver opublikował Basketball on Paper i dał światu analityki coś znacznie bardziej użytecznego: strukturę, która sprowadza grę do czterech fundamentalnych filarów, wyjaśniających z niezwykłą precyzją przyczyny zwycięstw i porażek.
Nazywamy je Czterema Czynnikami (Four Factors). Po przetestowaniu naszego modelu XGBoost_Top17 na danych z pięciu sezonów NBA, możemy z całą pewnością stwierdzić, że metryki te pozostają aktualne do dziś — jednak ich relatywne znaczenie różni się od tego, co pierwotnie proponował Oliver i co zakłada większość analityków. Oto czym są, dlaczego mają znaczenie i czego dowiedzieliśmy się o ich zachowaniu we współczesnej grze.
Cztery Czynniki (Four Factors) – Wyjaśnienie
Spostrzeżenie Olivera było eleganckie: o wynikach meczów koszykówki decydują cztery i tylko cztery rzeczy. Jak skutecznie rzucasz. Jak często tracisz piłkę. Jak dobrze zbierasz własne rzuty. I ile rzutów wolnych generujesz. Wszystko inne — tempo, gra izolacyjna, defensywa oparta na przekazywaniu krycia czy odpoczynek zawodników — ostatecznie przepływa przez te cztery kanały.
Skuteczność rzutów z gry (eFG%)
eFG% uwzględnia fakt, że rzut za trzy punkty jest wart o 50% więcej niż rzut za dwa.
eFG% = (FGM + 0.5 × 3PM) / FGA
Oliver przypisał temu czynnikowi najwyższą wagę — około 40% efektywności ofensywnej. Intuicja jest słuszna: skuteczność rzutowa to najkrótsza droga do punktów. W erze szybkiej gry i dużej liczby rzutów z dystansu, różnica między drużyną ze skutecznością 52% eFG% a 48% szybko narasta na przestrzeni 100 posiadań.
Jednak tutaj nasz model odbiega od konwencjonalnej wiedzy: różnica eFG% nie przetrwała selekcji cech do naszej listy Top17. Po przetestowaniu 266 kandydatów, eFG% zostało odfiltrowane podczas regularyzacji. Nie oznacza to, że skuteczność rzutowa jest nieważna — oznacza to, że jej sygnał jest już zawarty w bardziej holistycznych metrykach. Konkretnie PIE (Player Impact Estimate), który zajmuje dwa pierwsze miejsca w rankingu ważności cech (łącznie 37,9%), obejmuje skuteczność rzutową wraz ze stratami, zbiórkami i rzutami wolnymi w jednym zintegrowanym wskaźniku.
Widząc typ „High Confidence” na DataProven, nie oglądasz surowego porównania eFG%. Widzisz różnicę PIE, która ma już „wryty” w siebie wskaźnik skuteczności.
Wskaźnik strat (TOV%)
TOV% mierzy, jaki procent posiadań kończy się stratą.
TOV% = TOV / (FGA + 0.44 × FTA + TOV)
Oliver wycenił to na około 25% sukcesu w ataku. Nasz model pokazuje coś innego: wskaźnik strat drużyny gości z ostatnich 10 meczów (away_tov_pct_l10) to najwyżej sklasyfikowana cecha Four Factors w naszym modelu (4,1% ważności) — co czyni ją bardziej predykcyjną niż jakakolwiek inna indywidualna metryka tego systemu.
Gra na wyjeździe potęguje błędy w sposób, w jaki nie robią tego mecze u siebie. Drużyna przyjezdna, która gra niechlujnie od dwóch tygodni, nie uspokoi nagle gry wrogiej hali. Nasze okno L10 (ostatnie 10 meczów) wyłapuje ten wzorzec: jeśli zespół traci piłkę w ponad 18% posiadań w ostatnich dziesięciu spotkaniach, jest to nawyk, a nie przypadek. To dla nas najwyraźniejszy sygnał ostrzegawczy przed porażką gości.
Procent zbiórek w ataku (ORB%)
ORB% określa, jak często drużyna odzyskuje piłkę po własnych niecelnych rzutach.
ORB% = ORB / (ORB + DREB przeciwnika)
To najbardziej kontrowersyjny taktycznie czynnik we współczesnej koszykówce. Wiele drużyn celowo rezygnuje ze zbiórek w ataku, aby chronić się przed kontratakami — to wyrachowany kompromis, który sprawia, że ORB% jest sygnałem asymetrycznym, zależnym od filozofii trenera.
W naszym modelu wskaźnik zbiórek w ataku gości z ostatnich 5 meczów (away_oreb_pct_l5) zajmuje 9. miejsce z ważnością 3,5%, podczas gdy strona defensywna — dreb_pct_l10_diff — zajmuje 13. miejsce (2,6%). Ta asymetria ma znaczenie: drużyna gości agresywnie walcząca o tablice to silny sygnał wysokiej energii i zaangażowania. Zbiórka w obronie to z kolei fundament — ważny, ale oczekiwany.
Wskaźnik rzutów wolnych (FTR)
FTR oblicza się jako FTA / FGA, co odzwierciedla częstotliwość wymuszania rzutów wolnych.
FTR = FTA / FGA
Oliver przypisał temu najniższą wagę (ok. 15%). Nasz model w dużej mierze się z tym zgadza, choć z pewnym niuansem: cechy rzutów wolnych pojawiają się w naszym Top17 dwukrotnie, ale w specyficznej formie. home_fta_rate_l10 (16. miejsce, 1,8%) oddaje zdolność gospodarzy do wymuszania fauli w ostatnim czasie, a away_ftm_l10 (17. miejsce, 1,8%) mierzy rzuty wolne faktycznie trafione przez gości — nie tylko oddane.
Wskaźnik rzutów wolnych zachowuje się bardziej asymetrycznie, niż zakładał Oliver. Drużyna z elitarnym FTR — powiedzmy powyżej 0,35 — zyskuje znaczącą przewagę. Ale różnica między FTR średnim a nieco poniżej średniej jest w naszych prognozach prawie nieistotna. Ten czynnik ma największe znaczenie w skrajnych przypadkach.
Jak w rzeczywistości wyglądają wagi
Oryginalne wagi Olivera wynosiły około 40% dla skuteczności rzutów, 25% dla strat, 20% dla zbiórek i 15% dla rzutów wolnych — zarówno w ataku, jak i w obronie.
Najważniejszą różnicą w stosunku do modelu Olivera jest to, że skuteczność rzutowa, choć kluczowa, nie jest sygnałem możliwym do odseparowania na poziomie przewidywania meczu, gdy kontrolujemy ogólną jakość zespołu poprzez PIE. Dwie drużyny z identycznymi różnicami PIE, ale różnymi podziałami eFG%, są w oczach naszego modelu niemal identyczne — skuteczność jest już „wliczona w cenę”.
Model dodaje do PIE kontekst: formę w danej chwili (pie_l10_diff – 17,7%), to czy goście dbają o piłkę, czy któryś zespół wymusza rzuty wolne oraz czy odpoczynek lub terminarz dają asymetryczną przewagę.
Hierarchia, której faktycznie używa nasz model
Zrozumienie Four Factors jest przydatne. Ale zrozumienie ich interakcji z naszym pełnym zestawem cech jest jeszcze ważniejsze. Oto rzeczywista kolejność priorytetów naszego modelu przy generowaniu prognoz:
1. Ogólna luka w efektywności (łącznie 37,9%) Różnica PIE w całym sezonie i w ostatnich 10 meczach. To jest fundament. Zanim przejdziemy do jakiejkolwiek analizy Four Factors, holistyczna luka w efektywności między zespołami jest najsilniejszym predyktorem wyniku.
2. Bazowa jakość zespołu (łącznie 15,6%) Różnica w zwycięstwach/porażkach i bilans sezonu. Silne drużyny nie stają się nagle słabe — jakość z całego sezonu tworzy solidny fundament.
3. Kalibracja przewagi własnego boiska (8,0%) Szacowany Net Rating skorygowany o siłę terminarza (SOS). Przewaga własnego parkietu jest realna, ale to tylko tło, a nie gwarancja.
4. Świeża forma ofensywna (7,1%) Różnica w Offensive Rating z ostatnich 10 meczów. Oddaje aktualną trajektorię zespołu, niezależnie od średnich z sezonu.
5. Four Factors i dyscyplina (łącznie 15,9%) Straty, zbiórki, rzuty wolne i faule osobiste — w tej kolejności. Dbanie o piłkę to najwyżej oceniany indywidualny czynnik Four Factors. Skuteczność rzutowa jest ukryta w PIE powyżej.
Najczęstszym błędem analityków jest zaczynanie oceny meczu od eFG%. Nasz model sugeruje, że to błąd. Zacznij od różnicy PIE — ona zawiera już sygnał rzutowy. Potem sprawdź, czy goście dbali o piłkę w ostatnich dziesięciu meczach. Te dwa kroki dadzą Ci większą wartość predykcyjną niż jakikolwiek pojedynczy czynnik w izolacji.
Defensywna strona medalu
Kluczowym spostrzeżeniem Olivera było to, że każdy czynnik ma komponent ofensywny i defensywny. Wygranie bitwy eFG% wymaga zarówno dobrego rzucania, jak i uniemożliwiania skutecznych rzutów rywalowi. Wygranie walki na tablicach wymaga ograniczania zbiórek ofensywnych przeciwnika, a nie tylko generowania własnych.
W naszym modelu defensywne wersje tych czynników mają nieco inne wagi. Wskaźnik zbiórek w obronie (dreb_pct_l10_diff) zajmuje 13. miejsce (2,6%) — to ważne, ale niżej niż zbiórki w ataku gości. Implikacja jest taka, że kontrolowanie własnej tablicy to podstawa; modelem „wstrząsa” natomiast drużyna gości, która agresywnie zbiera w ataku wbrew dominującym trendom współczesnej NBA.
Różnica w faulach osobistych (pf_l10_diff) zajmuje 15. miejsce (2,0%). To rozszerzenie modelu Olivera: drużyny w tarapatach faulowych oddają rywalom darmowe punkty i zmuszają liderów do siedzenia na ławce. Zespół, który w ostatnich 10 meczach regularnie fauluje częściej niż rywale, sygnalizuje spóźnioną defensywę.
Czego nie widzą Four Factors?
Żaden system nie jest kompletny. Oliver przyznawał, że jego model ma ograniczenia. Four Factors opisują to, co wydarzyło się w ramach posiadań — nie oddają bezpośrednio jakości rzutów. Dwa zespoły mogą mieć identyczne eFG%, ale skrajnie różne procesy ofensywne: jeden generuje czyste rzuty za trzy po dobrym ruchu piłki, drugi oddaje trudne rzuty z półdystansu pod presją. Ten pierwszy model jest bardziej trwały.
Dlatego nasz model uzupełnia Four Factors o kontekst, którego system Olivera nie widzi: dane o odpoczynku i zmęczeniu (b2b_diff – 3,8%, away_optimal_rest – 3,2%) oraz historię bezpośrednich spotkań (h2h_dominance – 2,9%). Niektóre pary drużyn są tak niedopasowane taktycznie, że średnie z sezonu tego nie wyłapią.
Four Factors nie mówią nic o grze w końcówkach (clutch), tendencjach sędziów czy specyficznej dynamice konkretnego meczu. To realne czynniki generujące wariancję — dlatego żaden model nie przekroczy 70–75% skuteczności. Pewna nieprzewidywalność jest wpisana w koszykówkę. To właśnie sprawia, że warto ją oglądać.
Jak korzystać z Four Factors jako subskrybent DataProven
Przeglądając nasze prognozy, widzisz efekt końcowy modelu, który traktuje różnicę PIE jako fundament, a metryki Four Factors jako warstwy kontekstowe. Typ High Confidence zazwyczaj odzwierciedla zespół, który ma znaczącą przewagę w PIE, dba o piłkę w ostatnich meczach i korzysta z korzystnego terminarza.
Typ Low Confidence często dotyczy drużyn wyrównanych w PIE, gdzie sygnały Four Factors są mieszane — np. jeden zespół częściej traci piłkę, ale drugi częściej fauluje — co tworzy niepewność, której model nie jest w stanie rozstrzygnąć z dużą pewnością.
Zrozumienie tego systemu pomaga nie tylko korzystać z naszych prognoz, ale także oceniać je krytycznie. A budowanie świadomej społeczności jest dokładnie tym, na czym nam zależy.
Dean Oliver dał koszykówce język do opisywania jej fundamentów. Dwadzieścia lat później ten język wciąż najlepiej wyjaśnia, dlaczego drużyny wygrywają. Ale dane dodają przypis: hierarchia jest inna niż sądził, a skuteczność rzutowa — choć kluczowa — jest już zawarta w metrykach, które liczą się najbardziej.
W następnym odcinku: Kryterium Kelly'ego i zarządzanie kapitałem — jak dobierać wielkość stawek, gdy masz realną przewagę.