Розуміння 'Four Factors' у баскетболі: глибокий аналіз метрик, які насправді приносять перемоги
Кожен фанат баскетболу інтуїтивно розуміє, що приносить перемогу. Очки, звісно. Можливо, підбори. Чи суперзірка, яка бере гру на себе в четвертій чверті. Ці відчуття не хибні, але вони неповні. У 2004 році статистик Дін Олівер опублікував книгу Basketball on Paper і подарував світу аналітики дещо значно корисніше: структуру, яка зводить гру до чотирьох фундаментальних стовпів, що з дивовижною точністю пояснюють причини перемог і поразок.
Ми називаємо їх Чотирма факторами (Four Factors). Після тренування моделі XGBoost_Top17 на даних п'яти сезонів НБА ми можемо впевнено сказати: ці метрики зберігають актуальність і сьогодні, проте їхня відносна важливість відрізняється від того, що спочатку пропонував Олівер і що припускає більшість аналітиків. Ось чим вони є, чому вони важливі і що ми дізналися про їхню поведінку в сучасній грі.
Чотири фактори: пояснення
Ідея Олівера була елегантною: долю баскетбольного матчу вирішують чотири і тільки чотири речі. Наскільки ефективно ви кидаєте. Як часто втрачаєте м'яч. Наскільки добре підбираєте власні промахи. І скільки штрафних кидків заробляєте. Все інше — темп, ізоляції, переміщення в захисті, навантаження гравців — зрештою проходить через ці чотири канали.
Ефективний відсоток влучань з гри (eFG%)
eFG% враховує той факт, що триочковий кидок вартий на 50% більше, ніж двоочковий.
eFG% = (FGM + 0.5 × 3PM) / FGA
Олівер надав цьому фактору найбільшу вагу — приблизно 40% загальної ефективності нападу. Логіка проста: влучність кидків — це найкоротший шлях до очок. У сучасну еру швидкого баскетболу та простору різниця між командою з 52% eFG% та 48% eFG% швидко накопичується протягом 100 володінь.
Однак тут наша модель розходиться з загальноприйнятою думкою: різниця eFG% не пройшла відбір ознак до списку Top17. Після тестування 266 кандидатів, eFG% відпала під час регуляризації. Це не означає, що влучність кидків не має значення — це означає, що її сигнал уже закладений у більш комплексні метрики. Зокрема, PIE (Player Impact Estimate), що посідає перші два місця в нашому рейтингу важливості (сумарно 37,9%), об'єднує влучність кидків із втратами, підборами та штрафними в єдиний інтегрований показник.
Коли ви бачите прогноз «High Confidence» на DataProven, ви не бачите простого порівняння eFG%. Ви бачите диференціал PIE, в якому влучність кидків уже врахована.
Показник втрат (TOV%)
TOV% вимірює, який відсоток володінь закінчується втратою м'яча.
TOV% = TOV / (FGA + 0.44 × FTA + TOV)
Олівер оцінював цей фактор у 25% успіху атаки. Наша модель каже інше: показник втрат гостьової команди за останні 10 ігор (away_tov_pct_l10) є найбільш значущою ознакою системи Four Factors у нашій моделі (важливість 4,1%) — це робить його більш прогнозним, ніж будь-яку іншу окрему метрику Олівера.
Умови гри на виїзді посилюють вплив втрат значно сильніше, ніж домашні матчі. Гостьова команда, яка грала неохайно протягом двох тижнів, навряд чи раптово збереться на ворожій арені. Наше вікно L10 (останні 10 матчів) фіксує цей паттерн: якщо команда втрачає м'яч у понад 18% володінь протягом десяти ігор, це вже звичка, а не випадковість. Для нас це найчіткіший сигнал тривоги перед поразкою гостей.
Відсоток підборів у нападі (ORB%)
ORB% показує, як часто команда забирає м'яч після власних промахів.
ORB% = ORB / (ORB + DREB суперника)
Це найбільш тактично суперечливий фактор у сучасну епоху. Багато команд свідомо жертвують підборами в нападі, щоб захиститися від швидких відривів суперника. Цей розрахунок робить ORB% асиметричним сигналом, що залежить від філософії команди.
У нашій моделі показник підборів гостьової команди в нападі за останні 5 ігор (away_oreb_pct_l5) посідає 9-те місце з важливістю 3,5%, тоді як захисний показник — dreb_pct_l10_diff — на 13-му місці (2,6%). Асиметрія тут важлива: гостьова команда, що агресивно бореться за підбирання, є потужним індикатором енергії та самовіддачі. Захисний підбір, натомість, є базовим стандартом — він важливий, але очікуваний.
Показник штрафних кидків (FTR)
FTR розраховується як FTA / FGA, відображаючи, як часто команда стає на лінію.
FTR = FTA / FGA
Олівер призначив цьому фактору найнижчу вагу (близько 15%). Наша модель загалом погоджується, але з нюансом: ознаки штрафних кидків з'являються у нашому Top17 двічі, але у специфічній формі. home_fta_rate_l10 (16-те місце, 1,8%) фіксує нещодавню здатність господарів провокувати фоли, а away_ftm_l10 (17-те місце, 1,8%) вимірює штрафні, які гості реально влучили, а не просто кинули.
Показник штрафних кидків поводиться більш асиметрично, ніж передбачала модель Олівера. Команда з елітним FTR (скажімо, вище 0,35) отримує значну перевагу. Але різниця між середнім і трохи нижче середнього FTR у наших прогнозах майже не відчувається. Цей фактор найбільше важить в екстремальних значеннях.
Як насправді виглядають ваги
Оригінальні ваги Олівера становили приблизно 40% для кидків, 25% для втрат, 20% для підборів і 15% для штрафnych — як у нападі, так і в захисті.
Найважливіша відмінність від теорії Олівера полягає в тому, що ефективність кидків, хоч і дуже важлива, не є окремим сигналом на рівні прогнозування матчів, якщо ми контролюємо загальну якість команди через PIE. Дві команди з ідентичною різницею PIE, але різними показниками eFG%, для нашої моделі є майже рівними — ефективність уже «закладена в ціну».
Модель додає до PIE контекст: поточну форму (pie_l10_diff – 17,7%), те, чи контролюють гості м'яч, чи стає команда на лінію, а також чи створює графік або відпочинок асиметричну перевагу.
Ієрархія, яку насправді використовує наша модель
Розуміти Four Factors корисно. Але розуміти, як вони взаємодіють з нашим повним набором ознак — ще корисніше. Ось реальний порядок пріоритетів нашої моделі при генерації прогнозів:
1. Загальний розрив в ефективності (сумарно 37,9%) Диференціал PIE за весь сезон та останні 10 ігор. Це фундамент. До будь-якого аналізу Чотирьох факторів, цілісний розрив в ефективності між двома командами є головним предикатором результату.
2. Базова якість команди (сумарно 15,6%) Різниця перемог/поразок і баланс сезону. Сильні команди не стають слабкими миттєво — сезонна якість створює надійний фундамент.
3. Калібрування переваги домашнього майданчика (8,0%) Оціночний Net Rating, скоригований на складність розкладу (SOS). Домашній майданчик — це реально, але це лише фон, а не гарантія.
4. Свіжа форма в нападі (7,1%) Диференціал Offensive Rating за останні 10 матчів. Фіксує поточну траєкторію команди незалежно від середніх показників по сезону.
5. Four Factors та дисципліна (сумарно 15,9%) Втрати, підбори, штрафні та персональні фоли — саме в такому порядку. Контроль м'яча — це найважливіший окремий фактор системи Four Factors. Ефективність кидків прихована в PIE вище.
Найпоширеніша помилка аналітиків — починати оцінку матчу з eFG%. Наша модель підказує, що це хибний шлях. Почніть з диференціала PIE — він уже містить сигнал про кидки. Потім перевірте, чи не втрачали гості м'яч у своїх останніх десяти матчах. Ці дві перевірки дадуть більше користі, ніж будь-який окремий фактор Олівера.
Захисна сторона медалі
Глибока ідея Олівера полягала в тому, що кожен фактор має наступальну та захисну складову. Перемога в битві eFG% вимагає як влучних кидків, так і завади ефективним кидкам суперника. Перемога в підборах — це і збирання своїх промахів, і недопущення чужих підборів у нападі.
У нашій моделі захисні версії цих факторів мають трохи інші ваги. Показник захисних підборів (dreb_pct_l10_diff) посідає 13-те місце (2,6%) — це важливо, але нижче за підбори гостей у нападі. Це означає, що контроль свого щита — це база; а от команда гостей, яка агресивно йде на чужий щит всупереч сучасній філософії НБА, стає для моделі важливим сигналом.
Різниця за персональними фолами (pf_l10_diff) на 15-му місці (2,0%). Це розширення моделі Олівера: команди, що часто фолять, дарують суперникам легкі очки та змушують лідерів сідати на лаву. Команда, яка стабільно фолить частіше за опонента протягом десяти ігор, сигналізує про проблеми в захисті — запізнілі ротації та фоли замість чистого спротиву.
Що не бачать Four Factors
Жодна система не є повною. Олівер визнавав обмеження своєї моделі. Чотири фактори описують те, що сталося в рамках володінь, але вони не фіксують якість кидків безпосередньо. Дві команди можуть мати однаковий eFG%, але зовсім різний процес у нападі: одна створює відкриті триочкові через рух м'яча, інша — кидає важкі кидки з середньої дистанції під тиском. Перший варіant є більш стабільним.
Ось чому наша модель доповнює Four Factors контекстом, якого система Олівера не бачить: даними про відпочинок і втому (b2b_diff – 3,8%, away_optimal_rest – 3,2%), а także історією особистих зустрічей (h2h_dominance – 2,9%). Деякі пари команд тактично незручні одна одній так, що середні показники сезону цього не виявлять.
Four Factors нічого не говорять про гру в клатчі (кінцівках), тенденції суддівства або специфічну динаміку конкретного матчу. Це реальні чинники, що створюють варіативність, — саме тому жодна модель не може перевищити точність у 70–75%. Непередбачуваність — це частина баскетболу. Саме це робить його цікавим.
Як використовувати Four Factors підписнику DataProven
Коли ви переглядаєте наші прогнози, ви бачите результат роботи моделі, яка використовує диференціал PIE як фундамент, а метрики Four Factors — як контекстні шари. Прогноз High Confidence зазвичай відображає команду, яка має значну перевагу в PIE, контролює м'яч в останніх іграх і має сприятливий графік.
Прогноз Low Confidence часто стосується команд, які рівні за PIE, але де сигнали Four Factors суперечливі — наприклад, одна команда більше втрачає м'яч, але інша частіше фолить — що створює невизначеність, яку модель не може вирішити з високою впевненістю.
Розуміння цієї структури допомагає не просто споживати наші прогнози, а й оцінювати їх критично. Саме таку поінформовану аудиторію ми і прагнемо побудувати.
Дін Олівер дав баскетболу мову для опису його основ. Через двадцять років ця мова все ще найкраще пояснює, чому команди перемагають. Але дані додають примітку: ієрархія інша, ніж він вважав, а ефективність кидків — хоч і важлива — вже закладена в метриках, які важать найбільше.
Далі: Критерій Келлі та управління банкролом — як обирати розмір ставок, коли у вас є реальна перевага.