Підсумки регулярного сезону: Що модель вгадала, де помилилася і чому
760 прогнозів. Один регулярний сезон. Ось чесний розбір кожного рівня, кожного сюрпризу та того, що цифри насправді означають перед початком плей-оф.
Регулярний сезон НБА 2025/26 завершився вчора. Для DataProven це означає, що настав час зробити те, що ми обіцяли з першого дня: викласти всі результати на стіл, пояснити, що спрацювало, і прямо сказати про те, що ні.
Це не нарізка найкращих моментів. Це повний аудит.
Головні цифри
Платформа стартувала 22 грудня з оригінальною моделлю XGBoost_TOP14, яка працювала протягом 108 ігор до того, як ми перейшли на поточну XGBoost_TOP17_v1.4_Platt у середині січня. Модель із масштабуванням Платта — та, що працює сьогодні — охопила 652 з 760 загальних прогнозів.
Комбінований показник 67,63% трохи нижчий за автономну точність моделі Платта (68,56%), оскільки базовий період TOP14 тягнув його вниз. Поточна модель працює краще — і саме вона буде задіяна в плей-оф.
Ви можете відстежувати все це в прямому ефірі на дашборді калібрування, який показує показник Брієра, ECE, криві ROC та повний розподіл впевненості, що оновлюється після кожної гри.
Розподіл за рівнями — це те, де живе справжня історія
Проста точність — це метрика марнославства. Ми детально писали про це в оновленні за 3 місяці. Важливо те, чи відповідає заявлена впевненість моделі тому, що насправді відбувається на майданчику. Це і є калібрування.
Ось повна картина для моделі Платта за регулярний сезон:
| Рівень впевненості | Прогнози | Вірні | Факт. % | Модель казала | Розрив |
|---|---|---|---|---|---|
| Високий (74%+) | 213 | 183 | 85.92% | 80.16% | -5.76 pp |
| Середній (66–74%) | 105 | 73 | 69.52% | 70.20% | +0.68 pp |
| Низький (55–66%) | 219 | 138 | 63.01% | 60.25% | −2.77 pp |
| Дуже низький (<55%) | 115 | 53 | 46.09% | 52.47% | +6.38 pp |
Модель виявилася недостатньо впевненою у 2 з 4 рівнів (Високий та Низький), надто впевненою у рівні Дуже Низький і демонструє майже ідеальне калібрування в Середньому сегменті.
Висока впевненість: найсильніший сигнал платформи
High certainty
Маючи 85,92% на 213 прогнозах, рівень високої впевненості перевершив власну оцінку ймовірності майже на 6 відсоткових пунктів. Коли модель впевнена, вона дає результат.
Цей рівень складається з ігор, де модель видає результат 74% або вище після масштабування Платта. Як ми пояснювали в оновленні за 3 місяці, цей крок масштабування — це те, що перетворює сирі бали XGBoost на справжні ймовірності. У Високому рівні ці ймовірності виявилися консервативними — фактичний відсоток перемог був вищим, ніж очікувала модель.
Для контексту: елітні прогнозисти на ринках передбачень турнірів зазвичай зупиняються між 75–82% у своїх сегментах найвищої впевненості. 85,92% на 213 іграх наживо, з реальними коефіцієнтами, — це вагомий результат.
Середня впевненість: підручникове калібрування
69,52% фактично проти 70,20% оцінки моделі — розрив у 0,68 відсоткового пункту у 105 іграх. Це настільки близьке до ідеального калібрування, наскільки це можна знайти в спортивних прогнозах.
Середній рівень є найчіткішим доказом того, що масштабування Платта виконало свою роботу. До того, як ми його застосували, ймовірності в діапазоні 66–74% були перевантажені як сильними, так і слабкими сигналами, змішаними разом. Тепер вони розділені. Коли модель каже 70%, вона має на увазі 70% — і сезон це підтвердив.
Низька впевненість: справжня перевага, скромна, але реальна
219 прогнозів з точністю 63,01% проти оцінки моделі 60,25% — це позитивний сюрприз. Модель тут також недостатньо впевнена в собі — але розрив вужчий, ніж у Високому рівні, що має сенс. На межі оцінка ймовірності дається важче.
Цей рівень охоплює ігри, де модель щось бачить, але зберігає доречну обережність. Дані кажуть, що ця обережність була дещо надмірною.
Дуже низька впевненість: нижче за підкидання монети, і ми про це казали
46,09% точності на 115 прогнозах. Це той самий рівень, який показав гірші результати — не лише за оцінку моделі, а й за випадковість.
Це чесна частина. Коли впевненість моделі падає нижче 55%, щось іде структурно не так. Модель каже ~52%, але результати розв'язуються на рівні 46%. На 115 іграх це не шум — це закономірність.
Ми вказали на цю проблему у звіті за 3 місяці, і діагноз не змінився. Цей рівень ідентифікує ігри, де сигнали моделі справді слабкі. Правильна реакція на Дуже Низький прогноз — не ігнорувати його, а зважувати відповідно або використовувати як прапорець, що гра занадто непевна для моделювання.
Виправлення для цього рівня є в дорожній карті. Це не те, що ми будемо приховувати загальним рекалібруванням, яке б замаскувало проблему деінде.
Патерни на рівні команд
Сезон 2025–26 підтверджує, що передбачуваність досягає піку на полюсах ліги. Поки «брудна середина» залишається двигуном хаосу через коливання зусиль, модель чудово відстежує команди з фіксованою ідентичністю — будь то елітні претенденти чи фундаментально слабкі склади.
Найлегші для прогнозу (Фінальні підсумки регулярного сезону 2025-26)
| Команда | Точність | Чому |
|---|---|---|
| BKN | 82.2% | Офенсивне дно та проблеми на щитах: Фінішували останніми за PPG (105.9), FG% (44.3%), EFF (115.4), ORtg (108.7), REB (40.4) та DREB (29.8). Цей «одноразовий» атакувальний цикл робив кризи результативності вкрай передбачуваними. |
| WAS | 79.5% | Захисна прозорість: Фінішували 17–65 з найгіршим у лізі DRtg (122.7). Висока передбачуваність у тоталах «Opponent Over» через стабільну відсутність захисту кільця. |
| SAS | 77.8% | Системна стабільність: Сезон із 62 перемогами та топ-3 захистом. Зберегли надзвичайно стабільну загальну сезонну маржу +8.30. Їхня передбачуваність базувалася на стабільній домашній маржі +8.63, що робило їх фаворитом категорії «поставив і забув». |
| DET | 77.3% | Елітна форма: #1 посів на Сході (60-22). Попри статус еліти, вони були найбільш передбачуваними вдома (+10.49 домашня маржа) завдяки дисциплінованій захисній системі. Загалом фінішували першими за відсотком втрат суперника (14.8). |
| UTA | 77.3% | Захисна волатильність: Дозволяли лідируючі в лізі 126.0 PPG. Результати коливалися від конкурентних до розгромів на основі сигналів «управління» складом. |
| BOS | 75.6% | Дисципліна Чотирьох Факторів: Сезон із 56 перемогами, заснований на захисті №1 (107.2 PPG пропущено) та Off Rtg №2 (120.8). Високий eFG% (55.3) та низький відсоток втрат (11.2) зробили їхній результат дуже стабільним. |
Висновок: Передбачуваність екстремумів
Сан-Антоніо, Детройт та Юта підкреслюють універсальність моделі: DET та SAS тепер є елітними претендентами, чия системна дисципліна усуває «везіння» з рівняння, тоді як UTA — це двигун танкінгу, чиї ротації для розвитку створюють чіткі захисні колапси.
Модель обробляє обидва кінці спектру з високою точністю. Результат Бостона у 75,6% додатково доводить, що елітна ефективність є настільки ж математично обґрунтованою, як і фундаментальний провал. Зрештою, саме команди в «брудній середині», яким бракує або дисципліни претендента, або прозорого напрямку перебудови, спричиняють найбільше проблем для прогнозного моделювання.
Найважчі для прогнозу
| Команда | Точність | Чому |
|---|---|---|
| CHA | 53.5% | Волатильність молоді: 7-ма наймолодша команда (24.60). Забивали більше на виїзді (116.98), ніж вдома, створюючи результати з високою дисперсією, що суперечили їхньому базовому рівню розвитку на основі віку. |
| CHI | 55.8% | Виїзний захисний колапс: Поділили 7-ме місце серед наймолодших. Висока дисперсія пропущеnych очок із фарби та хаотичні захисні ротації зробили їхні фори неможливими для визначення. Хоча маржа залишалася дещо стабільною, вони пропускали величезні 124.44 на виїзді порівняно з 118.59 вдома. |
| MIA | 55.8% | Тактичні коливання форми: Екстремальна дисперсія очок; кілька ігор із 140+ очками, за якими слідували матчі менше 100 очок без попередження. Висока стеля вдома (123.46 PPG), за якою йшла непередбачувана офенсивна стагнація на виїзді. |
| HOU | 58.7% | Вибіркове зусилля ветеранів: 3-тя найстарша команда (27.39), передбачуваність постраждала через відпочинок ветеранів та коливання результативності в «клатчі». Зберегли елітний захист вдома (107.29 пропущено), але «пропускали» 112.73 на виїзді, що вказує на «коустинг» на основі зусиль, який модель не могла зафіксувати. |
| MIN | 59.5% | Зміна ідентичності: Ідеально дзеркальна маржа (+3.68 проти +3.02) маскувала повний переворот системи. Вони перетворилися з низькорезультативної домашньої команди (114.78) на високооктановий виїзний двигун (121.22). |
| ATL | 60.5% | Недисциплінований темп: 3-тя наймолодша команда (23.79). Як і MIN, вони побачили величезний захисний стрибок на виїзді (118.10 пропущено), що зробило стабільність їхніх фор вкрай ненадійною. |
Шарлотт, Чикаго та Маямі були трьома командами, з якими модель боролася найбільше. Усі три займали волатильний діапазон 9–12 місць на Сході, що характеризувався значною дисперсією всередині сезону. Наш аналіз 5000 ігор НБА показує, що різниця в поточній формі є домінуючим сигналом — і ці команди мали найменш стабільні криві форми в лізі. Шарлотт та Чикаго, обидві серед наймолодших складів ліги, були схильні до коливань юнацької енергії, тоді як Маямі демонстрували дисперсію «Heat Culture», де тактичні корективи призводили до драматичних перепадів результативності вдома та в гостях.
Труднощі Х'юстона були унікальними. Попри те, що вони були 3-ю найстаршою командою в лізі, вони коливалися між топовим претендентом та командою, наближеною до лотереї. Модель зчитує форму, але непередбачувана «дисперсія ветеранів» Х'юстона — елітний захист вдома (107.29) проти захисної кровотечі на виїзді (112.73) — створила профіль шуму, який зазвичай спостерігається у значно молодших команд.
Як сезон порівнюється з бектестом
Season Performance
Коли ми запустилися в січні, наш бектест показав точність 67,25%. Після 652 прогнозів наживо на поточній моделі ми маємо 68,56% — на 1,31 пункта вище бектесту. Цей напрямок незвичний. Моделі майже завжди втрачають позиції при переході від історичних даних до реальних умов.
Оригінальний 16-денний звіт (опублікований тут) показував точність на рівні 63,8%, що значно нижче бектесту. Ми пояснили це шумом малої вибірки та звичайним тертям під час розгортання в реальному часі. Цей діагноз був вірним. У міру зростання вибірки та застосування масштабування Платта модель стабілізувалася — а потім дещо перевищила показники бектесту.
Ми не заявляємо про перемогу. 1,31 пункта вище бектесту вкладається в межі статистичного шуму для набору даних такого розміру. Але напрямок має значення: модель не деградує, а калібрування значно покращилося з січня.
Що змінюється для плей-оф
Плей-оф структурно відрізняється від регулярного сезону, і модель це знає.
Набір функцій тренується на динаміці регулярного сезону: матчі back-to-back, дні відпочинку, вікна поточної форми з 5 та 10 ігор, сезонні агрегати Чотирьох Факторів. Плей-оф у баскетболі звужує ротації до семи або восьми гравців, усуває garbage time і вводить динаміку серій, яку жодна per-game модель не фіксує повністю заздалегідь.
Наші прогнози на плей-оф використовуватимуть ту саму модель. Структура рівнів та калібрування збережуться — але сприймайте впевненість кожного вибору як відправну точку, а не як остаточну відповідь. Ігри 3–7 у серії несуть інформацію, яку per-game модель не може побачити заздалегідь.
Кілька речей, за якими варто спостерігати:
Перевага домашнього майданчика стає меншою. У регулярному сезоні домашні команди виграли 56,44% ігор у нашому наборі прогнозів. У серіях плей-оф сіяні команди (зазвичай господарі) виграють серію приблизно в 65–70% випадків — але перевага вдома на рівні гри ближча до 55–58%. Існуючі сигнали моделі мають зберегтися.
Короткі ротації допомагають моделі. Менше гравців означає менше змінних. Команди зі стабільними семиосібними ротаціями є більш передбачуваними, ніж команди, які ротують дванадцять гравців і дають відпочинок зіркам у матчах back-to-back.
Контекст серії — це все. Після розгрому в грі №1 динаміка гри №2 повністю змінюється. Модель не буде цього знати, якщо ви їй не скажете. Використовуйте прогнози як імовірнісні базові показники та додавайте те, що ви знаєте про серію.
Чесне резюме
Season Summary
68,56% загалом. 85,92% на Високій впевненості. Майже ідеальне калібрування в Середньому рівні. Один недостатньо результативний рівень, про який ми відкрито заявляємо з березня. Це сезон у чотирьох рядках.
Метою DataProven ніколи не було заявляти про 80% точність і приховувати методологію. Вона полягала в тому, щоб побудувати щось, що має рацію щодо того, чого воно не знає, так само як і щодо того, що знає. Дуже Низький рівень, що дає результати нижче випадкових, — це не провал прозорості, це саме те, як виглядає прозорість. Модель сказала вам, що вона не впевнена. Вона мала рацію, будучи невпевненою.
Для плей-оф прогнози Високої та Середньої впевненості залишаються основним сигналом. Низька впевненість пропонує скромну перевагу. Дуже Низькі прогнози слід розглядати як прапорець, що гра справді занадто складна для моделювання.
Повний журнал сезону, розподіл за рівнями та дашборд калібрування доступні публічно за адресою https://dataproven.bet/en/calibration. Нічого не приховано. Це було зобов'язання з першого дня, і воно залишається чинним у постсезоні.
Приєднуйтесь до подорожі
Preview Tier
Дивіться 1-2 прогнози щодня
Безкоштовно
Core Tier
Доступ до всіх прогнозів з рівнями впевненості
€9.90/місяць
Insight Tier
Повна методологія, розширена аналітика, дані калібрування
€24.90/місяць
Кожен прогноз має мітку часу. Кожен результат відстежується. Кожна метрика ефективності є публічною.
Тому що у світі заявок на 80%, чесність на рівні 67,5% є конкурентною перевагою.
Є питання щодо методології чи функцій моделі? Сторінка методології охоплює повний набір функцій, пайплайн навчання та підхід до калібрування. Дашборд калібрування показуuje показники Брієра, ECE та діаграми надійності, що оновлюються після кожної гри.