Podsumowanie sezonu zasadniczego: Co model przewidział dobrze, co źle i dlaczego
760 prognoz. Jeden sezon zasadniczy. Oto szczera analiza każdego poziomu pewności, każdej niespodzianki i tego, co liczby faktycznie oznaczają przed fazą play-off.
Sezon zasadniczy NBA 2025/26 zakończył się wczoraj. Dla DataProven oznacza to czas na zrobienie tego, do czego zobowiązaliśmy się od pierwszego dnia: wyłożenie wszystkich wyników na stół, wyjaśnienie, co zadziałało, i bezpośrednie mówienie o tym, co nie wyszło.
To nie jest zestawienie najlepszych momentów. To pełny audyt.
Kluczowe liczby
Platforma wystartowała 22 grudnia z oryginalnym modelem XGBoost_TOP14, który działał przez 108 meczów, zanim w połowie stycznia przeszliśmy na obecny XGBoost_TOP17_v1.4_Platt. Model skalowany metodą Platta — ten, który działa dzisiaj — objął 652 z 760 wszystkich prognoz.
Łączny wynik 67,63% jest nieco niższy niż samodzielna trafność modelu Platta (68,56%), ponieważ okres bazowy TOP14 pociągnął go w dół. Obecny model osiąga lepsze wyniki — i to on będzie działał w fazie play-off.
Możesz śledzić to wszystko na żywo w panelu kalibracji, który pokazuje wynik Briera, ECE, krzywe ROC i pełny rozkład pewności aktualizowany po każdym meczu.
Podział na poziomy to miejsce, gdzie kryje się prawdziwa historia
Surowa trafność to statystyka próżności. Pisaliśmy o tym szerzej w aktualizacji po 3 miesiącach. Liczy się to, czy deklarowana pewność modelu pasuje do tego, co faktycznie dzieje się na boisku. To jest kalibracja.
Oto pełny obraz modelu Platta w przekroju sezonu zasadniczego:
| Poziom pewności | Typy | Trafione | Faktyczne % | Model wskazał | Luka |
|---|---|---|---|---|---|
| Wysoki (74%+) | 213 | 183 | 85.92% | 80.16% | -5.76 pp |
| Średni (66–74%) | 105 | 73 | 69.52% | 70.20% | +0.68 pp |
| Niski (55–66%) | 219 | 138 | 63.01% | 60.25% | −2.77 pp |
| Bardzo niski (<55%) | 115 | 53 | 46.09% | 52.47% | +6.38 pp |
Model jest zbyt mało pewny siebie w 2 z 4 poziomów (Wysoki i Niski), zbyt pewny siebie w poziomie Bardzo Niskim i wykazuje niemal idealną kalibrację w przedziale Średnim.
Wysoka pewność: najsilniejszy sygnał platformy
High certainty
Przy 85,92% na 213 typów, poziom wysokiej pewności osiągnął wyniki o prawie 6 punktów procentowych lepsze niż własne szacunki prawdopodobieństwa. Gdy model jest pewny, dowozi wyniki.
Ten poziom składa się z meczów, w których model generuje wynik 74% lub wyższy po skalowaniu metodą Platta. Jak wyjaśniliśmy w aktualizacji po 3 miesiącach, ten krok skalowania jest tym, co przekształca surowe wyniki XGBoost w autentyczne prawdopodobieństwa. W poziomie Wysokim te prawdopodobieństwa okazały się konserwatywne — faktyczny wskaźnik wygranych był wyższy, niż oczekiwał model.
Dla kontekstu: elitarni progności na rynkach przewidywań turniejowych zazwyczaj lądują między 75–82% w swoich przedziałach najwyższej pewności. 85,92% w 213 meczach na żywo, przy rzeczywistych kursach, jest znaczącym wynikiem.
Średnia pewność: podręcznikowa kalibracja
69,52% faktycznie vs 70,20% szacunków modelu — różnica 0,68 punktu procentowego w 105 meczach. To kalibracja tak bliska ideału, jak tylko można znaleźć w przewidywaniach sportowych.
Poziom Średni jest najwyraźniejszym dowodem na to, że skalowanie Platta wykonało swoje zadanie. Zanim je zastosowaliśmy, prawdopodobieństwa w zakresie 66–74% były przeładowane zarówno silnymi, jak i słabymi sygnałami zmieszanymi ze sobą. Teraz są oddzielone. Kiedy model mówi 70%, oznacza to 70% — i sezon to potwierdził.
Niska pewność: autentyczna przewaga, skromna, ale realna
219 typów przy trafności 63,01% wobec szacunków modelu na poziomie 60,25% to pozytywne zaskoczenie. Model tutaj również jest zbyt mało pewny siebie — ale luka jest węższa niż w poziomie Wysokim, co ma sens. Na marginesach szacowanie prawdopodobieństwa jest trudniejsze.
Ten poziom obejmuje mecze, w których model coś widzi, ale zachowuje odpowiednią ostrożność. Dane mówią, że ta ostrożność była nieco nadmiarowa.
Bardzo niska pewność: poniżej rzutu monetą, i tak właśnie mówiliśmy
46,09% trafności na 115 typów. To jest ten jeden poziom, który wypadł gorzej — nie tylko od szacunków modelu, ale i od czystego przypadku.
To jest ta szczera część. Gdy pewność modelu spada poniżej 55%, coś jest strukturalnie nie tak. Model mówi ~52%, ale wyniki rozstrzygają się na poziomie 46%. Przy 115 meczach to nie jest szum — to wzorzec.
Zasygnalizowaliśmy ten problem w raporcie po 3 miesiącach i diagnoza się nie zmieniła. Ten poziom identyfikuje mecze, w których sygnały modelu są autentycznie słabe. Właściwą reakcją na bardzo niski typ nie jest jego zignorowanie — jest nią odpowiednie wyważenie go lub użycie jako flagi, że mecz jest zbyt wyrównany, by go modelować.
Poprawka dla tego poziomu jest w planach. Nie jest to coś, co zatuszujemy szerszą rekalibracją, która maskowałaby problem gdzie indziej.
Wzorce na poziomie drużyn
Sezon 2025–26 potwierdza, że przewidywalność szczytuje na biegunach ligi. Podczas gdy „chaotyczny środek” pozostaje silnikiem zmienności wynikającym z wahań zaangażowania, model celuje w śledzeniu drużyn o stałej tożsamości — czy to elitarnych pretendentów, czy fundamentalnie wadliwych składów.
Najłatwiejsze do przewidzenia (Koniec sezonu zasadniczego 2025-26)
| Drużyna | Trafność | Dlaczego |
|---|---|---|
| BKN | 82.2% | Dno ofensywne i na tablicach: Ostatnie miejsce w PPG (105.9), FG% (44.3%), EFF (115.4), ORtg (108.7), REB (40.4) i DREB (29.8). Ten „jednoetapowy” cykl ofensywny czynił przestoje w punktowaniu niezwykle przewidywalnymi. |
| WAS | 79.5% | Przejrzystość defensywna: Bilans 17–65 z najgorszym w lidze DRtg (122.7). Wysoka przewidywalność w sumach „Przeciwnik powyżej” ze względu na stały brak ochrony obręczy. |
| SAS | 77.8% | Stabilność systemowa: Sezon z 62 wygranymi i top 3 defensywą. Utrzymali niezwykle stabilny całkowity margines sezonowy +8.30. Ich przewidywalność była zakotwiczona w stałym marginesie domowym +8.63, czyniąc ich faworytem typu „ustaw i zapomnij”. |
| DET | 77.3% | Elitarna forma: nr 1 na Wschodzie (60-22). Choć elitarni, byli najbardziej przewidywalni u siebie (+10.49 marginesu domowego) dzięki zdyscyplinowanemu systemowi obronnemu. Ogółem zajęli pierwsze miejsce w procencie wymuszonych strat (14.8). |
| UTA | 77.3% | Zmienność defensywna: Pozwalali na najwyższe w lidze 126.0 PPG. Wyniki przesuwały się od wyrównanych do pogromów na podstawie sygnałów „zarządzania” składem. |
| BOS | 75.6% | Dyscyplina Czterech Czynników: Sezon z 56 wygranymi napędzany przez obronę nr 1 (107.2 PPG dopuszczone) i Off Rtg nr 2 (120.8). Wysokie eFG% (55.3) i niski procent strat (11.2) uczyniły ich produkcję bardzo stabilną. |
Wniosek: Przewidywalność ekstremów
San Antonio, Detroit i Utah podkreślają wszechstronność modelu: DET i SAS to obecnie elitarni pretendenci, których dyscyplina systemowa usuwa „szczęście” z równania, podczas gdy UTA to silnik tankowania, którego rotacje rozwojowe tworzą czytelne zapaści defensywne.
Model obsługuje oba końce spektrum z wysoką precyzją. Wynik Bostonu (75,6%) dodatkowo dowodzi, że elitarna wydajność jest tak samo matematycznie uzasadniona, jak fundamentalna porażka. Ostatecznie to drużyny w „chaotycznym środku” — niemające ani dyscypliny pretendenta, ani przejrzystego kierunku przebudowy — sprawiają najwięcej problemów w modelowaniu predykcyjnym.
Najtrudniejsze do przewidzenia
| Drużyna | Trafność | Dlaczego |
|---|---|---|
| CHA | 53.5% | Zmienność młodości: 7. najmłodsza drużyna (24.60). Zdobywali więcej punktów na wyjeździe (116.98) niż u siebie, tworząc wyniki o wysokiej wariancji, które przeczyły ich bazowemu poziomowi rozwojowemu opartemu na wieku. |
| CHI | 55.8% | Zapaść defensywna na wyjeździe: ex aequo 7. najmłodsza drużyna. Wysoka wariancja dopuszczonych punktów z pomalowanego i chaotyczne rotacje defensywne sprawiły, że ich handicapy były niemożliwe do ustalenia. Choć marginesy pozostawały względnie stabilne, tracili potężne 124.44 na wyjeździe w porównaniu do 118.59 u siebie. |
| MIA | 55.8% | Taktyczne wahania formy: Ekstremalna zmienność punktowa; wielokrotne wybuchy ofensywne 140+ punktów, po których następowały mecze poniżej 100 punktów bez ostrzeżenia. Wysoki sufit u siebie (123.46 PPG), po którym następowała nieprzewidywalna stagnacja ofensywna na wyjeździe. |
| HOU | 58.7% | Selektywny wysiłek weteranów: 3. najstarsza drużyna (27.39), przewidywalność ucierpiała przez zakłócenia wynikające z odpoczynku weteranów i wahania formy w „clutch-time”. Utrzymali elitarną obronę u siebie (107.29 dopuszczone), ale „krwawili” 112.73 na wyjeździe, co sugeruje oparty na wysiłku „coasting”, którego model nie mógł uchwycić. |
| MIN | 59.5% | Zmiana tożsamości: Idealnie odzwierciedlone marginesy (+3.68 vs +3.02) maskowały całkowitą zmianę systemu. Przekształcili się z nisko punktującej drużyny domowej (114.78) w wysokoobrotowy silnik wyjazdowy (121.22). |
| ATL | 60.5% | Niezdyscyplinowane tempo: 3. najmłodsza drużyna (23.79). Podobnie jak MIN, zaliczyli ogromny skok defensywny na wyjeździe (118.10 dopuszczone), co uczyniło stabilność ich handicapów wysoce niewiarygodną. |
Charlotte, Chicago i Miami były trzema drużynami, z którymi model zmagał się najbardziej. Wszystkie trzy zajmowały zmienny zakres miejsc 9–12 na Wschodzie, charakteryzujący się znaczną wariancją wewnątrz sezonu. Nasza analiza 5000 meczów NBA pokazuje, że różnice w kroczącej formie są dominującym sygnałem — a te drużyny posiadały najmniej spójne krzywe formy w lidze. Charlotte i Chicago, oba będące jednymi z najmłodszych składów w lidze, były podatne na wahania energii młodzieńczej, podczas gdy Miami wykazało wariancję „Heat Culture”, gdzie korekty taktyczne prowadziły do dramatycznych zwrotów w wydajności u siebie i na wyjeździe.
Trudność Houston była unikalna. Mimo że byli 3. najstarszą drużyną w lidze, oscylowali między pretendentem z topu a drużyną z okolic loterii. Model odczytuje formę, ale nieprzewidywalna „wariancja weteranów” Houston — elitarna obrona u siebie (107.29) vs. defensywne krwawienie na wyjeździe (112.73) — stworzyła profil szumu typowy dla znacznie młodszych drużyn.
Jak sezon wypada na tle backtestu
Wyniki sezonu
Kiedy startowaliśmy w styczniu, nasz backtest wykazał 67,25% trafności. Po 652 prognozach na żywo na obecnym modelu, mamy 68,56% — 1,31 punktu powyżej backtestu. Ten kierunek jest nietypowy. Modele prawie zawsze tracą grunt, przechodząc z danych historycznych do warunków na żywo.
Oryginalny raport z 16 dni (opublikowany tutaj) pokazywał trafność na poziomie 63,8%, znacznie poniżej backtestu. Przypisaliśmy to szumowi małej próby i normalnym tarciom przy wdrożeniu na żywo. Ta diagnoza była trafna. W miarę wzrostu próby i zastosowania skalowania Platta, model zbiegł się — a następnie nieznacznie przekroczył wyniki backtestu.
Nie ogłaszamy zwycięstwa. 1,31 punktu powyżej backtestu mieści się w granicach szumu statystycznego dla zbioru danych tej wielkości. Ale kierunek ma znaczenie: model nie degraduje, a kalibracja znacznie poprawiła się od stycznia.
Co zmienia się w fazie play-off
Play-offy są strukturalnie inne niż sezon zasadniczy i model o tym wie.
Zestaw cech jest trenowany na dynamice sezonu zasadniczego: mecze dzień po dniu, dni odpoczynku, kroczące okna formy 5 i 10 meczów, agregaty Czterech Czynników z sezonu. Koszykówka w play-offach zawęża rotacje do siedmiu lub ośmiu graczy, eliminuje garbage time i wprowadza dynamikę serii, której żaden model per-game w pełni nie uchwyci z wyprzedzeniem.
Nasze prognozy na play-offy będą korzystać z tego samego modelu. Struktura poziomów i kalibracja zostaną zachowane — ale traktuj pewność każdego typu jako punkt wyjścia, a nie ostateczną odpowiedź. Mecze 3–7 w serii niosą informacje, których model per-game nie może zobaczyć z góry.
Kilka rzeczy, na które warto patrzeć:
Przewaga własnego boiska zacieśnia się. W sezonie zasadniczym drużyny gospodarzy wygrały 56,44% meczów w naszym zestawie prognoz. W seriach play-off rozstawiona drużyna (zazwyczaj gospodarz) wygrywa serię w około 65–70% przypadków — ale przewaga domowa na poziomie pojedynczego meczu jest bliższa 55–58%. Istniejące sygnały modelu powinny się utrzymać.
Krótkie rotacje pomagają modelowi. Mniej graczy oznacza mniej zmiennych. Drużyny ze stabilnymi siedmioosobowymi rotacjami są bardziej przewidywalne niż drużyny, które rotują dwunastoma ludźmi i dają odpocząć gwiazdom w meczach back-to-back.
Kontekst serii jest wszystkim. Po pogromie w meczu nr 1, dynamika meczu nr 2 całkowicie się zmienia. Model tego nie będzie wiedział, chyba że mu o tym powiesz. Używaj typów jako probabilistycznych punktów odniesienia i nakładaj na nie to, co wiesz o serii.
Szczere podsumowanie
Season Summary
68,56% ogółem. 85,92% przy wysokiej pewności. Niemal idealna kalibracja w poziomie Średnim. Jeden niedomagający poziom, o którym otwarcie informujemy od marca. To jest sezon w czterech linijkach.
Celem DataProven nigdy nie było deklarowanie 80% trafności i ukrywanie metodologii. Było nim zbudowanie czegoś, co ma rację co do tego, czego nie wie, tak samo jak co do tego, co wie. Poziom Bardzo Niski dający wyniki poniżej przypadku nie jest porażką przejrzystości — to jest właśnie to, jak przejrzystość wygląda. Model powiedział ci, że jest niepewny. Miał rację, będąc niepewnym.
W fazie play-off typy o Wysokiej i Średniej pewności pozostają głównym sygnałem. Typy o Niskiej pewności oferują skromną przewagę. Typy o Bardzo Niskiej pewności powinny być traktowane jako flaga, że mecz jest autentycznie zbyt wyrównany do wymodelowania.
Pełny rejestr sezonu, podział na poziomy i panel kalibracji są publiczne pod adresem https://dataproven.bet/en/calibration. Nic nie jest ukryte. To było zobowiązanie od pierwszego dnia i ono obowiązuje w postseasonie.
Dołącz do podróży
Preview Tier
Zobacz 1-2 prognozy dziennie
Za darmo
Core Tier
Dostęp do wszystkich prognoz z poziomami pewności
€9.90/miesiąc
Insight Tier
Pełna metodologia, zaawansowana analityka, dane kalibracji
€24.90/miesiąc
Każda prognoza ma sygnaturę czasową. Każdy wynik jest śledzony. Każda metryka wydajności jest publiczna.
Ponieważ w świecie deklaracji o 80%, szczerość na poziomie 67,5% jest przewagą konkurencyjną.
Pytania dotyczące metodologii lub cech modelu? Strona metodologii opisuje pełny zestaw cech, pipeline treningowy i podejście do kalibracji. Panel kalibracji pokazuje wyniki Briera, ECE i diagramy niezawodności aktualizowane po każdym meczu.