Strategija klađenja

Analiza modela za očekivane golove

Ranije uglavnom korišteni samo u onom dijelu zajednice kladitelja koja se bavi statističkim analizama, tzv. očekivani golovi su sada statistički podatak koji se koristi ravnopravno uz druge uobičajene statističke informacije kao što su posjed lopte, šutevi na gol i broj počinjenih prekšaja. Ipak, postoje razni pristupi računanju očekivanih golova. Ovaj članak istražuje različite modele i različite rezultate do kojih oni dolaze.

Cilj u nogometu je postići gol protiv svog protivnika bez da se primi gol. Zvuči jednostavno, ali zbog faktora kao što su nasumičnost i sreća, ekipe ne dolaze uvijek do rezultata kojeg zaslužuju. Zato su analiza podataka i pokazatelji kao npr. očekivani golovi korisni u sportskom klađenju – možemo analizirati uspješnost iz statističkog gledišta i dati oslonac tvrdnjama kao što je “nesretno su izgubili”.

S obzirom da je šut na gol definirajuća akcija koja prethodi svakom golu, podaci neke ekipe o šutiranju na gol su ključ bilo kojeg modela za očekivane golove.

Očekivani golovi (xG, eng. expected goals) su jedan oblik analize podataka koji ubrzano postaje jedan od omiljenih podataka među kladiteljima. Kalkulacije očekivanih golova su dostupne online, ali se razlikuju od izvora do izvora, jer izvori koriste različite modele da bi došli do rezultata.

Modeli imaju raspon od jednostavnih do vrlo kompleksnih. Slijedi objašnjenje kako različiti modeli za očekivane golove funkcioniraju. Koji su algoritmi iza tih različitih modela i koliko se razlikuju dobiveni rezultati?

Korištenje šuteva na gol

Andrew Beasley iz Pinnacle Pulsea je ranije objasnio kako izračunati očekivane golove koristeći osnovni model šuteva na gol. S obzirom da šutevi uvijek prethode golu, šutevi na gol su ključni dio svakog modela očekivanih golova; postoje nebrojeni događaji unutar nogometne utakmice koji utječu na postizanje gola, ali kada pokušavamo predvidjeti postizanje gola, šutevi su bez ikakve dvojbe najvažniji podatak.

Ovo je jednostavni pristup kojeg Opta definira kao “veliku šansu”: situacija u kojoj je razumno od igrača očekivati da postigne gol – kao i šutevi izvan kaznenog prostora i unutar kaznenog prostora.

Stopa pretvaranja šansi i šuteva u golove u zadnjih pet sezona engleske Premier lige znači da xG ima vrijednost od 0.387 (38.7% šanse postizanja gola), šutevi unutar šesnaesterca imaju vrijednost 0.07 (7% šanse), a šutevi van šesnaesterca 0.036 (3.6% šanse).

Detaljna analiza podataka o šutevima

Zbog veličine terena u nogometu, postoje različiti kutevi iz kojih se može šutirati, a utjecaj koji ovo ima na vjerojatnost postizanje zgoditka – bazirao se model na detaljnoj analizi lokacije šuteva ili ne – će utjecati na očekivane golove.

Iako sličan osnovnom modelu Andrewa Beasleya, ovaj pristup koristi detaljniju analizu lokacije otkud je šutirano na gol da bi se toj lokaciji dodijelila vrijednost xG. Najlakše je to postići na način da se polje podijeli na kvadrate i da se ucrta svaki šut.

Prednost korištenja ovakvog modela je što uzima u obzir razliku koja dolazi od pozicije otkud se šutira, jer igrač koji je direktno ispred gola ima vrlo veliku šansu za postizanja gola, dok igrač koji šutira iz malog kuta ima puno manju šansu. Također, teže je postići gol glavom nego nogom.

Model Paula Rileya je dobar primjer naprednijeg pristupa analizi lokacije šuta kada se izrađuje xG model.

Utjecaj akcije koja dovodi do šuta

Naravno, nisu samo lokacija šuta i to je li šutirano nogom ili glavom važni za procjenjivanje šanse hoće li šut biti pretvoren u gol. Akcija koja prethodi šutu će također imati utjecaj na kvalitetu šanse za gol.

Umjesto da samo dodijelimo xG vrijednost za šut temeljeno na tome otkud je šut krenuo, neki modeli će gledati kako se stvorila prilika za šut (centaršut, dodavanje kroz obranu, kontranapad itd.) i također detaljno analiziraju kakav je to šut (šut nakon driblinga, šut na odbijenu loptu itd.).

Očito, ovakav model zahtijeva puno više podataka i resursa da bi se izgradio i da bi bio održavan. xG model kojeg koristi 11tegen11 je jedan primjer modela za očekivane golove koji razmatra širi kontekts akcije kada dodjeljuje xG vrijednost šutevima.

Utjecaj obrane na xG

Tri prethodna načina za modeliranje očekivanih golova svi rade dosta dobar posao kod procjene koliko bi golova ekipa trebala postići u nekoj utakmici ili čak u cijeloj sezoni. Ipak, postoje i druge varijable koje doprinose potencijalnoj šansi za postizanje gola.

Umjesto da samo dodijele xG vrijednost temeljeno na lokaciji šuta, neki modeli će gledati kako je kreirana šansa za taj šut i analizirati sami šut u više detalja.

Nogomet nije samo napadačka igra. Obrambeno postavljanje i smanjenje šansi protivniku za postizanje gola su jednako važni – obrambeni igrači mogu prisiliti napadača da šutira na drugačiji način ili da u zadnji tren mora promijeniti pokret, i tada je teže postići gol.

Kao dodatak analiziranju napadačkog procesa – od toga kako je stvorena šansa do toga gdje se šut događa – korištenje blizine protivničkih obrambenih igrača i kako to utječe na kvalitetu šuta dodaju još jednu dimenziju modeliranju očekivanih golova.

To znači da moramo gledati gdje su golman i obrambeni igrači pozicionirani u odnosu na to gdje je šut pokušan, i to bi moglo proizvesti najtočniji xG rezultat.

Koji je najtočniji model za očekivane golove?

Sada kada znamo kako funkcioniraju različiti modeli za očekivane golove, možemo početi analizirati koja metoda proizvodi najtočnija predviđanja. Tablica ispod prikazuje stvarnu gol-razliku za svaki klub iz Premier lige 2016/17 i očekivani broj golova prema različitim modelima spomenutima ranije u članku.

Stvarna gol razlika (GR) i predviđanja triju modela

Klub GR Model1 + / –
Model2 + / – Model3 + / –
Arsenal +33 +12.5 -20.5 +17 -16 +15.39 -17.61
Bournemouth -12 -6.80 +5.20 -15 -3 -13.76 -1.76
Hull -43 -33.80 +9.20 -35 +8 -38.88 +4.12
Burnley -16 -19.20 -3.20 -26 -10 -21.06 -5.06
Chelsea +52 +25.90 -26.10 +31 -21 +31.91 -20.09
Crystal Palace -13 -1.50 +11.50 -5 +8 -6.05 +6.95
Everton +18 +5 -13 +1 -17 +1.82 -16.18
Sunderland -40 -27.40 +12.60 -26 +14 -30.56 +9.44
Leicester -15 -7.60 +7.40 -7 +8 -6.65 +8.35
Liverpool +36 +25.30 -10.7 +33 -3 +31.87 -4.13
Man City +41 +41.80 +0.80 +44 +3 +51.13 +10.13
Man United +25 +25 0 +24 -1 +29.48 +4.48
Middlesbrough -26 -21 +5 -25 +1 -22.46 +3.54
Southampton -7 +6.60 +13.60 +8 +15 +8.15 +15.15
Stoke -15 -0.60 +14.40 -2 +13 +0.45 +15.45
Swansea -25 -21.70 +3.30 -20 +5 -27.34 -2.34
Tottenham +60 +32.50 -27.50 +30 -30 +31.04 -28.96
Watford -28 -12.20 +15.80 -13 +15 -16.14 +11.86
WBA -8 -11.80 -3.80 -7 +1 -8.52 -0.52
West Ham -17 -11.10 +5.90 -7 +10 -9.83 +7.17

Najbolji način da bi se procijenila točnost ovih različitih pristupa nalaženju očekivanih golova nekog kluba je da se nađe korijen srednje kvadratne devijacije (root-mean-square deviation, RMSD), također često nazivan korijen srednje greške (root-mean-square error, RMSE). To se radi tako da uzmemo kvadrat razlike između stvarne gol razlike i očekivane gol razlike za svaki klub, izračunamo prosjek, i zatim nađemo korijen tog prosjeka.

  Model 1 xGD Model 2 xGD Model 3 xG
RMSD 12.92 12.55 12.01

Kao što vidimo, tri različita pristupa su i dalje vrlo slična što se tiče rezultata koje su proizveli za sezonu Premier lige 2016/17. Razdvaja ih RMSD od samo 0.91 unatoč tome što su korišteni vrlo različiti podaci.

Ipak, jedna sezona (380 utakmica) nije dovoljno velik uzorak da bi se izričito reklo da je neki pristup superioran drugome s bilo kakvom dozom sigurnosti. Također, računanje RMSD utakmicu po utakmicu bi dao puno bolji uvid u točnost svakog modela i koliko je taj model blizu predviđanju stvarnog broja postignutih golova u nekoj utakmici.

Želite naučiti više o očekivanim golovima?

Ako želite znati više o očekivanim golovima i primijeniti ovo znanje na sportsko klađenje, Andrew Beasley je pisao o tome kako se ovaj statistički pokazatelj može primijeniti na englesku Premier ligu.

Također možete pratiti Paula Rileya i 11tegen11 na Twitteru. Za vizualni prikaz očekivanih golova, UnderStat donosi grafike sa xG statistikama za lige petice.