Da bi uspješno predviđali rezultate nogometnih utakmica koristeći matematiku, kladitelji trebaju dvije stvari: informacije i model. Koliko je golova prosječno po utakmici? Koliko često su šutevi pretvoreni u golove? I, najvažnije, kako kladitelji mogu koristiti podatke o prošlosti da bi predvidjeli broj golova da bi mogli uplaćivati dobitne oklade? Ovaj članak objašnjava kako koristiti model za predviđanje broja očekivanih golova da bi se predvidio rezultat nogometne utakmice.
Sa samo 2.73 golova u prosjeku za period od zadnjih pet sezona engleske Premier lige, golovi u nogometu su relativno rijedak događaj. Kako popularna knjiga Chrisa Andersona i Davida Sallya o nogometnoj statistici The Numbers Game kaže, do 50% svakog nogometnog rezultata se može dogoditi zbog sreće, neke odbijene lopte, ili odluke suca.
Zato je imperativ da koristimo veći uzorak podataka kad radimo prognoze. Umjesto da koristimo 2.73 golova po utakmici u Premier League 2015/16, možemo koristiti 8.49 šuteva u okvir gola, ili možda 25.7 šuteva prema golu.
Problem ovdje je što postoji razlika između tim statističkim pokazateljima. Dok je svaki gol doista vrijedan 1 gol, među šutevima postoji vrlo različita stopa pretvaranja u golove, i tu dolazimo do očekivanih golova (xG). U prosjeku, šut u engleskoj Premier ligi je pretvoren u gol u 9.7% slučajeva u zadnjih pet sezona, ali odvajanje tih šuteva u kategorije pokazuje koliko može varirati stopa pretvaranja u golove.
Gledajući povijesne podatke, možemo izračunati prosječnu vjerojatnost pretvaranja šuta u gol tako da uključimo ili vrlo malo faktora ili puno faktora, po našoj želji. Neki utančaniji modeli uključuju informacije kao što je šutiranje nogom ili glavom, situacija koja je dovela do šuta, i tako dalje. Ovo zahtijeva napredne mogućnosti prikupljanja podataka i dodatne analitičke vještine, ali je moguće dobiti uvid u ove podatke i tako da koristimo pojednostavljenji model za očekivane golove. Ovdje objašnjavamo jedan takav.
Računanje vrijednosti različitih tipova šuteva
Krenimo od jedanaesteraca. Između 2011/12 i 2015/16 bila su dosuđena 443 jedanaesterca u Premier ligi, i postignuto je njih 347. U prosjeku, 78.3% jedanesteraca rezultira golom. Jedanaestercima dodjeljujemo xG = 0.783.
Opta definira “velike šanse” kao “situaciju u kojoj se od igrača može razumno očekivati da će postići gol (uglavnom jedan-na-jedan s golmanom ili šutevi iz velike blizine)”. U zadnjih pet sezona Premier lige, 2.579 od 6.213 velikih šansi je pretvoreno u golove, ali u ovo su uključeni i jedanaesterci pa njih moramo izuzeti iz kalkulacije. Kad to učinimo, velike šanse bez jedanaesteraca imaju xG = 0.387.
Šuteva unutar šesnaesterca je bilo 22.822, a njih 1.587 je pronašlo put do mreže, i to nam daje xG = 0.07.
Napokon, tu su i šutevi izvan šesnaesterca. Takvih je u zadnjih pet sezona najbolje engleske lige bilo 22.318 i doveli su do 809 golova, što je 3.6% šanse da šut izvan šesnaesterca rezultira golom. Za ove šuteve, dakle, imamo xG = 0.036. Bit će varijacija unutar ove skupine, jer su direktni slobodni udarci pretvarani u gol u oko 5 do 6% slučajeva, ali za ovaj pojednostavljeni model će i 3.6% biti dovoljno precizan podatak.
Kako izračunati očekivane golove ekipe
Gore spomenuti podaci o golovima su dostupni na puno web stranica i aplikacija, pa oboružani tim informacijama možemo vrlo brzo ustanoviti xG za svaku ekipu. Gledajući utakmice sezone 2016/17 do 12.3.2017., već vidimo kako nam ovo daje prednost u odnosu na to da koristimo samo podatke o šutevima bez xG vrijednosti. Od 211 utakmica Premier lige u kojima je netko pobijedio, ekipa koja je imala više šuteva na gol je pobijedila u njih 151 (71.6% slučajeva), dok je ekipa koja je imala veći xG rezultat pobijedila u 170 utakmica (80.6%).
Koristeći xG podatke za sezonu 2016/17 i Poisson distribuciju, radimo sljedeće prognoze za rezultate i koeficijente za utakmice 29. kola Premier League.
Kako možemo vidjeti iz “Predicted Result” kolone, imali smo jedan točan rezultat i četiri druga pogođena tipa. Koristeći kvote koje je naš sistem proračunao iz xG, favorit je pobijedio u šest od deset dvoboja, ali očito, trebali biste usporediti kvote koje proizvede sistem s onima koje nudi Pinnacle da biste vidjeli na što biste trebali uplatiti novac. Da doznate kako da se okoristite ovim podacima, pročitajte popularni članak Što predstavljaju koeficijenti za klađenje.
Limitacije xG prediktivnog modela
Važno je sjetiti se da svaki model ima svoja ograničenja. Koliko god model bio, ne može znati da je važni napadač ozlijeđen, da je ekipa dobila novi zamah jer je promijenila trenera, ili da će ekipa biti umorna zbog igranja u Europi prije tri dana.
Ovakav model će također biti loš u predviđanju vrlo visokih rezultata s obzirom da se temelji na prosjecima.
Ali, već i ovaj jednostavni model koji otkriva da je prosječan xG = 0.097 otkriva razlike među klubovima. Dok su šutevi Manchester Citya vrijedni xG = 0.113, šutevi Hulla su vrijedni samo xG = 0.083.
Korištenje statističkih podataka za očekivane golove vam može pomoći da kvantificirate kvalitetu obrane i napada neke ekipe. Ako koristite ove podatke zajedno s Poisson distribucijom, na putu ste da dobivate statistička predviđanja rezultata nogometnih utakmica.