Sport, adat, elemzés: sportadat-elemzés

Sport Data

Sport Data

Összefüggő paraméterek a labdarúgásban

2021. szeptember 07. - u1sd

„Ha a bolhának levágom az összes lábát, akkor megsüketül.” Az ismert vicc csattanója sosem volt annyira aktuális, mint manapság, az áltudományos érvelések, és matematikai megfontolások nélkül mérkőzéselemzések korában. A statisztikai számok olvasása, értelmezése bár amennyire egyszerű, annál több csapdát rejt egy sportrajongó számára. Sportfogadás esetében ezt a pénzünk bánja, de sportszakmai döntéseket téves értelmezésekre alapozni, akár egy egész generáció rovására is mehet.

A gondolat apropója egy Nemzeti Sport cikk volt, amely arról számolt be, hogy a statisztikai mutatók alapján miben volt jobb, rosszabb a mostani magyar férfi labdarúgó válogatott az EB-n szereplőnél. Almát bár nem szoktunk körtével hasonlítani, hiszen bár a sportág azonos, de a csapatok motivációi, körülményei, felkészülése teljesen más volt, de most nem is ez a fontos. A tanulságos az egyébként racionálisnak tűnő gondolatmenetben az, hogy ha nem vesszük észre az egyes jellemzők közötti összefüggéseket, akkor milyen nem megalapozott állításokra viheti az ember.

Nézzük a cikkben szereplő alapszámokat egymás mellett:

 Támadás

Anglia ellen

Albánia ellen

EB 2021 átlag

jó átadásaink száma

304 (84%)

413 (82%)

240 (77%)

labdabirtoklás

36%

50%

31%

támadások száma

50

81

52

lövések száma

4

7

5

xG értékeink

0,51

0,5

rúgott száma

0

0

1

 Védekezés

 

 

 

ellenfél jó átadásai

596

423

636

kapura lövés ellenünk

12

14

14,6

támadás ellenünk

87

92

94

kapott gól

4

1

2

xG ellenünk

2.11

1.78

2,3

„visszaszerzéseink”

33

35

49

megnyert párharc

61,5 átlagban

65

 

Felhívom a figyelmet a statisztikai érdekességre, amelyben a támadások száma – forrása nem szerepel, az UEFA ilyet nem tart nyilván - nem azonos a két csapat között. Ugye, a labda vagy az egyik vagy a másik csapatnál van, így logikusan a két számnak azonosnak kellene lennie. A Wyscout (feltételezett forrás) esetében a támadások száma azt mondja meg, hogy hány olyan folyamatos labdabirtoklása volt egy csapatnak, amelyben legalább egyszer eljutott az ún. támadóharmadba. Feltételezhetően, itt is valami ilyesmit akar jelenteni a támadások száma. Egy 105 méteres pályahosszúság esetében ez „csak” annyit jelent, hogy 35 méterre megközelítette az ellenfél az alapvonalat egyszer(!) labdajáratás közben. Nem kell túldimenzionálni a jelentőségét, de ez is jelez valamit.

Gondolkodjunk egy picit, hogy ez mit is jelentenek az adatok. Több labdabirtoklás alapvetően arányos kell legyen az átadások számával (hacsak valaki nem áll egyhelyben a labdával vagy rohan vele körbe-körbe), és a támadások számával is, és az pedig a lövések számával. Egy csapat, ha képes elég sokat passzolni, akkor el is kell tudjon jutni 35 méterre az alapvonaltól, legalább a szélen, jó messze a kaputól.

Csakhogy mit sem érnek a passzok és a labdabirtoklás, amikor az ellenfelek átlagosan kevesebb támadást vezetve is több gólt tudtak szerezni a két vb-selejtezőn (meccsenként 2.5-öt), mint az Eb-n (meccsenként 2-t), mert a védelmünk közel sem zárt olyan hatékonyan, nem működtek úgy az egyéni hibák utáni kisegítések, mint a nyáron. És mit ér a több támadás, ha közben a lövések számában (Eb: 6, szeptemberi vb-selejtezők: 5.5), kiváltképp a kaput eltaláló lövésekében (3.3, 1.5), no meg a gólok számában (Eb: 3 meccs, 3 gól, vb-selejtezők: 2 meccs 0) elmaradtunk a júniusi teljesítménytől, mert a támadók elöl, döntő helyzetekben rossz megoldásokat választottak (pedig a vb-selejtezős xG-mutatók megegyeztek az Eb-n látottal)?

Vegyük azonban észre, hogy az első mondatban az első három megállapítás valójában egy és ugyanaz: több jó passz = több labdabirtoklás = kevesebb támadás az ellenfél részéről. Logikusan ezzel összefügg a lövések száma, azaz továbbra is ugyanazt látjuk, nincs új értelmezés, új információ. Az állítása ennek a mondatnak végül is az, hogy bár sikerült többet passzolnunk, mégis több gólt kaptunk. Ez a következtetés azért elég sánta állítás. Minél többet birtokolom labdát (ami a támadásépítésről szól), akkor ugyan nincs annyi ideje a másiknak csapat a gólszerzésre, de lehetősége (ez pedig a védekezési képességről) attól még sok lehet. A két változó lényegében független (laza összefüggés van, pusztán azért, mert két csapat van csak a pályán és az idő áttételesen, töredékesen és esetlegesen gólszerzési lehetőséggé konvertálható).

Matematikai nyelven szólva az állítás a független tényezők kivonásával és az ismétlődések szűrésével a következőre egyszerűsíthető: több gólt kaptunk. Valójában ez az egyetlen helyes állítás. Előfordul az ilyen a legjobbakkal is…

Az xG jelzést azonban félreérti a szerző: nem azt jelzi, hogy valaki „rossz megoldást” választott, nem is a „helyzetek minőségét” (egy helyzetre még csak-csak értem és rendben is van, de egy mérkőzésre?!), hanem hogy 100 kísérletből („helyes” vagy „nem helyes” megoldást választva) hány gól születik. Akkor is, ha Messinél van a labda, és akkor is, ha a egy megyei mérkőzés sánta csatáránál. A kezdőkörből kapura lőni is xG értéket produkál. Rá lehet lőni egy meccsen 50x is, akkor kijöhet a 0,5-ös xG. A gól valószínűsége azért igen kicsi, mert pl. Seaman kell hozzá, hogy benézze. Ha jól lőttük, ha nem.

A lövések számával összevetve már érdekesebb a kép: az angolok átlagos lövése, helyzete (a cikk fogalmaival „minősége”) 0,17 xG értékű volt, míg Albánié 0,12 xG. A mieink értéke: 0,07 xG a két selejtező mérkőzésen átlagban, és 0,1 xG az EB-nél. Ebben van valójában a különbség. De legyünk őszinték, az xG nem véletlenül egy átlagérték, és mint ilyen az átlaghoz KELL, hogy tartson. Az EB-n erőn felül teljesítettünk, 0,5 xG-re 1 rúgott gólos átlag pontosan ezt jelenti. 5 mérkőzést nézve az xG értünk mérkőzések átlagában továbbra is 0,5, de nem nagy meglepetés, ha azt mondom, hogy az 3 gól / 5 mérkőzés az 0,6 (eggyel kevesebb gól pedig 0,4 lenne) a 0,5 érték felé tart. A várhatóértékek már csak így szoktak viselkedni. Hasonlóan, a 2,3 xG átlagban ellenünk szerzett és a „csak” 2db ténylegesen átlagosan kapott gól esetén is szerencse fiai voltunk az EB-n. Az öt mérkőzés (3db EB+2db selejtező) átlagos xG értéke 2,16, és láss csodát 2,2 gól volt a kapott gólátlagunk az öt mérkőzésen. Nincs meglepetés, az történt, amire számítani lehetett ilyen xG értékek mellett.

Nem a csatárok választottak rossz megoldást, hanem nincs xG értékünk, lövésünk. Az xG kumulatív érték, azaz a "helyzetek összeadódnak". Alacsony xG nem rossz minőségű helyzetet jelez, hanem kevés "érdemi" próbálkozást. Azaz nem jutunk el az ellenfél kapujához (vagy következetesen nem lőnek a támadók?!), nem dolgozunk ki helyzeteket (sem). Miért mondom ezt? Minden csapat közel 90 alkalommal eljut a védekező harmadunkba. Ez részben összefüggésben van a labdabirtoklással – ahogy korábban is írtam – igazából a labdabirtoklásra időre vetítve közel 1,8-2 támadás / labdabirtoklási perc jut a csapatokra, a mienkre is. Néha több, néha kevesebb (motivációtól és taktikától is függ). Viszont ha már eljutott, akkor az ellenfeleink nagyjából 15% eséllyel kapura is fog rúgni ellenünk. Nálunk ez a mutató viszont csak 8,5%. Minden mérkőzésen. Véletlen?

Beszélhetünk így csatárokról és védőkről, de ez sajnos a középpálya problémája (is). Nincs támasz és/vagy nincs szűrés. Ilyen alacsony „konverziós ráta” mellett (avagy az ellenfél magas rátája okán) vagy csak ordítóan nagy helyzetekkel, kontrákkal, elfutásokkal lehet nyerni, vagy jelentősen meg kell növelni a labdabirtoklási időt. Labdabirtoklási időre vetítve a „bruttó labdabirtoklási idő” 1,3%-át tudjuk gólra váltani, ellenfeleink pedig a 2,7%-át. Albánia megveréséhez ez alapján 66%-os labdabirtoklás felett tudtuk volna közel biztosan megverni.

Mennyire lehet erre játszani? Elég gyors-e a magyar futball ehhez?

Még egy adalék: a labdabirtoklási időre vonatkozó jó átadások száma is érdekes lehet. Az EB nagyszerű csapatai és Anglia is nagyjából 10,3 átadást produkálnak „labdabirtoklási” percenként. Az idézőjel annak szól, hogy a tiszta játékidő nem szerepel a cikkben (sem), így a labdabirtoklást a 90 perces mérkőzéshosszra vetítettem – amúgy teljesen hibásan. Albánia esetében ez a szám 9,4, ellenük pedig nekünk 9,18 ez az arány, az EB-n 8,6 volt, Anglia ellen is 9,4 körüli. A számokból azért látszik, hogy a jobbak ennyivel gyorsabban járatják a labdát.

Az biztos, hogy sokkal több gólt kaptunk, mint a két mérkőzésen „érdemeltünk” volna, de csak visszaadta a sors, amit az EB-n levett rólunk, hogy szárnyalni tudjunk. Az összes többi állítás és paraméter ezzel nincs összefüggésben, pontosabban ugyanazt jelzik: próbálkozunk, ahogy tudunk. A baj az alacsony lövés / támadás, ahhoz képest is alacsony átlagos xG / lövés értékben, a lassú labdajáratásban, a védekezési mélységben van. Hogy ezeknek mi az oka, miért alakulnak így, az nem derül ki a számokból. Az egy másik szakma nagy kérdése lehet.

süti beállítások módosítása