Sport, adat, elemzés: sportadat-elemzés

Sport Data

Sport Data

Az OBV (On-Ball Value) mutató

2021. szeptember 23. - u1sd

Sportágakban a mágikus mutatóknak mindig nagy szerepe és hatása volt. Egy-egy jól kitalált mutató alapvetően meghatározta a sportágak gondolkodását, fejlődését, átalakulását. A jégkorongban ilyen volt az ún. Corsi-mutató (tündöklött, majd alászállt), a közismert kanadai táblázat, a baseball-ban a SABR mértékek, kosárlabdában a hárompontos dobások pontossága. A labdarúgásban - elsődlegesen a sportfogadásban - ilyen az ún. xG mutató berobbanása, és elterjedése, amellyel a mérkőzések várható kimenetele annyival jobban becsülhető, mint más, hagyományos mutatóval, hogy ebből vannak font milliomossá vált, ipari méretekben dolgozó szereplők is (lásd Matthey Benham).

A fent felsorolt mutatókkal azonban a legfőbb gond az, hogy kizárólag az eredményt nézik, amely bár kétségkívül a játék elsődleges és legfontosabb célja, azonban nem hagy teret arra, hogy a játékosokat megfelelően értékeld. Az xG, a várható gólszerzés például a helyzetekből, pontosabban az adott játékszituációból származó várható gólok számát adja meg - azaz azt mutatja, hogy ha 100 ismert, pályán látott, hasonló szituációban az esetek hány százalékában esett gól. Játékostól, végrehajtótól függetlenül. Most tekintsük el attól a filozófiai élveboncolástól, hogy két eset mennyire lehet hasonló a labdarúgó pályán, nyilván egyszerűsítésekkel kell élni, de... Az elv világos. Minél magasabb xG-t ér el egy csapat, annál több gólt fog várhatóan szerezni. Ha nem most, akkor a következő mérkőzésen - és pont ettől nagyon jó ez a módszer a sportfogadásokban: jelzi a "szerencsefaktort". Ha egy csapatnak "elsült a lába", majd a következő mérkőzéseken nem fog, ha pedig körbe lőtte a kaput, akkor legközelebb betalál. Az átlagban szeretjük a következetes "középre" tartást.

Csakhogy az xG esetében (is) komoly probléma, hogy főleg a csatárok és a védők szemüvegén keresztül nézzük a mérkőzést. De mi van a középpályával? A csapat közel fele mégiscsak középpályás. Az xG hívők ilyenkor az xGPath  (vag xGBuildup - sokféle elnevezés ismert) mértékeket szokták elővenni, amely már közel sem annyira jó mutató, mint maga az xG. Az xGPath azt mondja, hogy díjazzuk mindazokat a szereplőket súlyozottan, akik az adott xG-hez hozzájárultak. Annak megítélésében, hogy melyik átadás volt a "kulcs" ahhoz, hogy az xG létrejöjjön már nagy a szórás. Lehet, hogy a csatár volt zseniális, lehet hogy 4 átadással ezelőtt keletkezett egy olyan szituáció, ahol a 3 a 2 elleni játékot kellett már "csak" befejezni, stb. Kézzel értékeljünk? Az xGPath esetében fix súlyok vannak, mert nem lehet más. Lényegében viszont így egy Corsi-mutatót kapunk, és a Corsi-mutató esetében pontosan tudjuk, hogy annyi köze van a játékos jóságának megítéléséhez, mintha a Duna vízállásából jeleznénk előre ugyanezt. Néha el fogjuk találni a helyes eredményt, és lesz olyan mérkőzés, amikor többször. Ennek majd örülünk és minden cikkben, szakmai fórumon csak ezeket a mérkőzéseket fogjuk majd mutogatni, elhallgatva, hogy egyébként ennek semmi értelme.

A másik lehetséges út, hogy az átadásokból indulunk ki, mert erről van még sok statisztika. Melyik a jó átadás? Az a jó átadás, amely kapu felé megy? Amelyik több védőt kerül meg? Ráadásul ahhoz, hogy átadás jó legyen az legalább annyira múlik a "címzetten", mint a "feladón". Ha nincs megjátszható játékos, nincs az a kreatív játékos, aki jó labdát tudna adni a többieknek. Kit díjazunk vagy díjazzunk? Ahogy a labdarúgásban élők szokták mondani, jó dolog és elvárás, hogy a labdával tudj bánni, de a helyzetek kialakításához a labda nélküli játék a kulcs. Ha valami, akkor ez biztosan nem látszik az xG mutatóban.

Orvosolhatja a hiányosságot, ha a labda pozíciójához értéket adunk. Ha egy játékos "növeli a labda értékét" általában, akkor "jobb" játékos, mint az, aki alapvetően "nem növeli az értékét". Egy ilyen mutató aranyat érne, de nem is olyan egyszerű ilyet találni. Ha egy csatár rendszeresen gólt lő, akkor nyilván jó játékos, de azért az sem mindegy, hogy "mindig" az üres kapuba kell lőjön, vagy nehéz helyzetben is megoldja-e a problémáit. A statisztikában ez sokszor nem látszik. Mi lehet a megoldás?

A StatsBomb régóta teszteli és szeptember 16-tól hivatalosan is nyilvánossá tette az ún. On-Ball Value (OBV) mutatót. Csodák egyelőre nincsenek, az OBV lényegében egy xGPath mutató, de érdekes módosításokat hajtottak végre, amelyek - szerintünk - már előrevetíti a középpálya helyes értékelésének lehetőségét. Nézzük, melyek a főbb mérlegelési szempontokat, amelyeket a StatsBomb figyelembe vesz:

  1. ne kizárólag a gólokat nézzük, hanem az xG értékeket, hiszen egy átadás jelentősége, értéke nem függhet attól, hogy az akció hogyan fejeződik be.
  2. érdemes lehet vizsgálni azt is, hogy ha bekapott gólról van szó, akkor melyik átadás mekkora értékű (kockázatos átadásoknak tényleg van ára).
  3. az átadás "címzettjének" nincs jelentősége, nem díjazzuk külön, hogy sikerült átvennie a labdát, mivel értéket teremteni csak az tud, akinél ott marad a labda, és akkor ezen a ponton értékeljük a játékos "munkásságát".
  4. fontosak a körülmények is, nem mindegy, hogy magas labdát kell elfejelni, nyomás alatt volt a játékos stb. Ebben az esetben a múlt érdektelen, csak a szituáció - és a következményei az érdekesek, ne foglalkozzunk azzal, hogy hogyan jutott a labdához a játékos.

Ha a fenti szempontokat mérlegre tesszük, akkor egy modellt építhetünk, amely alapján az átadás jóságát az alapján díjazza, hogy az xG, amikor 0-ról indul megszereztük a labdát (vagy pl. hazaadtuk), hogyan jutottunk el a támadás végén keletkező xG-hez. Egy a tizenhatos közeléből a védősorba visszatett labda így akár negatív is lehet, azaz nem teremt értéket, sőt! Így - logikusan - a részesedés nem lesz egyforma, nem előre kiosztott súlyokkal dolgozik, hanem igenis megkülönbözteti a játékosok valódi hozzájárulását. Például egy kiugratásnál, mélységi passz esetében az xG növelő érték maga a mélységi átadás. Akkor is, ha önzetlenül, ziccerben beadja még a játékos a középen üresen érkező játékosnak, így téve biztossá a gólt. Nem az assziszt az érték, hanem amiből a szituáció keletkezett.

Hozzá kell azonban tenni, hogy a modell továbbra is a támadójátékosokat preferálja. Ahogy ők is írják, a valósággal összevett ellenőrzésben, a modell elsődlegesen a Messi, Mbappé, Grealish típusú játékosokat kedvezményezi, mert a cselek lévén ők kerülnek helyzetbe. Elég gyanús, hogy a legjobb OBV értékelésű játékosok mind gólvágók (vagy gólpasszért felelnek). Miért? A StatsBomb modell okos, ügyes, de több "hibát" is vét. Az xG alapvetően akkor kezd el növekedni, amikor a tizenhatos közelébe kerülünk. Logikusan, hiszen a támadások, labdabirtoklások jó, ha 10%-ból lesz értelmezhető helyzet, lövés, esetleg gól, vagyis egy adott pozícióból, pl. a kezdőkörben a várható gólszerzés esélye igen-igen csekély. A csatárszekciónál tud csak növekedni az xG érték. A védősorban pl. az xG 0. A középső harmadban lényegében zéró. Egy büntető xG mutatója is "csak" 0.78. (A büntetők 78%-ból lesz gól. Khmm... EB?) Kevesen gondolnák, de az ötösről fejelni szögletnél, a kapufa vonalában 0.07 xG (és ott van a legjobb esély!). Milyen xG-növekedés lehet akkor a középpályán?! Tartunk tőle, hogy ez a modell is - sajnos - várhatóan a "2-3 átadásból gól lövünk" (pl. kontrajáték) eseteket súlyozza felül. De ez is előrelépés, sőt, okosabb megoldás, hogy az egyszerű xGPath.

A másik - szerintünk fundamentális - probléma a 3. pontban is tetten érhető. Egy átadásnak nem szabadna függenie attól, hogy az átadást kapó mit kezd vele. A legtöbb xG alapú megközelítésnek az egyik méregfogára nem tud megoldást adni: jó játékos az ilyen rendszerben csak az lehet, aki jó csapatban van. Áttételesen tehát a csapatot értékeli, nem a játékost. Zseniális Messi, de vajon ugyanilyen mutatókat hozna-e Mezőkövesden? Kiváló csapat a kövesdi is (magyar szinten), nem ezért hoztam példának. Mindazonáltal tartok tőle, hogy akkor is jóval kevesebb labdát kapna egy Messi képességű játékos, és azzal is csak gyötrelmesebben tudna élni (mert pl. mindenki őt fogja fogni). Azaz nem tudna (annyi) OBV értéket teremteni, és leírnák őt mint játékost. Kellenek a megfelelő társak, hogy tündökölhessen, akik elviszik az embert, akik csökkentik a nyomást, akik passzlehetőségeket és -sávokat kínálnak fel. Hiába kreatív egy játékos, és vannak "forintos" átadásai vannak, ha botlábú a környéken mindenki más. Sosem lesz jó OBV értéke ez alapján, hacsak nem rakják csatár pozícióba, amit már lát a statisztika.

Összességében az OBV egy jó irányba tett lépés, és üdvözlendő. Okos megfontolások vannak mögötte. Másik oldalról viszont tartok tőle, hogy ez sem hoz igazi áttörést, nem hoz olyan forradalmat sem, mint amit az xG hozott. A probléma továbbra is nyitott: hogyan értékeljük objektíven egy Nagy Ádám, vagy a magyar bajnokságban játszó Melnyik játékát? Mennyit érnek valójában ezek a játékosok? 

Összefüggő paraméterek a labdarúgásban

„Ha a bolhának levágom az összes lábát, akkor megsüketül.” Az ismert vicc csattanója sosem volt annyira aktuális, mint manapság, az áltudományos érvelések, és matematikai megfontolások nélkül mérkőzéselemzések korában. A statisztikai számok olvasása, értelmezése bár amennyire egyszerű, annál több csapdát rejt egy sportrajongó számára. Sportfogadás esetében ezt a pénzünk bánja, de sportszakmai döntéseket téves értelmezésekre alapozni, akár egy egész generáció rovására is mehet.

A gondolat apropója egy Nemzeti Sport cikk volt, amely arról számolt be, hogy a statisztikai mutatók alapján miben volt jobb, rosszabb a mostani magyar férfi labdarúgó válogatott az EB-n szereplőnél. Almát bár nem szoktunk körtével hasonlítani, hiszen bár a sportág azonos, de a csapatok motivációi, körülményei, felkészülése teljesen más volt, de most nem is ez a fontos. A tanulságos az egyébként racionálisnak tűnő gondolatmenetben az, hogy ha nem vesszük észre az egyes jellemzők közötti összefüggéseket, akkor milyen nem megalapozott állításokra viheti az ember.

Nézzük a cikkben szereplő alapszámokat egymás mellett:

 Támadás

Anglia ellen

Albánia ellen

EB 2021 átlag

jó átadásaink száma

304 (84%)

413 (82%)

240 (77%)

labdabirtoklás

36%

50%

31%

támadások száma

50

81

52

lövések száma

4

7

5

xG értékeink

0,51

0,5

rúgott száma

0

0

1

 Védekezés

 

 

 

ellenfél jó átadásai

596

423

636

kapura lövés ellenünk

12

14

14,6

támadás ellenünk

87

92

94

kapott gól

4

1

2

xG ellenünk

2.11

1.78

2,3

„visszaszerzéseink”

33

35

49

megnyert párharc

61,5 átlagban

65

 

Felhívom a figyelmet a statisztikai érdekességre, amelyben a támadások száma – forrása nem szerepel, az UEFA ilyet nem tart nyilván - nem azonos a két csapat között. Ugye, a labda vagy az egyik vagy a másik csapatnál van, így logikusan a két számnak azonosnak kellene lennie. A Wyscout (feltételezett forrás) esetében a támadások száma azt mondja meg, hogy hány olyan folyamatos labdabirtoklása volt egy csapatnak, amelyben legalább egyszer eljutott az ún. támadóharmadba. Feltételezhetően, itt is valami ilyesmit akar jelenteni a támadások száma. Egy 105 méteres pályahosszúság esetében ez „csak” annyit jelent, hogy 35 méterre megközelítette az ellenfél az alapvonalat egyszer(!) labdajáratás közben. Nem kell túldimenzionálni a jelentőségét, de ez is jelez valamit.

Gondolkodjunk egy picit, hogy ez mit is jelentenek az adatok. Több labdabirtoklás alapvetően arányos kell legyen az átadások számával (hacsak valaki nem áll egyhelyben a labdával vagy rohan vele körbe-körbe), és a támadások számával is, és az pedig a lövések számával. Egy csapat, ha képes elég sokat passzolni, akkor el is kell tudjon jutni 35 méterre az alapvonaltól, legalább a szélen, jó messze a kaputól.

Csakhogy mit sem érnek a passzok és a labdabirtoklás, amikor az ellenfelek átlagosan kevesebb támadást vezetve is több gólt tudtak szerezni a két vb-selejtezőn (meccsenként 2.5-öt), mint az Eb-n (meccsenként 2-t), mert a védelmünk közel sem zárt olyan hatékonyan, nem működtek úgy az egyéni hibák utáni kisegítések, mint a nyáron. És mit ér a több támadás, ha közben a lövések számában (Eb: 6, szeptemberi vb-selejtezők: 5.5), kiváltképp a kaput eltaláló lövésekében (3.3, 1.5), no meg a gólok számában (Eb: 3 meccs, 3 gól, vb-selejtezők: 2 meccs 0) elmaradtunk a júniusi teljesítménytől, mert a támadók elöl, döntő helyzetekben rossz megoldásokat választottak (pedig a vb-selejtezős xG-mutatók megegyeztek az Eb-n látottal)?

Vegyük azonban észre, hogy az első mondatban az első három megállapítás valójában egy és ugyanaz: több jó passz = több labdabirtoklás = kevesebb támadás az ellenfél részéről. Logikusan ezzel összefügg a lövések száma, azaz továbbra is ugyanazt látjuk, nincs új értelmezés, új információ. Az állítása ennek a mondatnak végül is az, hogy bár sikerült többet passzolnunk, mégis több gólt kaptunk. Ez a következtetés azért elég sánta állítás. Minél többet birtokolom labdát (ami a támadásépítésről szól), akkor ugyan nincs annyi ideje a másiknak csapat a gólszerzésre, de lehetősége (ez pedig a védekezési képességről) attól még sok lehet. A két változó lényegében független (laza összefüggés van, pusztán azért, mert két csapat van csak a pályán és az idő áttételesen, töredékesen és esetlegesen gólszerzési lehetőséggé konvertálható).

Matematikai nyelven szólva az állítás a független tényezők kivonásával és az ismétlődések szűrésével a következőre egyszerűsíthető: több gólt kaptunk. Valójában ez az egyetlen helyes állítás. Előfordul az ilyen a legjobbakkal is…

Az xG jelzést azonban félreérti a szerző: nem azt jelzi, hogy valaki „rossz megoldást” választott, nem is a „helyzetek minőségét” (egy helyzetre még csak-csak értem és rendben is van, de egy mérkőzésre?!), hanem hogy 100 kísérletből („helyes” vagy „nem helyes” megoldást választva) hány gól születik. Akkor is, ha Messinél van a labda, és akkor is, ha a egy megyei mérkőzés sánta csatáránál. A kezdőkörből kapura lőni is xG értéket produkál. Rá lehet lőni egy meccsen 50x is, akkor kijöhet a 0,5-ös xG. A gól valószínűsége azért igen kicsi, mert pl. Seaman kell hozzá, hogy benézze. Ha jól lőttük, ha nem.

A lövések számával összevetve már érdekesebb a kép: az angolok átlagos lövése, helyzete (a cikk fogalmaival „minősége”) 0,17 xG értékű volt, míg Albánié 0,12 xG. A mieink értéke: 0,07 xG a két selejtező mérkőzésen átlagban, és 0,1 xG az EB-nél. Ebben van valójában a különbség. De legyünk őszinték, az xG nem véletlenül egy átlagérték, és mint ilyen az átlaghoz KELL, hogy tartson. Az EB-n erőn felül teljesítettünk, 0,5 xG-re 1 rúgott gólos átlag pontosan ezt jelenti. 5 mérkőzést nézve az xG értünk mérkőzések átlagában továbbra is 0,5, de nem nagy meglepetés, ha azt mondom, hogy az 3 gól / 5 mérkőzés az 0,6 (eggyel kevesebb gól pedig 0,4 lenne) a 0,5 érték felé tart. A várhatóértékek már csak így szoktak viselkedni. Hasonlóan, a 2,3 xG átlagban ellenünk szerzett és a „csak” 2db ténylegesen átlagosan kapott gól esetén is szerencse fiai voltunk az EB-n. Az öt mérkőzés (3db EB+2db selejtező) átlagos xG értéke 2,16, és láss csodát 2,2 gól volt a kapott gólátlagunk az öt mérkőzésen. Nincs meglepetés, az történt, amire számítani lehetett ilyen xG értékek mellett.

Nem a csatárok választottak rossz megoldást, hanem nincs xG értékünk, lövésünk. Az xG kumulatív érték, azaz a "helyzetek összeadódnak". Alacsony xG nem rossz minőségű helyzetet jelez, hanem kevés "érdemi" próbálkozást. Azaz nem jutunk el az ellenfél kapujához (vagy következetesen nem lőnek a támadók?!), nem dolgozunk ki helyzeteket (sem). Miért mondom ezt? Minden csapat közel 90 alkalommal eljut a védekező harmadunkba. Ez részben összefüggésben van a labdabirtoklással – ahogy korábban is írtam – igazából a labdabirtoklásra időre vetítve közel 1,8-2 támadás / labdabirtoklási perc jut a csapatokra, a mienkre is. Néha több, néha kevesebb (motivációtól és taktikától is függ). Viszont ha már eljutott, akkor az ellenfeleink nagyjából 15% eséllyel kapura is fog rúgni ellenünk. Nálunk ez a mutató viszont csak 8,5%. Minden mérkőzésen. Véletlen?

Beszélhetünk így csatárokról és védőkről, de ez sajnos a középpálya problémája (is). Nincs támasz és/vagy nincs szűrés. Ilyen alacsony „konverziós ráta” mellett (avagy az ellenfél magas rátája okán) vagy csak ordítóan nagy helyzetekkel, kontrákkal, elfutásokkal lehet nyerni, vagy jelentősen meg kell növelni a labdabirtoklási időt. Labdabirtoklási időre vetítve a „bruttó labdabirtoklási idő” 1,3%-át tudjuk gólra váltani, ellenfeleink pedig a 2,7%-át. Albánia megveréséhez ez alapján 66%-os labdabirtoklás felett tudtuk volna közel biztosan megverni.

Mennyire lehet erre játszani? Elég gyors-e a magyar futball ehhez?

Még egy adalék: a labdabirtoklási időre vonatkozó jó átadások száma is érdekes lehet. Az EB nagyszerű csapatai és Anglia is nagyjából 10,3 átadást produkálnak „labdabirtoklási” percenként. Az idézőjel annak szól, hogy a tiszta játékidő nem szerepel a cikkben (sem), így a labdabirtoklást a 90 perces mérkőzéshosszra vetítettem – amúgy teljesen hibásan. Albánia esetében ez a szám 9,4, ellenük pedig nekünk 9,18 ez az arány, az EB-n 8,6 volt, Anglia ellen is 9,4 körüli. A számokból azért látszik, hogy a jobbak ennyivel gyorsabban járatják a labdát.

Az biztos, hogy sokkal több gólt kaptunk, mint a két mérkőzésen „érdemeltünk” volna, de csak visszaadta a sors, amit az EB-n levett rólunk, hogy szárnyalni tudjunk. Az összes többi állítás és paraméter ezzel nincs összefüggésben, pontosabban ugyanazt jelzik: próbálkozunk, ahogy tudunk. A baj az alacsony lövés / támadás, ahhoz képest is alacsony átlagos xG / lövés értékben, a lassú labdajáratásban, a védekezési mélységben van. Hogy ezeknek mi az oka, miért alakulnak így, az nem derül ki a számokból. Az egy másik szakma nagy kérdése lehet.

Statisztikai mutatókról és a realitásérzékről...

Az elmúlt héten két olyan cikk jelent meg az NSO és az MTK gondozásában, amelyek bár külön-külön akár meg is állhatnák a helyüket, inkább matematikai vagy realitásérzékbeli hiányosságokat tükröznek. Ritkán szoktam ennyire élesen és határozottan fogalmazni, de most azért van rá szükség, mert egy komplett szakmát és szakmai gondolkodást ásnak alá olyan cikkek, amelyek ennek ellenkezőjére lennének hivatottak.

A statisztika szerepe

Az NSO cikke esetében (a cikkhez nincs szerző, így nem tudok ennél pontosítani) a cikk arról értekezik, hogy mire jó a sok statisztika a mérkőzések közvetítésében. A cikket elolvasva a szerző arra a (ki nem mondott) konklúzióra jut, hogy semmi, merthogy egyik statisztikai mutató sem mond sokat a mérkőzés alakulásáról, másrészt mindennél van "jobb mutató" is. Egy olyan újságban, amely a mérkőzésekről tudósít, sokszor ezen mutatók támogatásával, nos, ez legalábbis szokatlan. Önmagában sem a véleménnyel, sem az állításokkal nem lenne problémám, ha ez így szakmailag korrekt lenne. Tegyük hozzá, hogy a szándék valószínűleg az lehetett, hogy a statisztika önmagában, értelmezés, kontextustól nélkül értelmetlen, de nem így sikerült végül megírni a cikket.

A mérkőzés közvetítésében a statisztika szerepe sokkal egyszerűbb: tartalomélményt kell adni. A riporter eredeti feladata a termék (mérkőzésközvetítés) eladása, vagyis az az élmény megteremtése, hogy a néző többet kap az által, hogy a képernyőn nézi a mérkőzést, mintha élőben látná. Olyan vagy legalább hasonló hangulatot kellene teremtsen, mint amilyen a lelátókon van. Már ha azt valaki megtapasztalta a maga teljességében. A statisztika olyan hozzáadott "érték", ami segíti a közvetítést, extra tartalommal tölti meg. Olyan mint a több, mint 10 perces akció- és szexjelenetek sorozata egy amúgy 20 perces cselekményű filmben. A mérkőzést közvetítő riporterek sem lettek jobbak az idők során (én viszonylag ifjúnak gondolom magam, de Szepesi György szintjét még mindig nem érik el a mai riporterek, olykor Hajdú B. István tud magával ragadó lenni - de ez magánvélemény), sem informáltabbak, sem értőbbek az amúgy is egyre bonyolultabb labdarúgáshoz, kell valami gumicsont, amiről lehet beszélni. Ez a szerepe a statisztikának a közvetítésekben. Nem több, nem kevesebb.

A statisztika vagy pláne statisztikai mutató önmagában semmire nem alkalmas. A statisztika maga egy jelenség, egy megfigyelés matematikai leírásának tudománya. Nem megállapít, leír. Abban segít, hogy fogalmunk legyen arról, hogy mivel állunk szemben. De egy mutató nem mutató. Egy angliai egyetemi felmérés szerint például van olyan egyetemi szak, ahol a női hallgatók felének volt szexuális kapcsolata a professzorukkal. Amikor megvizsgálták a botrányt okozó intézményt, megállapították, hogy 2 beiratkozott női hallgatójuk volt, aki közül az egyik a professzor felesége. Ő pedig őszinte volt. Aki a gólok számából, a futott kilométerekből messze menő következést von le, éppolyan hibás, mint aki azt gondolja, hogy a mérkőzést helyzetekre játsszák. A statisztikai mutatók nem önmagukban informatívak, hanem együttesen mutatnak egy képet, amelyet interpretálni, értelmezni kell tudni.

Ha sokat volt a csapatnál a labda és sokat is futott, az együtt értelmezhető (valahogy). Ha sokat van valakinél a labda, és kevesebbet fut, az egy másik eset. Igen, számít ehhez az állás, a játékosok képessége és minősége, de az is, hogy hányszor cserél gazdát egy időegység alatt a labda, azaz ezek mellé is kell sok-sok viszonyítási pont, hogy objektív képet kapjon az ember. Sherlock Holmes szavaival élve: nem bizonyítékokat kell keresni egy-egy elkövető lebuktatásához, hanem az összes(!) bizonyítékot figyelembe kell venni, hogy meghatározzuk a gyilkos személyét (és motivációit). A mai áltudományos világban különösen fontos megérteni, hogy egy elmélet, feltételezés, álláspont akkor helytálló, ha bizonyítékok igazolják ÉS egy sem mond ellent neki.

A kapura lövések száma semmivel nem informatívabb az xG (gólszerzés várható értéke) mutatónál, ahogy ez fordítva sem igaz. Maga az xG mutató is valójában több tíz mutatót rejthet, a cikkben például a kaputól való távolság függvényében mutatnak egy gólszerzési valószínűséget, ami éppúgy lehet tévút, mint a kapura lövések száma. Gondoljunk csak bele, a büntető gólszerzési valószínűsége mégiscsak nagyobb, mint a szögletből az ötös és a kapufa vonalához érkező, 3 védő (plusz kapus) szorításában fejelő védőé. Üres kapura meg akár félpályáról is nagyobb eséllyel találunk be, mint a tizenhatos területéről felállt védelem ellen. A kontextus mindkettőből hiányzik. A cikk szerint az xG mutató kivesz egy szerencsefaktor a rendszerből. Ellenkezőleg. Nem csak, hogy kifejezetten azt mutatja, de ráadásul több szinten integrál más "szerencsetényezőket" is. Például, hogy egy játékosnál hány "bénább" játékos van még a ligában, hiszen az xG egy relatív mutató - más játékosokhoz képest viszonyít. A mutatók nem mindenhatóak, a kapura lövések száma (volt lehetősége lőni - és a támadó hitt abban, hogy gólt tud lőni) éppolyan fontos, mint megvizsgálni, hogy mennyire sikeres egy-egy helyzetkihasználás. Más a célja, egyik sem jobb a másiknál, de önmagában mindkettő haszontalan, értelmezhetetlen.

Bizonyos játékosok szerepe tekintetében az edzőket húzza le a cikk, szerintük poszt specifikusan nézzük meg a mutatóit azután mondjunk ítéletet. Adatelemzés alapvetése, hogy amiről nincs információnk, arról nem ítélkezünk. A statisztika azt nem mondja meg, hogy mit kért az edző. Ő tudja mit kért, ki mit és hogyan valósított meg ebből, és a koncepciójának mi volt ennek megfelelően a kulcseleme. Az adatelemző nem edző, ne gondolja, hogy okosabb nála. Máshoz ért. Egy védő lehet rossz, hogy kevesebb "szerelést" mutatott be, de ha az volt a kérés, hogy pl. állítsa inkább lesre az ellenfelet, akkor jól végezte a dolgát? Ha az ellenfél hosszú labdás (mélységi átadáson alapuló) kontrákra játszik, amelynek a passzpontossága elve elmarad a tiki-taka pontosságától, vajon jobb lett a védő attól, hogy több labdát fülelt le? A mérkőzés képe adja meg a választ, szinte garantálható, hogy több szerelése, labdaszerzése lesz. Melyik esetben lesz egy középpályásnak több kulcspassza, ha az ellenfél nyílt sisakkal rohamoz, vagy ha betömörül a kapuja elé? Ha a helyzetek teremtését emeljük piedesztára, miért nem nézzük meg, hogy ki teremti azt a helyzetet, amely a helyzetteremtést eredményezi? Sokszor ugyanis a labda nélkül mozgó egyik támadó viszi el vagy zavarja össze azt a védőt, aki miatt helyzet egyáltalán létrejön - és jó eséllyel nem ez a játékos kapja majd a labdát. Kosárlabdában ő a zárás, a kézilabdában pedig sokszor ezt teszi a beállós. Őt melyik mutató írja le? Nem lő, nem passzol, csak teszi a dolgát. Nem lehet, hogy az edző éppen ezt a játékost dicséri?

Rajonghatunk a mutatókért, de egy-egy mutató nem segíti a labdarúgást: elemezni kell megtanulni, ami egy szakma.

A realitás érzék

Az MTK-Honvéd Magyar Kupa elődöntő második mérkőzéséről egy szokatlan "elemzés" jelent meg a klub honlapján. Mindenekelőtt gratulálunk az MTK-nak, tisztes helytállást láthattunk tőlük, nem vitatva azt sem, hogy komoly fizikai felkészülésen vannak túl. A publikált számok azonban nagyon furcsák. Katona Máté 16 km, Cseke Benjámin 15,5km, Pintér Ádám 14 km, Prosser Dániel 14 km az összes megtett táv. 120 percre. Számoljunk egy kicsit!

8 km/h átlag (16km / 2h) önmagában nem lenne meglepő adat átlag sebességre, de ebben az "átlagban" benne van az ivószünet, és az álló játék is. Ismerve a magyar bajnokság játékidejét, 90 perc alatt általában 50-55 perc szokott lenni a tiszta játékidő, 120 perc alatt pedig aligha volt több, 70-75 percnél. Katonát amúgy a 115. percben lecserélték, de számoljunk 75 perc tiszta játékidővel az ő esetében is. 15 km-nél az országos csúcs 45 perc 15 másodperc, akinek nem kell megküzdenie éles gyorsításokkal, lassításokkal, irányváltásokkal, labdával(!) - és ideális esetben mindent kiad magából. Igaz, neki nincs ivószünet és negyedóra két félidő között. A cikkből ugyanis kiderül, hogy Katona nem csak sokat futott, de sokszor nagyon gyorsan is. 34,5 km/h sebességet is elért, és 183 alkalommal(!) jutott 25,1km/h (7 m/s - azaz sprint szint) fölé.183 alkalom nehezen értelmezhető, mert 183 oda-vissza támadás talán volt a mérkőzésen, de mindig sprintelt volna? A mérkőzésen ez nem így tűnt... Ha másodperc, akkor 1283 métert tett meg sprintben? Az elég jó részteljesítmény, hiszen az 1500 méter országos rekordja 3:35.57 (ami 215 másodperc). Értem, hogy a futásban nincs pihenő, de nincs is irányváltás, dinamikus mozgás, 34,5 km/h csúcs futás, "csak" állóképesség, erő, kitartás. Nem mellesleg a számok szerint Katona sem sokat pihent a mérkőzésen.

Korábbi cikkünkben tárgyaltuk mennyi sprintelnek az egyes bajnokságokban, ez több, mint kiemelkedő. Ha tartósan hozza ezt a formát, akkor kétségtelenül a Premier League-ben van a helye a játékosnak. Ha viszont ennyire jó futó, akkor miért nem erre épül az MTK támadó játéka? Ha ő ennyit és ilyen gyorsan fut, akkor hol vannak hozzá képest a többiek?

Fenntartjuk a jogot a tévedésre, de az adatok kapcsán az emberben a realitás érzék megszólal. Ez az adat egyáltalán nem valószínű, hogy helyes. Nem gondoljuk, hogy itt adathamisítás történt, egyszerűen csak más magyarázat van a mérési eredményre. Például rosszul lett rögzítve a szenzor. Ha "lifeg", akkor is ilyen értékeket látunk, hiszen szegény szenzornak van holtjátéka. Vagy nem volt kalibrálva, esetleg olyan szakaszokat is rögzített, amely nem a mérkőzés része (pl. bemelegítések).

süti beállítások módosítása