Tenisova databáza

Tenisova databáza

16. May 0  

Tenisova databaza od TenisOnline je konecne hotova. 

Isto ste si vsimli ze v preview vam uvadzme jedinecny index s nazvom HighOdds Index. Je to index, ktory udava aka je pravdepodobnost prekvapeni na turnaji. Index vychadza z poslednych 5-tich sezon. Momentalne to bola jedina statistika ktoru sme publikovali. Vychadzala z dat, ktore sme rucne zbierali, ukladali v obrovskej excel tabulke.

COVID-19 stopol tenis a tak pre nas prisiel cas, konecne vsetky data ocistit, vytvorit strukturu pre databazu, vsetky data naimportovat a priniest vam jedinecne statistiky.

AKO TO FUNGUJE ?

Databaza obsahuje kumulativne cca 14.000 zapisov pre ATP a WTA. Data sme zaznamenavali od roku 2004 pre ATP turnaje a 2006 pre WTA turnaje. Challengerove zapasy su taktiez od roku 2006, ale nie su kompletne a momentalne nie su sucastou databazy. V priebehu roka by podla odozvy na databazu mohli byt aj tieto data sucastou statistik.

AKE ZAPASY SU SUCASTOU DATABAZY ?

V ramci TenisOnline milujeme prekvapenie, tenisove senzacie a vsetko co k tomu patri. Preto sa dlhodobo zameriavame na predikciu tychto zapasov. Do databazy sme tak od roku 2004 zapisovali vsetky zapasy, kde vyhral outsider v minimalnom kurze 2.4. Zapasy sme dalej rozdelovali podla roznych kriterii a tak si dovolime tvrdit ze sa jedna o uplne jedinecne data, kedze podobnym sposobom ich len velmi tazko niekto iny zbieral. Kurz sa urcoval na zaklade priemerneho kurzu z vyhladavacu kurzov a brali sme v uvahu kurz v momente uzavretia trhu.

AKE STATISTIKY MAME K DISPOZICII A AKO ICH VYUZIT ?

Tych statistik a grafov mame teraz k dispozici ozaj velmi vela a budeme ich postupne pridavat na nasu FB page.

Statistiky su rozneho typu. Napr dokaze povedat, ktory hrac mal najviac prekvapeni na antukovych turnajoch, kategorie 250. Dalej vieme ist do vacsich detailov ako za jednotilve roky, obdobia, konkretne mesiace, krajiny, proti konkretnym superom. Dokazeme urcit pocet prekvapeni, priemerny kurz pri prekvapeni, kumulativny kurz (spocitane vsetky vyherne kurzy dokopy). To iste vieme urcovat aj pri hracoch ktori prehravali. Je toho ozaj velmi vela co vieme urcit.

A ako to teda vyuzivame. Zozbierat data, precistit ich a nasledne z nich vytvorit zmysluplny celok je len prva cast nasej prace. V druhej casti sa chceme venovat machine learningu a na zaklade dat tvorit predikcie na obdobia pre hracov, ktori by mali mat pozitivny ci negativny vzostup. Mali by sme to urcovat pre jednotlive fazy sezony, povrchy ci klucove turnaje. 

PRECO MATEMATIKA V TENISE ?

Ak ste necitali nas predchadzajuci clanok BIG Data v tenise tak vam ho vrele odporucujeme. https://www.tenisonline.sk/blog/113-big-data-v-tenise/?backlink=mzwv2

Hraci ako Novak Djokovic uz davno maju vo svojich timov na full time top odbornikov na statistiku a big data. Konkretne Novak spolupracuje s renomovanym  Craigom O'Shaughnessym, ktory na zaklade matematiky analyzuje jeho hru a hru jeho superov. Matematika a machine learning tak zacinaju byt neoddelitelnou sucastou aj tenisovych zapasov.

Ak ste citali svetoznamu knihu od Paula Coelha: Alchymista, tak istotne poznate jeho vyrok: Vsetko co sa stane jedenkrat sa uz nemusi stat nikdy. Ale vsetko co sa stalo dvakrat sa takmer urcite stane aj tretikrat. 

My s tymto vyrokom suhlasime a preto matemtiku pouzivame na tenisove predikcie a tvorbu patternov, ktore funguju.

CO PLANUJEME DALEJ ?

Toto je len zaciatok. K datam o zapasoch sme dorobili nove databazove schemy ktore obsahuju informacie o jednotlivych turnajoch. Tieto data sa daju navzajom kombinovat a vieme tak urcovat detailnejsie zavislosti. Momentalne vytvarame dalsie schemy, ktore sa venuju jednotlivym hracom. Kde budu uvedene detaily ako silne/slabe stranky, pravak/lavak, krajina atd atd.

Okrem toho k jednotlivym zapasom od tejto sezony pridavame popis kde sa da urcit co vplyvalo na typ prekvapenia. Ak sa napr hralo v zlom pocasi, super bol unaveny z predchadzajuceho dlheho zapasu atd.

Cesta je ciel a my verime, ze databaza TenisOnline bude po par sezonach silny nastroj na predikciu tenisovych prekvapeni. 

 

 

 

Komentáre