מהלכים משותפים בכדורגל: איך מודדים משהו בלתי מדיד?
מהלכים משותפים בכדורגל: איך מודדים משהו בלתי מדיד?
פעולות חשובות כמו תנועה תמידית ללא כדור וריצות חכמות שמזיזות הגנות כמעט ולא נראות בסטטיסטיקות. אמנם נתונים מסייעים למנהלים לבנות כדורגל ביעילות, אבל הקבוצה הראשונה שתדע איזה שחקן מייצר הכי הרבה שטח ללא הכדור, עשויה לזכות ביתרון יחסי משמעותי
אחת מהבעיות המרכזיות בנתונים על כדורגל היא שרוב הנתונים הם על פעולות עם הכדור כשרוב השחקנים נוגעים בכדור פחות מ-2 דקות בכל משחק. זו בעיה כי כמעט כל הנתונים שאפשר להפיק מכדורגל מתייחסים ל-2 הדקות הללו.
אפשר למדוד בקלות יחסית אחוזי הצלחה בכדרורים ומסירות, אבל הפעולות הללו תלויות מאוד בשחקן המקבל את המסירה או בשחקן שמפנה את השטח לכדרור. פעולות חשובות לא פחות של השחקן ללא הכדור שכמעט ולא נראות בסטטיסטיקות.
נתונים מתקדמים כגון שערים צפויים (xG) או בישולים צפויים (xA) מאפשרים ללמוד על איכות הפעולות המכריעות של כל שחקן וכל קבוצה - מסירה אחרונה, יכולת סיום מול השער וכו'. יש גם ונתונים חדשים מאוד יחסית כגון איום צפוי (Expected threat - xT) שעשויים ללמד הרבה מאוד על שחקנים שמקדמים את הכדור לשער (או להפך, חוסמים התקדמות לשער שלהם).
בנתון xT מחלקים את כל המגרש למאות ריבועים. מסירה מריבוע שממנו הסיכוי להבקיע הוא 0.008% (ליד קו החצי) לריבוע של 0.026% (על קצה הרחבה) זו מסירה עם ערך xT גבוה במיוחד. כדרור מוצלח מקצה רחבה (0.026%) למרכז רחבת החמש (0.134%) הוא גם בעל ערך גבוה מאוד. בסוף משחק או עונה אפשר לסכם כמה סיכון יצר כל שחקן בכדרור או מסירה.
למשל, בעונה שעברה קווין דה בריינה ממנצ'סטר סיטי יצר 0.27 איומים צפויים ל-90 דק' - יותר מכל שחקן אחר. אם נחשיב את המספרים הללו בלבד זה אומר שמדי משחק הוא העביר לפחות שני כדורים למקומות הכי מסוכנים על המגרש.
הבעיה במטריקה הזו, כמו כל מטריקה בעצם, היא שהיא אינה לוקחת בחשבון את התנועות של חבריו לקבוצה של המוסר המסוכן. הרי מסירה מוצלחת היא תוצאה של מסירה טובה וקבלה טובה של הכדור. קבלת כדור טובה תלויה בתנועה טובה ללא הכדור. ומאחר שהכדורגל הוא משחק בו כל תנועה של כל שחקן תלויה בתנועה של שחקן אחר, התנועה הטובה ללא הכדור תלויה לא פחות בתנועה של שחקנים נוספים הרחק מהכדור. או אם להביא את זה לרמת השטח: בשביל שהמגן הימני יקבל מסירת עומק מוצלחת מהקשר המרכזי באזור מסוכן, הקשר הימני צריך לפנות את עצמו לשטח פנוי ולקחת עימו שחקן או שחקני הגנה כדי שיהיה למגן הימני יותר שטח פנוי לקבלת הכדור, כדרור או הרמה. התנועה של הקשר הימני יכולה ליצור בעיות בהתקפה אבל גם לסגור את השטח של שחקן מסוכן יותר בקבוצה שלו - החלוץ או הפליימייקר. כך שלתנועה של הקשר יכולה להיות ערך גבוה מאוד או נמוך מאוד. והוא בכלל לא חלק מהמהלך כי הוא לא מסר או קיבל את הכדור.
ועוד לא נכנסו לחשיבות סגירת הזוויות והשטחים על ידי שחקני ההגנה. כל הגורמים הללו כמעט ולא נלקחים בחשבון כשמסתכלים על הנתונים - גם בקבוצות שמשתמשות במחלקות האנליטיקס הטובות ביותר עם הנתונים המתקדמים ביותר. הבעיה בנתונים מתקדמים בכדורגל היא שבסופו של דבר קשה לדעת כמה כל שחקן תורם לביצועים, לרמת המסוכנות של הקבוצה שלו ולניצחונות.
"אנחנו רוצים לדעת איך פעולה של שחקן משנה את הסיכויים של קבוצה לכבוש שער"
חברת Twelve Football היא כרגע החברה היחידה שמנסה להעניק ערך לכל התנועות של השחקנים עם צילומים ולמידת מכונות. הם יצרו מדד שנקרא Target Run Value, המדד לוקח בחשבון את השטח שנוצר מתנועה של שחקן. בחברה מנסים גם להעניק ערך ליצירת שטח - כלומר כמה השטח שיצר "שווה". המדד של Twelve Football מלמד, למשל, שמבין כל השחקנים בפרמיירליג רוברטו פירמינו הוא השחקן הקדמי שמייצר הכי הרבה שטחים לחבריו לקבוצה. זה גם עובר את "מבחן העין" כי פירמינו טוב ביצירת שטחים באופן קיצוני.
דיוויד סומפטר, פרופסור למתמטיקה שכתב את הספר Soccermatics והוא אחד מהבעלים של Twelve Football, מספר כבר זמן רב שהוא מנסה להגיע למדד כמה שיותר שלם של תנועה ללא כדור, פעולות על הכדור, איכות הפעולות ללא הכדור ועם הכדור. "בסופו של דבר אנחנו רוצים לדעת איך פעולה של שחקן משנה את הסיכויים של קבוצה לכבוש שער" אומר סומפטר. "ריצה ללא כדור גם יכולה להיות בעלת ערך רב ומדיד".
תנועה תמידית ללא כדור וריצות חכמות שמזיזות הגנות גורמות לבלבול ולחוסר סדר בהגנה ויוצרות שטחים וחללים - יש בדברים הללו ערך עצום. הם הדברים שמגדילים את הסיכויים לכיבוש שער. וכרגע מעטים משתמשים בנתונים האלה. הקבוצה הראשונה שתדע איך להשתמש בנתונים הללו כדי לבחור הרכבים טובים יותר ולהביא שחקנים מתאימים יותר, תזכה ביתרון יחסי משמעותי.