Метрика оборонительного вклада

Йохан Харкинс , ведущий аналитик OptaPro, в своей первой записи в блоге рассуждает об использовании метрики ожидаемых голов для оценки игры защитников.

За один последний год аналитика футбольной статистики сделала несколько шагов вперёд как внутри профессионального клуба, так и в разрезе онлайн и научного сообществ. Показатели конвертации созданных шансов и даже ожидаемых голов стали довольно популярными терминами, которые всё чаще упоминаются и служат прочным базисом для оценки качества выступления. Свидетельствуя об общем прогрессе футбольной статистики, тем не менее, все передовые нововведения в этой сфере обладают одной общей чертой – они оценивают вклад в атакующие действия. В разгар бума релевантности футбольных данных использование статистического анализа для оценки оборонительного вклада остаётся намного более сложной задачей.

В какой-то степени это ожидаемо. Данные на основе событий хорошо подходят для восприятия действий в нападении, так как большая их часть (но, конечно, не вся) выполняется с мячом. Анализ оборонительных действий с другой стороны быстро сводится к изучению альтернативных реальностей. Грамотно расположенный защитник может отбить у нападающего само желание произвести удар. Но как в цифрах выразить предотвращение возможного удара?

Чтобы получить более эффективный анализ футбольных данных, я часто смотрю, как это работает в других видах спорта. По оборонительным метрикам целесообразно заглянуть в НБА, где данная тема получила развитие. Длительное время для измерения индивидуальных оборонительных качеств баскетболистов использовались действия на мяче: блок-шоты и стилы (перехваты). Но с недавних пор баскетбольное общество и даже сама ассоциация начали оценивать статистику количества и эффективности бросков соперника с различных участков поля, когда игрок находится на площадке, и сопоставлять с результатами выступления команды без него. Таким образом, можно вычислить некоторую часть оборонительного влияния игрока на команду без подсчёта новых статистических показателей.

Перехваты и отборы могут свидетельствовать о многих интересных моментах, но они не полностью характеризуют игру защитника. На основе данных Opta я взглянул, как этот новаторский подход из НБА применим в футболе.

Используя существующую модель ожидаемых голов (данная статья не предусматривает обсуждения методологии её формирования), я собрал информацию по каждому оборонительному футболисту в матчах Премьер-Лиги и вывел значения ожидаемых голов соперника с ними на поле и без них. Затем я учёл поправку на уровень оппонента путём вычитания среднего значения ожидаемых голов команды. Итоговые показатели по каждому игроку отображают влияние на уровень ожидаемых голов противника с учётом проведённого на поле времени, выраженных в значениях на 90 минут. Оценивается дозволенность создаваемых шансов противника, поэтому отрицательные значения предпочтительны.

Влияние на уровень ожидаемых голов игроков «Арсенала» и «Манчестер Юнайтед»:

arsenal-and-manchester-utd_580x367
Последние 3 столбца:

  • как изменяется уровень ожидаемых голов, если игрок на поле
  • как изменяется уровень ожидаемых голов, если команда играет без него
  • итоговое влияние игрока на уровень ожидаемых голов = столбец №1 – столбец №2

Представленные две команды провели два отличных с точки зрения организации обороны сезона. «Арсенал» использовал различных игроков в основе на протяжении определенных отрезков сезона, наибольшей ротации подверглись позиции крайних защитников. «Манчестер Юнайтед» в свою очередь выставлял почти всегда новую линию обороны вследствие не только травм отдельных футболистов, но и тактических перестроений тренера.

«Арсенал»

Матьё Дебюши получил травму на ранней стадии сезона, после чего первое время Калум Чемберс, а ближе к концу чемпионата Эктор Беллерин, считались основными правым защитником. Каждый из этого трио получил своё время на поле в сезоне, поэтому их данные можно рассматривать как более наглядные примеры выступлений «канониров» с ними и без них. Статистика влияния на уровень ожидаемых голов подтверждает сильные позиции Беллерина. Его итоговый показатель -0,2095 подразумевает, что с ним на поле значение ожидаемых голов соперника «Арсенала» становится на 1/5 гола ниже [или на один пропущенный мяч меньше в 5 матчах, чем на аналогичном отрезке без него]. Не забываем, речь только об оборонительном вкладе, а от крайних защитников зачастую многого ждут ещё и в атакующих действиях.

На левом фланге обороны Киран Гиббс и Начо Монреаль на разных отрезках были основными крайними защитником «Арсенала». Монреаля использовали большую часть второй половины сезона, и его рейтинг заметно лучше. Показатель Гиббса 0,3849 предполагает, что с ним в составе оборонительно «Арсенал» выступает заметно хуже, чем без него.

«Манчестер Юнайтед»

У «МЮ» статистика подчеркивает важность Фила Джонса. Его использование в центре защиты понижало уровень ожидаемых голов противника в среднем более чем на треть гола. Высокие значения у Антонио Валенсии и Эшли Янга, что в какой-то степени отражает выбор в их пользу перед относительно слабыми значениями своих наиболее частых сменщиков в лице Рафаэля и Люка Шоу соответственно. Учитывая различие схем и смены позиций между оборонительными игроками «Юнайтед», больше интересной информации можно получить, если просчитать влияние на ожидаемые голы по каждой схеме или позиции.

Заключение

Данная метрика полезна как для нахождения оптимального сочетания игроков команды, так и для оценки индивидуальных действий. Тем не менее, она не совершенна. Баскетбольный метод не так хорошо подходит футболу. Подвижная природа построений в баскетболе делает использование этой методологии более универсальной. Итоговый показатель влияния у таких игроков, как Пер Мертезакер, который отыграл почти все минуты за «Арсенал», сильно зависит от значения выступления команды без него на поле, где выборка минут очень мала. Более того, вообще любая попытка оценить игроков по результатам выступления оппонентов приводит к ряду неконтролируемых переменных, влияющих на итоговые цифры. Тем не менее, это первый шаг учёта едва уловимых моментов, которыми защитники могут оказать влияние на игру, та область, где точно потребуется нестандартное мышление.


Источник: OptaPro

  • Al Cappucсino

    На мой взгляд, логичным было бы рассматривать сразу пары защитников (цз) - тогда это была бы довольно наглядная статитстика. а брать отдельно игроков, которые работают совместно, а потом учитывать крайних с этой целью...даже не знаю) но подход интресный.

  • Igor Stepanov

    Эх. Получить бы доступ ко всем данным опты хотя бы на месяц...

  • CROSBY

    Даешь ОТАМЕНДИ или ДЕ ВРЕЯ!

    • Lemm

      Есть же раздел специальный, чтобы слушать кого кто хочет 🙂

  • Автор думает в правильном направлений, однако выбранный им метод не совсем подходит для футбола. В НБА где играют 5 на 5 благодаря малому количеству людей в игре, определить
    влияние каждого игрока на атаку/защиту проще чем футболе. А в футболе очень много
    факторов влияют на то пропустит ли команда или нет. 1 защитник может провести выдающийся
    матч, но команда может пропустить много голов, поэтому нужно учесть еще игру вратаря, других защитников, опорной зоны и тд.

    • Lemm

      А еще и нападающих, которые могли бы вступить в прессинг и отобрать мяч вообще на чужой стороне поля. Все это из разряда бы. С точки зрения статистики, как науки , данная выборка - абсолютно верная. И единственное узкое в ней место - неравномерное распределение игрового времени. У игроков вроде Мертезакера всегда будут средние по команде показатели.

      Можно попробовать делать поправку на активные действия, совершаемые игроком, но не уверен, что это хороший способ

    • Andrey Krivonogov

      действия других сложно наверное учитывать, плюс влияние не очевидно. А вот ограничить считаемые ожидаемые голы только ударами из непосредственной зоны ответственности игрока + с пасов из зоны ответственности можно попробовать.

    • Кирилл Быков

      Все, что нужно - чуть большая, чем в баскетболе длина дистанции.

  • ANIMAWKA 2.0

    Статистика муть)

  • Кирилл Быков

    Огромное спасибо, очень интересный материал.

    "Грамотно расположенный защитник может отбить у нападающего само желание произвести удар." - краеугольный камень статистики оборонительных действий. Будет полезен людям, которые требуют объяснить важность М. Каррика с точки зрения статистики. Его бесценное умение не давать разрываться линиям и сохранять баланс почти нереально оценить статистически.

    Единственное, что оставляет вопросы: "Затем я учёл поправку на уровень оппонента путём вычитания среднего значения ожидаемых голов команды." - интересен алгоритм, по которому автор вычитал это самое среднее значение.

    • Lemm

      Я вообще хотел бы получить доступ к опте, посмотреть на кучу статистики. Там ведь целая вселенная, неизведанный край данных, можно много нового почерпнуть для себя.

      А по поводу Каррика - вот именно это умение и есть его ключевой навык. Он накрывает самую опасную зону - зону десятки, не оставляя ее открытой никогда. Это фактически отрезает дальние удары по воротам и прямую доставку мяча нападающим.

      • Кирилл Быков

        Я так и не разобрался в их сайте, а много читать было лень, но где-то здесь, на каррике, мне объясняли, что их (OPTA) сервисами пользуются телевизионщики и даже футбольные клубы, соответственно, услуги их стоят недешево.

        По Каррику - это касается не только реджиста, но и чистокровных опорников типа Макелеле или Гаттузо. Сам факт их наличия в определенной зоне не дает развернуться контратаке оппонента на полной скорости, при этом они могут не вступать в отбор в и вообще не контактировать с мячом. И это лишь один из многих примеров. Отсюда концепция - статистика это очень здорово, информативно и полезно, но иногда нужно просто полагаться на то, что видишь, на здравый смысл.

        • Lemm

          По поводу опты - насколько я знаю, они не против иногда снабжать небольшими выборками за просто так. Все же услуги недешевы, но ведь как-то хочется получать доступ 🙂
          Хотя бы на самые примитивные выборки 🙂

          • Igor Stepanov

            Если есть доступ к университету - можете сделать в опту запрос от имени универа с целью научной работы. Обычно такие компании как опта дают данные под конкретный научный проект бесплатно.

          • Lemm

            Есть, можно будет попробовать 🙂

  • CrzyMphst

    Спасибо за перевод. Очень интересная статья, если что-то подобное еще появится, хотелось бы тоже познакомиться.

  • Lemm

    Я же говорил, что Валя крут!

    • One United

      Интересный подход. Валя решает)

    • Sergey Pgkgyexcht

      Мне сложно верить статистике, по которой Монреаль хороший защитник)

      • Lemm

        Это не значит, что он хороший защитник, это значит, что он хороший деф в рамках Арсенала. А там такой подбор в защите, что Монреаль на уровне вполне 🙂

        • Sergey Pgkgyexcht

          Он даже в рамках Арсенала не уровень)

          • Lemm

            А кто уровень? Гиббс? Надеюсь, что вы шутите)

          • Sergey Pgkgyexcht

            Надеюсь Вы шутите про Монреаля)

          • Lemm

            Так а кто? Назовите мне фамилию. Там только Косельни тянет на звание приличного игрока обороны 🙂

          • Sergey Pgkgyexcht

            >Там только Косельни тянет на звание приличного игрока обороны

            Так мы ведем наше обсуждение все же "в рамках Арсенала" или в рамках абстрактной приличности игроков? Если "в рамках Арсенала", то практически любой защитник там сильнее Монреаля и только из-за травм остальных он отыграл столько в этом сезоне)

          • Lemm

            В рамках Арсенала, конечно. Хоть убейте меня, но я не могу сказать, что Гиббс лучше Монреаля. Не смотрел статистику, да и не особо хочу. мы вообще начали спорить с того, что это показатели в рамках команды и скатились в демагогию какую-то 🙂

            По поводу этйо статистики я уже писал где-т ов этой ветке. У нее есть один большой недостаток. Основной игрок, лидер обороны всегда будет бултыхаться где-то в центре рейтинга 🙂

          • Sergey Pgkgyexcht

            Только вот лучше, проигрывал конкуренцию Монреалю он только из-за травм.