xFootball: Что такое xG и как превратить xG в xPoints

А. Кузнецов, О. Железнов

Последнее время в комментариях просто в геометрической прогрессии множатся различные вариации вопроса «Что такое xG?». Постоянно ссылаться на авторов других ресурсов, рассматривавших эту тему, потихоньку становится стыдно, потому — держите разбор главного футбольного тренда 2016-го от Карриковедения.

Модель xG — метод оценки качества шансов, которые команда создаёт в атаке или позволяет создать сопернику у своих ворот. Сама аббревиатура xG (сокр. от expected goals) так и переводится — «ожидаемые голы». Позднее появилось ещё несколько показателей: xA — «ожидаемые голевые пасы», xW/xD/xL — «ожидаемые победы/ничьи/поражения», xPoints — «ожидаемые набранные очки» и xGa/xAa — «допущенные ожидаемые голы/ассисты» — то есть голы и голевые пасы, которые анализируемая команда позволила создать сопернику.

Освежим знания из теории вероятностей, чтобы понять, как считаются все эти показатели: допустим, у нас есть случайный эксперимент A — «игрок бьёт по воротам». Какой игрок, как бьёт — пока неважно. У этого эксперимента есть множество исходов Ω = {«игрок пробил мимо», «удар заблокирован одним из полевых игроков», «вратарь парировал удар», «игрок попал в каркас ворот», «игрок забил гол»}. Есть ещё некоторое количество возможных исходов, вроде «игрок промазал мимо мяча» или «прилетели инопланетяне и испепелили мяч на лету», но мы опустим их для простоты понимания. Каждый из этих исходов имеет определенную вероятность наступления, сумма которых даёт нам единицу, то есть 100%-ю вероятность того, что игрок ударил по мячу. И, собственно, вероятность наступления исхода «игрок забил гол» — это и есть значение искомого параметра xG для данного конкретного удара. После матча xG всех ударов суммируется и мы получаем те самые цифры, графики и схемы, которые вы в последнее время так часто встречаете. Тем не менее нужно помнить, что xG — не совсем классическая вероятность. Её можно интерпретировать как вероятность, но считается xG не как вероятность, а как значение функции, сглаженное логистической регрессией (чтобы попадать в диапазон от 0 до 1). То есть, грубо говоря, xG — это в первую очередь индекс качества момента, который можно интерпретировать как вероятность забить гол этим ударом. Это очень важный нюанс.

Не будем подробно останавливаться на истории появления xG, потому что она всё ещё пишется, но отдельного упоминания заслуживают норвежский тренер Эгил Ольсен, ещё 20 лет назад заложивший основы этой модели во время своей работы с национальной сборной, и английский журналист Майкл Кэйли, год назад опубликовавший статью Premier League Projections and New Expected Goals и ставший одним из главных популяризаторов модели. Впрочем, употреблять слово «модель» в единственном числе здесь не совсем верно, на данный момент существует несколько методов подсчёта xG, которые отличаются подходом к расчету (некоторые модели используют лишь положение на поле, некоторые вообще основаны на количестве действий в штрафной соперника и так далее).

В данной статье мы остановимся на модели Майкла Кэйли. В попытке создать как можно меньше формул, но при этом сохранить нюансы различных видов шансов, Майкл остановился на 6 типах ударов по воротам:

  • прямые удары со штрафного;
  • удары после обыгрыша вратаря;
  • удары головой после навеса;
  • удары головой после других типов передач;
  • удары другими частями тела после навеса;
  • так называемые «обычные» удары — удары, нанесённые не головой и после передачи, отличной от навеса.

Да, пенальти и автоголы в модели Кэйли не учитываются и просто записываются в карточку результата матча как дополнительный статистический параметр. Исключение пенальти можно понять, потому как от пробивающего игрока ждут 100% гола, приравнивая удар с точки к 1,0 xG, что не совсем верно — на самом деле такой удар весит 0,8±0,05 в зависимости от лиги и сезона. Автоголы же абсолютно случайны, оценить вероятность автогола в матче просто невозможно.

Удары были дифференцированы именно так, потому что множества ударов каждого типа имеют различные (но схожие для ударов одного типа) кривые зависимости вероятности забить гол от угла и расстояния до ворот. Кроме этих факторов, учитываются позиция пасующего и тип атаки (заслуживающая упоминания статья о качестве дальних ударов). Вопреки расхожему мнению, мастерство вратаря и так называемое «умение завершать атаки» (англ. «finishing») бьющего игрока влияют на вероятность гола гораздо меньше, чем перечисленные выше факторы. Это легко можно доказать с помощью коэффициента корреляции — статистической зависимости двух величин друг от друга (изменение одной величины влечёт за собой изменение другой): лишь для игроков, наносящих за сезон более 250 ударов, коэффициент корреляции «финишинга» принимает сколько-нибудь значимое значение. Чтобы это проверить, нужно взять игроков, разбить все их удары на две выборки одинакового размера и проверить, существует ли какая-то корреляция. Для убедительности стоит повторить это действие несколько раз. Коэффициент корреляции считается сильным, если принимает значение от 0,7 (или −0,7 если корреляция отрицательная) и больше. player_finishing_by_bucket-0

Premier League Projections and New Expected Goals

То есть, как мы видим из графика выше, существует лишь некая очень слабая связь между качеством шансов и их конвертацией для игроков, нанесших более 250 ударов за последние 5 лет. Исходя из этого, можно сказать, что мастерство нападающего выражается в другом — в более качественных шансах. Умение открыться и найти мяч в штрафной соперника — тот самый пресловутый инстинкт хищника, который делает игрока нападающим топ-уровня. У вратарей же вообще нет никакой сколько-нибудь значимой корреляции, потому что если игрок наносит удар весом 0,6–0,8 xG — с одинаковой вероятностью его пропустят как Де Хеа с Акинфеевым, так и Гатальский. Но ведь мастерство топ-вратаря далеко не заканчивается на (не)умении отражать «мёртвые» удары.

В первую очередь, проблема отсутствия какой-либо зависимости кроется в объёме выборки — очень важном для статистического анализа понятии. Кэйли приводит отличный пример: в предпоследнем сезоне НХЛ Александр Овечкин совершил 795 бросков по воротам, Стефен Карри в том же сезоне 1341 раз бросил мяч в кольцо в НБА. В футболе же есть только два игрока, ударившие по воротам более 1000 раз за последние 6 лет (исключая пенальти). Догадываетесь, как их зовут?

shot_conversion-0
Premier League Projections and New Expected Goals

«И, собственно, к чему всё это?» — можете спросить вы. «Всё это» — ещё одна попытка осознать и описать хотя бы часть игры в футбол с помощью статистического анализа, преследующая две цели: понять, насколько хорошо команда создаёт и реализует свои моменты и насколько реальные результаты команды (в которые частенько вмешивается его величество Случай) отличаются от «сферических в вакууме». С первым всё просто — в один гол конвертируется примерно 0,6–0,8 xG, значит если анализируемая команда наиграла хотя бы на это количество — забить минимум раз она точно заслужила. Со вторым всё гораздо интереснее: удача играет большую роль в футболе из-за пресловутого малого количества матчей и малой результативности, просто сравните его с баскетболом и бейсболом и поймёте, почему «просчитать» футбол гораздо сложнее.

Перейдём к xPoints. Допустим, играют команды А и B, и команда А создала 10 шансов по 0,2 xG каждый, а команда B — 10 шансов по 0,1 xG. Маловероятно, что матч завершится со счётом 10–10, так же маловероятно, что команда B выиграет 3–0... Хотя в таком фортунозависимом спорте, как футбол, всё возможно! В теории вероятностей есть формула полной вероятности, которая позволяет вычислить вероятность интересующего события через условные вероятности этого события. В случае матча, в котором было создано по 10 моментов с каждой стороны, нужно учесть вероятность наступления каждого потенциально возможного исхода: 0–0, 1–0, 0–1, 1–1, 2–1 и так далее до 10–10. Затем с помощью формулы полной вероятности необходимо вычислить вероятность победы команды А, вероятность ничьей и вероятность победы команды B. Эти величины нужны, чтобы получить математическое ожидание (или среднее значение случайной величины) набранных командой очков, которое считается по формуле «кол-во очков, получаемых за победу, умножить на вероятность победы + кол-во очков, получаемых за ничью, умножить на вероятность ничьей». Готово — мы получили примерное количество очков, которое команда должна была набрать за матч.

«Что за бред, как количество очков может быть дробным? Как команда может набрать 1,7 или 0,3 очка?» — спросите вы. Тут необходимо понять, что xPoints — это не реальное количество очков, на которое наиграла команда, а некий показатель качества игры. Да, обычные очки, присуждаемые за победу/ничью — это тоже показатель качества, но значение этого показателя распределяется дискретно, то есть принадлежит множеству [0, 1, 3]. Дискретное значение подразумевает собой конечное число вероятностей, тем не менее довольно часто случаются матчи, после которых сложно сказать однозначно, что одна команда была явно сильнее другой. Именно поэтому для моделей, оценивающих качество игры команды, необходимо брать математическое ожидание величины, а не конкретное значение из множества выше. Оценив разницу реальных очков и xPoints, можно сделать выводы об удаче, сопутствующей команде, и понять, какие команды явно прыгают выше головы, а какие, наоборот, не реализуют свои шансы должным образом.

Составив таблицы xPoints для нескольких предыдущих сезонов, можно сказать, что в целом они служат хорошим ориентиром. В сезоне 2013/14 много команд действительно показали хорошую результативность, особенно «Ливерпуль», «Арсенал», «Тоттенхэм» и «Эвертон».

Из прошлогодней таблицы очевидно, что «Лестер» и «Вест Хэм» прыгнули намного выше головы. Не менее очевидно, почему Луи Ван Гал был уволен, несмотря на победу в Кубке Англии — ситуация в чемпионате была просто ужасающей. «Юнайтед» не только мало создавал, но и допускал у своих ворот слишком много опасных моментов — это признак верного середняка и отсутствия прогресса как такового. При этом утверждение, что многие команды выступили ниже своих возможностей, более чем справедливо — только 5 команд вышли в плюс по разнице xPoints и очков по итогам сезона, из них лишь 3 — сколько-нибудь значимо.

Сезон 2016-2017 «Юнайтед», несмотря на мнимую «полосу неудач» в матчах с андердогами, завершил с практически нулевой разницей P-xP.

Конечно же, xG не может претендовать, да и не претендует, на звание «универсальной теории всего» в футболе. Но если не возводить модель в культ и не пытаться судить об игре команды, руководствуясь только xG и xPoints, она может стать интересным инструментом для оценки качества игры команды, подхода главного тренера к стратегии создания голевых моментов и конверсии шансов — или реализации бьющих игроков.

xG-карта матча «Ньюкасл» – «Юнайтед» и таблицы xPoints предоставлены xMetrics.

Теги: , ,
  • Егор Гаврилов

    А где брать актуальную статистику по xG?

  • Вчерашний матч Челси-Эвертон очень наглядно демонстрирует плюсы и минусы этой модели. Челси заработал 1.9 xG, при этом забив 5 голов (Эвертон, кстати, получил ровно 0 - я такого не помню вообще). 1.9 xG - это очень неплохой показатель, но это явно меньше, чем 5 голов. О чем это говорит? О том, что xG неправильно моделировать на не ожидаемый, а реальный результат, а также о том, что высокая результативность Челси вчера - это хорошо, но это вчера. Регулярно такого быть не может в принципе. Даже в следующем матче не будет.

    • Lemm

      При моделировании ожидаемого результата Челси не получит счет 5-0, это точно)

  • Непоколебимая вера в Марсьяля

    Молодцы, весьма доходчиво.

    Последний абзац можно жирным выделить)

  • Блиндовед

    По итогу эта модель связана только с одним из элементов игры (удары по воротам и реализация). А из-за того, что она продуцирует некоторые очки, многие воспринимают это, как достоверно правильный счет матча за вычетом везения-невезения.

    Проблема этой модели еще и в том, что команды с разными стилями игры и аналогичным результатом могут часто иметь абсолютно разное количество очков xG.

    • alexalansmith14

      да, абсолютно верно. потому модель и нужно в первую очередь рассматривать как метрику качества именно ударов, а затем уже - делать выводы обо всём остальном. Но только осторожно )

  • Pervintin

    Спасибо за материал!
    уже вот много читал и интересовался хG..все же стоит выделить один большой минус - то,что эта модель учитывает лишь завершенные удары,ведь в футболе бывает очень много моментов,где вероятность гола велика и без удара, ну взять хотя бы там прострелы вдоль ворот и когда футболисту буквально считанных сантиметров не хватает,что бы дотянутся до мяча и переправить его в пустые ворота(ну или просто футболист подскользнулся и т.д)
    и еще один момент хотел узнать у автора,как ты вот считаешь ситуации,когда в одной атаке происходит несколько очень опасных ударов по воротам(к примеру,которые будут тянуть в сумме ну там на 1.2)?насколько я помню,Кайли в таких моментах ничего не предпринимает,и высчитывает каждый удар по отдельности,что на мой взгляд - не верно..ведь фактически невозможно наиграть за одну атаку больше,чем на гол..

    • prostofrost

      Описание вашего примера из ранее опубликованных статей:

      «Скажем, если вероятность того, что первый удар будет забит равна 0,8, но он не забивается, а затем наносится второй с xG 0,6, то сумма атаки, конечно, не может быть 1,4. Но этот вопрос решается достаточно просто и красиво с помощью формулы полной вероятности: вероятность того, что первый удар не будет забит – 0,2, а если мяч оказался после него в поле и последовал второй удар, то его вес уже равен 0,6*0,2 = 0,12. Таким образом, у вас никогда не возникнет ситуации, что xG будет больше или равен единице, даже если за одну атаку вы нанесете сотню ударов» ©

      • Pervintin

        я понимаю,что решить этот вопрос можно,я ж просто и интересовался,как Лемм в таких ситуациях высчитывает..просто,если я не ошибаюсь,в модели Кайли это не учитывается,т.е. за одну атаку удары в сумме могут набрать большее значение,чем "1"

        • Lemm

          Как я писал выше, xG - это не вероятность, а коэффициент опасности удара. Поэтому за одну атаку вполне возможно нанести ударов суммой 1.4 xG, это не означает что за одну атаку должно было быть забито 1.5 гола. Поэтому я просто считаю моменты

          Высчитывая же xP, где xG трактуется именно как вероятность я пользуюсь именно таким подходом, который описал Александр выше

  • сезон 14/15 потерял (=
    благо за статью..

    • Lemm

      Я и не планировал его выкладывать, как и наш чемпионский сезон. Там мало интересного, на самом деле

      • Laforge

        Потому что они выбиваются из общей канвы?)

        • Lemm

          Нет. Чемпионский сезон например показывает что сити недобрал, а саф реально выжал все сроки из команды, сделав +19 от предполагаемого. В предшествующие чемпионский сезоне Сити тоже ожидаемо играл лучше

      • crjekp

        В том сезоне мы забили 62 гола, должны наверное по XG выйти на 4-5 место 🙂

  • Gleb

    Все хорошо, но вот это утверждение ложно:

    Коэффициент корреляции считается сильным, если принимает значение от 0,7 (или −0,7 если корреляция отрицательная) и больше.

    Все зависит от размера выборки. В некоторых случаях и 0.3 будет считаться значимым коэффициентом корреляции.

    • Lemm

      Извините, может я конечно недостаточно хорошо усвоил тервер и статистику из университета, но я совершенно точно помню, что трактование коэффициента корреляции Пирсона никак не зависит от размера выборки. А еще я своей не сильно умной головой, смотря на формулу вычисления этого самого коэффициента понимаю, что трактовать 0.3 как сильную связь в принципе недопустимо.

      Я допускаю, что вы изложили мысли не совсем так, как хотели, поэтому хотелось бы внести ясность. К-т корреляции в районе 0.3 буквально для 20 игроков в мире, безусловно он вносит некую поправку, т.к. даже 0.01 вносит поправку, однако эта поправка не имеет ключевого значения, для большинства же игроков к-т настолько малозначим, что можно выдвигать гипотезу о том, что финишинг скилл большинства игроков в мире зависит от удачи и настроения, а не от умений. Действительно интересным и значимым он становится, пожалуй тогда, когда в одной команде собрано 2-3 из этих 20 игроков (см. Барселона)

  • Lexa

    > мастерство нападающего выражается в другом — в более качественных шансах. Умение открыться и найти мяч в штрафной соперника — тот самый пресловутый инстинкт хищника, который делает игрока нападающим топ-уровня

    Умение открыться в штрафной - может любой средний нападающий, но от этого он топовым не становится)) Чичарито по такой логике топ-форвард, а на самом деле он просто хороший форвард, но не более)

    • Daniil Ivanov

      Хорошо, что Вы относитесь к тем, кто "видит игру". Блестящее понимание. Спасибо.

      • Lexa

        Если вам есть что сказать, то скажите это нормально, без всякого сарказма.

  • crjekp

    Если отсортировать таблицы по XGa то получим более точное место Юнайтед в таблице 🙂

    в 2013-2014 - 7 место (7 место)
    в 2015-2016 - 5 место (4-5 места, 5 место)
    в 2016-2017 - 7 место (7-8 места, 8 место)

    • Lemm

      Интересное наблюдение)

  • Zee Captain

    xG и иже с ним конечно весьма интересный показатель для анализа, но как верно отмечено в последнем абзаце - не является абсолютной истиной.

    Статистика есть наука о том, как, не умея мыслить и понимать, заставить делать это цифры

    P.S. спасибо за статью, теперь знаю куда кинуть ссылку товарищам, когда меня снову начнуть тыкать носом в xG)))

    • alexalansmith14

      будем очень благодарны )

  • Lexa

    Статистика в футболе - это все второстепенно. Самое главное - это уметь видеть игру, а умеет это не каждый.

  • Vitold

    весьма интересные модели. спасибо за проделанную работу!
    интересно, кто-то пытался учитывать вероятности забить гол не только как независимые события, а например как зависимые (в таком случае и суммировать их надо иначе)?

    • Gadzhi

      Как бы ты ввел зависимость события "удар по мячу приведет к голу" от предыдущих голов?

      • Vitold

        ну например когда остаются считанные секунды до конца и команда проигрывает в финале лиги чемпионов 1 мяч - то вероятность забить будет отличаться от вероятности забить под меньшим давлением.

        • Gadzhi

          И сколько событий наберется, чтоб что-то анализировать? 2 (оба в 99-м)?

          • Vitold

            ну например оба финала лч когда реал играл с атлетико.

          • Gadzhi

            Но нужны-то тысячи 🙂

          • Vitold

            если считать не только финалы лч, а рассматривать модель в общем, то можно найти тысячи.

          • Lemm

            нужны даже тысячи тысяч, чтобы сделать хоть какой-то вывод. Увы, за сезон в АПЛ наносится около 10000 ударов - по такой выборке делать выводы о психологии и фарте нереально в принципе. Статистика в футболе штука сложная, потому что все упирается в малое число событий. Именно поэтому, я считаю модель xG и некоторые другие модели громадным шагом в преодолении барьера малого размера выборки данных

          • Vitold

            да, скорее всего дополнительный компонент не добавит точности результату - погрешность и так достаточно велика...

          • Vitold

            бывают ситуации когда мяч не идет в ворота. и стоит только забить гол, как сразу может начать залетать вообще все... психология - важный аспект в футболе. но я не предлагаю тут же добавить это в подсчеты. вопрос был о том, пытался ли кто-то это уже делать, и если пытался, то зачем изобретать велосипед?

        • Lexa

          Все зависит от психологии и насколько команда мотивирована на тот момент.

  • prostofrost

    xG крайне любопытный показатель с точки зрения статистики, он отлично раскрывает сухую цифру ударов по воротам, которая зачастую может вводить в заблуждение.

    Проблема xG кроется в поспешных (а теперь это уже переходит в плоскость и непоспешных) выводах, которые строятся на основе этих показателей. Зачастую вижу, когда карта xG приводится как неоспоримый аргумент в том или ином споре, однако же удар по воротам/опасный момент это неоднозначная для воприятия человека вещь. Можно сравить с назначением пенальти: иногда все сойдутся во мнении, что пенальти бы, иногда — что не был, а зачастую развернутся серьезные споры. Некую ясность могут вносить профессиональные судьи, но и те иногда принимают разные стороны. А здесь же, бывает так, что понятием xG пользуются как неоспоримым аргументом, что конечно же не так, учитывая хотя бы молодость этой модели.

    Поэтому в тексте крайне важен последний абзац. Пользоваться моделью можно и нужно, но делать это с умом. А то в сети уже встречаются такие показатели, выведенные из xG, как «коэффициент удачи».

    • Lemm

      Ну коэффициент удачи это по крайней мере забавно) сам xG почему-то многие считают мантрой и неоспоримым доказательством, хотя и в модели есть промахи, и результаты ее можно интерпретировать только как коэффициент опасности момента. Даже не реализации, а моментов

      • Lexa

        Вы вчера говорили мол без Погба ещё будет хуже, опять же если не видеть игру, то действительно может так показаться. Также вы утверждаете, что в команде только два топ-игрока (Погба и Златан), но при этом Ибра транжирит все моменты, а Погба привозит голы в свои ворота. А Мата, который лучший в этом сезоне, для вас не топ. У меня это в голове не укладывается...

        • Lemm

          И не будет укладываться, увы)

          • Lexa

            У вас найдётся хоть один аргумент в том что Мата не топ кроме как "он плох в прессинге"?

          • Lemm

            Перечитайте старую беседу -там есть и другие аргументы, помимо прессинга

          • Lexa

            Я читал, там нет ни одного здравого аргумента. Погба что ли идеален во всем? Он мало того, что в атаке играет не всегда хорошо, так ещё и обороне для опорного хава действует ужасно. Но это почему-то не мешает вам называть его топ-игроком. У Златана так же минусов достаточно. А Мата, при всех своих недостатках, сейчас один из лучших в команде, но этого замечать вы не хотите. У вас либо неприязнь к Мате, либо вы живёте в каком-то своём мире.

          • Lemm

            Понимаете в чем проблема, вы считаете свои аргументы правильными, мои глупыми. Но фишка в том, что я считаю глупыми ваши аргументы о ключевой роли Маты.

            И еще более глупыми я считаю сравнение Поля и Хуана

          • Lexa

            Никто не сравнивает Мату и Погба в плане их амплуа - это было бы глупо. Разговор о том, кто топ, а кто нет - в этом нет ничего глупого.

            Опять-же кто вам сказал, что Мата ключевой игрок? В нынешнем МЮ нет такого прям лидера, который бы выделялся. Есть классные игроки, которые вместе могут хорошо взаимодействовать. Мата входит в этот список, так как является топ-игроком. Мата точно так же как Златан в начале сезона помогал команде решать матчи, не просто так ведь его признают лучшим игроком месяца.

            Ваши аргументы не имеют веса, поэтому я с ними не согласен. Мои аргументы хотя-бы подкреплены фактами (решал и решает матчи, признавали лучшим в команде).

          • Lemm

            Мата не решил ни одного матча, разве что матч с Сити в КАЛе за уши притянуть. Мата забил Борнмуту после ошибки обороны, забил второй Лестеру и отдал ассист на третий. Простите но как-то это даже на Погба не тянет в плане "тащил". Вот и все геройства Маты в этом сезоне 🙂

          • prostofrost

            Сделал игру за 5 минут в первом матче с Фенербахче.

          • Lemm

            Не согласен. Пас под пенальти, заработанный совершенно другим игроком на дриблинге - это не сделал игру

          • Ancord

            Мата заработал пенальти на 31 минуте, который реализовал Погба и счет стал 1:0)

          • prostofrost

            А потом отдал голевую на второй пенальти). Да, это и называется "сделал игру за 5 минут".

          • Lexa

            Борнмут (любой гол забивается в следствии ошибки обороны, здесь просто была грубая ошибка, но это не отменяет заслуг Маты), Фенербахче, Лестер (да забил второй гол, но сделал все сам + г/п). Вот уже получилось 3 матча. А какие матчи простите решал Погба? Два гола с Фенербахче (один с пенальти который заработал Мата)? Так там Мата сделал игру. Гол Лестеру? Опять-же там Мата сделал игру + Блинд шикарно подавал. Так где геройства Погба?

          • prostofrost

            Поддерживаю.
            При этом мне довольно сильно наплевать на заслуги Погба в атаке (которых не так и много), пока он причастен практически к любому опасному моменту и голу у наших ворот, вне засисимости от того, насколько малы его оборонительные функции.

            Если Моуринью избавился от Маты в Челси по причине плохой обороны, то Погба уже в запасе гнить должен по этой логике.

          • Lexa

            Вот-вот, в атаке не ахти, в обороне ужасен, но при этом топ. Мата в атаке один из лучших, в обороне пашет как может (уж простите, но у него нет таких физических данных как у Погба, чтобы бороться с бугаями), при этом не топ. Как это понимать...

            Жозе пока не может посадить Погба, все-таки это он его купил, причём за рекордную сумму, как же так сеу Жозе облажается ведь. Но ему придётся рано или поздно это сделать, если Погба не прибавит.

          • prostofrost

            Да не в этом суть, облажался или не облажался тренер. Погба ключевой игрок команды, через которого пытаются строить игру, именно поэтому он играет каждый матч и он главный участник всех моментов у наших ворот и имеет лучшую атакующую статистику в команде. Это всё вытекает одно из другого. Вопрос только в том, что зависимость от формы/настроения/качества игры Погба становится слишком велико, и это может выйти боком, пока мы ждем, что он начнет показывать топ-футбол.

          • Lexa

            Я это все понимаю, просто размышляю почему Жозе сейчас не сажает его на лавку.

            Ок, ключевой игрок, значит вдруг него нужно создать благоприятные условия. Как это сделать? Лично я думаю, что Погба так и будет привозить голы имея в центре поля лишь одного партнера. Сыграй МЮ в 4-3-3, то Погба уже сможет больше идти в атаку, а условно Эррера и Феллаини будут заниматься больше черновой работой. Но в таком случае Мату придётся на фланг снова ставить, мне кажется все-таки под напом он играет лучше.

    • Так же минусом можно назвать то что не берется учет кто именно наносил удар. Условный Месси с 20 метров намного опаснее чем например Бускетс, однако у них будет одинаковый xG

      • Lemm

        Читайте выше по корелляцию уровня игрока. По большому счету это абсолютно неважно

  • Gadzhi

    Вот этот момент не очень понял:
    > Её можно интерпретировать как вероятность, но считается xG не как вероятность, а как значение функции, сглаженное логистической регрессией (чтобы попадать в диапазон от 0 до 1).

    Тут софтмакс имеется в виду?

    • Lemm

      Вот тут я не понял

      • Gadzhi

        Softmax, грубо говоря, превращает веса взаимоисключающих исходов в "честные" вероятности. (Формула на картинке). Или в данном случае просто 1/1 + e^x берется?
        https://jamesmccaffrey.files.wordpress.com/2016/03/softmaxequation.jpg?w=640

        • Lemm

          Угу, простая регрессия, которая сглаживает значение функции. Насколько я понимаю, у Кайли была нейросеть, которая и дала ему эти модели, а значение опасности удара -2.57537257 как-то слабо можно интерпретировать, поэтому он и делает "преобразование"

  • crjekp

    Спасибо за статью!
    Вопрос к авторам, откуда вы берете данные по ударам (расстояние и место удара, как был нанесен удар (правой/левой ногой, головой)), есть ли какие-то открытые API?
    Учитываются ли при подсчете XG заблокированные удары?
    Учитываются ли при подсчете XG удар правши левой ногой или рост футболиста при ударе головой? 🙂

    • alexalansmith14

      Олег парсит данные whoscored.com. Подозреваю, что за денежку Opta предоставляет API со всем необходимым, также подозреваю, что денежку они просят очень большую )
      нет, нога и рост игрока не учитываются ) а заблокированные удары должны - сам факт удара-то был

    • Lemm

      собираю с хускорда, Опта за данные по одному сезону просит 18000 евро. Таких денег у меня нет, увы. Сотрудничать на постоянной безвозмездной основе они отказались.
      Заблокированные учитываются, понятное дело, ведь факт удара был - и даже у такого удара есть опасность. Для вещей вроде роста при ударе головой - увы, это невозможно учесть. Пуйоль ростом 178 играл головой получше многих наших 190 - тут не вывести никакой корреляции, потому что выборка очень мала. Удар правши левой ногой - еще меньше данных, чем по голове. То есть можно предполагать, что такие вещи, если и вносят какую-то неопределенность, то очень малую и очень редко

      • Gadzhi

        Ударюсь в оффтопик, но можешь рассказать, что именно ты с этими данными делаешь потом? 🙂 Может, я тоже могу поучаствовать немножко?

        • Lemm

          Так, боюсь что будет большая дискуссия. Найди меня вк http://vk.com/oleg_zheleznov или телеграм @lemmleto, там и пообщаемся

      • crjekp

        Спасибо, за ответ.

        А есть ли у тебя таблицы XG для игр с аутсайдерами (15-20), середняками (9-14) и претендентами (1-8). Интересно посмотреть кто как играет с кем 🙂 и кто с кем набирает очки.

        • Lemm

          Считать теоретически можно сделать, но пользы будет мало - результаты и так лежат на поверхности

          • crjekp

            А у вас есть сайт где можно смотреть эти таблицы за другие сезоны или xg по матчам или может быть есть другие сайты где можно такую информацию посмотреть?

          • alexalansmith14

            есть группа Олега ) https://vk.com/footmetrics

          • crjekp

            Спасибо

          • Lemm

            Поменял чутка ссылку на группу, теперь https://vk.com/xmetrics))

          • Lemm

            Сайта нет, потому что одному это все делать очень долго, а время, как известно, самый дефицитный ресурс. Но если есть люди со знанием angularJS, которые хотят помочь, прошу отписать)

            В планах есть, в общем-то. Карты интересные, как минимум по АПЛ, я выкладываю здесь https://vk.com/xmetrics, смотрите на здоровье)

  • Спасибо большое за статью!

  • stepan

    статья отличная, спасибо!
    отдельное спасибо за ссылку на твиттер SciSports, граф xG по ходу матча мне прям очень нужен, у Кэйли его нет.

    с утверждениями по влиянию вратаря/нападающего все же поспорил бы, ибо выборки, на которых сделаны обратные выводы, не считаю репрезентативными. нужно еще покопаться, разобраться)

    • alexalansmith14

      здравый смысл тоже не хочет верить в слабое влияние умений вратаря и бьющего. Если решитесь на собственное исследование - дайте знать )

    • Lemm

      Увы, выборками большего размера футбол не обладает, и, скорее всего, не будет обладать пока правила не изменятся коренным образом. Как вы видите, существует некая более-менее вменяемая связь лишь для игроков нанесших очень много ударов за последние года, но а) - связь эта очень слаба, б) выборка за последние шесть лет по футболисту не может быть репрезентативна по определению, потому что за шесть лет можно выйти на пик и скатиться в лютое дерьмо

  • Материал интересный, статья отличная, xG — туфта и не нужно.
    Лучше ТТД в исполнении Бубнова ничего не придумали. Такая же бесполезная метрика, что и xG, зато Бубнов смешно орёт "%PLAYERNAME% ДУОЙКА!"

    • Mr Yorke

      Как же метко этот топовый коммент отражает глубину мыслей нынешней тусовки на каррик.ру

      • Не говорите. Одни горлопаны и тусовщики. Ужс.

      • а список голосов За показывает школьников (=

        • Ну там ничего удивительного нет, к сожалению.

    • newton_hitman

      xD

  • Эль Кардо

    Крутой текст! Спасибо!

  • Battousai

    Спасибо огромное за интересный материал, после вчерашней игры не легко было наверное отвлечься от всего и написать всё ))

    • BrooxUnited

      Думаю, эта статья не один день писалась.

      • Lemm

        Все верно, на подходе еще xS)

        • Евгений Соколовский

          xL будет?)

          • alexalansmith14

            только XXXXXL )

        • Antilles

          Дни прошли зря. Хотя, это только мое мнение...

          • prostofrost

            От того, что вы подписали, что это лишь ваше мнение, менее глупым оно не становится.

          • Antilles

            Я еще помню его обещание рассказать про мифическую полезность Погба, вот там от смеха уже не удержаться.

          • prostofrost

            Я думаю, вы здесь ненадолго. А опыт у меня большой.

          • Antilles

            С открытия этого сайтика. А ваш опыт, он в общем то, никому не интересен.

          • alexalansmith14

            Погба весьма полезен на поле, но зачастую его полезные действия не идут на пользу команде из-за низкой реализации, а сам Поль привозит голы из-за своей недисциплинированности

          • Lemm

            Меня огорчает ваше неуважение к чужому труду и нежелание принимать чужую точку зрения

          • Antilles

            С чего вы взяли, что я не уважаю ваш труд и вашу же точку зрения?

        • BrooxUnited

          Дерзайте)

  • Alex de Mario

    Спасибо за статью! Хотелось бы почаще наблюдать полную таблицу со всеми xПараметрами на сайте. Она очень наглядно показывает, что Мойес неудачник, с фортуной у него дела не складываются. И очень неприятно сознавать, что также Мауру также не прёт.

  • Мечты Бербатова

    Спасибо, интересно, но это уже второстепенная статистика. Однако все равно интересно.

  • Askar

    мне лично хватает знать то что xG никак не связан с точкой G)))