Поддержка
  • Офлайн
 
18+

Оцифровка футбола. На что способен метод xG в ставках на футбол

28 октября 2016 14:06

Уже далеко не секрет, что все виды спорта пытаются разложить на цифры и математические модели. Подобная мода пришла из США, где полно настоящих гиков в мире статистики и цифр,  а потому вполне понятно, что наибольший успех обсчета спортсменов и их результатов достигнут именно в американских лигах. Больше половины команд бейсбольной лиги оперируют цифрами сабметрики, там это уже норма, продвинутая статистика успешно работает в НБА и НФЛ, некоторые успехи замечены в НХЛ. Понятно, что делом времени была и оцифровка футбола.

Оцифровать футбол пытались и раньше, можно вспомнить знаменитые ТТД Лобановского, а сейчас и Бубнова. Однако подсчет ТТД в чем-то устарел  и не отражает всех реалий на поле, потому что содержит  в себе достаточно отвлекающих  статистических шумов, из-за чего велика погрешность. Вполне возможно, что сейчас Лобановский предложил бы адаптированный вариант оцифровки.
Можно сказать, что на смену ТТД пришел xG.  Аббревиатура  xG  от «expected goals» (ожидаемые цели) – это ничто иное, как статистическая  модель ожидаемых голов.  В основе ее лежит подсчет опасных моментов от производимых командой ударов. Нужно отметить, что каждый удар имеет свой коэффициент опасности и формировался эмпирическим путем.



Коэффициенты произведенных ударов суммируются, и получается альтернативный исход, который формирует представление о качестве игры команды. Если рассматривать  эти цифры от тура к туру, то можно получить не только альтернативную таблицу, а и увидеть эффективность действий каждой команды, за счет чего был добыт успех, спрогнозировать возможный спад или подьем команды.

Считается, что первым подобную модель анализа использовал норвежский тренер Эгил Ольсен. Он считал, что количество ударов является ключевым показателем эффективности команды на поле, а потому и прибегал к альтернативному подсчету эффективности действия игроков.  При этом, как человек здравомыслящий, он соглашался, что удар удару рознь, а потому применял градацию опасности ударов, чтобы получить более объективные средние числа.

На данный момент гуру системы подсчета xG принято считать Майкла Кэйли. Он учитывает не только сам удар, а и ситуацию, в результате которой возможность для удара получилась. Учитывается все, удар после дриблинга или кросса, после какого паса была получена возможность для удара и ряд других факторов, которые дополняются в его модели. Пенальти он выносит за скобки, указывая его отдельно.



Стоит отметить, что более упрощенные модели предлагают рассматривать пенальти  в общей массе опасных моментов, присуждая статистически оправданный коэффициент опасности - 0.76. Например, такой принцип применяется у модели tegen11 или при подсчете РФПЛ  NVasyukhin.
Важно отметить, что у этой в целом объективной системы анализа и возможного моделирования будущих тенденций есть несколько недостатков.

Система пока никак  не учитывает, кто наносит удар. Все-таки есть разница, когда бьет Месси или Кокорин. Достаточно сказать, что лишь Месси и Криштиано Роналду перевыполняют план потенциальных голов метода xG, их реализация выше. Немаловажно и то, кто стоит на воротах. Этого модель тоже не учитывает, что дает определенную погрешность в расчетах. Но эта погрешность, по мнению авторов  расчетов, должна привести к средним цифрам  после достаточного количества средних игр. И вот тут мы плавно подошли к еще одной проблеме, в футболе, в отличие от НБА, НХЛ, MLB количество игр сезона значительно меньше, если говорить про национальные чемпионаты, то даже втрое меньше. Из-за этого ряд статистических тенденций найдет свое подтверждение несколько позже, не вместившись в отрезок одного сезона, при условии, что команда не вносила кардинальных изменений в ростер, не меняла тренера. К примеру «Суонси» был хорош в сезоне-2014/15, его все хвалили, но не обращали внимание на показатели xG, которые говорили о том, что команда набирает больше очков, планируемого статистической моделью. В итоге менеджмент был доволен, реальных изменений ни в тренерский состав, ни в ростер не вносил, а в новом сезоне результаты команды пошли вниз. Ситуация с «Лестером» Раньери в этом смысле тоже показательна, «лисы» перевыполнили план набранных очков, относительно статистической модели и получили регресс в сезоне нынешнем. Понятно, что здесь важную роль  сыграла психология, потеря Канте, однако цифры тоже играют немалую роль. Проблемы «Вест Хэма» тоже можно было просчитать, их показатели по системе xG проецировали значительно меньше набранных ими очков, откат к средним значениям мы и наблюдаем сейчас.
 


Пример разбора матча прошедшего тура.

Стоит  отметить, что чемпионом мира по xG считается лондонский «Арсенал» Венгера. Во многом это обусловлено тем, что «канониры» активно работают со статистическими данными этой системы и это позволяет, а потому они стараются наносить как можно больше ударов из статистически выгодных положений.  Почему же им не удалось выиграть титут в таком случае? Можно говорить о психологии, качестве реализации своих опасных ударов, травматичности лидеров. Все это так, но цифры вещь упрямая, если суммировать очки двух последних сезонов и сезона нынешнего, то лучшая команда по набранным очка как раз «Арсенал» Венгера. Это говорит о том, что в системе НБА, где 82 игры в регулярке у них были бы куда лучшие шансы на итоговую победу, благодаря правильным действиям на поле  с учетом расчетов модели xG. Пока для меня это самое слабое место попытки оцифровать футбол, так как выборки результатов не хватает на один сезон.

Потому на данный момент говорить о том, что показатели xG позволят с хорошей точностью прогнозировать каждый отдельный матч мне кажется преждевременным. Скорее это пока дополнительный инструмент при анализе, который  в цифровом значении показывает качество игры команды и относительно набранных очков позволяет задавать вопросы, получать ответы и прогнозировать тенденцию относительно некоторых команд на сезон и, возможно, на будущие сезоны, при учете, что система построения игры и исполнители кардинально не менялись.

Разберем на примере РФПЛ.



Таблица РФПЛ после сыгранных 11 туров.

Сразу бросается в глаза, что питерский "Зенит" не зря в лидерах чемпионата, они просто таки доминируют и по качеству игры в  системе xG.  "Спартак" напротив кажется командой переоцененной, во многом из-за того, что смогли забить в полтора больше больше ожидаемых голов статистической модели. Эта интересная информация накануне московского дерби против "ЦСКА", так как команда Слуцкого лишь слегка перевыполняет план по набору очков относительно показанных статистических показателей, но пропустили даже больше чем позволили создавать, а это ведь лишь 6 голов в 11 играх, но и забили больше созданного. Если говорить языком цифр, то получается, что в предстоящем матче ЦСКА выглядит небольшим фаворитом, хотя букмекеры считают наоборот, отдавая предпочтение "красно-белым". Понятно, что модель не учитывает психологию, проблемы Слуцкого, а оттого будет любопытно проверить на деле, кто прав в отдельном матче. Но с форой (0) на армейцев я бы рассмотрел.

Больше других недобрали очков "Локомотив", "Рубин", "Оренбург", "Крылья Советов". Значительно выше статистических показателей идет Спартак, о котором я говорил выше, Анжи и "Ростов" с уникальной реализацией, которая двоекратно превышает показатели модели качества создаваемых моментов. Здесь будет уместно указать на особый стиль ростовчан, модель игры Бердыева не предполагает доминацию даже с середняками и аутсайдерами, а потому и статически цифры размываются, при этом хорошо видна реализация, что нужно учитывать при анализе возможностей команды.

Также предлагаю вам ознакомиться с рейтингом команд других чемпионатов, построенным на основе метода xG. 

Рейтинг xG испанской Примеры.



Как можно увидеть из расчетов, "Алавес" несмотря на приличный старт забрал лишние очки, как и "Атлетик" с "Севильей". А вот недосчитались больше других "Гранада", "Осасуна" и "Барса". 

Бундеслига.



Интересные данные можно было наблюдать в Германии после 6 тура, когда в топе-5 лучших команд по качеству игры относительно метода xG можно увидеть "Ингольштадт", которые показали рекордный дефицит очков во всех европейских чемпионатах. Эти данные пригодились бы всем, кто играл дортмундцев на выезде против "Ингольштадта" в 8 туре.

Эредивизия.

Метод xG позволяет планировать и делать долгосрочные прогнозы. К примеру, в Эредивизии, небольшим фаворитом можно считать ПСВ в борьбе за чемпионство, несмотря на их 6 очковое отставание от "Фейенорда" и "Аякса".

 
Завершить обзор предлагаю самым интересным европейским чемпионатом на данный момент, извини РФПЛ, но речь не от тебе.

 АПЛ.

Рейтинг защиты АПЛ.



Общий рейтинг эффективности команд АПЛ.



Твиттеры, откуда брать xG-результаты:

1) Caley Graphics: https://twitter.com/Caley_graphics
2) 11tegen11: https://twitter.com/11tegen11
3) РФПЛ: https://twitter.com/NVasyukhin


На этом все, мой лонгрид завершен.  Интересно будет обсудить прочитанное в комментариях. Как вы относитесь к данной модели, насколько уместно ее использовать в ставках, давайте разговаривать.

Следите за обновлениями!


Всем профита!

Интересный материал?
Да24
Нет0
Автор
Автор Intelbet
Блог • 22 577 очков • 1 место
Комментарии (22)
Start typing your username
Загрузить фото
26.11.2016 в 00:19
+
0
-
#
Это Докторская. Не меньше))s53.png
Ответить
Автор Intelbet
26.11.2016 в 00:46
+
+1
-
#
Огромное спасибо! Очень приятно, что основательный труд не остался незамеченным.
Ответить
30.10.2016 в 12:02
+
0
-
#
пример (смотреть не обязательно): intelbet.ru/blogs/66821/#comment557011

и там:
мнение моей таблицы: не верю даже в ТБ1,5 и в ТБ2,5

результат матча: 0-0
Ответить
29.10.2016 в 00:15
+
+3
-
#
Хорошая статья. Лично я сам считаю, что это довольно интересный элемент для анализа. И его можно использовать как дополнительние к остальным вещам.
Если твоя игра не основывается только на статистике, либо только на интуитивном, то данная информация должна тебе помочь.
Лично я считаю полезным знать, что скрывается за счетом. Потому что, если команда проиграла - это ещё не значит, что она была откровенно плоха. Нужно смотреть, че там в матче было, моменты и прочее. Для этого помогает просмотр матча, обзоров, либо текстового лайва(хотя там приукрашивают порой).
Так вот xG, на мой взгляд, дает представление о том кто сколько и по чем создал/позволил создать. Без просмотра матчей и обзоров.
В конце хочу сказать, что, скорее всего, за этим подходом будет будущее в беттинге, ниша достаточно непокрытая и достаточно интересная. Лично я посматриваю в сторону xG-метода и хочу добавить в свой инструментарий, как ещё одно средство для анализа.

З.Ы. в комментах увидел некого пользователя da78. Давно не встречал такой особенный и достаточно сложный для восприятия способ изъяснения)
Ответить
29.10.2016 в 13:26
+
0
-
#
неясно пишу ? прочитай мою писанину медленно 5-жды
и окажется что у меня всё учтено в кратчайшем сообщении
а более полное объяснение объяснённого мной займёт десяток страниц

вкратце моя идея соответствует теореме о средней линии интеграла
никто не виноват что для многих простейшее набор букв
Ответить
Автор Intelbet
29.10.2016 в 00:41
+
+1
-
#
Спасибо. Мне тоже кажется, что xG будет играть важную роль в беттинге, потому и решил подготовить этот материал. Причем, xG дает лаконичную оцифровку общего положения дел и формы команды, что дает более полную картину о форме команд и игроков. Как один из инструментов при анализе матчей, считаю xG необходимым помощником.
Ответить
28.10.2016 в 21:00
+
+1
-
#
Высший пилотаж Джонни.Спасибо тебе за труд при подготовке этого материала и за сам материал тоже....Согласен с твоим мнением(( отмахиваться от цифр не получится, они могут не дать результат в конкретной игре, но на дистанции именно за ними, как правило, правда.)).s53.pngs53.pngs53.png
Ответить
Автор Intelbet
28.10.2016 в 22:53
+
+2
-
#
Спасибо, очень приятно. Для меня этот материал был важен, я долго вынашивал в голове идею, как подать сложные расчеты доступным языком с макисмальным массивом полезной информации. Действительно, большинство игнорируют цифры и среднее значение, из-за чего букмекер остается в плюсе, потому что он подобными цифрами и инфой не пренебрегает, а старается использовать любое преимущество.
Ответить
28.10.2016 в 20:47
+
+1
-
#
Ну Джони чисто батя ) Как всегда статьи на убой сверх уровень
Ответить
Автор Intelbet
28.10.2016 в 22:54
+
0
-
#
Спасибо, очень лестно слышать подобную оценку! Обещаю не сбавлять оборотов.
Ответить
28.10.2016 в 19:31
+
0
-
#
наверняка читатели за"думают"ся впервые

однако моделировать можно и нужно ... прошлое

задавшись вопросом ? как нужно было ставить чтобы выиграть ?

и учитывая поНИЖенные коэффициенты ответ обычно будет:

"никак НЕвыиграть на дистанции постоянными ставками без догона"

"никак НЕвыиграть на дистанции БЕЗ поВЫШения и поНИЖений ставок"
Ответить
28.10.2016 в 17:21
+
0
-
#
Дааа...заумно))) Лучше я рискну ставкой не зная этих вычислений, чем стану похож на Перельмана))))
Ответить
Автор Intelbet
28.10.2016 в 22:58
+
0
-
#
Материал непростой, согласен. Я старался лаконично и доступно подать, потому что непросто разобраться с тем обьемом информации, который я собрал при подготовке к статье. Конечно, же ваше право как поступать дальше, но в следующий раз, когда будете пенять на то, что мне просто не повезло, подумайте, может быть этому было цифровое обьяснение. У меня так было в матче "Ингольштадта" и дортмундской "Боруссии", я искренне полагал, что ставка была правильная, просто не повезло. Оказалось, что "Ингольштадт" был самой недооцененной командой нового сезона, что и подтвердил в игре с дортмундцами. Скипанул ли бы я этот матч, если бы знал данную инфу ранее? Определенно, да.
Ответить
28.10.2016 в 15:50
+
+1
-
#
Интересно.Попытка смоделировать идея хорошая и правильная. Наверняка толк в этом есть. Ведь любое мнение субъективно и не дает реальной картины.
Эффективность модели зависит от того, на сколько верно в математической моделе определена значимость того или иного фактора. Одна задача собрать все возможные факторы влияющие на результат в целое, а другая задача определить,что из этого, и в какой мере влияет на результат. Второе просчитать сложно, так как меняются реалии, и тут уже все зависит, насколько удачно и точно отрегулированы модификаторы.
Ответить
28.10.2016 в 14:54
+
+3
-
#
Привет. За работу +++. Но честно, я читал и в это время мозг опухал! Куда катимся, скоро не Роналду по полю будет бегать, а его изображение с данными что он может. Но серьезно к этому относиться не нужно. Все это хорошо, пусть считают, но как можно знать какой игрок вышел на поле!? После вчерашнего поноса или отдохнувший!? Играют в первую очередь люди, а не роботы, и не понимаю как можно это все относить к ставкам и прогнозируя опираясь на это. Еще теннис, где играет один человек, может что-то и можно взять, но 11 ???? Честно я считаю, что этим занимаются те, кому нехер делать. Да!!! а погодные условия не учитывают!? Ветер 5 и 10 метров в секунду, и как Месси бьет при разных порывах!? ))) Ладно, все это лирика! За материал спасибо.
Ответить
28.10.2016 в 15:19
+
0
-
#
я перестал читать в самом начале
потому как в ИНТЕГРАЛЬНОЙ intelbet.ru/blogs/66201/ системе

как заменяются сложные графики прямоугольниками
также и сложные расчёты приведут лишь к пониманию

заНИЖенных коэффициентов заНИЖенных коэффициентов
заНИЖенных коэффициентов заНИЖенных коэффициентов

и к упрощению только с целью НЕУЧАСТИЯ в ставках с...

заНИЖенными коэффициентами заНИЖенными коэффициентами
заНИЖенными коэффициентами заНИЖенными коэффициентами

например в виде таблиц заучиваемых наизусть
как есть подобные таблицы для рулетки
для нОучно обоснованных пределов несовпадения подряд

народ если для кого что пишу новое
значит таковые обречены проигрывать
--
Комментарий был отредактирован
Ответить
Автор Intelbet
28.10.2016 в 15:13
+
+3
-
#
Привет. Спасибо за мнение. С одной стороны я согласен с тем, что данная система имеет слабые места, о которых писал в материале. Но отмахиваться от цифр не получится, они могут не дать результат в конкретной игре, но на дистанции именно за ними, как правило, правда. Я долго готовился к тому, чтобы написать этот лонгрид, и честно скажу, голова пухла в процессе подготовки. При этом мне кажется, что данный метод рабочий и может пригодиться в ставках.
Ответить
28.10.2016 в 15:32
+
+1
-
#
на данную тему случайно есть мой ютюб:


Ответить
23 августа в 13:33
+
0
-
#
Из видео ничего не понятно.
Ответить
28.10.2016 в 15:34
+
0
-
#
расставляем команды для ставок по %%% баланса
в зависимости от среднего гола и от кыфов

массив сотен результатов доделывать некогда
потому как оказавшись в плюсе
бессмысленно испытывать всякие догоны
хотя задумывалось как догон

ищу тех у кого есть такие же ютюбы и таблицы
и в одном из блогов проводятся эксперименты
--
Комментарий был отредактирован
Ответить
28.10.2016 в 18:20
+
+1
-
#
Можешь объяснить , что это конкретно такое ?
Ответить
30.10.2016 в 12:06
+
0
-
#
случайно набрёл на твой вопрос
там эксперименты лета

предполагалось догонять ТБ1,5 с у-3-ением ставки
пытаясь иметь преимущество ставя больше на забивающих
а в случае проигрыша повышать ставки в 3 раза

в результате в свыше 120 матчах было обычно выигрышно
без повышений ставок и даже флэтом

и пока досчитывать и пересчитывать
просто неинтересно
Ответить
Статистика за октябрь / за всё время
Top 10 Эксперты Гандикаперы
Top 10 Ставки Прибыль
Пардо (2) 9/0/4 +6 730 ₽
VolleyStats (1) 7/0/1 +5 630 ₽
Панков 4/1/1 +3 200 ₽
Вуйтек 6/0/4 +2 750 ₽
Пирожков (2) 7/1/4 +2 380 ₽
Кириченко 6/0/3 +2 120 ₽
Батурин (1) 4/0/3 +1 960 ₽
Елагин (2) 2/0/4 +1 030 ₽
Егоров 2/0/5 +910 ₽
Бебуришвили 3/0/2 +520 ₽
Эксперты Ставки Прибыль
Пардо (2) 9/0/4 +6 730 ₽
Вуйтек 6/0/4 +2 750 ₽
Пирожков (2) 7/1/4 +2 380 ₽
Батурин (1) 4/0/3 +1 960 ₽
Елагин (2) 2/0/4 +1 030 ₽
Егоров 2/0/5 +910 ₽
Салинас (1) 8/0/9 -100 ₽
Муканов (4) 11/0/10 -2 060 ₽
Светоч (1) 5/0/6 -2 950 ₽
Гутцайт 2/1/5 -3 800 ₽
Райлян 1/0/6 -5 210 ₽
Гандикаперы — профессиональные игроки, которые показали плюс, сделав не менее 300 ставок.
Гандикаперы Ставки Прибыль
VolleyStats (1) 7/0/1 +5 630 ₽
Панков 4/1/1 +3 200 ₽
Кириченко 6/0/3 +2 120 ₽
Бебуришвили 3/0/2 +520 ₽
Arkadiy_bets 3/0/2 +300 ₽
APrel (1) 3/1/2 +80 ₽
Кашин (3) 7/1/6 -300 ₽
Claudio 2/0/2 -310 ₽
Садовой 8/1/5 -360 ₽
Трифонов (1) 3/0/3 -790 ₽
Жуков 9/1/10 -1 470 ₽
Гусев 2/0/4 -2 830 ₽
Solomon 5/0/7 -2 850 ₽
Basketmen 0/0/3 -3 000 ₽
Top 10 Эксперты Гандикаперы
Top 10 Ставки Прибыль
Жуков 623/28/392 +131 190 ₽
Кириченко 291/20/164 +63 380 ₽
Панков 201/15/112 +55 320 ₽
Чаплыгин 217/13/126 +50 450 ₽
Пардо (2) 208/1/153 +43 030 ₽
Батурин (1) 120/1/89 +22 570 ₽
Claudio 57/5/35 +16 870 ₽
Светоч (1) 220/58/172 +13 995 ₽
VolleyStats (1) 37/0/20 +13 400 ₽
Бебуришвили 251/55/209 +7 105 ₽
Эксперты Ставки Прибыль
Пардо (2) 208/1/153 +43 030 ₽
Батурин (1) 120/1/89 +22 570 ₽
Светоч (1) 220/58/172 +13 995 ₽
Пирожков (2) 385/70/417 +4 035 ₽
Райлян 42/5/42 +2 400 ₽
Гутцайт 177/29/168 +2 380 ₽
Вуйтек 146/12/122 +310 ₽
Салинас (1) 153/0/140 -3 280 ₽
Муканов (4) 47/2/44 -8 590 ₽
Егоров 13/1/37 -13 590 ₽
Елагин (2) 177/0/207 -22 340 ₽
Сторонние 191/10/207 -46 570 ₽
Гандикаперы — профессиональные игроки, которые показали плюс, сделав не менее 300 ставок.
Гандикаперы Ставки Прибыль
Жуков 623/28/392 +131 190 ₽
Кириченко 291/20/164 +63 380 ₽
Панков 201/15/112 +55 320 ₽
Чаплыгин 217/13/126 +50 450 ₽
Claudio 57/5/35 +16 870 ₽
VolleyStats (1) 37/0/20 +13 400 ₽
Бебуришвили 251/55/209 +7 105 ₽
Трифонов (1) 82/8/58 +5 860 ₽
Гусев 56/1/44 +1 800 ₽
Arkadiy_bets 3/0/2 +300 ₽
APrel (1) 3/1/2 +80 ₽
Solomon 236/7/215 -910 ₽
Садовой 30/5/22 -1 300 ₽
Basketmen 0/0/3 -3 000 ₽
Кашин (3) 17/3/18 -3 140 ₽