Tribuna/Футбол/Блоги/Рейс Киев - Амстердам/Футбольная статистика: кто и как ее считает, сколько это стоит

Футбольная статистика: кто и как ее считает, сколько это стоит

Разбираемся, как все устроено.

Автор — Олег Барков
30 листопада 2021, 21:31
20
Футбольная статистика: кто и как ее считает, сколько это стоит

Разбираемся, как все устроено. 

Аналитические данные в современном футболе – то, без чего уже невозможно представить игру номер один. Каждый болельщик и специалист сейчас может найти статистику на любой вкус и кошелек – от обычных показателей до самых продвинутых метрик, вроде ожидаемых голов (xG), продвижения мяча (Packing) и трекинговых данных, которые позволяют получать информацию о беговой работе футболистов.

Но даже на базовом уровне часто бывает, что мы получаем разные статистические данные от разных компаний. Почему так происходит, и как вообще устроен мир статистики в футболе? Мы попробовали разобраться.

Какой бывает статистика, кто предоставляет аналитические данные

Если разделить статистические данные на категории, то можно выделить три основные: базовая статистика по матчу, данные о событиях и трекинговые данные.

▪️ Статистика матча – то, что на самой поверхности. Это составы, расстановка, замены, карточки, голы и т.д.

▪️ Данные о событиях (Events Data) – упорядоченный набор данных, описывающий последовательность действий игроков с мячом (удары, передачи, единоборства, обводки, перехваты, подборы и т д). Такие данные систематизируют разборщики (аннотаторы), которые анализируют видеозаписи матчей и формируют соответствующие отчеты. Такую работу проделывают аналитические компании Opta Sports, Wyscout, Instat, StatsBomb и другие.

▪️ Трекинговые данные (Tracking data) – точные пространственные координаты всех игроков и мяча в каждый момент времени матча. Эти данные собираются специализированными оптическими системами отслеживания перемещений футболистов на основе камер, которые устанавливаются на стадионе. Самыми известными поставщиками таких данных являются компании ChyronHego, STATS Perform, BallJames и Second Spectrum.

В мире очень много аналитических компаний, которые предоставляют статистические данные для самых разных клиентов – клубам, футболистам, телевидению и спортивным сайтам, агентам, букмекерам и не только. Есть огромные компании вроде Opta, которая на рынке уже больше 20 лет. Есть всем известные в нашей стране WyScout и Instat, есть менее раскрученные фирмы, которые работают на локальном уровне. Рынок статистики очень обширный.

Часто бывает, что в послематчевой статистике даже базовые показатели, такие как удары по воротам, у разных компаний расходятся. Все дело в подсчете – у каждой компании свои модели, и даже с ударами иногда бывает дилемма. Кто-то относит к ударам заблокированные выстрелы, кто-то – нет.

Как считают статистику

Есть два способа подсчета аналитических данных – вручную специалистами, которых называют «разборщиками», а также автоматически, с помощью специальных программ. Также подсчет бывает в лайв-режиме (прямо по ходу матча) и после завершения игры.

Собирать данные по матчу начали еще в 80-х годах, а Валерий Лобановский и его научная группа сделали подсчет данных культом. Тогда аналитики просто надиктовывали действия, происходившие на поле, а затем расшифровывали запись с диктофона. На выходе получали данные о ТТД игроков и действии команды.

Сейчас диктофоном уже никто не пользуется, но все равно в некоторых аналитических компаниях данные обсчитывают вручную. На один матч «разборщик» компании WyScout тратит 6-8 часов, а в Instat – от 4 до 12 часов рабочего времени. Все зависит от того, сколько людей задействовано в этом процессе. К слову, в Тернополе находится офис WyScout, и там работают украинские «разборщики».

Чтобы разобрать игру, аналитик проставляет отметки на каждый эпизод матча – точный или неточный пас, удары, навесы, единоборства, тип атаки и так далее. Затем благодаря этим тегам появляются видеонарезки определенных эпизодов, а в отчете о матче формируется статистическая картина.

«Мы собираем данные и в ходе матча, и после него, это зависит и от клиента, и от его контракта. Если анализ матча происходит после игры, то 1-2 «разборщика» работают в районе 4-5 часов. Если анализ делается во время матча, то это минимум 4-5 человек. Наши люди сидят и на стадионе, и в дата-центре, так получается быстрее обрабатывать данные», – объясняет директор по маркетингу InStat Николаем Прудников.

В лайв-режиме Instat создает три этапа: первичный разбор, вторичный разбор и контроль ошибок. Однако, не все компании решаются использовать подсчет в лайве. Например, WyScout отказался от этого, потому что старается соблюдать права клубов и лиг на телетрансляции.  

У Opta процесс подсчета данных комбинированный, и в механике работы компании ничего не меняется вот уже 15 лет. Видео матча «прогоняется» через программное обеспечение Opta, два человека (по одному на команду) фиксируют каждое касание мяча, а третий в режиме реального времени следит за процессом. Весь пласт информации составляется онлайн.

Почему у разных компаний цифры иногда получаются разными

Каждая статистическая компания имеет свой собственный алгоритм подсчета данных. Поэтому иногда один и тот же параметр у двух разных компаний может отличаться. Например, WyScout считает отборы и подборы в одну ячейку, другие компании разграничивают эти действия. Существуют разные методики оценки того или иного эпизода – например, часто платформы дают разные цифры по обводкам и обостряющим передачам, просто подход к одному эпизоду у двух компаний может быть разным.

Если в Opta считают, что автоматический процесс намного эффективнее ручного, то в Instat доверяют больше человеку.   

«Ошибки случаются, но гораздо реже, чем с алгоритмами. Машины не могут проверять собственные ошибки и находить нетривиальные пути решения задач.

Есть хороший пример: в одном из матчей третьей лиги Франции качество съемки было не очень хорошим, в одном из эпизодов была верховая борьба. Не было понятно, кто выиграл. На первой стадии разбора поставили неправильный маркер – что выиграл игрок команды «А». Но на вторичном этапе ошибку увидели и исправили. В таких эпизодах люди превалируют над машинами», – объясняет Прудников.

WyScout тоже использует комбинированную систему подсчета – специальная программа обсчитывает информацию, а человек все контролирует. У компании есть офисы в самых разных странах, где работают «разборщики» – в Украине, России, Молдове, Болгарии.

У американского гиганта Hudl (в эту компанию входит WyScout) есть сервис, позволяющий тренерскому штабу разработать собственную методологию. Благодаря платформе Sportscode тренер может залить видео и разобрать его с точки зрения нужных ему параметров. Их может быть всего пять, а не 100, как в обычном отчете WyScout – вплоть до того, что там может быть информация о том, сколько раз полузащитник повернул головой перед приемом мяча. Здесь ты сам разбираешь матч, тем самым снижая процент погрешности. В Украине Sportscode используют шесть клубов УПЛ.

Что такое xG

Стремительный прогресс аналитики и, в частности, данных о событиях, дал нам одну из самых популярных метрик на сегодняшний день – ожидаемые голы (xG). Эта метрика позволяет измерять качество моментов, создаваемых игроками, и оценивает непосредственно вероятность гола после каждого удара в диапазоне от 0 до 1.

Если мы посмотрим на показатель xG «Шерифа» в матче с «Реалом», то можем увидеть совершенно разные цифры по xG команды Юрия Вернидуба у трех аналитических платформ: Opta – 0,37, Instat – 0,26, WyScout – 0,28. Почему так происходит?

Все дело в различных моделях подсчета ожидаемых голов, которые используют компании. Нет единой методики, у каждого она своя. Показатель опасности удара высчитывается, основываясь на самых разных данных: расстояние до ворот, тип удара, позиция для удара, способ и место передачи под удар. Даже учитывается скорость атаки, дистанция, преодоленная футболистом с мячом, действия перед ударом (обводка, удар в одно касание), текущий счет поединка, помехи со стороны защитников, количество защитников перед бьющим и т.д. И у каждого эти переменные могут быть разными и иметь разный вес.

Например, Instat делит удары по категориям – ногой, головой, другой частью тела. Также рассматривает стандартные положения и отдельно – пенальти. У удара с 11-метровой отметки коэффициент 0,75.

Важно понимать, что суммарный xG команды в одном конкретном матче не обязательно должен отражать количество голов, которые должна была забить команда. Она показывает нам сколько опасных моментов было создано и сколько должно было быть с них голов в матче. Эта метрика куда более эффективна на дистанции.

Что такое Instat Index

Еще одной популярной в футбольных кругах метрикой, особенно в Восточной Европе, является Instat Index. По сути, это оценка игрока за матч, которая высчитывается по сложной схеме, разработанной компанией.

Для вратарей Index рассчитывается на основе примерно 15 показателей (игра на выходах, парированные удары, пассы и так далее). Для полевых игроков индекс рассчитывается на основе приблизительно 30 показателей (удары, единоборства, фолы, отборы и так далее).

«По своей сути это совокупность всех действий игрока с определенным коэффициентом. То есть, каждому типу действий, в зависимости от позиции, проставляется определенный коэффициент. Затем все эти действия суммируются и умножается на коэффициент уровня партнеров футболиста и коэффициент соперников.

То есть, если «Ман Юнайтед» и «Ман Сити» сыграют друг против друга, и «Сити» выиграет 3:0, то у игроков команды победительницы будет высокий коэффициент. Но если «Ман Сити» сыграет с командой Лиги 2, то у футболистов за такую же победу будет более низкий коэффициент», – объясняет представитель Instat Николай Прудников.

Instat Index не используется в аналитике, он чаще используется в скаутинге. В одном отдельно взятом матче Index – это оценка. Но если мы берем этот показатель на дистанции, то можем увидеть, как футболист выступает в динамике. Можно построить диаграмму, наглядно увидеть, как футболист играет в домашних или гостевых матчах по отдельности.

Часто индексом слишком увлекаются агенты, которые стремятся продать футболиста, или же сами игроки. Но иногда и клубы тоже используют Index при поиске новичков. Здесь главное – помимо оценки учитывать и контекст.

«Спортивный директор «Стандарда» рассказывал, что его скаутский отдел не в силах обработать такой поток информаций и предложений, поэтому пользуется Instat Index. Чтобы понять, кого рассматривать, они фильтруют игроков – средняя оценка за сезон не менее 250. И уже после этого начинают углубленно изучать потенциальных новичков», – говорит Прудников.

Сколько стоит продвинутая статистика

Конечно же, большинство аналитических компаний продают свои услуги футбольным клубам, а также представителям других видов спорта – баскетбол, хоккей, бейсбол, американский футбол. Данные – удовольствие не из дешевых.

«Средний пакет услуг, покупаемый клубом, стоит 5 тысяч евро. При наличии 1300 клиентов ежегодный оборот составляет примерно 7-8 миллионов евро», – еще пару лет назад говорил о своих доходах основатель Instat Александр Иванский. Компания предоставляет самый разный спектр пакетов – для футболистов, клубов, СМИ.

Максимальный годовой пакет может достигать даже 80 тысяч евро. У конкурентов из Wyscout, который на рынке обитает дольше, чем Instat, самый дорогой пакет стоит около 10 тысяч евро.

«Клуб может обойтись и одним аккаунтом, где будет собрана вся информация – с отчетами и видео. Это будет стоить 9,5 тысяч евро в год. Каждый дополнительный аккаунт стоит 1200 евро. Если клубу нужна информация только по своему чемпионату и еще четырем соседним странам, то ценник падает до 2-3 тыс. евро за аккаунт. А дальше уже можно формировать предложение по различным данным. Например, есть приложение по пенальти – там вся информация об игроках, кто в какую точку бьет. Нужно разобрать стандарты? Это еще 1200 евро в год. Таким образом чек можно накопить до 10-15 тыс. евро в год», – говорит представитель WyScoutВиталий Соловьев.  

Фото: Instat, WyScout

Найкраще у блогах
Більше цікавих постів

Інші пости блогу

Всі пости