"Прогнозирование исхода футбольных матчей / Л. В. Бехтер, Н. И. Клевец "
--------------------------------------------------------------------------------------------------------------
Модели и компьютерные программы предсказания результатов спортивных игр разрабатываются на протяжении многих лет. Большинство из них используют стохастические методы описания неопределенности: регрессивный и авторегрессивный анализ, метод Байезиана в комбинации с цепями Маркова и методом Монте-Карло. Особенностями таких моделей являются: достаточно высокая сложность, большое количество допущений, потребность в наличии большого массива статистических данных. Кроме того, эти модели не всегда легко интерпретировать. Существуют также модели, использующие нейронные сети для предсказания результатов футбольного матча. Их можно рассматривать как универсальные аппроксиматоры нелинейных зависимостей, опробованные на экспериментальных данных. Для них также необходимо иметь массивы статистических данных, а физическое значение весов между нейронами после обучения определить нельзя.
Рассмотрим модель оценки рейтинга команд с использованием квалиметрического метода. Квалиметрия - научная дисциплина, в рамках которой изучаются методология и проблематика комплексной, количественной оценки качества объектов любой природы. В данном случае проводится рейтинговая оценка двух футбольных клубов, принимающих участие в матче.
Этапы выполнения работы:
1. Выбор показателей, формирующих рейтинг футбольной команды
2. Анализ показателей:
- Выделение стимуляторов/дестимуляторов;
- Формирование весовых коэффициентов;
3. Построение математической модели:
- Приведение показателей к сопоставимому виду;
- Расчет интегрального показателя рейтинга команд;
4. Формирование лингвистической интервальной шкалы.
5. Оценка точности модели (итеративный этап):
- Подготовка статистических данных;
- Расчет показателей точности модели;
6. Формирование выводов о целесообразности применения модели на практике.
Итак, в первую очередь перед нами становится задача выбора показателей, формирующих рейтинг футбольной команды. Целесообразно выбрать для оценки такие параметры, сбор статистической информации о которых не был бы затруднителен. В то же время данные показатели должны обладать высокой степенью важности для рейтинга команды. Учтя вышеприведенные факторы, мы остановили свой выбор на следующих параметрах:
- Место в турнирной таблице;
- Набрано очков *;
- Количество забитых мячей *;
- Количество пропущенных мячей *;
- Количество ударов по воротам **;
- Количество ударов в створ ворот **;
- Количество передач **;
- Количество точных передач **;
- Выиграно угловых **;
- Процент владения мячом **;
- Количество пропускающих матч игроков;
- Отдых (сколько дней команда не играла);
- Не пропускали голов в матчах (подряд);
- Забивали голы в матчах (подряд);
- Домашний матч (1 - да, 0 - нет);
* - показатель рассчитывается как сумма значений за последние 5 матчей
** - показатель рассчитывается как среднее значение за последние 5 матчей
Отметим, что параметр отдых не учитывается, если команды не играли больше двух недель.
Среди вышеприведенных показателей есть как стимуляторы, так и дестимуляторы. Стимуляторами называются показатели, увеличение которых приводит к увеличению рейтинга команды, а дестимуляторы - это показатели, уменьшение которых приводит к росту рейтинга футбольного клуба. Отметим, что среди выделенных нами показателей дестимуляторами являются следующие:
- Место в турнирной таблице;
- Количество пропущенных мячей;
- Количество пропускающих матч игроков;
Остальные показатели являются стимуляторами.
Практические исследования показали, что данные коэффициенты целесообразно корректировать в зависимости от команд, принимающих участие в матче. Например, если у команды в запасе имеются высококвалифицированные футболисты, то для неё снижается вес показателя "Количество пропускающих матч игроков". Кроме того, есть команды, которые играют домашние встречи значительно лучше, чем выездные. В таких случаях весовой коэффициент для параметра "Домашний матч" целесообразно увеличить.
Определившись с показателями и весовыми коэффициентами, можем приступать к расчету рейтинга команд. Для этого нам необходимо выполнять ряд действий:
1. Рассчитаем относительный вес показателя для каждой команды. Для этого воспользуемся формулой 1 для показателей-стимуляторов и формулой 2 для показателей-дестимуляторов:
(1)
где B - исходное значение показателя,
i - команда,
Brel - относительное значение показателя.
(2)
2. Рассчитаем рейтинг команд по формуле 3.
(3)
где W - матрица весовых коэффициентов,
Mrel - матрица, содержащая относительные значение показателей Brel для каждой команды,
i - команда,
Ra - рейтинг команды.
3. Для удобства сравнения сделаем нормировку рейтинга команд на единицу по формуле 4.
(4)
где Ra - абсолютный рейтинг команды
i - команда,
Rrel - рейтинг команды, нормированный на единицуДля интерпретации полученного рейтинга команд необходимо ввести так называемую лингвистическую интервальную шкалу. В квалиметрии шкала измерений является средством адекватного сопоставления и определения численных значений отдельных свойств и качеств различия объектов.
http://bets.today/ru/articles/weighted-sum-of-indexes