Система формирования прогноза на футбольный матч: majniagen

majniagen

Система формирования прогноза на футбольный матч

Feb 24, 2015 19:55

Здравствуйте, уважаемый читатель.

Нейронная сеть, образно выражаясь, есть комплекс опыта и догадки. Некоторые блоки этой системы содержат в себе данные - предыдущий опыт. Другие блоки отвечают за агрегацию этих данных - элементы дедуктивного вывода. И, наконец, на завершающем этапе работают элементы сравнения, поиска решений на основе веса достоверности каждого вывода, полученного на предыдущем этапе. На каждом этапе своё отрабатывают несколько функций, если говорить о программной реализации.
Структура системы
Кластерный анализ

Данные для решения объединены в кластеры. Кластеры - массив схожих данных в количественных и качественных характеристиках. Правда, градация по рейтингу рассматриваемых чемпионатов отсутствует. Следует здесь же отметить, что системой представлены не все лиги - тому вина разница в их уровне. Нельзя сравнивать второй польский дивизион с Премьер лигой Англии. Да и первый польский с трудом можно назвать сравнимым. А данные пришлось бы агрегировать в один кластер топ-чемпионата с очевидно отстающим в классе.

Поэтому на данный момент многих европейских и мировых чемпионатов нет в базе знаний, не предполагается и принятия решений по матчам этих турниров. Кроме того, решения по некоторым из включенных в рассмотрение чемпионатов, на данный момент показывают удручающий результат. В частности речь идёт о чемпионате Швейцарии.

То есть можно говорить, что на определённом этапе поиска решений система выглядит прецедентной, чем абсолютно схожа с другим классом - системой поддержки принятия решений. Но в процессе поступления новых примеров для обучения происходит корректировка весов. Все сигналы, получаемые от кластера данных, проходят через сито - определяется вес каждого сигнала, а также сравниваются с таблицей достоверности. Если в последней нет ещё релевантной записи, то этот этап игнорируется, но поиск решения продолжается, чтобы сформировать прогноз на футбольные матчи.

Не участвуют в поиске и принятии решения такие данные, как принимающая сторона, стартовые составы, квалификация тренера, погодные условия и другие, вполне могущие быть важными. Но, увы, отслеживание и поиск информации за десятком и более матчей проблематично. Для таких целей потребовалась бы либо сторонняя база данных, либо интеллектуальный поиск и обработка в Интернет содержимого из новостных публикаций или официальных сайтов клубов и профессиональных лиг. А это уже вполне самостоятельный трудоёмкий программный продукт.

Так что в данном случае проводится попытка универсализировать алгоритмы под множество примерно равных чемпионатов без учёта сторонних факторов, кроме как вычисление текущего рейтинга команды, её игровой формы, потенциальной силы в матче и ещё несколько параметров оказавшихся существенными. Из-за недостатка учёта специфики чемпионата на данный момент можно назвать провальным принятие решений по чемпионату Бразилии Сериа А.

Настройка весов проводится после каждого матча. Алгоритм корректируется программистом лишь в случаях выявления необходимости такого вмешательства. Развитие системы предполагается пока только в контексте корректировки весов (что логично на всей жизни нейросетевой модели), а так же выявления новых кластеров и пополнения новых. Впрочем, пополнение кластера подразумевает изменение его веса значимости. Из этого следует, что сеть изменяет свой размер. В некоторые периоды количество кластеров может быть уменьшено по причине признания несостоятельности такой группировки данных.

В каждом конкретном принятии решения могут быть задействованы несколько кластеров, только один или вообще ни одного. Поэтому в публикации решений системы могут быть не все матчи очередного тура чемпионата. Для таких случаев и проводится поиск новых кластеров - как программно, так и экспертно. Структура кластера свободна, но дисперсия фиксирована для каждого из них.

Кластер имеет свой уровень достоверности. И после каждого события чемпионата значение этого уровня может быть либо увеличено на определённый коэффициент, либо уменьшено - уже в результате от исхода матча. Так, например, если исходя из назначения кластера в матче ожидалась победа гостей, но выиграли хозяева, то вес сигнала (или назвать «уровнем достоверности») от такого кластера будет уменьшен.

Кластеры, только-только введённые в систему, предварительно имеют очень низкое влияние на принятие решения. По мере наполнения базы знаний кластеры получают новые значения весов. Однако, это не позволит расширить обзор предметной области. Для чего и необходим постоянный поиск новых условий для новых группировок.

Источник

Футбол, Спорт