Прогнозы

Так получилось, что первый свой блог (жил он, разумеется, в жж) я завел перед немецким чемпионатом мира по футболу 2006 года. Помнится, одними из самых животрепещущих в нём тем были знаменитый, но ныне подзабытый эпизод с ударом головой, положение команд в турнирной таблице, расцветка форм сборных; ещё какие-то глупости… давно уж нет того журнала. Удивительно, но при той совершенно ещё юношеской попытке воспитать в себе любовь к футболу (как же: все вокруг да, а я — нет!?) экспертом в нём я так и не стал, и живу сегодня в совершенно параллельном игре мире, разбираясь в ней немногим больше, чем в бейсболе.

2018 год, снова пишу, снова за окном чемпионат — уже здесь, в России. И как бы мы, не футбольные люди, обывательски болея лишь во времена значимых событий (либо за компанию), не пытались спрятаться от всё нарастающего потока футбольных и околофутбольных новостей, сделать это решительно невозможно. А раз так, надо либо смириться, либо искать положительные и интересные стороны «проблемы».

А что может быть интереснее математики?

Совершенно неравнодушным оставила меня новость о том, что группа совсем не британских (а немецких и бельгийских) учёных, опираясь на статистику четырёх последних чемпионатов мира, научила компьютер играть в футбол — условно, виртуально — и по результатам 100 тысяч симуляций на построенной в ходе исследования математической модели нынешнего турнира выявила в том числе следующие интересные вещи:

  • сборная России выйдет из группы — вероятность 50,4%;
  • проиграет в 1/8 сборной Испании — вероятность 87,0%;
  • чемпионом вновь станет Германия — кто бы сомневался.

Препринт статьи, а главное, картинки и таблички со всеми цифрами — на arXiv.org (текст, карточка статьи). Чем-то напоминает то, как мы курсе на четвёртом-пятом пытались (правда, без всякого машинного обучения, одно что не на коленке) прогнозировать спрос на электроэнергию — по выборке, на определённые дни недели, в зависимости от месяца и времени суток и т.д. Да, модели те были несложные (а потому вполне рабочие), сравнительно элементарные, однако без такого опыта лично мне понимать и адекватно оценивать многое в нынешних предиктивных технологиях было бы значительно труднее.

Что касается исследования, уверен, можно придумать сотню (и миллион других) разумных возражений, например:

  • большинство представленных в статье раскладов очевидны, лежат на поверхности, а потому практическая польза модели стремится к нулю;
  • выборка крайне скудна (чемпионаты — не весь футбольный мир, модель, построенная на статистике ещё хотя бы и товарищеских матчей, была бы куда более репрезентативна);
  • в глазах любого мало-мальски грамотного (и не очень) болельщика и журналиста все эти предсказания смехотворны.

Можно, но суть совсем не в этом: для исследователя совершенно не важно «зачем» что-то делать (или делается), главное — «как» и «почему». И здесь, в век развития самообучающихся машин, сам собой возникает вопрос — а есть ли в прогнозировании результатов (чего угодно — хоть игры, хоть спроса на электроэнергию, других цикличных явлений) место мнению эксперта? Научив машину предсказывать исходы матчей, останутся ли у дел добрая часть спортивных журналистов, букмекеров, комментаторов очередной спортивной платформы?

Ответ самому себе сочиню в следующем абзаце, минутку помечтаем. Действительно, хочется верить, что эти 50,4% будут иметь своё место, хочется верить, что команда другая, а все те бесчисленные неудачи — так это вполсилы мяч катали, чтобы не перетренироваться. Напряжённая атмосфера вокруг команды — то лишь злые языки. Да и тренер не безавторитетный, а просто мягкий и не давит сильно на игроков. Каждый раз на это наивно надеемся. И верим в какое-то чудо (случается же!) — уж его-то не просчитать…

Место останется. Создаваемые алгоритмы ещё долгое время будут подобны мышлению человека, ведь только он пока что учитель: готовит выборку, придумывает архитектуру, косвенно закладывая в машину не только достоинства, но и свои недостатки. А у человека, как мы знаем, есть одна примечательность способность: он часто ошибается. И машина эта глупая ошибается — давайте верить.