在足球场上,下一分钟将发生什么?
足球里有一句名言:足球是圆的。
意思是,在足球里,什么都有可能发生。
这句话背后隐藏着一个深刻的数学模型。
统计学中,有一个被称为“随机过程”的子学科。
在这个领域里,有这么一种过程,它满足一种性质:未来只和现在有关,和过去无关。
听起来是不是很像足球比赛?
这种过程被称为马尔可夫过程,这种性质被称为马尔可夫性。
我们知道,足球比赛中的进球是一个累加过程,从0到1,再到2,以此类推。
这种累加过程被统计学家称为计数过程。而有马尔可夫性的计数过程被称为泊松过程。
你可能会问,足球比赛中的进球是否真的满足马尔可夫性,也就是说,下一分钟有没有进球真的只取决于现在的状态,而和过去无关吗?
我一直听闻,足球中的进球满足泊松过程。
要想知道它是不是满足泊松过程,只需要检查进球间的时间间隔是否满足指数分布。容易证明,两者是等价的。
2023年7月14日上午,我终于去谷歌上进行了一番搜索。
很多地方都声称足球中的进球满足泊松过程(或者声称进球间的时间间隔满足指数分布),比如这篇博客,但是却没有数据支持自己的说法。
在谷歌学术上,我找到一篇有数据的论文。文中,作者统计了1990-2002的四届世界杯的数据,发现进球间的时间间隔的分布和指数分布极其相似。但我觉得,只用四届世界杯的数据也太少了点。如果我用所有世界杯的数据呢?一百年来,世界杯一共也就几千个进球,FIFA应该会保存这些珍贵的数据吧?
随后,我在Google上使用site:www.kaggle.com goal data of FIFA World Cup
进行搜索,在kaggle上找到了1930-2022世界杯的全部进球的数据。
之后,我分析了数据,发现进球间的时间间隔的分布和指数分布极其相似。
于是乎,至少在足球场上,未来真的只在乎现在,而不念过往。
领先的一方不要得意,落后的一方不要放弃。
如果人生真的是足球,那该多好!