Odds

Zurück zu den Artikeln

Kann man xG zur Vorhersage von Fußballspielen verwenden ?

In diesem Artikel werden wir versuchen zu verstehen, was erwartete Tore (xG) sind, wie man xG zur Vorhersage von Fußballspielen verwenden kann und schließlich das Modell analysieren, das von Mark Dixon und Stuart Coles von der Universität Lancaster im Nordwesten Englands erstellt wurde.


Sportwetten, zumindest für diejenigen, die mehr als nur ein Hobby daraus machen wollen, sind seit langem mit dem Konzept des Erwartungswerts vertraut, insbesondere mit der Idee des erwarteten Wertes.


Wetten können gewonnen oder verloren werden, aber das Ergebnis ist größtenteils nur eine Folge des Zufalls.


Langfristig ermöglicht das Wissen über den erwarteten Wert dem Wettenden jedoch, abzuschätzen, was er bei einer größeren Stichprobe von Wetten erwarten kann. Der Begriff „Erwartung“ ist nur ein anderes Wort für den „arithmetischen Mittelwert“ oder „Durchschnitt“.


In letzter Zeit hat das Konzept des Erwartungswerts seinen Weg in den Fußball gefunden, und zwar durch die Idee der erwarteten Tore oder xG. Erwartete Tore werden als Leistungsmaß verwendet, um die Leistungen von Fußballteams und -spielern zu bewerten, indem einer Torchance eine Wahrscheinlichkeit zugewiesen wird, die in einem Tor resultieren könnte.


Diese Wahrscheinlichkeit wird anhand historischer Daten zu ähnlichen Torchancen und deren Torerfolgsrate berechnet. Der xG-Wert für eine Torchance liegt somit zwischen 0 und 1.


Darüber hinaus ergibt die Summe der xG-Werte in einem Spiel mit einer bestimmten Anzahl von Torchancen den xG-Wert für das Spiel selbst oder, häufiger, den xG-Wert für jedes Team in einem Spiel.


In der Theorie bietet der xG-Wert eine realistischere Darstellung der Spielqualität der Teams in einem Spiel und der Überlegenheit eines Teams gegenüber einem anderen als die tatsächlichen Tore.


Tore werden mit einem gewissen Maß an Zufall erzielt (was Statistiker als „Rauschen“ bezeichnen), und die Verwendung des tatsächlichen Ergebnisses zur Vorhersage dessen, was ein Team im nächsten Spiel leisten könnte, könnte weniger zuverlässig sein als die Verwendung seines xG-Wertes.


In gewisser Weise sind Tore wie Gewinne und Verluste bei Wetten, während erwartete Tore wie der erwartete Wert sind. Wenn das der Fall ist, können wir dann xG anstelle von Toren verwenden, um das Ergebnis von Fußballspielen vorherzusagen und einen Gewinn zu erzielen?


Buts contre xG


Tore vs. xG


Der Mathematiker und Autor von "Soccermatics": Mathematical Adventures in the Beautiful Game“, David Sumpter, hat einige Hinweise auf den relativen Nutzen von Toren im Vergleich zu xG gegeben, wenn es darum geht, das Ergebnis von Spielen vorherzusagen. Sumpter verdeutlicht die Schwierigkeit, ein Vorhersagesignal aus Tordaten zu extrahieren.


"Aus statistischer Sicht ist das Ergebnis eines Fußballspiels fast ebenso viel Rauschen wie Signal. Eine mathematische Erklärung dafür kann direkt in der Poisson-Verteilung gefunden werden. Tore im Fußball sind nach dem Poisson-Gesetz verteilt, und die Teams erzielen im Durchschnitt etwa 1,4 Tore. Die Varianz und der Mittelwert sind in der Poisson-Verteilung gleich. Der Standardabweichung ist daher die Quadratwurzel von 1,4, also 1,18. Das Rauschen (1,18) ist also nur geringfügig niedriger als das Signal (1,4).“


xG hingegen ist ein Maß für die geschaffenen Chancen und bietet daher ein besseres Maß für die Qualität eines Teams in einem Spiel als Tore.


Es enthält normalerweise weniger Rauschen und mehr Signal. Sowohl für Tore als auch für xG nimmt die Menge an Rauschen in den Spielergebnissen ab, je mehr Spiele untersucht werden. Der Abnahmerate ist jedoch anfänglich für xG höher als für Tore.


Sumpter verwendet diese Informationen, um die Art von Daten zu empfehlen, auf die wir uns konzentrieren sollten, wenn wir versuchen, Vorhersagen für kommende Spiele zu treffen. Für ein oder zwei Spiele liefert der Spielbericht selbst die nützlichsten Informationen.


Andererseits werden für Stichproben von mehr als 15 Spielen oder den Großteil einer halben Saison die Tordaten möglicherweise genauso zuverlässig sein wie xG.


Das Rauschen wird immer noch etwas höher sein, aber der Unterschied ist minimal. Außerdem stellen Tore die Realität dar – was passiert ist –, während xG ein probabilistisches Modell der Chancenverteilung ist. Wenn es ungenau ist, kann es sich als weniger zuverlässig erweisen als die Tordaten.


Zwischen diesen beiden Extremen liegt ein spannendes Feld zur Verwendung von xG als Vorhersagewerkzeug. Sumpter behauptet, dass der xG-Bericht zwischen drei und sechs Spielen am nützlichsten ist, während zwischen sieben und 15 Spielen ein Vergleich zwischen Toren und xG sinnvoller sein könnte.


Für diesen Artikel habe ich ein xG-Vorhersagemodell erstellt, das die letzten sechs Spiele eines Teams verwendet, um zu beurteilen, ob es zur Generierung eines Wettgewinns verwendet werden kann.


Das Modell von Dixon-Coles


Der am besten dokumentierte Ansatz zur Vorhersage von Fußballspielen wurde 1997 von Mark Dixon und Stuart Coles (von der Universität Lancaster) im Journal of Applied Statistics veröffentlicht.


Das nicht überraschend als Dixon-Coles-Modell bekannte Modell entwickelt das Konzept der Angriffs- und Verteidigungsstärke, indem es die Anzahl der von jedem Team erzielten und kassierten Tore mit den Ligadurchschnitten über eine bestimmte Anzahl vorheriger Spiele vergleicht.


Diese Daten werden dann verwendet, um die erwartete Anzahl von Toren zu schätzen, die jedes Team in seinem nächsten Spiel erzielen wird.


Schließlich wird die Poisson-Verteilung verwendet, um die Wahrscheinlichkeiten einzelner Tore zu berechnen, wobei die erwartete Anzahl von Toren der Mittelwert der Verteilung ist. Pinnacle hat einen Artikel veröffentlicht, der die Methodik beschreibt.


Hier habe ich das Modell angepasst, um xG anstelle von Toren zu verwenden, und die Angriffs- und Verteidigungsstärken basierend auf den letzten sechs Heim- oder Auswärtsspielen berechnet. Mein Datensatz umfasste Spiele, die in den höchsten englischen, französischen, deutschen, italienischen und spanischen Ligen in den Spielzeiten 2015/16 bis 2019/20 gespielt wurden.


Die vorhergesagten Wahrscheinlichkeiten für Heimsiege, Unentschieden und Auswärtssiege wurden in implizite faire Wettquoten umgerechnet und dann mit den Schlusskursen von Pinnacle verglichen.


Wenn diese höher waren, repräsentierten sie den theoretischen Wert des Vorhersagemodells. Die wertvollen Wetten wurden dann mit den Ergebnissen verglichen.


Der nachstehende Graph zeigt die Zeitreihe der erzielten Gewinne bei den 7.795 wertvollen Wettgelegenheiten, die vom Modell identifiziert wurden, bei insgesamt möglichen 18.006. Der Gewinn aus flachen Einsätzen im Verhältnis zum Umsatz beträgt -5,0 %. Dieser Wert ist im Vergleich zu einem Verlust von -4,3 % zu sehen, wenn jeder der 18.006 möglichen Ergebnisse blind mit einem einzigen Einsatz gewettet worden wäre. Da der erwartete Durchschnittswert für diese Stichprobe 38,9 % betrug, wäre es eine Untertreibung zu sagen, dass es sich um eine Unterperformance handelt.


Mögliche Ungültigkeit des Modells


Der erste Hinweis auf das Scheitern dieses Modells könnte in der Zahl des erwarteten Durchschnittswerts liegen.


Mit durchschnittlichen Quoten von 4,69 deutet eine Zahl von fast 40 % für den erwarteten Durchschnittswert der Wetten, die mehr als ein Drittel aller möglichen Gelegenheiten ausmachen, stark auf eine erhebliche Abweichung der impliziten fairen Wettquoten von den tatsächlichen Pinnacle-Preisen hin.


Ein Korrelationsdiagramm zwischen den vom Modell vorhergesagten xG-Werten und den tatsächlichen xG-Werten, die für das Spiel aufgezeichnet wurden, bestätigt diesen Punkt.



Es gibt viel Rauschen; das modellierte xG ist nicht besonders effektiv bei der genauen Vorhersage des tatsächlichen xG einer Mannschaft in einem Spiel.


Die Ursache des Modellversagens ist möglicherweise schwieriger zu identifizieren, da es potenziell mindestens vier Probleme gibt. Erstens könnte die Verwendung eines Dixon-Coles-Modells zur Vorhersage von Fußballergebnissen an sich fehlerhaft sein. Die Poisson-Verteilung, die das Herzstück dieses Modells bildet, geht davon aus, dass erzielte Tore unabhängig sind, d.h. dass ein Tor nicht die Ursache eines weiteren Tores ist.


Diese Annahme ignoriert jedoch den Einfluss der Psychologie von Spielern und Teams. Teams, die in Rückstand geraten, könnten motivierter sein, als sie es vorher waren, um den Ausgleich zu erzielen, während Teams, die ein Unentschieden halten, motivierter sein könnten, weiter anzugreifen.


Was ist eine gute Rendite bei Sportwetten ?


Wenn dies der Fall ist, muss die Idee, dass Tore zufällig erzielt werden, sicherlich in Frage gestellt werden.


Dixon und Coles selbst stellten fest, dass ihr ursprüngliches Vorhersagemodell Ergebnisse mit niedrigen Punktzahlen (0-0, 1-0, 0-1 und 1-1) unterschätzte. Um dies zu bestätigen, habe ich meine vom Modell vorhergesagten xG-Daten und die tatsächlichen xG-Daten des Spiels separat vom niedrigsten zum höchsten Wert neu organisiert und als künstliche Korrelation unten dargestellt (durchgezogene Linie).


Es ist klar, dass es weniger niedrige xG-Werte gibt als mein Modell vorhersagt, während es mehr hohe xG-Werte gibt als es sollte (gestrichelte Linie).


Was Dixon und Coles bei den Toren festgestellt haben, scheint auch für xG zu gelten, was nicht völlig überraschend ist, da Tore und xG bei Spielen über große Datenmengen hinweg gut korreliert sind.



Eine zweite mögliche Fehlerquelle könnte das xG-Modell selbst sein. In meinem Datensatz entsprach die Gesamtsumme der erzielten Tore 97,8 % der während der Spiele erzielten Tore. Obwohl dies wie ein gutes Ergebnis erscheint, ist es schwer zu sagen, ob dieser Unterschied groß genug ist, um die Gültigkeit eines Modells zur Vorhersage erzielter Tore zu beeinflussen.


Was können Wettanbieter von den Spielen der Vorsaison lernen ?


Eine dritte Fehlerquelle könnte in meiner Auswahl der Anzahl der letzten Spiele liegen, die zur Berechnung der Angriffs- und Verteidigungsstärken von Dixon-Coles verwendet wurden.


Aus den oben im Artikel genannten Gründen habe ich sechs Spiele gewählt. Vielleicht hätte eine andere Zahl, höher oder niedriger, bessere Ergebnisse geliefert.


Eine solche Änderung wäre relativ einfach umzusetzen, obwohl sie eine vollständige Überarbeitung des Modells erfordern würde, was ich hier nicht vorhabe.


Darüber hinaus wurden die sechs Spiele gleich gewichtet. Dixon und Coles erkannten an, dass neuere Spiele möglicherweise stärker gewichtet werden sollten, wenn die durchschnittlichen Stärken berechnet werden, und führten diese Gewichtung in späteren Versionen ihres Modells ein.


Auch dies ist eine Funktion, die ich selbst modellieren könnte, aber ich habe mich aufgrund der mühsamen Natur des Prozesses dagegen entschieden.


Ein letztes Problem, das vielleicht existenzieller ist, besteht darin, dass mein Modell versucht, durch die Vorhersage von Fußballspielen Gewinne zu erzielen.


Abgesehen von allen anderen möglichen Fehlerquellen kann ein gutes xG-Modell, viel besser als meines, möglicherweise keinen nicht zufälligen Gewinn erzielen, weil es nicht so gut ist wie das Modell, das der Buchmacher zur Festlegung seiner Quoten verwendet.


Da das Dixon-Coles-Modell gut dokumentiert ist und xG mittlerweile ein weit verbreitetes Maß ist, ist es möglich, dass alle Informationen, die ein solcher Vorhersageansatz liefert, bereits in die Quoten der Buchmacher eingepreist sind.


Ein relatives Können


Sportwetten ähneln stark den Sportarten, auf denen sie basieren. Es handelt sich um einen Wettbewerb der relativen Fähigkeiten zwischen zwei oder mehreren Parteien, die darum kämpfen, wer die Zukunft am besten vorhersagen kann.


Je fähiger der Vorhersager ist, desto zuverlässiger und gültiger sind seine Bewertungen der Wahrscheinlichkeiten tatsächlicher Ergebnisse (und damit der Wettquoten). Fehler werden finanziell bestraft.


Pinnacle, wohl der beste Buchmacher der Branche in Sachen Datenanalyse, verfügt über außerordentlich zuverlässige Vorhersagemodelle, die weitaus besser sind als meine. Wir wissen, dass Pinnacle Kunden hat, die in der Lage sind, nicht zufällige Gewinne zu erzielen, aber ich habe bereits ihre Seltenheit angesprochen.


Wenn Pinnacle das Aston Villa der Vorhersagemodelle ist, sind diese scharfsinnigen Kunden eher wie Liverpool und Manchester City.


Natürlich können Sie ein gutes Modell haben, vielleicht ein Reading oder Derby, das gut genug ist, um anständige Vorhersagen zu treffen, aber nicht konstant gut genug, um die besten Modelle zu schlagen. Mein Modell würde sich wahrscheinlich nicht einmal für die Isthmian League qualifizieren.


Die Frage, ob xG effektiv verwendet werden kann, um auf dem Fußballwettenmarkt Geld zu verdienen, ist die folgende: Die von einem Vorhersagemodell bereitgestellten Quoten spiegeln die Qualität der darin enthaltenen Informationen wider.


xG kann tatsächlich eine nützliche Datenquelle zum Aufbau eines Vorhersagemodells bieten, aber wenn Pinnacle diese Informationen bereits in sein eigenes Modell einbezieht, zusammen mit anderen nützlichen Informationen, die mir nicht zur Verfügung stehen, wird mein Vorhersagemodell nicht besser abschneiden als ihres.


Alle Informationen, die meine xG-Daten auf den Tisch bringen, sind bereits in ihre Quoten integriert. Es ist Canvey Island F.C. gegen Aston Villa.


Wenn Pinnacle (und andere Buchmacher) die xG-Daten bereits in ihren Vorhersage- und Quotenmodellen verwenden, was wahrscheinlich ist, da diese Daten seit langem verfügbar sind, stellt sich die Frage, ob meine Verwendung dieser Daten das verbessert, was sie bereits tun.


Können mir die xG-Daten also helfen, beim Wetten auf Fußball Gewinne zu erzielen? Wie bei jeder anderen Form der Datenanalyse zu Wettzwecken hängt die Antwort davon ab, wie Sie sie verwenden. Und die Art und Weise, wie Sie sie verwenden, muss besser sein als die Art und Weise, wie Buchmacher sie derzeit verwenden.

Samstag, 24. Februar 2024

In der gleichen Kategorie

Odds

Bankroll management: Odds, edge and variance

Freitag, 10. Januar 2025

In this article, we will explore key concepts that are essential for anyone looking to approach betting in a strategic and disciplined way. We will cover three fundamental areas: bankroll management in betting, understanding variance, and the different ba...

Artikel ansehen

Odds

Wie man die Buchmacher im Over/Under-Markt schlägt ?

Freitag, 8. November 2024

Sind Sie ein Fußballfan, der seine Chancen im Over/Under-Wettmarkt verbessern möchte? Das Verständnis der Strategien der Buchmacher und die Anwendung eines datenbasierten Ansatzes können Ihnen einen entscheidenden Vorteil verschaffen. In diesem Leitfaden ...

Artikel ansehen

Odds

Anwendung des Elo-Bewertungssystems beim Fußballwetten

Montag, 7. Oktober 2024

Das Elo-Bewertungssystem, das ursprünglich zur Bewertung der Fähigkeiten von Schachspielern entwickelt wurde, wurde auf verschiedene Sportarten übertragen und wird heute im Fußball häufig verwendet, um die Leistung der Teams zu vergleichen. Durch diese Me...

Artikel ansehen