Datenscouting – ein Begriff, der Fußballdeutschland und alle, die an Scouting interessiert sind, bewegt. Doch was ist damit gemeint? Ziel ist es, die Fähigkeiten eines Spielers allumfassend abzubilden, messbar zu machen und Spieler mit der größtmöglichen Objektivität zu bewerten. Ohne dabei den subjektiven Faktor, das „klassische“ Scouting live und vor Ort, wie es im Profifußball gang und gäbe ist, zu vernachlässigen.
Die Vorreiter der Datenanalyse
Europaweit sind der FC Midtjylland aus Dänemark und der FC Brentford aus England die Vorreiter der Datenanalyse. Beide Clubs gehören dem gleichen Besitzer, Matthew Benham, welcher durch Sportwetten ein Vermögen verdient hat und die Analysten seiner Wettfirma als Datenscouts einsetzt. Auch Manchester City, einer der ganz großen Clubs in Europa und seit dieser Saison Arbeitgeber von Ex-Bayern-Trainer Pep Guardiola, setzt stark auf Datenanalyse bei Transferentscheidungen und Scouting.
In Deutschland ist davon auszugehen, dass Bayer Leverkusen und RB Leipzig führend sind, wobei es sich mittlerweile fast kein Club mehr erlauben kann, ganz ohne Analysedaten auszukommen. Die Nachfrage wächst stetig.
Vorbildlich sind auch die Vereine aus der nordamerikanischen Major League Soccer, die fast ausschließlich auf Datenanalyse setzen. Allerdings hat der amerikanische Sport generell ein anderes Verhältnis zu Zahlen und Daten.
Die Vorteile der Datenanalyse
Dank der heutigen Technik und des Internets ist es möglich, so gut wie jedes relevante Fußballspiel weltweit zu schauen, abzuspeichern und zu analysieren. Die Qualität der erhobenen Daten wird hierbei immer besser und genauer. Es werden immer weitreichendere Daten erhoben und gemessen. Dazu sei von meiner Seite gesagt: Quantität ist nicht gleich Qualität. Nicht jeder erhobene Zahlenwert ist relevant, andere Werte müssen in Kontext gesetzt werden. Berücksichtigt man das, bekommt man wirklich aussagekräftige Zahlen und Werte, die den subjektiven Eindruck beim Schauen eines Fußballspiels oft untermauern. In vielen Fällen sagen sie aber auch das genaue Gegenteil aus.
Der größte Vorteil der Datenanalyse ist der, dass Sie Tausende von Spielern innerhalb kürzester Zeit erfassen, bewerten und miteinander vergleichen können. Und dies nicht nur in einigen wenigen Ligen, sondern weltweit sowohl im Profi- als auch im Jugendbereich. Wird ein Spieler nach bestimmten Kriterien gesucht, beschränkt sich der Kandidatenkreis also nicht nur auf vier oder fünf Ligen – sondern eventuell auf 20 bis 25, was wiederrum zu zwei weiteren Vorteilen des Datenscoutings führt: Effizienz und Kostensenkung.
Scouts müssen nicht rund um den Globus reisen, um passendes Spielermaterial zu sichten und zu bewerten. Die Vorabanalyse filtert Spieler nach zuvor festgelegten Kriterien und liefert als Ergebnis die passenden Kandidaten. Diese Ergebnisse machen es den Talentsichtern um ein vielfaches einfacher, sich gezielt vor Ort in den Stadien auf die wirklichen relevanten Spieler zu konzentrieren und mit ihren subjektiven Eindrücken die objektiven Einschätzungen der Datenanalyse zu bestätigen.
Beim Scouting die richtigen Spieler verpflichten
Neben einzelnen Spielern ist es natürlich auch möglich, ganze Kader, Wettbewerbe und Ligen zu evaluieren. Schwachstellen auf einzelnen Positionen können früh sichtbar gemacht werden. Die eigene Jugendabteilung kann detailliert analysiert und mit dem Profikader verglichen werden, um aufzuzeigen, welche Spieler den Sprung ins Profigeschäft schaffen können. Gerade für „kleinere“ Clubs mit geringerem finanziellem Spielraum ist diese Art des Scoutings unerlässlich, da sie in vielen Fällen auf die eigenen Jugendspieler angewiesen sind und jeder Zugang sitzen sollte, da es sonst sportlich schnell zum Albtraum werden kann. Hier kann die Datenanalyse eine entscheidende Rolle spielen. Sie gewährt den Clubs einen Blick über den Tellerrand hinaus, zeigt Spieler und Märkte auf, die eventuell bisher vernachlässigt wurden, und hilft so, weiterhin konkurrenzfähig zu bleiben und die richtigen Spieler zu verpflichten.
Für Verbände, wie beispielsweise den DFB, ist es möglich, alle potenziellen Kandidaten für U- und A-Nationalmannschaften mit einem Klick bis ins Detail zu evaluieren. Kommt die Frage auf, ob ein U-21-Nationalspieler bereit ist für den Schritt ins A-Team, kann man ihn innerhalb kürzester Zeit mit allen Spielern aus eben jenem A-Team vergleichen. Die Vorteile der Daten sind beinahe grenzenlos. Sie können mit Daten Muster im Spielaufbau sichtbar machen, sie können Standards evaluieren, sie können Einflüsse einzelner Spieler auf Offensive und Defensive messbar machen – Scouting par excellence.
Der GSN-Index
Widmen wir uns nun im Speziellen unserem Ratingsystem, dem sogenannten „GSN-Index“. Der GSN-Index soll einen Spieler möglichst allumfassend bewerten, weshalb das Ratingsystem auf vier Säulen beruht. Der Sinn dahinter ist es, nicht nur die Leistung auf dem Spielfeld zu bewerten, sondern auch das Entwicklungspotenzial eines Spielers messbar zu machen sowie seine fußballerischen Eigenschaften zu raten und sein bisheriges Spielniveau zu evaluieren.
1Soccer related characteristics
Fußballerische Eigenschaften: Das Rating der fußballerischen Eigenschaften ist die Basis des GSN-Indexes und auch der Teil der Analyse, der sich am ehesten mit dem klassischen Scouting vor Ort deckt. Jeder Spieler wird von mehreren Scouts unabhängig voneinander in über 70 verschiedenen Kategorien bewertet. Anschließend werden diese Bewertungen in Zahlenwerte umgewandelt. Das System berücksichtigt dabei technische, taktische, mentale und physische Eigenschaften, welche zusammengefasst einen Wert zwischen 0 und 100 ergeben. Der Topwert 100 wird dabei allerdings von keinem Spieler weltweit erreicht. Das System nimmt automatisiert Rücksicht auf positionsbezogene Unterschiede. Ein Innenverteidiger hat ein anderes Anforderungsprofil als beispielsweise ein Linksaußen. Das Endrating haben wir auf unseren Infografiken in diverse Kategorien gliedert, um besser veranschaulichen zu können, was der Zahlenwert letztendlich bedeutet.
2Potential/Future SRC
Zukünftige fußballerische Eigenschaften: Hierbei haben wir einen Algorithmus entwickelt, der auf modifizierten Zukunftsprognosen aus dem Finanz-und Wirtschaftssektor basiert. Alle Eigenschaften aus Säule 1 werden hierbei regelmäßig überprüft. Es wird festgestellt, ob und inwieweit sich ein Spieler in jeder Kategorie verbessern oder auch verschlechtern kann. Wichtige Kriterien hierbei sind unter anderem Alter, fußballerische Ausbildung und Verletzungsanfälligkeit. Auch die Entwicklung von Spielern mit fast identischen Eigenschaften spielt hierbei eine Rolle. Jede Verbesserung beziehungsweise Verschlechterung wird auf den Future SRC angerechnet.
3+/- performance
Leistung: Oftmals ist dieser Part für unsere Klienten mit am interessantesten, da er die Leistung eines Spielers während einer Partie bewertet. Spieler bekommen anhand ihrer Leistungsdaten Pluspunkte für positive Aktionen während eines Spiels. Dazu zählen Tore, Vorlagen, abgefangene Pässe und angekommene Flanken. Minuspunkte gibt es für negative Aktionen wie Fouls, Fehler die zu Gegentoren führen und roten Karten. Positionsbezogene Unterschiede werden hierbei natürlich auch wieder berücksichtigt, so werden die Offensivaktionen eines Verteidigers beispielsweise anders bewertet als die eines Stürmers. Anhand von Heatmaps können wir zusätzlich abbilden, wo eine Aktion stattgefunden hat und ob beispielsweise Gegnerdruck vorhanden war, was ebenfalls Einfluss auf die Bewertung hat. Ein weiterer Faktor ist zudem die absolvierte Spielzeit.
Ausgangswert ist dabei der Wert 100, welcher einen ausgeglichenen Plus-Minus-Wert darstellt. Unser System erfasst zur Berechnung Passdaten, Zweikampfdaten, Tore und Vorlagen – aber auch geblockte Schüsse, abgefangene Pässe, Fouls und vieles mehr. Insgesamt fließen rund 150 verschiedene Leistungsdaten in den Performance-Wert ein, darunter auch abstrakte Werte wie der „Shapley Wert“ und das „Expected-Goals-Modell“. Anhand des Shapley-Werts kann man den Einfluss eines einzelnen Spielers auf das gesamte Team beziehungsweise auf die gesamte Partie bestimmen.
Das Expected-Goals-Modell bewertet vereinfacht gesagt die Qualität der Torschüsse anhand der Wahrscheinlichkeit auf ein Tor. Basierend auf historischen Daten – etwa 400.000 Torschüsse – kann man berechnen, wie hoch die Erfolgschancen auf ein Tor von jeder Stelle des Spielfeldes sind. Ein Elfmeter hat beispielsweise eine Erfolgsquote von 0,78 bzw. 78 Prozent. Schüsse außerhalb des Strafraums haben eine Erfolgsquote von null bis sieben Prozent. Unterschieden wird auch zwischen Schüssen und Kopfbällen, da sich hierbei die Wahrscheinlichkeiten ändern. Zusätzlich zu der Qualität der Torschüsse sagt uns der Expected-Goals-Wert noch etwas über das Verhaltensmuster von Spielern vor dem gegnerischen Tor. Topstürmer wie Robert Lewandowski, Lionel Messi und Luis Suárez geben den Großteil ihrer Torschüsse im gefährlichen Bereich ab, in dem die Erfolgschancen auf einen Treffer zwischen 25 und 85 Prozent liegen.
4Level of play
Spielniveau: Unser System berücksichtigt hierbei jede Partie, die während der Karriere eines Spielers absolviert wurde, und bewertet diese auf einer Skala von 1 bis 20. Beispiele hierfür sind das Champions-League-Finale oder das WM-Finale mit einem Wert von 20. Semiprofessionelle und Jugendpartien haben meist einen Wert von unter 3,5. Berücksichtigt werden hierbei auch das Alter des Spielers. Ein 18-Jähriger, der 90 Minuten in der Bundesliga spielt, bekommt ein höheres Rating als beispielsweise ein 30-Jähriger, der ebenfalls 90 Minuten in der Bundesliga spielt. Jede Liga und jede Mannschaft in dieser Liga hat einen eigenen, ihrer Stärke zugeordneten Zahlenwert, welcher in unserem System automatisiert verrechnet wird. Je höher das Spielniveau, desto besser ist das für den GSN Index.
Wert für die Zukunft
Fasst man nun alle vier eigenständigen Werte zusammen, bekommt man den „Current GSN-Index“, also den derzeitigen GSN-Index eines Spielers, der zeigt, wie gut oder schlecht ein Spieler zum aktuellen Zeitpunkt ist. Dieser Wert macht es zudem möglich, beim Scouting Spieler aus unterschiedlichen Ligen, Ländern und Altersgruppen miteinander zu vergleichen. Das gilt auch für den „Possible GSN-Index“, also den „möglichen GSN-Index“, welcher die bestmögliche Entwicklung für die Zukunft berechnet. Dieser Wert setzt sich aus dem derzeitigen GSN-Index und dem Steigerungspotential der vier Säulen zusammen.
In unserer Datenbank befinden sich derzeit circa 340.000 Spieler, die sich anhand des GSN-Indexes detailliert bewerten und vergleichen lassen. Weitere Informationen finden Sie auf www.global-soccer-network.com.
Im Oktober 2017 startet erstmals die Weiterbildung Spielanalyse und Scouting, mit der die Teilnehmer auf das zukunftsweisende Thema der datengestützten Spielanalyse vorbereitet werden.