Drating
Vorbemerkung
Dieser Abschnitt beschreibt die Berechnung von Runden-Ratings, also dem Rating, welches man für eine gespielte Runde bekommt.
Es gibt diverse Stellen, die ihr eigenes Rating berechnen (PDGA, Metrix, DiscGolfValley, D-Rating, …). Allen gemein ist, dass der Algorithmus nicht vollständig veröffentlicht wurde. Wir haben also diverse Algorithmen entwickelt, auf Tauglichkeit untersucht und die meisten verworfen.
Wer nach 2017 mindestens eine gewertete Runde gespielt hat, hat(te) auch ein D-Rating.
Begriffe
- Runden-Rating (RR): Wird für eine Person in einer bestimmten Runde in einem bestimmten Turnier ermittelt.
- Gesamt-Rating (GR): Eine gewichtete Mittelung aller Runden-Ratings im Wertungszeitraum für eine Person.
- Wertungszeitraum: Normalerweise eine komplette Saison, also 365 Tage. Da allerdings durch Corona bedingt erhebliche Zeiten keine Turniere statt finden konnten, wird der Wertungszeitraum entsprechend um die Corona-Zwangspausen verlängert. Beispiel während Corona am 24.9.21: Der Wertungszeitraum beträgt 709 Tage (statt den normalen 365 Tagen). Wenn die Zwangspausen hinten aus dem Wertungszeitraum hinausrutschen, wird dieser auch wieder kürzer.
- Propagator: Ein Spieler, der im Wertungszeitraum mindestens 8 Runden gespielt hat. Damit kann man annehmen, dass dessen D-Rating recht gut der realen Spielstärke entspricht und nicht durch Ausreißer verfälscht wird.
Ziel
Das D-Rating soll automatisch berechnet werden können. Es soll so wenig wie möglich zusätzliche Arbeit für die TDs machen. Bei Turnieren der German Tour muss man sich ja mit dem D-Rating qualifizieren, um einen Startplatz zu erhalten. Weil nur Mitglieder des Deutschen Frisbee-Verbands (DFV) ein D-Rating erhalten, müssen Ausländer mit dem PDGA-Rating antreten. Daher soll das D-Rating so ähnlich wie möglich zu dem PDGA-Rating sein.
Anforderungen, damit ein D-Rating berechnet wird
Wenn ein Kurs mindestens 12 Bahnen hat, wird ein Rating berechnet.
- Es sind mindestens 15 Propagators zu Beginn der 1. Runde erforderlich.
- Spieler, deren RR mehr als 60 Punkte schlechter als deren aktuelles GR sind, sind keine Propagators für diese Runde.
- Spieler, deren GR unter 700 liegt, sind keine Propagators.
- RR wird für Spieler berechnet, die einem deutschen Verein angehören.
Beschreibung des Algorithmus
Wie oben schon beschrieben, wurde keiner der relevanten Algorithmen zur Berechnung von Ratings veröffentlicht. Wir haben daher diverse eigene Implementationen ausprobiert und die meisten verworfen, weil sie den PDGA-Ratings zu unähnlich waren oder weil die Erfassung der nötigen Daten zu aufwendig oder zu wenig reproduzierbar erschien. Bei dem verbliebenen Algorithmus haben wir die frei wählbaren Parameter so angepasst, dass die Ergebnisse sehr ähnlich zu denen der PDGA waren. Weil diese Parameter aber jeweils mehrere Einflüsse haben, können wir nicht konkret sagen, wie diese Berechnung abläuft. Sie ist einfach nur ähnlich genug.
Mit der folgenden Rechenmethode wird für jede/n Spieler*in für jede Runde ein D-Rating berechnet:
Man erzeuge ein Koordinatensystem. Auf der X-Achse ist die Anzahl der in dieser Runde benötigten Würfe dargestellt (Score), auf der Y-Achse das jeweilige Rating des Spielers/Propagators, welches er vor dem Turnier hatte. Für die zu berechnende Runde macht man für jeden Propagator eine Markierung in diese Grafik, die seinem Vor-Rating und dem Score dieser Runde entspricht. Wenn man das bei allen Propagators macht, dann erhält man eine mehr oder weniger diffuse Punktwolke, die von links oben nach rechts unten geht:
Dann muss man nur noch eine Näherungsgerade durch diese Punktwolke legen, und dann kann man für jeden Score das Rating ablesen. Das ist immer eine Gerade, d.h. ein Wurf weniger ist (in dieser Runde) immer gleich viele Rating-Punkte wert. In der nächsten Runde ist das sehr wahrscheinlich wieder ein bisschen anders.
Für das gesamte Turnier wird anschließend noch eine Mittelung durchgeführt. Man nimmt an, dass die Bedingungen in zwei Runden ähnlich sind, wenn sich das D-Rating bei gleichem Score um max. 25 Punkte unterscheidet. Wenn das Gruppieren von Runden unter diesem Kriterium eindeutig ist, dann werden die entsprechend ähnlichen Runden gemittelt. Dadurch erhält man jedes Mal das gleiche Rating, wenn man in mehreren Runden den gleichen Score spielt.
Bei der PDGA heißt das unofficial bzw. official. Kann man leicht ausprobieren, indem man an den Link zu einem PDGA-Turnier ein '/unofficial' anhängt, z.B.: https://www.pdga.com/tour/event/53119/unofficial und sich dann die Ratings für gleiche Scores betrachtet.
Link auf PDGA, wo “ähnliche Bedingungen” definiert werden: https://www.pdga.com/faq/ratings/why-are-ratings-same-score-thrown-same-course-layout-not-same-either-different-rounds-or . Wir haben allerdings auch ein paar Gegenbespiele gefunden, es ist also nicht klar, welcher Algorithmus derzeit von der PDGA verwendet wird.
Das D-Rating (hier zur Unterscheidung Gesamt-Rating genannt) wird auf der Webseite https://rating.discgolf.de angezeigt.
Allgemeines
Die PDGA veröffentlicht keine Hinweise, wie das Runden-Rating berechnet wird. Allerdings gibt es auf deren Webseite an diversen Stellen einzelne Hinweise, wie aus den RRs das Gesamt-Rating ermittelt wird. Man weiß allerdings nicht, welche davon aktuell noch verwendet werden.
Die PDGA-Rechenmethode
1. Das GR basiert auf Runden der letzten 12 Monate vor der letzten gezählten Runde.
2. Hat der Spieler < 8 Runden, wird der Zeitraum auf max. 24 Monate erweitert, bis entweder 8 Runden erreicht sind oder 24 Monate.
3. Runden mit mehr als 100 Punkten oder 2,5 Standardabweichungen schlechter als das GR werden nicht gewertet ("whichever number is smaller"). Das Kriterium mit der kleineren Abweichung zählt also zuerst.
4. Ab 8 RR zählen die neuesten 25 % der RR doppelt (nicht Zeit, sondern Anzahl).
5. 999 oder DNF haben keine Auswirkungen auf das GR.
6. Die Gewichtung eines RR erfolgt anhand der Anzahl der Bahnen dieser Runde.
7. 888: 6 Monate 5 Punkte Abzug
8. Runden zwischen 13 und 36 Bahnen (jeweils einschließlich) erhalten ein RR.
Sonstiges
Auch nicht aktive PDGA-Mitglieder nehmen an der Rating-Berechnung teil. Das sieht man am tooltip 'Propagator', wenn man mit der Maus über die Stelle fährt, wo ein Rating stehen würde, es aber nicht steht, weil der Spieler aktuell kein Mitglied der PDGA ist.
Umsetzung im D-Rating
Im Prinzip wie PDGA, mit folgenden Abweichungen:
Regel 1: immer ab dem Zeitpunkt der letzten GR-Berechnung, nicht ab der letzten gewerteten Runde.
Regel 2: Der erweiterte Zeitbereich entfällt. Es gelten immer 12 Monate bzw. 365 Tage + Corona-Pause (siehe Wertungszeitraum).
Regel 3: Diese Berechnung wird bis Ende der Saison 2021 bei jeder Berechnung des GR neu angestellt. Ab 2022 erfolgt das nur einmalig zum Turniertag.
Regel 7: 888 wird in Deutschland nicht geahndet.
Regel 8: in Deutschland gibts ab 12 Bahnen ein D-Rating.
Zusätzliche Regeln
9. Für jedes vollendete Jahr, in dem keine Runde gespielt wurde, wird das D-Rating um 10 Punkte reduziert.
10. Nach 3 Jahren ohne Runde wird der Spieler nicht mehr auf der Webseite https://rating.discgolf.de angezeigt. Die Daten bleiben aber in der Datenbank erhalten.
Wie oft wird ein neues (Gesamt-)Rating berechnet?
Während der Saison wird an jedem Sonntag eines Turnier-Wochenendes ein neues Rating berechnet. Damit ist immer ein aktueller Datenbestand gewährleistet, der zur Qualifikation der Turniere der German Tour oder der Deutschen Meisterschaften nötig ist. Der Sonntag ist der Stichtag, je nach Datenlage wird die Berechnung auch einige Tage später durchgeführt, dann aber rückwirkend auf den Sonntag berechnet.
Bei jeder Berechnung wird natürlich der Wertungszeitraum auf den aktuellen Stichtag angepasst. Dadurch kommt es auch vor, dass gespielte Runden aus dem Wertungszeitraum nach hinten raus rutschen und dann nicht mehr zählen. Dadurch wird sich das D-Rating meist ändern, auch wenn man nicht gespielt hat.
Warum ist mein D-Rating anders als das PDGA-Rating?
Der Algorithmus des PDGA-Ratings ist geheim. Wir haben uns dem angenähert, aber es bleiben kleine Differenzen. Außerdem können die Ratings auch gar nicht identisch sein, denn:
- Die Berechnung basiert auf den Scores der anderen Spieler (propagators). Bei der PDGA müssen die propagators ein PDGA-Rating haben (was nur ca. 1/3 der deutschen Spieler hat). Das D-Rating bekommt jeder Spieler, der mindestens ein C-Turnier gespielt hat. Somit ist die Datenbasis schon eine andere. Selbst mit dem gleichen Algorithmus kämen andere Ratings heraus.
- Es gibt Turniere, die nur zu einem der beiden Ratings zählen, z.B. Turniere im Ausland.
- Streichresultate werden auch anders gehandhabt: Bei der PDGA wird bei jeder neuen Berechnung erneut geprüft, ob die entsprechende Runde schlecht genug war, um gestrichen zu werden. Im D-Rating wird das nur einmalig gemacht (weil wir davon ausgehen, dass zu diesem Zeitpunkt das Leistungsniveau des Spielers bewertet wird und nicht einige Monate oder Quartale später).
Durch diese Effekte hat ein Spieler in beiden System auch unterschiedliche Ratings, die dann wieder in die jeweiligen Rating-Berechnungen einfließen und die Ratings der anderen Spieler beeinflussen.
Ich habe beim letzten Turnier deutlich besser als mein Rating gespielt, aber das neue Rating ist kaum gestiegen.
Dafür gibt es mehrere mögliche Ursachen. Zu einen fallen evtl. alte Runden aus der Wertung. Wenn die besser waren als die neuen Runden, wird das neue Rating sinken. Außerdem verschiebt sich der Bereich der doppelt zählenden Runden. Wenn da eine oder mehrere gute Runden nicht mehr doppelt zählen, wird das Rating auch schlechter.
Für die Nerds unter euch ist hier eine Tabelle, wo ihr die Berechnung des Gesamt-Ratings nachvollziehen könnt: (ist noch in Überarbeitung)