Highspeed Opi schrieb:
Und wie soll Statistik denn funktionieren?
30.000.000 Spieler, 1.500.000 Cheater (1.500.000 : 30.000.000 = 0,05)
100 Spieler, 5% Cheater (100 x 0,05 = 5)
Gegenrechnung:
30.000.000 Spieler : 100 pro Spiel = 300.000 Spiele
1.500.000 Cheater : 100 pro Spiel = 15.000 Cheater
15.000 : 300.000 = 0,05 = 5%
Deshalb die Aussage: "statistisch 5 Cheater pro Spiel".
Wo ist der Fehler? Ich habe auch keine Variable vergessen, denn genau so funktioniert Statistik und wenn man die Statistik fälschen bzw. schön machen möchte, setzt man entsprechende Variablen ein. Beispielsweise nur Spiele mit deutscher IP und nur zwischen 13:00 Uhr und 17:00 Uhr, etc.
Wenn wir die Cheater pro Spiel bzw. deren Spielbeitrittswahrscheinlichkeit ermitteln wollen, sprechen wir erst einmal von Stochastik. Ganz unabhängig davon triffst du mehrere Annahmen, die nicht zwangsläufig Gültigkeit haben müssen.
Du schließt einfach von der Menge der Spieler und Menge der Cheater auf eine durchschnittliche Menge an Cheatern pro Spiel. Das ist natürlich falsch. Zuerst gilt zu klären, wie viele Spieler wie viele Spiele pro Tag spielen und ob sich die Spielweise von Cheatern demgegenüber unterscheidet. Wenn z.B. die Cheater durchschnittlich nur 5 Runden pro Tag spielen (alle anderen aber beispielsweise 10), weil sie immer gewinnen und es ihnen schneller langweilig wird oder sie z.B. nur eine bestimmte Anzahl an Runden pro Tag cheaten und die restlichen ohne Cheat spielen (oder oder oder), dann ändert sich davon abhängig natürlich sehr stark die erwartete Anzahl an Cheatern pro Spiel.
Ebenso könnte sich das natürlich umgekehrt verhalten, wenn die "normalen" Spieler z.B. sehr schnell keine Lust mehr haben, weil sie zu häufig auf Cheater o.Ä. treffen.
Hinzukommend wäre noch zu klären, wie gut zufällig Spieler zusammen zu einer Runde gepairt werden und ob dort weitere Constraints herrschen - etwa Ranking, Ping/Region, ...
Das beeinflusst eine derartige Rechnung natürlich ebenso stark.
Schlussendlich hast du nichts anderes gemacht, als die Zahlen in Relation zueinander zu setzen. So funktioniert das nicht. Wenn wir die Annahmen treffen, dass (1) Spieler & Cheater gleichzeitig häufig online sind, (2) Spieler & Cheater durchschnittlich gleich viele Spiele pro Tag spielen, (3) Spieler & Cheater zu ähnlichen Zeiten online sind, (4) Spieler & Cheater in jeder Region nahezu ähnlich verteilt, (5) das Pairing der Spieler aus dem Pool ausschließlich zufällig mit ordentlichem RNG passiert usw. usf.,
dann könnte man deine Zahlen (30.000.000 Spieler, davon 1.500.000 Cheater) in einem
sehr naiven Szenario z.B. verwenden um für ein Spiel (100 Spieler) die Menge der Cheater über
Ziehen ohne Zurücklegen zu modellieren:
Wir ziehen aus unserer Grundgesamtheit von 30.000.000 Spielern zufällig n = 100 Spieler für ein Spiel und wollen ermitteln, wie hoch die Wahrscheinlichkeit für k = 5 Cheater im Spiel ist. D.h. wir haben N = 30.000.000 - 1.500.000 = 28.500.000 "normale Spieler" und M = 1.500.000 Cheater sowie p = M / N = 1/20.
Die Wahrscheinlichkeit P ergibt sich dann aus: (n über k) * p^k * (1 - p)^(n-k) = 0,18 (gerundet)
(Beleg: z.B. jedes beliebige Stochastik-Fachbuch)
D.h. in dieser
sehr naiven Betrachtungsweise wäre die Wahrscheinlichkeit
etwa 18% in einem Spiel von 100 Spielern
genau 5 Cheater zu haben.
Wie erwähnt ergibt diese Betrachtungsweise aber keinerlei Sinn (auch wenn
diesmal der Ansatz mathematisch korrekt ist), weil die anderen Variablen (gleichzeitige Spieler/Cheater, Seeding, Anzahl von Spielen pro Tag, Spieldauer, ...) variieren werden und für eine verlässliche Aussage mit in Betracht gezogen werden müssten.