|
-
Mitglied
Theoretisches zu Panini Sammelalben
Da ich die folgenden Informationen interessant genug finde, habe ich mir die Freiheit genommen, hierfür ein eigenes Thema zu erstellen (bisher sind die Informationen nur versteckt in irgendwelchen Beiträgen).
Ich hatte mir nämlich vor kurzem auch die "85 Jahre Donald Duck Sammelkollektion" und zwei zugehörige Displays (je 50 Päckchen á 5 Stickern) gegönnt und bei dieser Gelegenheit den Spaß gemacht, die theoretischen Überlegungen zu den Wahrscheinlichkeiten weiter zu verallgemeinern und die Päckchen auf Gleichverteilung zu testen. Hier folgt nun meine Auswertung.
Rohdaten der 2 Displays
Code:
Sticker Display 1
103 89 191 127 91
260 247 121 150 218
132 146 102 222 45
78 180 271 20 270
174 61 160 176 255
261 228 106 131 14
50 57 272 21 122
33 268 154 4 129
99 187 74 147 30
197 205 95 70 223
42 194 112 269 5
275 64 68 226 163
137 158 45 138 8
49 196 29 136 259
17 237 241 214 124
108 165 39 156 114
242 236 254 2 200
69 46 122 87 253
235 188 32 209 233
88 116 179 67 56
219 3 178 232 172
139 83 5 135 96
212 145 7 182 211
173 59 125 243 183
79 37 114 82 22
9 6 252 44 195
150 184 144 168 58
263 215 218 11 71
75 113 56 189 271
111 34 222 1 101
131 157 80 234 143
267 12 14 251 191
65 115 183 146 68
248 273 21 192 98
70 40 90 216 81
204 15 223 247 160
140 177 58 57 254
225 244 269 161 270
136 35 27 13 92
54 258 259 228 74
148 133 143 194 178
202 220 67 110 33
209 84 77 231 79
238 229 233 205 45
164 142 81 165 241
208 19 243 55 275
182 38 128 257 75
213 206 211 121 122
119 86 92 116 218
181 264 168 185 242
Sticker Display 2
79 198 172 192 201
263 20 253 16 76
111 273 29 35 52
44 157 126 4 134
248 244 32 84 250
1 40 63 226 26
139 152 200 1 98
17 221 8 217 162
65 127 71 110 275
192 35 190 72 2
193 268 96 260 41
202 19 252 94 20
267 166 22 261 109
208 264 222 89 268
161 84 159 232 170
213 237 254 212 137
75 167 124 161 33
225 220 7 38 221
132 147 39 228 61
54 236 174 49 154
185 219 160 187 148
141 235 68 3 238
167 251 272 89 185
43 4 269 104 64
2 3 87 67 23
127 247 112 176 149
138 236 156 226 175
164 158 74 149 17
198 11 102 94 55
152 214 47 38 110
166 176 21 180 181
267 50 5 83 186
139 262 241 12 24
50 138 179 205 187
274 232 243 135 237
119 36 45 51 263
140 61 191 55 242
91 197 271 64 204
10 215 178 9 69
60 46 122 132 193
88 82 80 145 83
217 11 234 189 12
240 214 168 82 215
42 87 66 196 158
249 15 218 248 79
155 37 114 42 204
108 135 144 188 46
16 18 216 146 15
227 258 14 225 75
48 113 56 108 54
Karten Display 1
16
22
12
31
29
3
22
8
7
16
24
3
20
29
21
16
34
33
7
29
11
10
28
7
26
6
20
2
36
19
33
15
13
32
10
28
23
9
26
6
4
25
36
19
17
35
13
32
30
12
Karten Display 2
25
18
18
9
5
32
35
31
5
19
9
6
27
20
1
27
14
32
33
15
1
6
17
21
23
2
4
28
14
19
15
21
29
13
11
28
30
33
24
3
34
10
8
26
11
36
34
16
7
2
Auswertung der 2 Displays
Code:
"[,q]" steht für die Anzahl verschiedener Motive, die mindestens q-fach vorkommen.
Karten Display 1
[,1] [,2] [,3] [,4] [,5] [,6]
31 16 3 0 0 0
Karten Display 2
[,1] [,2] [,3] [,4] [,5] [,6]
34 16 0 0 0 0
Karten: theoretisch vorhergesagte Erwartungswerte bei Gleichverteilung aller möglichen Päckchen
[,1] [,2] [,3] [,4] [,5] [,6]
27.19 14.62 5.82 1.79 0.44 0.09
Sticker Display 1
[,1] [,2] [,3] [,4] [,5] [,6]
196 51 3 0 0 0
Sticker Display 2
[,1] [,2] [,3] [,4] [,5] [,6]
190 60 0 0 0 0
Sticker: theoretisch vorhergesagte Erwartungswerte bei Gleichverteilung aller möglichen Päckchen
[,1] [,2] [,3] [,4] [,5] [,6]
165.35 63.28 17.15 3.53 0.57 0.078
Man mag nun denken, die Differenz bei Display 2 zur theoretischen Vorhersage 190-165.35=24.65 lässt ich auch bei Annahme einer Gleichverteilung aller Päckchen noch mit dem Zufall erklären. Dem ist aber ganz eindeutig nicht so. Um dies rechnerisch zu verdeutlichen, sei mit Y die Anzahl verschiedener Motive, welche man mit einem Display bekommt, bezeichnet (d.h. die Motive, die mindestens einmal vorkommen => q=1). Unter der Annahme der Gleichverteilung der Päckchen ist die Wahrscheinlichkeit, dass Y vom Erwartungswert ?=165.35 um weniger als 24.65 abweicht, gleich
P(|y-?|<24.65)=P(140.7<Y<190)=P(140<Y<190)=0.9999989
Die Wahrscheinlichkeit, dass sogar beide Displays Abweichungen vom Erwartungswert um 24.65 oder mehr haben (wie es bei mir ja mit 190 und 196 der Fall war), beträgt, unter der Annahme der Gleichverteilung der Päckchen, (1-0.9999989)^2, also etwa 1 zu 826 Milliarden (unter Annahme der Gleichverteilung, sind die Displays natürlich unabhängig)! Zum Vergleich: Die Chance auf den Lottohauptgewinn (6 Richtige aus 49 + Superzahl) beträgt rund 1 zu 140 Millionen. Die Päckchen innerhalb eines Displays bei Panini sind damit ganz klar nicht gleichverteilt! Das bedeutet, es kommen gar nicht alle möglichen Päckchen in den Displays vor oder sie kommen mit unterschiedlichen Häufigkeiten vor oder beides.
Ob die Päckchen im Gesamten trotzdem noch gleichverteilt sind, lässt sich mit den mir vorliegenden Daten nicht beweisen oder widerlegen. Da bräuchte man Päckchen aus vielen (>20) verschiedenen Displays. Aber ich habe nur zwei Displays. Falls sich in Zukunft jemand noch Sticker Päckchen dieser Serie kauft (oder auch anderer Serien), würde ich mich freuen, wenn die Daten hier in diesem Thema veröffentlicht werden.
Erwartungswert bei unbekannter Verteilung
Nun da die Verteilungsannahme (jedes der (276 über 5) = 12868936080 möglichen Päckchen aus 5 Stickern kommt mit gleicher Wahrscheinlichkeit vor) auf sehr wackligen Füßen steht, lassen sich natürlich auch die Formeln für den Erwartungswert und die Varianz der erhaltenen Motive (beim Kauf von n Päckchen) möglicherweise gar nicht auf das Panini-Modell anwenden. Welche Informationen über die "wahre" Verteilung der Sticker bzw. Päckchen sind überhaupt sicher? Dies sind offenbar genau die beiden folgenden Annahmen.
(A1) Alle Päckchen enthalten genau s>0 verschiedene Sticker (bei Panini in der Regel mit s=5 erfüllt).
(A2) Die Wahrscheinlichkeit bei zufälliger Wahl eines Päckchens ein bestimmtes Stickermotiv zu erhalten, ist für jedes Motiv gleich.
Annahme (A1) ist offensichtlich korrekt. Annahme (A2) wird durch Hermann Paul, Geschäftsführer von Panini, garantiert: "Alle Panini-Sticker werden gleich oft gedruckt"
https://www.kleinezeitung.at/sport/f...h-oft-gedruckt
Lässt sich alleine aus diesen beiden Annahmen, ohne der genauen Kenntnis, welche Päckchen mit welcher Häufigkeit vorkommen (oder auch gar nicht vorkommen), trotzdem noch der Erwartungswert der Anzahl der beim Kauf von n zufällig gewählten Päckchen erhaltenen unterschiedlichen Stickermotive, die mindestens q-fach vorkommen (q=1,2,3,...) bestimmen? Mich hat es etwas überrascht, aber die Antwort auf diese Frage ist tatsächlich "Ja" und die Formel zur Berechnung ist die gleiche wie im Modell der Gleichverteilung aller Päckchen!
Gibt es insgesamt m verschiedene Stickermotive und bin ich an k>0 von diesen interessiert, dann ist, unter den beiden Annahmen (A1) und (A2), die erwartete Anzahl mich interessierender, verschiedener Motive, die mindestens q-fach vorkommen, beim Kauf von n zufällig gewählten Päckchen, die jeweils s verschiedene Sticker enthalten, durch
https://s1.imagebanana.com/file/200202/0mUmxvIG.png
gegeben, unabhängig davon, wie die Wahrscheinlichkeitsverteilung genau aussieht und welche Päckchen überhaupt vorkommen! Zur Berechnung der Varianz reichen die Informationen (A1) und (A2) leider nicht aus.
Herleitungen finden sich im Skript im Abschnitt "Anzahl mindestens q-fach vorkommender Objekttypen – die Panini-Formel" (S. 3 - 4). Das Skript ist mittlerweile zu einer wirklich umfangreichen Arbeit, mit tatsächlich neuen Ergebnissen über gewisse Zufallsvariablen, angewachsen und ich bin am überlegen, diese in einem anderen Rahmen zu veröffentlichen. Solange ich das nicht tue, kann sich jeder gerne eine aktuelle Version über die folgenden beiden Links beschaffen bzw. online lesen.
Download Link (MEGA)
online lesen (YUMPU)
Die Auswertungen der beiden Displays führen also zu der Vermutung, dass die Produktionsprozesse bei Panini dazu führen, dass die Auswahl der Päckchen innerhalb eines Displays nicht zufällig geschieht, wohlgemerkt unter der Gültigkeit der (globalen) Annahmen (A1) und (A2).
R-Skript
Code:
n = 42; m = 276; k = 276; s = 5; q = 1; p = s / m
e = k - k * pbinom(q-1, size=n, prob=p)
print(e)
Geändert von Cap'n Kuda (23.02.2021 um 00:56 Uhr)
Grund: Link aktualisiert
-
Mitglied
Zitat von Cap'n Kuda
Die Auswertungen der beiden Displays führen also zu der Vermutung, dass die Produktionsprozesse bei Panini dazu führen, dass die Auswahl der Päckchen innerhalb eines Displays nicht zufällig geschieht,
Definiere "zufällig"! ;-)
Du gehst bei deiner Wahrscheinlichkeitsrechnung ja immer von einem idealisierten Zufall aus, den es im mechanischen Produktionsprozess so aber wahrscheinlich gar nicht gibt.
Die Motive werden sicher nicht zufällig gedruckt, sondern jedes einzelne Motiv bogenweise. Die Motive werden dann irgendwie gemischt und schon hier wird wohl nicht mehr auf mathematische Genauigkeit (größtmögliche Entropie) geachtet. Es reicht, wenn die Motive "durcheinander" sind. An einer Stelle liegen dann etwas mehr vom Motiv X, an anderer Stelle von Motiv Y. Man prüft nur noch, dass 5 verschiedene in einer Tüte sind und gut ist.
Eine exakte Zufälligkeit würde man nur erreichen, wenn ein Algorithmus fünf Zufallswerte ermitteln würde und die Tüte dann mit den entsprechend ausgelosten Motiven befüllt würden. Aber was wäre das für ein Aufwand! Außerdem wären dann am Ende von Motiv X ein paar zu wenig und von Motiv Y ein paar zu viel gedruckt.
Wahrscheinlich wurden von allen Motiven gleichviele gedruckt, aber die Verteilung auf die Tütchen ist nicht zufällig sondern nur "hinreichend durcheinander".
Das ist meine Vorstellung; meine letzte Mathestunde ist allerdings schon ein paar Jahre her ...
-
Mitglied
Zitat von TiTriTra
Wahrscheinlich wurden von allen Motiven gleichviele gedruckt, aber die Verteilung auf die Tütchen ist nicht zufällig sondern nur "hinreichend durcheinander".
Ich denke das trifft für die Displays zu. Aber wenn man nur unregelmäßig in dem einen oder anderen Laden ein paar Päckchen kauft und diese demzufolge aus unterschiedlichen und unabhängigen Displays stammen, sollte Annahme (A2) gelten (und die beruht ja auch nur auf der unbewiesenen Behauptung von Herrn Paul). Vielleicht geht Panini ja irgendwann dahin über, dass die Bögen schon zufällig zusammengestellt sind (also vor dem Zerteilen). Dann bräuchte man auch nicht mehr kompliziert mechanisch mischen.
Ursprünglich wurden die Bilder übrigens ähnlich den Lottozahlen in einem Butterfass gemischt. Da hatte man wohl echten Zufall.
https://panininewsroom.de/es-begann-mit-wundertueten-2/
Berechtigungen
- Neue Themen erstellen: Nein
- Themen beantworten: Nein
- Anhänge hochladen: Nein
- Beiträge bearbeiten: Nein
-
Foren-Regeln
|
|
Lesezeichen