Le
problème
Il s'agit du problème de Diophante
G191****
:
Je joue une partie
avec deux dés à la manière du Blackjack. Je lance
les deux dés autant de fois que je le souhaite. A l'issue de
chaque lancer, je calcule la somme des numéros obtenus puis
le cumul des sommes enregistrées depuis le début de
la partie. Si je m'arrête, mon score est égal à
la somme cumulée à la condition que celle-ci reste inférieure
ou égale à 21.
Si cette somme est strictement supérieure à 21, mon
score est nul.
Quelle stratégie dois-je adopter pour maximiser l'espérance
mathématique de mon score ?
Déterminez cette espérance mathématique : quel
meilleur score puis-je espérer avec un bonne tactique ?
Expérimentons
Dans l'animation suivante,
- on peut jouer seul tout simplement : JOUER.
A chaque jeu, on décide de continuer ou bien de s'arrêter.
Si l'on dépasse 21, bien entendu on perd et le score du jeu
est 0.
On peut également faire une SIMULATION animée ou ULTRA
rapide avec espérance immédiate sur de très nombreux
jeux.
Le résultat sera variable avec le SEUIL d'arrêt choisi.
Ne pas regarder trop vite la solution ;).
SOLUTION
et Démonstration
(Ma
démarche complète
ICI )
Cherchons les probabilités d’obtenir les sommes de 1
à 12 en jouant avec deux dés.
Il suffit de dresser le tableau des résultats possibles avec
deux dés et de compter le nombre d’apparitions de chaque
nombre.
Exemple : 2 a 1 chance sur 36 d’apparaître
car on l’a une seule fois dans le tableau.
3 a 2 chances sur 36 etc.
1 -> 0 ; 2 -> 1 ; 3
-> 2 ; 4 -> 3 ; 5 -> 4
; 6 -> 5 ; 7 -> 6 ; 8
-> 5 ; 9 -> 4 ; 10
-> 3 ; 11 -> 2 ; 12 ->1.
CHERCHONS à
partir d'exemples
Imaginons que,
-on
a obtenu la somme 15 :
21-15=6
Possibilités :
6 -> 5/36
5 -> 4/36
4 -> 3/36
3 -> 2/36
2 ->1/36
Probabilité totale :
(5+4+3+2+1)=15/36
inférieure à 18/36, je m’arrête car j’ai
plus de chances de perdre que de gagner.
--on
a obtenu la somme 6 :
21-6=15
Tous les jeux sont OK, je rejoue.
--on a obtenu la somme 14 :
21-14=7
Possibilités :
7 -> 6/36
6 -> 5/36
5 -> 4/36
4 -> 3/36
3 -> 2/36
2 -> 1/36
Probabilité totale :
(6+5+4+3+2+1)=21/36
supérieure à 18/36, je continue car j’ai plus
de chances de gagner que de perdre.
FINALEMENT
- Tant que j’ai une somme inférieure ou égale
à 14 je peux obtenir jusqu’à 7 points et les probabilités
sont : (6+5+4+3+2+1)/36 = 21/36 dont plus de 18/36.
-A partir de 15 les probabilités ok sont de (5+4+3+2+1)/36
= 15/36 mois de 18/36 donc STOPPER.
Mais il faut tenir compte de l’espérance et on a un meilleur
résultat avec un seuil de 14.
La bonne stratégie
sera de s’arrêter dès que l’on approchera
d'n seuil de 14 ...
Il faut analyser plus précisément.
Le calcul est un peu délicat et se fait de proche en proche.
Pour ceux qui
sont intéressés, voici le début de la démarche,
ma démarche complète
est ICI.
En un seul lancer
de dés (probabilité p1)
p1(X=1)
= 0/36
p1 (X=2) = 1/36
p1 (X=3) = 2/36
p1 (X=4) =3/36
p1 (X=5) = 4/36
p1 (X=6) = 5/36
p1 (X=7) = 6/36
p1 (X=8) = 5/36
p1 (X=9) = 4/36
p1 (X=10) = 3/36
p1 (X=11) = 2/36
p1 (X=12) =1/36
Calcul des probabilités
selon le nombre de jeux
En deux lancers de dés (proba p2)
p2(X=4) -> p (X=2 )*p(X=2)=1/36²
p2 (X=5) -> p(X=2 )*p(X=3)+p1(X=3)*p(X=2)=2/36²+2/36²=4/36²
p2 (X=6) -> p(X=2 )*p(X=4)+p1(X=3)*p(X=3)+p(X=4)*p(X=2)=3/36²+4/36²+3/36²=10/36²
p2 (X=7) -> 2*p (X=2 )*p(X=5)+2*p(X=3)*p(X=4)=2*4/36²+2*6/36²=20/36²
p2 (X=8) -> 2*p(X=2 )*p(X=6)+2*p(X=3 )*p(X=5)+p (X=4 d(X=4)=2*5/36²+2*8/36²+9/36²=35/36²
p2 (X=9) -> 2*p(X=2 )*p(X=7)+2*p(X=3 )*p(X=6)+2*p (X=4)*p(X=5)=2*6/36²+2*10/36²+2*12/36²=56/36²
p2 (X=10) -> p(X=5 )*p(X=5)+2*p(X=6 )*p(X=4)+2*p (X=7)*p(X=3)+2*p(X=8)*p(X=2)=
16/36²+2*15/36²+2*12/36²+2*5/36²=80/36²
p2 (X=11) -> 2*p(X=6)*p(X=5)+2p(X=7)*p(X=4)+2*p(X=8)*p(X=3)+2*p(X=9)*p(X=2)=
( 2*20+2*18+2*10+2*4)/36²=104/36²
p2 (X=12) -> p(X=6)p(X=6)+2*p(X=7)p(X=5)+2*p(X=8)p(X=4)+2*p(X=9)p(X=3)+p(X=10)p(X=2)=
(25+2*24+2*15+2*8+2*3)/36²=125/36²
p2 (X=13) -> 2*p(X=7)p(X=6)+2*p(X=8)p(X=5)+ 2*p(X=9)p(X=4)+ 2*p(X=10)p(X=3)+2*p(X=11)p(X=2)=
(2*30+2*20+2*12+2*6+2*2)/36²=140/36²
p2 (X=14) -> p(X=7)p(X=7)+2*p(X=8)p(X=6)+2*p(X=9)p(X=5)+2*p(X=10)p(X=4)+2*p(X=11)p(X=3)+
2*p(X=12)p(X=2)=(36+50+32+18+8+2)/36²=146/36²
p2 (X=15) -> 2*p(X=8)p(X=7)+2*p(9)p(X=6)+2*p(10)p(X=5)+2*p(11)p(X=4)+2*p(12)p(X=3)=
=(2*30+2*20+2*12+2*6+2*2)/36²=140/36²
p2 (X=16) ?p(X=8)p(X=8)+2*p(X=9)p(X=7)+2*p(X=10)p(X=6)+2*p(X=11)p(X=5)+2*p(X=12)p(X=4)=
=( 25+2*24+2*15+2*8+2*3)/36²=125/36²
p2 (X=17) -> 2*p(X=8)*p(X=9)+2*p(X=7)*p(X=10)+2*p(X=6)*p(X=11)+2*p(X=5)*p(X=12)=
=(40+36+20+8)/36²=104/36²
p2 (X=18) -> p(X=9)*p(X=9)+2*p(X=8)*p(X=10)+2*p(X=7)*p(X=11)+2*p(X=6)*p(X=12)=
=(16+30+24+10)/36²=80/36²
p2 (X=19) -> 2*p(X=9)*p(X=10)+2*p(X=8)*p(X=11)+2*p(X=7)*p(X=12)=
24+20+12)/36²=56/36²
p2 (X=20) -> p(X=10)*p(X=10)+2*p(X=9)*p(X=11)+2*p(X=8)*p(X=12)=(9+16+10)/36²=35/36²
p2 (X=21) -> 2*p(X=11)*p(X=10)+2*p(X=12)*p(X=9)=(12+8)/36²=20/36²
p2 (X=22) -> p(X=11)*p(X=11)+2*p(X=12)*p(X=10)=(4+6)/36²=10/36²
p2 (X=23) -> 2*p(X=12)*p(X=11)=( 4)/36²=4/36²
p2 (X=24) -> p(X=12)*p(X=12)=1/36²
Le total fait bien 36²=1296 =36*36? OK
En poursuivant
les calculs en plusieurs étapes,
nous trouvons que la stratégie optimale donnant le meilleur
résultat correspond à un seuil de 14
L'animation précédente,
permet de vérifier de façon très précise
ce résultat.
On obtient : E
~ 15.705329831634371
Ci-dessus, une simulation sur 20 000 cas avec la condition d’arrêt
sur 14 donne effectivement une moyenne de 15.7
On retient donc le seuil de 14 :
-tant que le résultat est inférieur à 14, je
continue ;
-à partir d’une somme supérieure ou égale
à 14 j’arrête de jouer et prends le score donné.
Avec un SEUIL de 14, l’espérance mathématique
est de 15.7 environ.
A vos
jeux...