Statistique 250
On suppose que dans la classe [500,510[, la distribution est linéaire
d’où : Me 500 510 500
40 12 57 12
donc Me = 506.22 g: ça signifie que la moitié des boîtes prélevées
pèse 506.22 g ou plus et l’autre moitié pèse 506.22 g ou moins.
2°) Le pourcentage de boîtes dont la masse nette est supérieure ou
égale à 500 grammes est la fréquence cumulée décroissante jusqu’à
la valeur 500: c’est 85%.
Exercice 3
1°) Pour tout i on a Ci = yi
y6
Période 1ère Année 2ème Année 3ème Année
(ti)
t1=tr t2= t3=tr t4=tr t5= t6=tr t7=tr t8= t9=tr
1 tr2 3 1 tr2 3 1 tr2 3
Moyenne 16.3 17.0 16.5 16.5 16.9 17.1 16.0 16.9 17.1
(yi) 6 5 8 7 0 8 6 5 9
Coef. 1 1.04 1.01 1.01 1.03 1.05 0.98 1.04 1.05
multi Ci
2°) Pour tout i on a Ii = 100 x Ci
Période 1ère Année 2ème Année 3ème Année
(ti) t7=tr t8= t9=tr
t1=tr t2= t3=tr t4=tr t5= t6=tr
1 tr2 3 1 tr2 3 1 tr2 3
Moyenne 16.3 17.0 16.5 16.5 16.9 17.1 16.3 16.9 17.1
(yi) 6 5 8 7 0 8 659
Indice Ii 100 104 101 101 103 105 98 104 105
3°) a) On a I5 = 103, on en déduit que la moyenne trimestrielle au
cours du 2ème trimestre de la 2ème Année (t5) représente 103% de la
moyenne trimestrielle au cours du 1er trimestre de la 1ère Année (t1):
c'est-à-dire qu’au 2ème trimestre de la 2ème Année, il ya eu une
amélioration de 3% par rapport au 1er trimestre de la 1ère Année.
• I7 = 98, on en déduit que la moyenne trimestrielle au cours du 1er
trimestre de la 3ème Année (t7) représente 98% de la moyenne
trimestrielle au cours du 1er trimestre de la 1ère Année (t1): c'est-à-
dire qu’au 1er trimestre de la 3ème Année, il ya eu une régression de
1% par rapport au 1er trimestre de la 1ère Année.
Statistique 251
b) • t10 = t1 x107 16.36 x107 =17.51 • t11= t1 x106
100
= =
100 100
16.36 x106
= 17.34
100
• t12= t1 x109 = 16.36 x109 = 17.83
100 100
Période 1ère Année 2ème Année
(ti) t1=tr1 t2= tr2 t3=tr3 t4=tr1 t5= tr2 t6=tr3
Moyenne 16.36 17.05 16.58 16.57 16.90 17.18
(yi)
100 104 101 101 103 105
Indice Ii
Période (ti) 3ème Année 4ème Année
t10=tr1 t11= tr2 t12=tr3
Moyenne(yi t7=tr1 t8= tr2 t9=tr3
) 17.51 17.34 17.83
16.36 16.95 17.19
Indice Ii 107 106 109
98 104 105
4°)
Titre du graphique 5°)
t1
t2
t3
t4
t5
t6
t7
t8
t9
Pour k{1, 2, 3, 4} désignons par:
• t1k le 1er trimestre de la k-ème année
• t2k le 2ème trimestre de la k-ème année
• y1k la moyenne au cours de t1k
Statistique 252
• y2k la moyenne au cours de t2k
On va calculer l’indice I2k de y2k rapporté à la base 100 en t1k (c'est-à-
dire que l’indice de y1k est 100)
y
y21on trouve: I21 = 100 x = 100 x 17.05 = 104
16.36
11
y
y22I22 = 100 x = 100 x 16.90 = 102
16.57
12
y
y23I23 = 100 x = 100 x 16.95 = 104
16.36
13
y
y24I24 = 100 x = 100 x 17.34 = 99
17.51
14
Conclusion: au cours de sa:
• 1ère Année et du 1er trimestre au 2ème, l’élève a fait une progression
de 4%
• 2ème Année et du 1er trimestre au 2ème, l’élève a fait une progression
de 2%
• 3ème Année et du 1er trimestre au 2ème, l’élève a fait une progression
de 4%
• 4ème Année et du 1er trimestre au 2ème, l’élève a fait une régression
de 1%
Exercice 4
I) Pour faciliter la tâche, on commence par résumer la série X par le
tableau ci-dessous:
N 15678 9 1 1 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3
o 01234567890369124
m
br
Statistique 253
e
de
jo
ur
s
ne
ig
eu
x
eff 1 1 3 3 2 1 2 3 4 3 4 1 1 3 4 2 3 1 1 2 1 2 1
ec
tif
Ek 12581 1 1 1 2 2 2 2 2 3 3 3 4 4 4 4 4 4 4
0 1 3 6 0 3 7 8 9 2 6 8 1 2 3 5 6 8 9
1°) On a X 1 23 xi = 15.4
49 ni
i 1
2°) • L’effectif total N = 49 = 2 x 24 + 1 alors la médiane Me de X et
la valeur qui correspond au 25ème individu qui est 14 (d’après la ligne
des effectifs cumulés croissants du tableau ci-dessus)
• L’effectif total N = 49 = 4 x 12 + 1 alors 1er quartile Q1 = x12+1 =x13 =
10
et le 3ème quartile Q3 = x3x12+1 = x37 = 19
II) 1°) Soi E et E’ les écarts interquartiles respectifs de X st Y, alors
E = Q3 - Q1 = 19 – 10 = 9 et E’ = Q3' - Q1' = 18 – 7 = 11
2°)
Commentaire: la boîte associée à la série X est plus serrée
que celle qui correspond à la série Y.
Statistique 254
donc l’écart interquartile - qui regroupe la zone centrale – de la
série X est inférieur à l’écart interquartile de la série Y: ça
traduit l’homogénéité relative de X par rapport à Y.
3°) Le fait que X est inférieur à Y laisserait penser que la série Y
est plus dispersée que la série X
c'est-à-dire que dans la période 1900 – 1948, les nombres des
jours où il neige sont plus proches que ceux de la période 1949
- 1997
Exercice 5
I) En utilisant les quartiles
1°) • La série définie par L1 est résumée par le tableau 1 ci –
dessous:
tableau 1
Note (xk) 4 6 7 8 9 10 11 12 13 14 15 16
Effectif (nk) 1 1 1 3 4 4 1 3 2 2 1 1
Pour calculer les paramètres de la série des notes en math, on
complètera ce tableau:
Note (xk) 4 6 7 8 9 10 11 12 13 14 15 16
Effectif (nk) 1 1 1 3 4 4 1 3 2 2 1 1
Ek 1 2 3 6 10 14 15 18 20 22 23 24
• L’effectif total de cette série est N = 24 = 2 x 12 donc Me =
x12 x13 = 10 10 = 10
22
• L’effectif total de cette série est N = 24 = 4 x 6 donc Q1 =
x6 x7 = 8 9 = 8.5
22
et Q3 = x18 x19 = 12 13
2 = 12.5
2
2°) • La série définie par L2 est résumée par le tableau 2 ci –
dessous:
tableau 2
Note 1 4 6 7 8 9 10 11 12 14 15 16 18 20
Effectif 1 2 1 2 1 1 4 2 2 3 2 1 1 1
Note 1 4 6 7 8 9 10 11 12 14 15 16 18 20
Statistique 255
Effectif 1 2 1 2 1 1 4 2 2 3 2 1 1 1
Ek 1 3 4 6 7 8 12 14 16 19 21 22 23 24
Pour calculer les paramètres de la série des notes en physique, on
complètera ce tableau:
• L’effectif total de cette série est N = 24 = 2 x 12 donc
M’e = x12 x13 = 10 11 = 10.5 donc
22
• L’effectif total de cette série est N = 24 = 4 x 6
Q' = x6 x7 = 7 8 = 7.5
12 2
et Q' = x18 x19 = 14 14 = 14
32 2
3°) • Diagramme en boîte des notes en math
• Diagramme en boîte des notes en physique
• Me étant proche de M’e donc les deux séries ont la même
médiane –presque- c'est-à-dire que la proportion d’élèves qui a eu
plus que (ou moins que) 10 (ou 10.5) est la même –presque- en math
et en physique.
• On a: l’interquartile des notes en math est: Q 3 - Q1 = 12.5 – 8.5 =
4
et l’interquartile des notes en physique est: Q' - Q' = 14 – 7.5 =
31
6 .5
Statistique 256
donc Q 3 - Q1 < Q' - Q' donc la zone centrale (qui n’est pas
31
influencée par les valeurs extrêmes) comprenant 50% des notes est
plus concentrée (moins dispersée) en math qu’en physique.
Par suite cette classe est plus homogène en math qu’en physique.
Graphiquement: la boîte (le rectangle) des notes en math est plus
serrée que la boîte (le rectangle) des notes en physique.
• On a de plus, l’étendue des notes en math est 16 – 4 = 12
et l’étendue des notes en physique est 20 – 1 = 19
II) En utilisant les écarts-types
1°) • M = 1 x(4x1+ 6x1 +7x1 + 8x3 + 9x4 + 10x4 + 11x1 +12x3 +
24
13x2 + 14x2 + 15x1 + 16x1) = 10.375
• M ' = 1 x(1x1 + 4x2 + 6x1 +7x2 + 8x1+ 9x1 + 10x4 + 11x2 + 12x2
24
+ 14x3 + 15x2 + 16x1 + 18x1 + 20x1) = 10.75
C’est comme si chaque élève de cette classe a eu 10.37 en math et
10.75 en physique
Le fait que M ont M ' des valeurs très proches donne l’impression
que le niveau de cette classe en physique est presque identique à ce
qu’il est en math.
2°) • On a V 1 i121nixi2 x2 alors = V = 2.87
N
i141nixi2
• V' 1 x2 alors ’ = V ' = 4.50
N
’ étant supérieur à alors la série de notes de physique est
beaucoup plus dispersée que celle de notes de math, par suite cette
classe est plus homogène en math qu’en physique.
Exercice 6
1°)
Montant en dinars [10, 30 , 40 40 , 60 60 , 70 [70 ,
30[ 90[
Effectif (ni) 8 30 40 20 2
Fréquence (fi) 0.08 0.3 0.4 0.2 0.02
Fréquences 0.08 0.38 0.78 0.98 1
Cumulées
croissantes
Statistique 257
Remarque: les classes [10, 30[, 40 , 60 et [70 , 90[ ont une
amplitude double de celle des autres, pour respecter le principe de
proportionnalité des aires des rectangles aux effectifs, les effectifs
réels seront alors doubles de ce qu’on lit sur l’histogramme: d’où les
résultats.
2°)
Montant en dinars [10, 30 , 40 , 60 , [70 ,
30[ 40 60 70 90[
Effectif (ni) 8 30 40 20 2
Effectif par unité 0.4 3 2 2 0.1
d’amplitude
Fréquence (fi) 0.08 0.3 0.4 0.2 0.02
fi .ci 1.6 10.5 20 13 1.6
Puisque les classes de cette série n’ont pas la même amplitude
alors sa classe modale est celle qui a le plus grand effectif par
unité d’amplitude, c’est alors la classe 30,40
Interprétation: au cours du premier trimestre de 2006, le nombre de
ménages qui payent une facture dont le montant est dans la classe
30,40 est supérieur au nombre de ménages qui payent une facture
dont le montant est dans n’importe quelle autre classe .
5
La moyenne de cette série est x = fi.ci = 1.6 + 10.5 + 20 + 13 +
i1
1.6 = 46.700 (on utilisera une calculatrice au mode ‘’Stat’’)
Interprétation: c’est comme si chaque ménage de ce village a payé
au cours du premier trimestre de 2006 une facture dont le montant
est 46D700.
3°) Le montant M - tel que 75 des ménages payent une facture
inférieure à M - correspond au 3ème quartile de cette série.
D’après le tableau dressé en 1°), la fréquence cumulée croissante se
trouve dans la classe 40 , 60
on suppose qu'à l'intérieur de cette classe, la répartition est
uniforme et par suite on déterminera Q3 par interpolation linéaire.
0n a alors Q3 bi 0.75 FCi signifie
bs bi FCs FCi
Q3 40 0.75 0.38 signifie Q3 = 58D500 = M
60 40 0.78 0.38
Statistique 258
Conclusion: 75 des ménages payent une facture inférieure à
58D500
4°) On a la variance V = 51fici2 x2 =
i
2x0.08² + 35x0.3² + 50x0.4² + 65x0.2² + 80x0.02² - 46.700²
alors V 13 ,84 (on utilisera une calculatrice au mode
‘’Stat’’) ainsi x - , x + = 46.700 – 13.840 , 46.700 + 13.840 =
32.860 , 60.540
Soit F1 la fréquence cumulée croissante qui correspond à la
valeur 32.860; cette valeur se trouve dans la classe 30 , 40
où on suppose que la répartition est uniforme et par suite on
déterminera F1 par interpolation linéaire. D’où:
32.860 30 F1 0.08 alors F1 = 0.17 c'est-à-dire 17%
40 30 0.38 0.08
des ménages payent une facture dont le montant est inférieur à
32D860.
Soit F2 la fréquence cumulée croissante qui correspond à la
valeur 60.540; cette valeur se trouve dans la classe 60 , 70
où on suppose que la répartition est uniforme et par suite on
déterminera F1 par interpolation linéaire. D’où:
60.540 60 F2 0.78 alors F2 = 0.79 c'est-à-dire 79%
70 60 0.98 0.78
des ménages payent une facture dont le montant est inférieur à
60D540.
Conclusion: la fréquence des factures dont le montant appartient à
x - , x + est (79 – 17)% = 62%
Exercice 7
1°) Commençons par résumer ces données dans un tableau
récapitulatif.
Nombre d’allumettes par 30 32 34 36 38 40 42 44 48
boîte 112236311
Effectif
Statistique 259
2°) 30 32 34 36 38 40 42 44 48
Nombre d’allumettes par 112236311
boîte 1 2 4 6 9 15 18 19 20
Effectif
Ek
On a N = 20 = 2 x 10 = 4 x 5 alors
• la médiane Me = x10 x11 = 40 40
+ 40
22
• le 1er quartile Q1 = x5 x6 36 36 = 36
2
=
2
• le 3ème quartile Q3 = x15 x16 = 40 42 = 41
2 2
x 1 9 et 1 9 ni .x 2 x2
= 20 i1 = 4.11
= ni.xi = 38.7 i
20 i1
3°)
Classes [30,34[ [34,38[ [38,42[ [42,46[ [46,50[
Effectif 2 4 9 4 1
Statistique 260
• La moyenne de la série Z est z= 1 5
20
ni.ci = 39.6
i1
• son écart-type est Z = 1 5 n i .c2 z2 = 3.98
20 i1 i
Commentaire: il est important de remarquer la différence entre x et
z malgré que ce sont les moyennes de deux séries qui décrivent le
même phénomène.
Ceci est dû au fait que la moyenne avec un regroupement en classes
n’est pas aussi précise que la ‘’vraie’’ moyenne (par données
individuelles)
Un regroupement en classes permet des calculs rapides au dépend
de la précision des résultats.
4°) Pour tout yi on a: yi = xi - x 1 .xi x c’est de la forme yi
= a. xi + b
donc y = a. x + b = 1 .x x =0 et son écart-type Y =
a . 1 . = 1
Commentaire: la série Y ainsi définie est appelée la variable centrée
réduite associée à X.
Statistique 261