Les statistiques : vocabulaire et interprétation des résultats
Introduction :
La statistique est une science qui étudie les données recueillies lors d’une enquête ou d’une série de mesures. Au cycle 3, nous avons appris à trier des informations recueillies et vu rapidement les différentes représentations graphiques de données. En 5e, nous allons consolider ces connaissances tout en intégrant de nouvelles notions comme l’effectif et la fréquence.
Nous commencerons ce cours par un point sur le vocabulaire des statistiques, puis nous définirons les notions d’effectif et de fréquence. Nous enchaînerons ensuite par les méthodes d’organisation et de représentations de résultats pour lire et interpréter des données.
Vocabulaire et définitions
Vocabulaire et définitions
Vocabulaire
Vocabulaire
La liste des données collectées lors d’une enquête ou d’une série de mesures est appelée série de données statistique. Étudier une série statistique, c’est étudier un caractère dans une population :
- la population est l’ensemble des individus étudiés ;
- le caractère est le type de mesure que l’on recueille ; il peut être qualitatif (couleur des yeux, marque de la voiture, du téléphone portable) ou quantitatif (poids, nombre de voitures au domicile, temps passé au téléphone) ;
- les valeurs sont toutes les valeurs possibles que peut prendre ce caractère ;
- les données sont toutes les mesures que l’on a recueillies.
Étude 1 : On a relevé la couleur des yeux des 25 élèves d’une classe de 5e. Voici la série de données que nous avons recueillie : |
- La population étudiée est une classe de 5e.
- Le caractère étudié est la couleur des yeux. C’est un caractère qualitatif.
- Les valeurs possibles du caractère sont : bleu, gris, marron, noir, noisette et vert (6 valeurs).
- Les données sont tous les résultats recueillis (Marron – marron – bleu – marron – gris – etc.). Il y a 25 données.
Effectif et effectif total
Effectif et effectif total
Effectif d’une valeur :
L’effectif d’une valeur du caractère est le nombre de fois que cette valeur apparait dans la liste, c’est-à-dire le nombre d’individus qui possèdent cette valeur du caractère.
Effectif total :
L’effectif total de la série est le nombre total d’individus de la population étudiée, c'est-à-dire la somme des effectifs.
Étude 1 : On a relevé la couleur des yeux des 25 élèves d’une classe de 5e. Voici la série de données que nous avons recueillie : |
Dans cette série de données statistique :
- l’effectif de la valeur « bleu » est $8$ (« bleu » apparait $8$ fois dans la liste ; $8$ élèves ont les yeux bleus) alors que l’effectif de la valeur « noir » est $1$ (« noir » apparait $1$ fois dans la liste ; $1$ seul élève a les yeux noirs) ;
- l’effectif total est le nombre d’élèves interrogés, soit $25$.
Fréquence d’une valeur
Fréquence d’une valeur
Fréquence d’une valeur :
La fréquence d’une valeur est le quotient de l’effectif de cette valeur par l’effectif total, soit :
$$\text{Fréquence d’une valeur}=\dfrac{\text{Effectif de la valeur}}{\text{Effectif total}}$$
La fréquence d’une valeur est un nombre compris entre $0$ et $1$.
La somme de toutes les fréquences est égale à $1$.
La fréquence peut être laissée sous forme de fraction ou donnée sous forme décimale ou de pourcentage.
Sous forme de pourcentage, la valeur de la fréquence devient :
$$\dfrac{\text{Effectif de la valeur}}{\text{Effectif total}} \times 100\ \%$$
Étude 1 : On a relevé la couleur des yeux des 25 élèves d’une classe de 5e. Voici la série de données que nous avons recueillie : |
Dans cette série de données statistiques, la fréquence de la valeur « bleu » est : $$\dfrac{\text{Effectif de la valeur “bleu”}}{\text{Effectif total}}=\dfrac{8}{25}=0,32=32\ \%$$ La fréquence de la valeur « bleu » dans cette classe de 5e est $0,32$.
- Autrement dit, $32\ \%$ des élèves de cette classe ont les yeux bleus.
Organiser et représenter des données pour lire et interpréter des résultats
Organiser et représenter des données pour lire et interpréter des résultats
Organisation des données sous forme de tableau
Organisation des données sous forme de tableau
Les résultats d’une étude statistique sont le plus souvent rassemblés dans un tableau de données.
Tableau de données :
Un tableau de données permet de rassembler et d’organiser des données afin de faciliter la lecture et l’interprétation des informations.
Un tableau de données regroupe les valeurs, les effectifs, voire les fréquences de la série statistique.
Étude 1 : On a relevé la couleur des yeux des 25 élèves d’une classe de 5e. Voici la série de données que nous avons recueillie : |
Pour cette étude, en relevant les effectifs de chacune des valeurs du caractère puis en calculant leur fréquence (comme nous l’avons fait pour la valeur « bleu »), nous obtenons les résultats que nous avons rassemblés dans le tableau de données ci-dessous :
Couleur des yeux |
Bleu | Gris | Marron | Noir | Noisette | Vert | Total |
Effectifs |
$8$ | $1$ | $11$ | $1$ | $2$ | $2$ | $25$ |
Fréquences |
$\dfrac{8}{25}$ | $\dfrac{1}{25}$ | $\dfrac{11}{25}$ | $\dfrac{1}{25}$ | $\dfrac{2}{25}$ | $\dfrac{2}{25}$ | $\dfrac{25}{25}$ |
Fréquences |
$0,32$ | $0,04$ | $0,44$ | $0,04$ | $0,08$ | $0,08$ | $1$ |
Fréquences |
$32\ \%$ | $4\ \%$ | $44\ \%$ | $4\ \%$ | $8\ \%$ | $8\ \%$ | $100\ \%$ |
Ce tableau n’est pas forcément représentatif du niveau national. Il n’a été établi qu’à partir de l’étude d’une classe d’un collège (25 adolescents âgés de 12 à 13 ans). Pour aller plus loin, il faudrait comparer ces résultats à ceux d’une enquête nationale réalisée sur un plus grand nombre d’individus et plus représentatifs de la population.
D’une manière générale, il faudra toujours savoir comment ont été réalisées les études que l’on nous propose afin de pouvoir y porter un regard critique.
Lorsque le nombre de valeurs est trop important, afin de limiter la taille du tableau, on peut regrouper les valeurs par classes, c'est-à-dire par intervalles de valeurs. De par la notion même d’intervalle, ce type de classement ne peut être envisagé que si le caractère étudié est quantitatif.
Étude 2 : Nous avons demandé à ces mêmes 25 élèves le temps qu’ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine. Voici les réponses obtenues en nombre d’heures : |
Vu le nombre et la disparité des réponses, nous pouvons choisir de les regrouper par classes d’intervalle 1 heure.
Soit $n$ le nombre d’heures de sport par semaine, alors les 5 classes de valeurs obtenues sont : $0\leq n<1$ – $2\leq n<3$ – $3\leq n<4$ – $4\leq n<5$.
Ainsi, par exemple, l’effectif de la classe $2\leq n<3$ est $9$ (dans la série de données ci-dessus, il y a $9$ valeurs telles que $2\leq n<3$).
En relevant les effectifs pour chacune des classes de valeurs puis en calculant leur fréquence, voici le tableau de données que nous pouvons établir :
$n$ = nombre d’heures de sport par semaine |
$\small 0\leq n<1$ | $\small 1\leq n<2$ | $\small 2\leq n<3$ | $\small 3\leq n<4$ | $\small 4\leq n<5$ | Total |
Effectifs |
$4$ | $5$ | $9$ | $4$ | $3$ | $25$ |
Fréquence |
$\dfrac{4}{25}$ | $\dfrac{5}{25}$ | $\dfrac{9}{25}$ | $\dfrac{4}{25}$ | $\dfrac{3}{25}$ | $\dfrac{25}{25}$ |
Fréquence |
$0,16$ | $0,2$ | $0,36$ | $0,16$ | $0,12$ | $1$ |
Fréquence |
$16\ \%$ | $20\ \%$ | $36\ \%$ | $16\ \%$ | $12\ \%$ | $100\ \%$ |
Représentations graphiques
Représentations graphiques
Pour illustrer graphiquement les résultats d’une étude statistique, il existe plusieurs types de représentations sous forme de diagrammes et/ou graphiques.
Diagramme en bâtons
Diagramme en bâtons :
Un diagramme en bâtons est composé de bâtons (ou de barres) de même largeur dont la hauteur est proportionnelle à l’effectif.
Un diagramme en bâtons représente une série statistique en illustrant la répartition des effectifs.
Étude 1 : On a relevé la couleur des yeux des 25 élèves d’une classe de 5e. Voici la série de données que nous avons recueillie : |
Cette étude peut être représentée par le diagramme suivant :
Diagramme en bâtons
Diagramme circulaire
Diagramme circulaire :
Un diagramme circulaire est un disque partagé en secteurs circulaires (parties de cercle) dont l’angle est proportionnel à l’effectif.
Un diagramme circulaire représente une série statistique en illustrant les proportions des effectifs, soit la fréquence de chaque valeur du caractère étudié.
On peut inclure la valeur de cette fréquence (en pourcentage) à l’intérieur de chaque secteur circulaire.
MÉTHODOLOGIE :
Pour calculer la valeur de l’angle de chaque secteur circulaire, on multiplie la valeur de la fréquence concernée par la valeur de l’angle de la totalité du disque, soit $360\degree$.
Étude 1 : On a relevé la couleur des yeux des 25 élèves d’une classe de 5e. Voici la série de données que nous avons recueillie : |
Cette étude peut être représentée par le diagramme suivant :
Diagramme circulaire
La valeur de l’angle du secteur circulaire représentant la proportion d’yeux bleus a été calculée ainsi : $32\ \%$ de $360\degree$ soit $\dfrac{32}{100}\times 360 = 115,2 \degree$
On a procédé de la même manière pour calculer les autres valeurs d’angles.
Diagramme à bandes
Diagramme à bandes :
Un diagramme à bande est une bande rectangulaire partagée en bandes dont la longueur est proportionnelle à l’effectif.
Un diagramme à bande représente une série statistique en illustrant les proportions des effectifs, soit la fréquence de chaque valeur du caractère étudié.
On peut inclure la valeur de cette fréquence (en pourcentage) à l’intérieur de chaque bande.
Un classement par ordre décroissant (ou croissant) de cette proportion facilite la lecture du diagramme.
MÉTHODOLOGIE :
Pour calculer la longueur de chaque bande, on multiplie la valeur de la fréquence concernée par la longueur de la totalité de la bande.
Étude 1 : On a relevé la couleur des yeux des 25 élèves d’une classe de 5e. Voici la série de données que nous avons recueillie : |
Cette étude peut être représentée par le diagramme suivant :
Diagramme à bandes
Nous avons choisi une bande de longueur $15\text{ cm}$.
La longueur de la bande représentant la proportion d’yeux marrons a été calculée ainsi :
$44\ \%$ de $15\text{ cm}$ soit $\dfrac{44}{100}\times 15 = 6,6\text{ cm}$.
On a procédé de la même manière pour calculer les autres longueurs de bande.
Histogramme
Histogramme :
Un histogramme est un diagramme type « bâtons » utilisé pour représenter une série de données regroupées en classes. Il est composé de bâtons dont la largeur correspond à la largeur de l’intervalle et dont la hauteur est proportionnelle à l’effectif de la classe.
Un histogramme représente une série statistique en illustrant la répartition des effectifs par classes.
De par la notion d’intervalles, un histogramme n’a de raison d’être que dans le cas de l’étude d’un caractère quantitatif.
Étude 2 : Nous avons demandé à ces mêmes 25 élèves le temps qu’ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine. Voici les réponses obtenues en nombre d’heures : |
Vu le nombre et la disparité des réponses, nous pouvons choisir de les regrouper par classes d’intervalle 1 heure.
Soit $n$ le nombre d’heures de sport par semaine, alors les 5 classes de valeurs obtenues sont : $0\leq n<1$ – $2\leq n<3$ – $3\leq n<4$ – $4\leq n<5$.
Cette étude peut être représentée par l’histogramme suivant :
Histogramme
Graphique
Graphique :
Un graphique représente une série statistique en illustrant l’évolution des effectifs.
Étude 2 : Nous avons demandé à ces mêmes 25 élèves le temps qu’ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine. Voici les réponses obtenues en nombre d’heures : |
Vu le nombre et la disparité des réponses, nous pouvons choisir de les regrouper par classes d’intervalle 1 heure.
Soit $n$ le nombre d’heures de sport par semaine, alors les 5 classes de valeurs obtenues sont : $0\leq n<1$ – $2\leq n<3$ – $3\leq n<4$ – $4\leq n<5$.
Si nous prenons pour valeurs la valeur centrale de chaque intervalle (soit $0,5$ – $1,5$ – $2,5$ – $3,5$ et $4,5$), cette étude peut être représentée par le graphique suivant :
Graphique
Conclusion :
Les statistiques sont de plus en plus présentes dans les médias de par l’utilisation de tableaux, de diagrammes ou de graphiques. Il est donc important de savoir comment sont recueillies les informations et de comprendre comment sont construites les représentations qu’on nous propose et leur signification. Il faut également assimiler les deux notions essentielles que sont l’effectif et la fréquence d’une valeur. Et toujours garder un œil critique !