Les statistiques : vocabulaire et interprétation des résultats

Introduction :

La statistique est une science qui étudie les données recueillies lors d’une enquête ou d’une série de mesures. Au cycle 3, nous avons appris à trier des informations recueillies et vu rapidement les différentes représentations graphiques de données. En 5e, nous allons consolider ces connaissances tout en intégrant de nouvelles notions comme l’effectif et la fréquence.

Nous commencerons ce cours par un point sur le vocabulaire des statistiques, puis nous définirons les notions d’effectif et de fréquence. Nous enchaînerons ensuite par les méthodes d’organisation et de représentations de résultats pour lire et interpréter des données.

Vocabulaire et définitions

Vocabulaire

La liste des données collectées lors d’une enquête ou d’une série de mesures est appelée série de données statistique. Étudier une série statistique, c’est étudier un caractère dans une population :

  • la population est l’ensemble des individus étudiés ;
  • le caractère est le type de mesure que l’on recueille ; il peut être qualitatif (couleur des yeux, marque de la voiture, du téléphone portable) ou quantitatif (poids, nombre de voitures au domicile, temps passé au téléphone) ;
  • les valeurs sont toutes les valeurs possibles que peut prendre ce caractère ;
  • les données sont toutes les mesures que l’on a recueillies.
bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des 25 élèves d’une classe de 5e.

Voici la série de données que nous avons recueillie :
Marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron.

  • La population étudiée est une classe de 5e.
  • Le caractère étudié est la couleur des yeux. C’est un caractère qualitatif.
  • Les valeurs possibles du caractère sont : bleu, gris, marron, noir, noisette et vert (6 valeurs).
  • Les données sont tous les résultats recueillis (Marron – marron – bleu – marron – gris – etc.). Il y a 25 données.

Effectif et effectif total

bannière definition

Définition

Effectif d’une valeur :

L’effectif d’une valeur du caractère est le nombre de fois que cette valeur apparait dans la liste, c’est-à-dire le nombre d’individus qui possèdent cette valeur du caractère.

bannière definition

Définition

Effectif total :

L’effectif total de la série est le nombre total d’individus de la population étudiée, c'est-à-dire la somme des effectifs.

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des 25 élèves d’une classe de 5e.

Voici la série de données que nous avons recueillie :
Marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron.

Dans cette série de données statistique :

  • l’effectif de la valeur « bleu » est $8$ (« bleu » apparait $8$ fois dans la liste ; $8$ élèves ont les yeux bleus) alors que l’effectif de la valeur « noir » est $1$ (« noir » apparait $1$ fois dans la liste ; $1$ seul élève a les yeux noirs) ;
  • l’effectif total est le nombre d’élèves interrogés, soit $25$.

Fréquence d’une valeur

bannière definition

Définition

Fréquence d’une valeur :

La fréquence d’une valeur est le quotient de l’effectif de cette valeur par l’effectif total, soit :

$$\text{Fréquence d’une valeur}=\dfrac{\text{Effectif de la valeur}}{\text{Effectif total}}$$

bannière propriete

Propriété

La fréquence d’une valeur est un nombre compris entre $0$ et $1$.
La somme de toutes les fréquences est égale à $1$.

La fréquence peut être laissée sous forme de fraction ou donnée sous forme décimale ou de pourcentage.
Sous forme de pourcentage, la valeur de la fréquence devient :

$$\dfrac{\text{Effectif de la valeur}}{\text{Effectif total}} \times 100\ \%$$

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des 25 élèves d’une classe de 5e.

Voici la série de données que nous avons recueillie :
Marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron.

Dans cette série de données statistiques, la fréquence de la valeur « bleu » est : $$\dfrac{\text{Effectif de la valeur “bleu”}}{\text{Effectif total}}=\dfrac{8}{25}=0,32=32\ \%$$ La fréquence de la valeur « bleu » dans cette classe de 5e est $0,32$.

  • Autrement dit, $32\ \%$ des élèves de cette classe ont les yeux bleus.

Organiser et représenter des données pour lire et interpréter des résultats

Organisation des données sous forme de tableau

Les résultats d’une étude statistique sont le plus souvent rassemblés dans un tableau de données.

bannière definition

Définition

Tableau de données :

Un tableau de données permet de rassembler et d’organiser des données afin de faciliter la lecture et l’interprétation des informations.

bannière à retenir

À retenir

Un tableau de données regroupe les valeurs, les effectifs, voire les fréquences de la série statistique.

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des 25 élèves d’une classe de 5e.

Voici la série de données que nous avons recueillie :
Marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron.

Pour cette étude, en relevant les effectifs de chacune des valeurs du caractère puis en calculant leur fréquence (comme nous l’avons fait pour la valeur « bleu »), nous obtenons les résultats que nous avons rassemblés dans le tableau de données ci-dessous :

Couleur des yeux

Bleu Gris Marron Noir Noisette Vert Total

Effectifs

$8$ $1$ $11$ $1$ $2$ $2$ $25$

Fréquences
(sous forme de quotient)

$\dfrac{8}{25}$ $\dfrac{1}{25}$ $\dfrac{11}{25}$ $\dfrac{1}{25}$ $\dfrac{2}{25}$ $\dfrac{2}{25}$ $\dfrac{25}{25}$

Fréquences
(sous forme décimale)

$0,32$ $0,04$ $0,44$ $0,04$ $0,08$ $0,08$ $1$

Fréquences
(sous forme de pourcentage)

$32\ \%$ $4\ \%$ $44\ \%$ $4\ \%$ $8\ \%$ $8\ \%$ $100\ \%$
bannière attention

Attention

Ce tableau n’est pas forcément représentatif du niveau national. Il n’a été établi qu’à partir de l’étude d’une classe d’un collège (25 adolescents âgés de 12 à 13 ans). Pour aller plus loin, il faudrait comparer ces résultats à ceux d’une enquête nationale réalisée sur un plus grand nombre d’individus et plus représentatifs de la population.

D’une manière générale, il faudra toujours savoir comment ont été réalisées les études que l’on nous propose afin de pouvoir y porter un regard critique.

Lorsque le nombre de valeurs est trop important, afin de limiter la taille du tableau, on peut regrouper les valeurs par classes, c'est-à-dire par intervalles de valeurs. De par la notion même d’intervalle, ce type de classement ne peut être envisagé que si le caractère étudié est quantitatif.

bannière exemple

Exemple

Étude 2 :
Nous avons demandé à ces mêmes 25 élèves le temps qu’ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine.

Voici les réponses obtenues en nombre d’heures :
$2$ – $4$ – $0$ – $0,5$ – $1,5$ – $2$ – $2,5$ – $3$ – $2,5$ – $0$ – $0,75$ – $4$ – $5$ – $3$ – $1,5$ – $1$ – $2$ – $3,5$ – $1,5$ – $1$ – $2,5$ – $3,5$ – $2$ – $2,5$ – $2$.

Vu le nombre et la disparité des réponses, nous pouvons choisir de les regrouper par classes d’intervalle 1 heure.

Soit $n$ le nombre d’heures de sport par semaine, alors les 5 classes de valeurs obtenues sont : $0\leq n<1$ – $2\leq n<3$ – $3\leq n<4$ – $4\leq n<5$.

Ainsi, par exemple, l’effectif de la classe $2\leq n<3$ est $9$ (dans la série de données ci-dessus, il y a $9$ valeurs telles que $2\leq n<3$).

En relevant les effectifs pour chacune des classes de valeurs puis en calculant leur fréquence, voici le tableau de données que nous pouvons établir :

$n$ = nombre d’heures de sport par semaine

$\small 0\leq n<1$ $\small 1\leq n<2$ $\small 2\leq n<3$ $\small 3\leq n<4$ $\small 4\leq n<5$ Total

Effectifs

$4$ $5$ $9$ $4$ $3$ $25$

Fréquence
(sous forme de quotient)

$\dfrac{4}{25}$ $\dfrac{5}{25}$ $\dfrac{9}{25}$ $\dfrac{4}{25}$ $\dfrac{3}{25}$ $\dfrac{25}{25}$

Fréquence
(sous forme décimale)

$0,16$ $0,2$ $0,36$ $0,16$ $0,12$ $1$

Fréquence
(sous forme de pourcentage)

$16\ \%$ $20\ \%$ $36\ \%$ $16\ \%$ $12\ \%$ $100\ \%$

Représentations graphiques

Pour illustrer graphiquement les résultats d’une étude statistique, il existe plusieurs types de représentations sous forme de diagrammes et/ou graphiques.

Diagramme en bâtons

bannière definition

Définition

Diagramme en bâtons :

Un diagramme en bâtons est composé de bâtons (ou de barres) de même largeur dont la hauteur est proportionnelle à l’effectif.

bannière à retenir

À retenir

Un diagramme en bâtons représente une série statistique en illustrant la répartition des effectifs.

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des 25 élèves d’une classe de 5e.

Voici la série de données que nous avons recueillie :
Marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron.

Cette étude peut être représentée par le diagramme suivant :

Diagramme en bâtons mathématiques cinquième Diagramme en bâtons

Diagramme circulaire

bannière definition

Définition

Diagramme circulaire :

Un diagramme circulaire est un disque partagé en secteurs circulaires (parties de cercle) dont l’angle est proportionnel à l’effectif.

bannière à retenir

À retenir

Un diagramme circulaire représente une série statistique en illustrant les proportions des effectifs, soit la fréquence de chaque valeur du caractère étudié.

On peut inclure la valeur de cette fréquence (en pourcentage) à l’intérieur de chaque secteur circulaire.

MÉTHODOLOGIE :

Pour calculer la valeur de l’angle de chaque secteur circulaire, on multiplie la valeur de la fréquence concernée par la valeur de l’angle de la totalité du disque, soit $360\degree$.

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des 25 élèves d’une classe de 5e.

Voici la série de données que nous avons recueillie :
Marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron.

Cette étude peut être représentée par le diagramme suivant :

Diagramme circulaire mathématiques cinquième Diagramme circulaire

La valeur de l’angle du secteur circulaire représentant la proportion d’yeux bleus a été calculée ainsi : $32\ \%$ de $360\degree$ soit $\dfrac{32}{100}\times 360 = 115,2 \degree$

On a procédé de la même manière pour calculer les autres valeurs d’angles.

Diagramme à bandes

bannière definition

Définition

Diagramme à bandes :

Un diagramme à bande est une bande rectangulaire partagée en bandes dont la longueur est proportionnelle à l’effectif.

bannière à retenir

À retenir

Un diagramme à bande représente une série statistique en illustrant les proportions des effectifs, soit la fréquence de chaque valeur du caractère étudié.

On peut inclure la valeur de cette fréquence (en pourcentage) à l’intérieur de chaque bande.
Un classement par ordre décroissant (ou croissant) de cette proportion facilite la lecture du diagramme.

MÉTHODOLOGIE :

Pour calculer la longueur de chaque bande, on multiplie la valeur de la fréquence concernée par la longueur de la totalité de la bande.

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des 25 élèves d’une classe de 5e.

Voici la série de données que nous avons recueillie :
Marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron.

Cette étude peut être représentée par le diagramme suivant :

Diagramme à bandes mathématiques cinquième Diagramme à bandes

Nous avons choisi une bande de longueur $15\text{ cm}$.
La longueur de la bande représentant la proportion d’yeux marrons a été calculée ainsi : $44\ \%$ de $15\text{ cm}$ soit $\dfrac{44}{100}\times 15 = 6,6\text{ cm}$.

On a procédé de la même manière pour calculer les autres longueurs de bande.

Histogramme

bannière definition

Définition

Histogramme :

Un histogramme est un diagramme type « bâtons » utilisé pour représenter une série de données regroupées en classes. Il est composé de bâtons dont la largeur correspond à la largeur de l’intervalle et dont la hauteur est proportionnelle à l’effectif de la classe.

bannière à retenir

À retenir

Un histogramme représente une série statistique en illustrant la répartition des effectifs par classes.

De par la notion d’intervalles, un histogramme n’a de raison d’être que dans le cas de l’étude d’un caractère quantitatif.

bannière exemple

Exemple

Étude 2 :
Nous avons demandé à ces mêmes 25 élèves le temps qu’ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine.

Voici les réponses obtenues en nombre d’heures :
$2$ – $4$ – $0$ – $0,5$ – $1,5$ – $2$ – $2,5$ – $3$ – $2,5$ – $0$ – $0,75$ – $4$ – $5$ – $3$ – $1,5$ – $1$ – $2$ – $3,5$ – $1,5$ – $1$ – $2,5$ – $3,5$ – $2$ – $2,5$ – $2$.

Vu le nombre et la disparité des réponses, nous pouvons choisir de les regrouper par classes d’intervalle 1 heure.

Soit $n$ le nombre d’heures de sport par semaine, alors les 5 classes de valeurs obtenues sont : $0\leq n<1$ – $2\leq n<3$ – $3\leq n<4$ – $4\leq n<5$.

Cette étude peut être représentée par l’histogramme suivant :

Histogramme mathématiques cinquième Histogramme

Graphique

bannière definition

Définition

Graphique :

Un graphique représente une série statistique en illustrant l’évolution des effectifs.

bannière exemple

Exemple

Étude 2 :
Nous avons demandé à ces mêmes 25 élèves le temps qu’ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine.

Voici les réponses obtenues en nombre d’heures :
$2$ – $4$ – $0$ – $0,5$ – $1,5$ – $2$ – $2,5$ – $3$ – $2,5$ – $0$ – $0,75$ – $4$ – $5$ – $3$ – $1,5$ – $1$ – $2$ – $3,5$ – $1,5$ – $1$ – $2,5$ – $3,5$ – $2$ – $2,5$ – $2$.

Vu le nombre et la disparité des réponses, nous pouvons choisir de les regrouper par classes d’intervalle 1 heure.

Soit $n$ le nombre d’heures de sport par semaine, alors les 5 classes de valeurs obtenues sont : $0\leq n<1$ – $2\leq n<3$ – $3\leq n<4$ – $4\leq n<5$.

Si nous prenons pour valeurs la valeur centrale de chaque intervalle (soit $0,5$ – $1,5$ – $2,5$ – $3,5$ et $4,5$), cette étude peut être représentée par le graphique suivant :

Graphique mathématiques cinquième Graphique

Conclusion :

Les statistiques sont de plus en plus présentes dans les médias de par l’utilisation de tableaux, de diagrammes ou de graphiques. Il est donc important de savoir comment sont recueillies les informations et de comprendre comment sont construites les représentations qu’on nous propose et leur signification. Il faut également assimiler les deux notions essentielles que sont l’effectif et la fréquence d’une valeur. Et toujours garder un œil critique !