Aussi appelée « diagramme en boîte » ou « box plot », la boîte à moustaches est la représentation graphique d'une série statistique. Elle fait apparaître la plus petite valeur, le premier quartile, la valeur médiane, le troisième quartile et la plus grande valeur. Elle illustre donc la distribution des variables d'une série.

>> Téléchargement : le guide essentiel de l'A/B testing [+ modèle]

Comment faire une boîte à moustaches ?

 

Ordonner la série de valeurs

Représentation ordonnée d'une série de valeurs statistiques, la boîte à moustaches nécessite d'organiser les données. La série doit donc être classée par ordre croissant, permettant ainsi de repérer, par exemple, plus facilement et rapidement les deux valeurs situées au milieu de l'enchaînement afin de calculer la médiane.

Si la série de valeurs étudiée correspond à la valeur en euros du panier des 10 derniers clients d'une boutique et que les valeurs sont les suivantes : 150, 34, 30, 45, 110, 19, 40, 119, 25 et 167, alors elle devra être classée ainsi : 19, 25, 30, 34, 40, 45, 110, 119, 150, 167.

 

Identifier les valeurs

La seconde étape est l'identification des valeurs qui apparaîtront dans la boîte à moustaches. Les deux valeurs les plus faciles à distinguer sont la plus petite et la plus grande valeur. Dans l'exemple évoqué ci-dessus, la plus petite valeur est 19 et la plus grande, 167.

La seconde valeur, la médiane, nécessite de faire un calcul basique. Une fois identifiées les deux valeurs figurant au milieu de la liste (40 et 45 dans l'exemple), elles doivent être ajoutées l'une à l'autre, puis divisées par deux pour obtenir une moyenne. Ainsi, 40 + 45 = 85 et 85 ÷ 2 = 42,5. La médiane est donc 42,5.

Ensuite, la série de valeurs doit être coupée en deux afin d'obtenir deux moitiés. La valeur se situant au milieu de la première moitié, c'est-à-dire la valeur médiane, se nomme le premier quartile. Ici, la première moitié de la série se compose des valeurs suivantes : 19, 25, 30, 34, 40. Le premier quartile correspond donc à 30.

De la même manière, la valeur médiane de la deuxième moitié correspond au troisième quartile. Dans l'exemple, la seconde moitié comporte les valeurs suivantes : 45, 110, 119, 150, 167. Le troisième quartile a donc pour valeur 119.

Les 5 valeurs nécessaires à la construction de la boîte à moustaches sont donc identifiées :

  • La plus petite valeur est 19.
  • Le premier quartile est 30.
  • La médiane est 42,5.
  • Le troisième quartile est 119.
  • La plus grande valeur est 167.

 

Tracer la boîte à moustaches

La dernière étape consiste à construire la boîte à moustaches à partir des données recueillies précédemment. L'utilisateur commence par tracer, selon une échelle définie, une ligne droite graduée, qui représente la suite de valeurs étudiée.

Dans l'exemple, l'échelle est graduée de 2 euros en 2 euros afin que chaque valeur soit visible sur la représentation.

Ligne droite graduée de la boîte à moustaches

Puis, l'utilisateur trace un trait vertical au-dessus de cette ligne pour représenter la médiane.

Médiane de la boîte à moustaches

Ensuite, il place deux traits verticaux pour symboliser le premier et le troisième quartile et relie les trois repères à l'aide de lignes pour former une boîte.

Premier et troisième quartiles de la boîte à moustaches

Boîte de la boîte à moustaches

Enfin, l'utilisateur place deux points pour illustrer la plus petite et la plus grande valeur. Il termine la construction en représentant les « moustaches ». Pour y parvenir, il trace une ligne reliant les deux points à la boîte.

Points des valeurs minimale et maximale de la boîte à moustachesSchéma complet de la boîte à moustaches

La boîte à moustaches est terminée.

Comment mettre en place un A/B testing ?

Télécharger ce guide et son modèle gratuits pour mettre en place un A/B testing et ainsi augmenter les conversions sur votre site web et optimiser l'engagement client

 

Comment lire une boîte à moustaches ?

La boîte à moustaches est créée dans le but de permettre l'analyse facile et rapide d'une série statistique. D'un coup d'œil, l'utilisateur peut identifier la valeur minimum et maximale. Néanmoins, il doit avoir pris connaissance de la légende pour comprendre l'échelle utilisée. Il peut également identifier la valeur médiane, représentant la valeur située en milieu de série.

Toujours d'un coup d'œil, il peut comprendre que :

  • 25 % des valeurs sont comprises entre la valeur minimum et le premier quartile.
  • 25 % des valeurs sont comprises entre le premier quartile et la médiane.
  • 25 % des valeurs sont comprises entre la médiane et le troisième quartile.
  • 25 % des valeurs sont comprises entre le troisième quartile et la plus grande valeur.
  • 75 % des valeurs sont comprises entre la plus petite valeur et le troisième quartile.

Concrètement, selon l'exemple, l'utilisateur peut identifier que :

  • 25 % des valeurs sont comprises entre 19 et 30, donc 25 % des 10 derniers paniers validés en boutique affichaient une valeur comprise entre 19 et 30 euros.
  • 25 % des valeurs sont comprises entre 30 et 42,5, donc 25 % des 10 derniers paniers validés en boutique affichaient une valeur comprise entre 30 et 42,5 euros.
  • 25 % des valeurs sont comprises entre 42,5 et 119, donc 25 % des 10 derniers paniers validés en boutique affichaient une valeur comprise entre 42,5 et 119 euros.
  • 25 % des valeurs sont comprises entre 119 et 167, donc 25 % des 10 derniers paniers validés en boutique affichaient une valeur comprise entre 119 et 167 euros.
  • 75 % des valeurs sont comprises entre 19 et 119, donc 75 % des 10 derniers paniers validés en boutique affichaient une valeur comprise entre 19 et 119 euros.

L'utilisateur peut donc facilement déduire des pourcentages de répartition, sans avoir à faire de calculs.

En observant l'écart entre les deux quartiles, appelé l'écart-type, il peut constater la dispersion des données autour de la médiane. Si l'écart-type est important, cela signifie que les données sont très dispersées. Dans le cas inverse, cela veut dire que les valeurs sont très proches de la médiane. Pour être encore plus exhaustif, d'autres données peuvent être ajoutées à la boîte à moustaches, comme la moyenne, matérialisée par une croix rouge.

La boîte à moustaches peut s'avérer utile pour comprendre le comportement des utilisateurs sur un site, ou encore pour faire de l'A/B testing.

Communauté HubSpot

 

Pour aller plus loin, téléchargez ce guide et ce modèle gratuits et mettez en place un A/B testing efficace pour augmenter considérablement les conversions sur votre site internet et optimiser l'engagement client.

Le guide essentiel de l’A/B testing [+ modèle]

Publication originale le 25 octobre 2022, mise à jour le 20 janvier 2023

Sujet(s):

a/b testing