7 juillet 2011

Boîte à moustaches sur GeoGebra


Dans les représentations graphiques de données statistiques, la boîte à moustaches est un moyen rapide de figurer le profil essentiel d'une série statistique quantitative. Elle a été inventée en 1977 par John Tukey, statisticien américain du XXème siècle.
Les boîtes à moustaches sont actuellement en vogue dans l'enseignement français, puisqu'elles font partie des programmes de mathématiques en lycée. On les y désigne aussi sous le vocable de boîtes à pattes ainsi que Box Plot. Ce diagramme est utilisé principalement pour comparer un même caractère dans deux populations de tailles différentes.

La boîte à moustaches résume simplement quelques paramètres de position du caractère étudié :

Vocabulaire de stats :
  • 1er quartile : nombre noté Q1 partageant les valeurs de la série en deux groupes tels que au moins 25% des valeurs de la série sont inférieures à Q1, et au moins 75% des valeurs lui sont supérieures.
  • Médiane : nombre partageant les valeurs de la série en deux groupes tels que au moins 50% des valeurs de la série sont inférieures à Méd, et au moins 50% des valeurs lui sont supérieures. Pour déterminer ce nombre, on trie les valeurs de la série par ordre croissant. Si l'effectif est impair, Méd est la valeur du milieu de la série. Si l'effectif est pair, on peut prendre tout nombre situé entre les deux valeurs du milieu de la série, souvent on prend leur moyenne.
  • 3ème quartile : nombre noté Q3 partageant les valeurs de la série en deux groupes tels que au moins 75% des valeurs de la série sont inférieures à Q3, et au moins 25% des valeurs lui sont supérieures.
Voici un exemple de représentation :

Les segments horizontaux sont les "pattes" de la boîte, les segments verticaux aux extrémités sont les "moustaches", celles-ci sont parfois mises aux 5ème et 95ème centiles.
Pour créer ces boîtes avec le logiciel GeoGebra, rien de plus simple ! Dans le champ de saisie, entrer l'instruction BoiteMoustaches[] et adaptez les arguments de cette fonction selon votre série. 
Pour calculer en même temps les paramètres => Exemple vert :
BoiteMoustache[ordonnée, demi-hauteur de la boîte, {valeurs de la série}]

Vous connaissez déjà les paramètres de la série => Exemple jaune :
BoiteMoustache[ordonnée, demi-hauteur de la boîte, minimum, Q1, M&diane, Q3, Maximum] 

Cliquez pour afficher en grand


10 commentaires:

Benjamin a dit…

Dans la même fibre, en bourse est utilisé un mode de représentation graphique des évolution des marchés : en bougie ou chandelier.

Je vous invite à en lire une brève description ici : http://www.abcbourse.com/apprendre/11_comment_lire_un_graphique.html

Cette représentation permet ensuite, de faire certaines prévision à court terme.

RuBisCO a dit…

Notre professeur de mathématiques de première nous montrait toujours les résultats des DS sous forme de boites à moustaches, plutôt que la moyenne qui donne peu d'informations et qui est parfois trompeuse.
Sonia, il faut passer à GeoGebra 5.0 maintenant ;).

RuBisCO a dit…

Aussi, une petite astuce : pour obtenir de belles images, choisissez "Fichier-Exporter" plutôt qu'un copier-coller. Vous pouvez ainsi faire de superbes animations GIF, a condition d'avoir un curseur d'affiché.
Un petit exemple : un puzzle de Dudeney qui se passe d'un triangle équilatéral à un carré.

Sonia Geffrier a dit…

Merci pour ces conseils. Je voulais surtout gagner du temps pour l'image.
Quel est ce scoop ? Je ne connais pas d'endroit où télécharger GeoGebra 5 !
Vite, les infos !!

Romain a dit…

Quelques précisions sur ces boxplots. Pour dessiner les "moustaches", on utilise également l'intervalle l'inter-quartile. Chaque extrémité de moustache est calculée ainsi : Q1-1.5*(Q3-Q1) et Q3+1.5*(Q3-Q1). Ensuite chaque moustache est "raccourcie" aux valeurs appartenant à l'intervalle [Q1-1.5*(Q3-Q1);Q3+1.5*(Q3-Q1)]. Les valeurs n'appartenant pas à cet intervalle sont représentées par des points en dehors des moustaches. En statistiques, cela sert à détecter les valeurs extrêmes/aberrantes.
J'espère avoir été clair ! Sinon, c'est plus détaillé ici : http://hal.archives-ouvertes.fr/docs/00/28/76/97/PDF/12_Boite-a-moustaches-StatVotre.pdf
Bonne lecture !

Sonia Geffrier a dit…

Merci Romain !

RuBisCO a dit…

GéoGébra 5 bêta (bleu) : c'est la version bien connue avec la 3D.
Mais il y a une version 4.0 bêta sans 3D (rouge) : elle associe parfaitement l'affichage en LaTex, un calculateur formel Maxima et 2 affichages graphiques distinct.
Liste des nouveautés par rapport à la version classique 3.2.47 :
- polygone indéformable : une fois créé, on peut seulement le déplacer et faire des rotations
- ligne brisée
- stylo
- calcul probabilité
- inspecteur de fonction
- insérer bouton pour des scripts
- calcul formel : factoriser, développer, substituer, résoudre, dériver et intégrer
- tableur : statistique à 1, 2 ou plusieurs variables, créer des listes, des matrices ou des tableaux.

Sonia Geffrier a dit…

Merci Rubisco pour ces infos.
J'ai fini par voir des news là-dessus sur Wikipédia puis sur le site de GeoGebra, mais j'attends les versions stables pour les installer.

RuBisCO a dit…

Moi, j'ai les 3 installées sur l'ordinateur et il cohabitent très bien !
Par contre, il faut la mettre à jour de temps en temps : par exemple, ils ont rajouté "Enregistrer dans Tableau" et "Tourner autour d'un point" dans la version stable.

RuBisCO a dit…

Voila le vrai lien vers ma création Géogébra :
http://www.imagup.com/data/1124828521.html

Enregistrer un commentaire

Des réactions, des propositions ? Exprimez-vous :-)
(A cause de quelques commentaires inopportuns, ceux-ci sont modérés et ne paraissent qu'après approbation)