Statistiques.
Par Ramy • 22 Novembre 2017 • 17 018 Mots (69 Pages) • 671 Vues
...
Pourquoi ne pas toujours pas prendre des classes de même longueur ? Si on a des revenus très dispersés, c’est plus évident.
Remarque :
- Combien de classes choisir ?
Si on en a plus, on a une analyse plus fine (voir différence entre 9 et 18 classes, plus affiné). Le désavantage est qu’on peut avoir des classes vides.
Si on en prend trop peu, c’est peu pratique, même si l’information est néanmoins intéressante (88,6 % > 11,4%).
On peut donc analyser que les revenus les plus faibles ont la fréquence la plus élevée, on pourrait par exemple comparer deux villes avec des histogrammes.
- Classes de longueurs différentes :
Parfois on peut vouloir grouper des données dans des classes de longueurs différentes.
Une erreur assez courante consiste alors à tracer des rectangles dont les hauteurs sont égales aux fréquences Fi alors que les longueurs des classes ne sont pas égales entre elles.
En pratique, on travaillera presque toujours :
- soit avec des classes de même longueur,
- soit avec une première classe définie par "moins de", une dernière classe définie par ". . . ou plus" et des classes intermédiaires de même longueur.
20/02/14
2k k+1
278
- Il faut prendre du recul par rapport aux histogrammes.
- La courbe des fréquences cumulées :
Celle-ci est la représentation graphique des fréquences cumulées dans un tableau classé.
Procédé de construction :
- À la borne supérieure de chaque classe (sur l’axe horizontal), on fait correspondre un point dont l’ordonnée est égale à la fréquence cumulée.
- Ces points sont reliés deux à deux par des segments de droite.
Représentation graphique des fréquences cumulées dans un tableau classé, voir graphique :
Si on appelle f(x), les fréquences de ménages qui ont un revenu inférieur ou égal à x.
F (3000) : fréquence des ménages qui ont un revenu inférieur ou égal à 3000 = 0.101
F (6000) : fréquence des ménages qui ont un revenu inférieur ou égal à 6000 = 0.474
F(45000) : fréquence des ménages qui ont un revenu inférieur ou égal à 4500
On prend les F(3000) et F(6000), on les additionne et on les divise par deux. On estimera donc la valeur à 0.2875. On a donc 28,75% des ménages qui ont un revenu inférieur ou égal à 45000.
- On a donc plus des segments horizontaux, mais une courbe.
On peut aussi dire quelle est la valeur de x tel que 50% des ménages ont un revenu inférieur ou égal à x. On prendra le 0.5 comme ordonnée et regarder l’abscisse qui lui correspond.
- X appartiendra dans la classe] 6000, 9000 [, x = 6262, 63
- Mesures numériques pour les variables discrètes et continues :
- Les mesures de centralité :
- Le mode :
- Pour des valeurs individuelles :
Définition : le mode, noté M est la valeur observée qui a la fréquence la plus élevée.
Dans un diagramme en bâtons, le mode est celui qui a la fréquence la plus élevée.
- Pour des valeurs groupées en classes :
La classe modale est la classe qui a la fréquence la plus élevée, on la calcule à partir de l’histogramme. Le mode est le centre de la classe modale.
On parle du mode approché. Si on prend l’histogramme en 18 classes, on n’aura pas le même mode. A l’examen, si on doit couper des données en classe. On aura des limites pour savoir les classes.
- La médiane :
- La médiane pour des valeurs individuelles :
Si on a un tableau de nombres, il s’agit du fait que 50% son supérieurs à la médiane et 50% inférieurs.
Définition :
Notons
- xi (i = 1, 2, ⋅ ⋅ ⋅ , n), les observations
- x (i) (i = 1, 2, ⋅ ⋅ ⋅ , n), les observations ordonnées.
La médiane, notée m, est la valeur qui sépare les observations ordonnées en deux groupes de même effectif.
Si on a un tableau brut : 1, 5, 2, 3, 8, 9, 1 xi.
Si on met x(i), on a un tableau ordonné, on a (1,1, 2, 3, 5, 8, 9)
Si on a n impair (7 dans ce cas-ci).
On prend le m = x ((n+1)/2) = x ((7+1)/2) = x (4) ➔ 3 (4ème donnée).
Si n est pair, on rajoute un 1 au début du tableau ordonné. On définira la médiane en prenant deux nombres et en les divisant par deux.
N = 8, n paire, m = x (n/2) + x (n/2+1)/ 2 = x(4) + x(5) / 2 = 2 + 3+ 2 = 2,5
Voir l’exemple sur les revenus des ménages.
- La médiane calculée à partir d’un tableau de fréquences :
La médiane est obtenue à partir de l’équation F (x) = 0.5
Pour le nombre d’enfants par ménage, on avait une courbe cumulative, et donc on n’avait pas de solution pour 0.5.
On peut aussi voir le tableau, où la médiane serait égale à 2 (borne supérieure).
On peut aussi faire la moyenne des deux valeurs et trouver une valeur de 1,5.
...