Statistique, la régression linéaire multiple.
Par Junecooper • 28 Mai 2018 • 1 155 Mots (5 Pages) • 590 Vues
...
L’intervalle de confiance pour estimer , au niveau de confiance (1 - α) pour 1 ≤ j ≤ p, est donnée par :
Test d’hypothèses sur
Pour la régression multiple nous avons deux types de tests :
La première question qu’on pourrait se poser est :
« Est-ce que le modèle de régression théorique permet d’expliquer la variation de Y de façon significative ? »
Cette question peut se décomposer en deux sous-questions :
1) Est-ce que la contribution individuelle de chacune des variables Xj, j = 1, 2, 3,..., p, dans l’explication de Y est significative ?
Dans ce cas, on utilise un test de Student sur les paramètres pris individuellement.
Les étapes d'un test d’hypothèses sur les pris individuellement:
1- Énoncer les hypothèses :
Ho = = 0;
H1 = .
Remarque : Si Ho est retenue, alors la variable indépendante Xj n’est pas significative (elle n’explique pas les valeurs prises par Y).
2- Préciser les conditions de validité du test :
- la population est normale;
- la variance résiduelle est inconnue.
3- Statistique utilisée :
4- Trouver la région critique au niveau de signification α ;
On rejette Ho, si , sinon on l’accepte.
Exemple : Suite de l’exemple (Restaurant Cocorico).
e) Est-ce qu’individuellement la variable X2 explique Y de façon significative au seuil α = 0,01 ?
Solution : (voir information sur la sortie informatisée)
---------------------------------------------------------------
Deuxième sous-question :
2) Est-ce que globalement l’ensemble des variables X1, X2, X3, ...Xp, explique Y de façon significative ?
Dans ce cas on utilise l’analyse de la variance.
Les étapes d'un test d’analyse de la variance sur les pris globalement:
1- Énoncer les hypothèses :
2- Statistique utilisée :
Soit à l’aide du logiciel SPSS, si > , alors l’ensemble des Xj explique Y de façon significative (c’est-à-dire au moins un des ); sinon, la droite de régression n’est pas significative au niveau α.
Exemple : Suite de l’exemple.
f) Est-ce que le modèle est significatif au seuil α = 0,01 et y a-t-il des variables explicatives qui ne sont pas significatives au seuil α = 0,01 ?
Solution : (voir sortie informatisée pour résoudre)
---------------------------------------------------------------
Coefficient de détermination multiple
Le coefficient de détermination ou d’explication empirique pour un modèle de régression multiple est donné comme suit :
Ce coefficient permet de mesurer la proportion de la variation totale dans Y qui est expliquée par l’ensemble des variables explicatives X1, X2, X3, ...Xp, c’est-à-dire la dispersion des observations autour de l’hyperplan de régression.
Comme dans le cas de R2 dans le modèle simple, 0 ≤ R2 ≤ 1.
Remarque: * On peut augmenter la valeur de R2 en introduisant de nouvelles variables explicatives dans le modèle. Chaque variable introduite dans le modèle augmente SCR (la somme des carrés due à la régression). D’autre part, pour un même nombre d’observations, plus le nombre de variables explicatives augmente dans le modèle, plus le nombre de degrés de liberté associé au carré moyen résiduel diminue. Il faut éviter de se rendre à un point de saturation où le nombre de paramètres à estimer est égal au nombre d’observations dans l’expérience (n > p + 1).
Exemple :
Calculer le coefficient de détermination de l’exemple du restaurant Cocorico et donnez sa signification
Solution :
...