La demande de cigarette
Par Christopher • 19 Novembre 2017 • 3 973 Mots (16 Pages) • 711 Vues
...
Règle de décision : Si p-value ≤ α, alors on rejette H0 au niveau α. Sinon, on ne rejette pas H0.
Ici, p-value = 0.0044 0 au niveau 5%.
On en conclut que le modèle est globalement significatif.
On se propose alors de tester la significativité de chaque coefficient avec un risque de α=5% :
H0 : βi=0 contre Ha : βi≠0 avec i =1, 2, 3, 4, 5
Règle de décision : Si la p-value > α, on ne rejette pas H0. Sinon, si la p-value ≤ α, on rejette H0.
Pour la variable Lincome, 1 = 1.89438 et la p-value est égale à 0.008 0. Lincome est donc significative à 5%. De plus, on peut dire que Lincome est significative à 1% puisque p-value [pic 9]
Pour la variable Lcigpric, 2 = -0.72917 et la p-value est égale à 0.9011 > 5%, donc on ne rejette pas H0. Lcigpric n’est pas significative à 5%. De plus, on peut dire que Lcigpric n’est pas significative puisque p-value > 10%. On ne rejette donc pas l’hypothèse β2 = 0.[pic 10]
Pour la variable Educ, 3 = -0.37688 et la p-value est égale à 0.0251 0. Educ est donc significative à 5%.[pic 11]
Pour la variable Age, 4 = -0.0452 et la p-value est égale à0.1154 > 5%, donc on ne rejette pas H0. Age n’est pas significative à 5%. De plus, on peut dire que Age n’est pas significative puisque p-value > 10%. On ne rejette donc pas l’hypothèse β4 = 0.[pic 12]
Pour la variable Restaurn, 5 = -2.93272 et la p-value est égale à 0.0096 0. Restaurn est donc significative à 5%. De plus, on peut dire que Restaurn est significative à 1% puisque p-value [pic 13]
Les variables significatives à 1% sont très significatives. Ainsi, on peut supposer que le logarithme du revenu et les restrictions concernant le tabagisme dans les restaurants ont un effet important sur la consommation de cigarettes. Cependant, le logarithme du prix du paquet de cigarettes et l’âge n’ont pas d’effet sur la consommation de cigarettes puisque les variables ne sont pas significatives. Ainsi :
1 = 1.89438 signifie que si le revenu augmente de 1%, le nombre de cigarettes fumées par jour augmente de 1.89438/100 = 0.0189438 unités, ceteris paribus.[pic 14]
3 = -0.37688 signifie que si Educ augmente d’une unité, le nombre de cigarettes fumées par jour diminue de 0.37688 unités, ceteris paribus.[pic 15]
5 = -2.93272 signifie que si Restaurn augmente d’une unité, le nombre de cigarettes fumées par jour diminue de 2.93272 unités, ceteris paribus.[pic 16]
On ne commente pas les paramètres 2 et 4 puisque les variables explicatives associées ne sont pas significatives.[pic 17][pic 18]
Afin de confirmer la significativité de chaque coefficient, observons les intervalles de confiance à 95% des paramètres βi :
On utilise la formule [k ± ((k))1/2*c] avec c le quantile d’une tn-p d’ordre 1-α/2. Ici, n-p=801 et c=1,96.[pic 19][pic 20][pic 21]
ICLincome = [0.49655 ; 3.29222]
ICLcigpric = [-12.24287 ; 10.78454]
ICEduc = [-0.70660 ; -0.04715]
ICAge = [-0.10149 ; 0.01109]
ICRestaurn = [-5.14956 ; -0.71587]
Les intervalles de confiance ont 95% de chance de contenir la vraie valeur de leur βi respectif. Par exemple, pour la variable explicative Lincome, on effectue le test suivant au niveau 5% :
H0 : β1=0 contre Ha : β1≠0
0 ∉ ICLincome donc on rejette H0 au niveau 5%.
Pour la variable explicative Lcigpric, on effectue le test suivant au niveau 5% :
H0 : β2=0 contre Ha : β2≠0
0 є ICLcigpric donc on ne rejette pas H0.
Par la même méthode, on retrouve les résultats précédents, ce qui nous confirme la significativité ou la non significativité de chaque variable. De plus, σ²=185.47516 correspond à la variance du terme d’erreur v.
La valeur du R² est 0.0210, ce qui signifie que 2,10% de la variance de Cigs est expliquée par le modèle, c’est-à-dire par Lincome, Lcigpric, Educ, Age et Restaurn. La faiblesse de cette valeur nous laisse penser que le nombre de cigarettes fumées par jour ne dépend que très peu des variables explicatives étudiées.
A la suite de cette étude, on peut conclure que le prix du paquet de cigarettes et l’âge n’ont pas d’effet sur la consommation de cigarettes. Quant au revenu, au niveau d’éducation et aux restrictions concernant le tabagisme dans les restaurants, ils jouent un rôle dans la consommation de cigarettes. En effet, on constate que s'il existe des restrictions concernant le tabagisme dans les restaurants de l'Etat de résidence, alors les fumeurs consomment environ 3 cigarettes de moins par jour. Ceci n’est pas négligeable compte-tenu de la moyenne de 8,7 cigarettes fumées par jour dans l’échantillon étudié. Cependant, la valeur du R² nous montre que seulement une faible part de la variance du nombre de cigarettes fumées par jour est expliquée par le modèle.
- Etude du modèle 2 :
On se propose maintenant d’étudier le logarithme du nombre de cigarettes fumées par jour en fonction des caractéristiques individuelles comme le logarithme du revenu, le logarithme du prix du paquet de cigarettes, le niveau d’éducation, l’âge et les restrictions concernant le tabagisme dans les restaurants. Pour cela, on suit les mêmes étapes que dans l’étude du modèle 1.
[pic 22]
A nouveau, nous avons testé la significativité du modèle à l’aide d’un test de Fisher au niveau α=5% :
H0 : β1=β2=β3=β4=β5=0 contre Ha : β1≠0 ou β2≠0 ou β3≠0 ou β4≠0 ou β5≠0
Ici, p-value = 0.0312 0 au niveau 5%.
On en conclut que le modèle est globalement significatif.
Testons alors la significativité de chaque coefficient avec un risque de α=5% :
...