И последнее. Мы везде в этой работе говорим «решение женщины работать», «зарплата на которую она согласна», но надо понимать, что от её работодателя, мужа и прочих обстоятельств её «решения» зависят не меньше, чем от неё самой. Поэтому будем просто считать что это такая вольность речи и на самом деле под «решением женщины» следует понимать «факт» её работы или не работы в течение года и её фактическую зарплату.
3. Построение probit–модели
Будем строить модель по принципу «от общего к частному» — включим сначала в регрессоры всё, что по нашему мнению может оказать влияние на решение женщины работать или нет, а затем будем выбрасывать незначимые регрессоры. В принципе, все параметры могут в той или иной мере влиять на решение женщины работать или не работать как напрямую, так и косвенно. Естественно, когда мы включаем в что–то в регрессоры, мы автоматически предполагаем экзогенность этих факторов. Хоть это и не всегда так, мы будем пренебрегать этой неточностью.
Dependent Variable: INLF | ||||
Method: ML - Binary Probit | ||||
Sample: 1 753 | ||||
Included observations: 753 | ||||
Convergence achieved after 7 iterations | ||||
Covariance matrix computed using second derivatives | ||||
Variable | Coefficient | Std. Error | z-Statistic | Prob. |
C | 1.049874 | 0.616767 | 1.702220 | 0.0887 |
AGE | -0.045950 | 0.014875 | -3.089074 | 0.0020 |
CITY | 0.023907 | 0.117833 | 0.202885 | 0.8392 |
EDUC | 0.150875 | 0.031530 | 4.785062 | 0.0000 |
EXPER | 0.125522 | 0.018936 | 6.628641 | 0.0000 |
EXPERSQ | -0.001964 | 0.000607 | -3.236757 | 0.0012 |
HUSAGE | -0.009709 | 0.014175 | -0.684944 | 0.4934 |
HUSHRS | -0.000219 | 0.000107 | -2.044014 | 0.0410 |
HUSWAGE | -0.025630 | 0.022702 | -1.128933 | 0.2589 |
KIDSGE6 | 0.042115 | 0.044219 | 0.952416 | 0.3409 |
KIDSLT6 | -0.891024 | 0.121123 | -7.356365 | 0.0000 |
HUSEDUC | -0.026605 | 0.023351 | -1.139365 | 0.2546 |
FATHEDUC | 0.002138 | 0.018419 | 0.116091 | 0.9076 |
MOTHEDUC | 0.007709 | 0.019298 | 0.399440 | 0.6896 |
NWIFEINC | -0.002166 | 0.008078 | -0.268119 | 0.7886 |
UNEM | -0.020280 | 0.017179 | -1.180541 | 0.2378 |
Mean dependent var | 0.568393 | S. D. dependent var | 0.495630 | |
S. E. of regression | 0.425885 | Akaike info criterion | 1.097913 | |
Sum squared resid | 133.6758 | Schwarz criterion | 1.196166 | |
Log likelihood | -397.3641 | Hannan-Quinn criter. | 1.135765 | |
Restr. log likelihood | -514.8732 | Avg. log likelihood | -0.527708 | |
LR statistic (15 df) | 235.0181 | McFadden R-squared | 0.228229 | |
Probability(LR stat) | 0.000000 | |||
Obs with Dep=0 | 325 | Total obs | 753 | |
Obs with Dep=1 | 428 |
Тест Вальда не отвергает гипотезу о том, что CITY, HUSAGE, HUSWAGE, KIFDGE6, HUSEDUC, FATHEDUC, MOTHEDUC и NWIFEINC можно исключить из модели. Это хорошо, посколько из по–настоящему эндогенных переменных в регрессорах осталась только HUSHRS.
Wald Test: | ||||
Null Hypothesis: | C(3)=0 | |||
C(7)=0 | ||||
C(9)=0 | ||||
C(1)=0 | ||||
C(12)=0 | ||||
C(13)=0 | ||||
C(14)=0 | ||||
C(15)=0 | ||||
F-statistic | 1.380391 | Probability | 0.201375 | |
Chi-square | 11.04313 | Probability | 0.199268 |
Не смотря на то, что UNEM тоже является незначимым, мы его оставим, поскольку есть априорная убеждённость в том, что он влияет на то, будет ли человек работать, а экономический смысл всё–же превыше всего. Строим новую модель, исключая регрессоры CITY, HUSAGE, HUSWAGE, KIFDGE6, HUSEDUC, FATHEDUC, MOTHEDUC и NWIFEINC.
Dependent Variable: INLF |
| |||
Method: ML - Binary Probit |
| |||
Sample: 1 753 |
| |||
Included observations: 753 |
| |||
Convergence achieved after 7 iterations |
| |||
Covariance matrix computed using second derivatives | ||||
Variable | Coefficient | Std. Error | z-Statistic | Prob. |
C | 1.076020 | 0.505786 | 2.127422 | 0.0334 |
AGE | -0.058761 | 0.007930 | -7.410217 | 0.0000 |
EDUC | 0.116306 | 0.023901 | 4.866228 | 0.0000 |
EXPER | 0.124113 | 0.018718 | 6.630820 | 0.0000 |
EXPERSQ | -0.001841 | 0.000602 | -3.060569 | 0.0022 |
HUSHRS | -0.000175 | 8.72E-05 | -2.009457 | 0.0445 |
KIDSLT6 | -0.883876 | 0.117450 | -7.525523 | 0.0000 |
UNEM | -0.021421 | 0.016771 | -1.277280 | 0.2015 |
Mean dependent var | 0.568393 | S. D. dependent var | 0.495630 | |
S. E. of regression | 0.427032 | Akaike info criterion | 1.089487 | |
Sum squared resid | 135.8553 | Schwarz criterion | 1.138614 | |
Log likelihood | -402.1920 | Hannan-Quinn criter. | 1.108413 | |
Restr. log likelihood | -514.8732 | Avg. log likelihood | -0.534119 | |
LR statistic (7 df) | 225.3624 | McFadden R-squared | 0.218852 | |
Probability(LR stat) | 0.000000 | |||
Obs with Dep=0 | 325 | Total obs | 753 | |
Obs with Dep=1 | 428 | |||
Интересным является тот факт, что если в уже построенную регрессию добавить NWIFEINC, то p–значение при этом регрессоре будет 0.03, хотя раньше тест Вальда отверг значимость этого регрессора вместе с другими с p–значением 0.20. Это лишний раз показывает то, насколько разные модели можно получить идя «снижу вверх» и «сверху вниз».
По виду оценок коэффициентов можем судить только о положительном или отрицательном влиянии фактора на вероятность принятия решения работать или нет. При вычислении маржинального эффекта по факторам, сможем точно сказать, на сколько, количественно, в среднем, меняется вероятность. Знаки при всех коэффициентах соответствуют интуиции.
Положительное влияние оказывают образование и опыт работы, последний на прямую зависит от того будет женщина работать или нет. Причем стоит заметить что при большом опыте работы, его маржинальное влияние на вероятность работать заметно ослабевает. То есть, например, увеличение опыта работы с 2 до 7 лет даёт гораздо больший в клад в «решимость работать дальше», чем увеличение опыта с 22 до 27 лет. Причины которыми люди руководствуются при принятии решений о работе, как мы предполагаем, абсолютно разные. Это может косвенно зависеть от насыщаемости зарплаты по опыту или от выхода на пенсию при накоплении большого опыта работы так как опыт сильно коррелирует с возрастом. Конечно же, достоверно узнать истинные причины, которые руководят людьми и приводят к подобным зависимостям, мы не можем. Заметим только, что зависимость вогнутая, нелинейная по опыту работы.
Занятость мужа отрицательно влияет на желание жены работать. Можем предположить что это связано с тем, что жена откажется работать, если муж в состоянии обеспечить семью. Но, как видно из маржинального эффекта, это влияние не так велико и равно (-0.00013) на каждый дополнительный час работы. Мы не можем наверняка объяснить это влияние, так как вероятность работать при одинаковом среднем количестве детей, например, уменьшается с ростом HUSHRS. Кроме того имеет место проблема эндогенности HUSHRS.
Абсолютно очевидно, что с увеличением количества маленьких детей вероятность, что женщина будет работать, сильно падает. Она посвятит свое время не работе, а маленьким детям. Это было понятно ещё из предварительного анализа взаимных корреляций. Если посмотреть на значение маржинального эффекта, можно сказать, что в среднем, имея двух детей до 6 лет, женщина работать не будет почти никогда.
Безработица, как и ожидалось, отрицательно влияет на вероятность работать. Не значима она оказалась, скорее всего, из–за агрегирования по большой территории.
AGE | -0.04405 |
EDUC | 0.087403 |
EXPER | 0.09307 |
EXPERSQ | -0.00138 |
HUSHRS | -0.00013 |
KIDSLT6 | -0.6604 |
UNEM | -0.0165 |
Рассчитаем маржинальный эффект:
; ![]()
;
. Поскольку у нас есть жёсткая связь между регрессорами EXPER и EXPERSQ, то это можно учесть следующим образом:
.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 |


