Aplicación del método de pareo en la Base de Datos de beneficiarios del Crédito Público Individual

July 23, 2017 | Autor: T. Velasco | Categoría: Measurement and Evaluation, Impact Evaluation, Microcredit

Descripción

BDP S.A.M.: Consultoría de apoyo para la elaboración de propuesta de evaluación de impacto del Crédito Productivo Individual Nota metodológica Aplicación del método de pareo en la Base de Datos de beneficiarios del CPI Tito Armando Velasco 1.

Definición de grupos de tratamiento y control

Grupo de tratamiento: Productores que obtuvieron no recientemente un crédito productivo individual (entre 2007 y 2010). Grupo control: Productores que obtuvieron recientemente crédito, planteándose utilizar dos alternativas:  Año 2011  Segundo semestre 2011 2.

Variables de resultado (outcomes)    

Número de empleos. Gasto mensual de la unidad productiva y familiar per cápita. Gasto anual del hogar per cápita. Proporción del gasto del hogar que se destina a la formación de capital humano (gasto en educación).  Activo total de la unidad familiar y productiva. 3.

Desagregación de los impactos

Los impactos se desagregaron según:  Sexo del productor o Varones o Mujeres  Edad del productor o Productor 30 y 45 años  Categoría de actividad de producción o Producción o Transformación-turismo 1

 Monto del crédito o 24.000 y 40.000 y 60.000 Por otro lado, para poder estimar impactos diferenciados por la antigüedad en el desembolso del crédito, se estiman impactos para cuatro años (una ecuación por año):     4.

2007 2008 2009 2010

Definición de la variable de participación en el CPI

d6m

= 1 productor en el grupo de tratamiento, desembolso del crédito hasta junio de 2011 = 0 productor en el grupo de control, desembolso entre julio y diciembre de 2011

d1a

= 1 productor en el grupo de tratamiento, desembolso del crédito hasta diciembre de 2010. = 0 productor en el grupo de control, desembolso entre enero y diciembre de 2011

5.

Estimación de la propensión a participar en el CPI

La estimación de la probabilidad o propensión a participar (propensity score) en el CPI se realiza en base a la estimación de un modelo probabilístico Logit de participación en el CPI, es decir, en el cuál la variable dependiente es d6m (o d1a). El modelo irrestricto que se plantea es el siguiente: d6m = f (edad_deudor, sexo, hog_biparent, viv_prop, chq_h, lpz_h, or_h, pts_h, tja_h, scz_h, ben_h, pdo_h, organizacion, primaria, secundaria, tecnico, universidad, num_dependientes, antecedentes, neg_casa, neg_propio, cat_produccion, alimentos textiles_cueros, maderas, exp_negoc, urbano, conoc_negoc, asist_tec, export, monto_credito, dest_cred, sexo_op, lactivo, ventas_activo, p_utilidad, p_ing_negocio, emp_ven, ingpc, gastpc, geducp) La ecuación para d1a es exactamente la misma. Variables: edad_deudor: edad del beneficiario sexo: sexo del beneficiario (1 hombre, 0 mujer) hog_biparent: hogar biparental (1 casado o concubinado, 0 divorciado, soltero o viudo) viv_prop: vivienda propia (1 la casa donde vive es propia, 0 en otro caso) chq_h lpz_h or_h pts_h tja_h scz_h ben_h pdo_h: dummies departamentales organizacion: el beneficiario pertenece a alguna organización (1 asociación, coraca, oeca, otb, 0 ninguna) 2

primaria: el beneficiario tiene instrucción primaria (1 primaria, 0 en otro caso) secundaria: el beneficiario tiene instrucción secundaria (1 secundaria, 0 en otro caso) tecnico: el beneficiario tiene instrucción en nivel técnico (1 técnico, 0 en otro caso) universidad: el beneficiario tiene instrucción universitaria (1 universitaria, 0 en otro caso) num_dependientes: número de dependientes antecedentes: antecedentes crediticios del beneficiario (1 tiene crédito anterior, 0 no tiene) neg_casa: el negocio funciona en el lugar donde vive (1 funciona en el lugar, 0 no funciona en el lugar) neg_propio: propiedad del inmueble del negocio (1 propio, 0 en otro caso) cat_produccion: la categoría de actividad es producción (1 producción 0 en otro caso) alimentos: el beneficiario está en el rubro de alimentos (1 alimentos, 0 en otro caso) textiles_cueros: el beneficiario está en el rubro de textiles o de cueros (1 textiles o cueros, 0 en otro caso) maderas: el beneficiario está en el rubro de maderas (1 maderas, 0 en otro caso) exp_negoc: experiencia en el negocio en meses urbano: área geográfica (1 urbano, 0 rural) conoc_negoc: conocimiento del negocio (1 conocimiento excelente o bueno, 0 conocimiento aceptable o malo) asist_tec: el beneficiario requiere asistencia técnica (1 si, 0 no) export: actualmente exporta (1 si, 0 no) monto_credito: monto del crédito (Bs) dest_cred: destino del crédito (1 capital de inversiones, 0 capital de operaciones) sexo_op: proxy para conocer si el codeudor es el/la cónyuge (1 codeudor tiene sexo opuesto, 0 mismo sexo). lactivo: logaritmo del activo total ventas_activo: expresa las ventas en términos del activo total p_utilidad: margen de utilidad en relación al valor de las ventas p_ing_negocio: ingreso declarado del negocio respecto al activo total emp_ven: expresa el total de ventas por empleado ingpc: ingreso mensual per cápita del hogar (Bs/persona) gastpc: gasto mensual per cápita de la unidad familiar y productiva geducp: proporción del gasto del hogar destinado a educación Debido a los dos grupos de control sugeridos (ver punto 1), se requiere estimar un total de 8 ecuaciones de participación en el programa de acuerdo al siguiente detalle:  4 ecuaciones para la variable d6m, para los 4 años (2007, 2008, 2009 y 2010)  4 ecuaciones para la variable d1a, para los 4 años (2007, 2008, 2009 y 2010) 6.

Ajustes de algunas variables en la Base de Datos

Debido a los missings de algunas variables, y para evitar la pérdida de casos, se tuvieron que reemplazar por valores cero en los siguientes casos:  En las variables de activo, pasivo o patrimonio. 3

 En las variables de ingresos (ingresos del negocio, ingreso agrícola, actividades pecuarias, actividades familiares).  En el número de dependientes.  En las variables de ventas, costos y margen de utilidad.  En las variables de gastos (gastos familiares, gastos de producción, otras deudas, gastos familiares, gasto en educación, en salud y en vestimenta).  En las variables de sexo de codeudor, se anotó “mujer”. Se corrigieron algunos errores de datos en la BD:       

Para ingresos agrícolas, un caso Para valor de ventas, un caso Para costos, dos casos Para gastos en alimentos, cuatro casos Para gastos en educación, tres casos Para gastos en vestimenta, tres casos Para la experiencia en el negocio, un caso

También se hicieron ciertos supuestos para mejorar los datos:  Cuando el valor de ventas registra cero existiendo valor en ingresos del negocio, se reemplazó el valor de ventas por este último.  Se homogeneizó el valor de ventas al período anual (las ventas aparecían en periodicidad mensual, bimensual, etc.)  En casos donde existen ventas pero se registra missings en el margen de utilidad, se reemplazó por un mínimo de Bs. 300 (4 casos). 7.

Balanceo de las variables

Para garantizar un adecuado pareamiento, una condición necesaria es que las variables cumplan la propiedad de balanceo, lo cuál significa que las observaciones en la BD que tienen el mismo propensity score deben tener la misma distribución de características (variables) observables. En su forma más simple, esto significa que las medias de las variables definidas en el punto 5, tanto para el grupo tratamiento y control, no deben diferir significativamente. La estimación del modelo Logit sugerido en el punto 5 presentó el inconveniente de que muchas de las variables no estaban “balanceadas”, lo que obligó a re-especificar dicha ecuación en forma más “simplificada” (parsimoniosa) en cada uno de los 8 casos. Tomando como ejemplo un caso, para los dos grupos de control sugeridos, la estimación parsimoniosa para la gestión 2007 que asegura balanceo en todas las variables fue la siguiente:

4

Logistic regression

Number of obs LR chi2(27) Prob > chi2 Pseudo R2

Log likelihood = -1990,7953 d1a

Coef.

edad_deudor sexo hog_biparent chq_h lpz_h pts_h scz_h ben_h pdo_h primaria secundaria organizacion tecnico universidad num_depend~s neg_casa cat_produc~n alimentos textiles_c~s maderas exp_negoc urbano conoc_negoc asist_tec monto_cred~o p_utilidad geducp _cons

,0342313 ,19087 -1,111984 -,5615577 ,3200212 -,3324566 1,438576 3,372266 2,173239 -,5386568 -,4767749 ,3776266 -,7193533 ,1339123 ,1346127 ,2080398 -1,538661 ,3749845 ,294872 ,5381843 -,0031969 1,395045 -,2615606 ,3505257 8,52e-06 -,0007187 ,0263079 -1,321054

Std. Err. ,0045216 ,0995018 ,0903001 ,1488263 ,1193677 ,1921153 ,1228477 ,2498351 ,2710871 ,237363 ,2376842 ,0933713 ,275001 ,2689881 ,0282651 ,1016159 ,1658107 ,209285 ,2085055 ,2638585 ,0005273 ,1446551 ,2834505 ,0902287 1,71e-06 ,0022421 ,0061617 ,4823279

z 7,57 1,92 -12,31 -3,77 2,68 -1,73 11,71 13,50 8,02 -2,27 -2,01 4,04 -2,62 0,50 4,76 2,05 -9,28 1,79 1,41 2,04 -6,06 9,64 -0,92 3,88 4,99 -0,32 4,27 -2,74

Logistic regression

Coef.

edad_deudor sexo or_h ben_h pdo_h secundaria tecnico num_depend~s antecedentes neg_casa alimentos textiles_c~s maderas urbano conoc_negoc export p_utilidad ingpc geducp _cons

,0082211 -,0564665 -,2681089 1,571787 ,482507 -,0210788 -,2163218 -,0557259 -,2703818 -,0395083 -,4932041 -,1046413 -,0533049 1,413419 -,0261809 1,027938 -,0038921 ,0000835 ,0115486 ,7326269

0,000 0,055 0,000 0,000 0,007 0,084 0,000 0,000 0,000 0,023 0,045 0,000 0,009 0,619 0,000 0,041 0,000 0,073 0,157 0,041 0,000 0,000 0,356 0,000 0,000 0,749 0,000 0,006

Std. Err. ,0035989 ,0887739 ,1561087 ,2275692 ,2477087 ,0746076 ,1569328 ,0234028 ,1267198 ,0911397 ,1950328 ,2255695 ,2754649 ,1472116 ,2699629 ,2439086 ,0018881 ,0000256 ,0060599 ,3846372

z 2,28 -0,64 -1,72 6,91 1,95 -0,28 -1,38 -2,38 -2,13 -0,43 -2,53 -0,46 -0,19 9,60 -0,10 4,21 -2,06 3,26 1,91 1,90

P>|z| 0,022 0,525 0,086 0,000 0,051 0,778 0,168 0,017 0,033 0,665 0,011 0,643 0,847 0,000 0,923 0,000 0,039 0,001 0,057 0,057

4260 1852,30 0,0000 0,3175

[95% Conf. Interval] ,0253692 -,0041498 -1,288969 -,853252 ,0860647 -,7089958 1,197799 2,882599 1,641918 -1,00388 -,9426274 ,1946222 -1,258345 -,3932946 ,079214 ,0088762 -1,863644 -,0352066 -,1137913 ,021031 -,0042304 1,111526 -,8171135 ,1736807 5,18e-06 -,0051131 ,0142312 -2,2664

Number of obs LR chi2(19) Prob > chi2 Pseudo R2

Log likelihood = -2461,0093 d6m

P>|z|

= = = =

= = = =

,0430935 ,3858899 -,9349988 -,2698634 ,5539777 ,0440825 1,679353 3,861934 2,70456 -,0734339 -,0109224 ,560631 -,1803614 ,6611192 ,1900113 ,4072033 -1,213678 ,7851755 ,7035353 1,055337 -,0021634 1,678564 ,2939923 ,5273707 ,0000119 ,0036756 ,0383846 -,3757089

4260 537,74 0,0000 0,0985

[95% Conf. Interval] ,0011674 -,2304602 -,5740764 1,125759 -,002993 -,167307 -,5239044 -,1015946 -,518748 -,2181389 -,8754614 -,5467494 -,5932061 1,124889 -,5552984 ,5498864 -,0075928 ,0000334 -,0003285 -,0212481

,0152749 ,1175272 ,0378585 2,017814 ,9680071 ,1251494 ,0912609 -,0098572 -,0220156 ,1391223 -,1109468 ,3374669 ,4865964 1,701948 ,5029366 1,50599 -,0001915 ,0001336 ,0234257 1,486502

5

Ecuaciones similares se estimaron para los otros 6 casos. 8.

Métodos de pareo

Una vez que se cuenta con la estimación de las ecuaciones de participación en el CPI, se estima el impacto por los siguientes cuatro métodos:  Pareo del vecino más próximo (nearest neighboor matching - NN): Cada productor del grupo de tratamiento se parea con un productor del grupo de control, de modo que sea el más cercano en términos del propensity score.  Pareamiento estratificado (stratification matching - S): Consiste en dividir el rango de variación del propensity score en intervalos tales que dentro de cada intervalo de tratados y control, tengan en promedio, el mismo propensity score.  Pareamiento Kernel (Kernel matching - K): Los productores tratados son emparejados con un promedio ponderado de todos los productores del grupo de control con pesos que son inversamente proporcionales a la distancia entre los propensity scores de tratados y control.  Pareamiento radius (radius matching - R): Cada productor tratado es emparejado solamente con el control cuyo propensity score cae en una vecindad predefinida del propensity score del productor tratado. Los errores estándar bajos los cuatro métodos anteriores pueden ser obtenidos con bootstrapping. El bootstrapping ejecuta la estimación del impacto múltiples veces, obteniendo muestras aleatorias sucesivas. 9.

Resultados

Un resumen de los resultados obtenidos para la variable total de empleos se muestra a continuación. La mayoría de los estimadores son estadísticamente significativos. Sin embargo, las conclusiones que se pueden derivar no son definitivas en función de las limitaciones de la opción metodológica y la calidad de la información de la BD del BDP S.A.M.:

6

Tratamiento: 2007, control: 2° sem 2011 Desagregación

Monto

activ.

Edad

Sexo

Total Varones Mujeres Productor 30 y 45 años Producción Transformaciónturismo 24.000 y 40.000 y 60.000 y

Lihat lebih banyak...

Aplicación del método de pareo en la Base de Datos de beneficiarios del Crédito Público Individual

Descripción

Comentarios