“Inferencia Ecológica en Elecciones a Gobernador de la Provincia de Buenos Aires”, en: Estadística, Interamerican Statistical Institute, 2010, ISSN 0014- 1135

August 23, 2017 | Autor: Fernando Suárez | Categoría: Electoral Studies, Peronismo, Ecological Inference
Share Embed


Descripción

ESTADÍSTICA (2010), 62, 179, pp. 45-57 © Instituto Interamericano de Estadística

ESTADISTICA (2009), 62, 179, pp. c Instituto Interamericano de Estad´ıstica

´ INFERENCIA ECOLOGICA EN ELECCIONES A GOBERNADOR DE LA PROVINCIA DE BUENOS AIRES LILA RICCI Facultad de Ciencias Exactas, Universidad Nacional de Mar del Plata [email protected] MARCELA FERRARI Facultad de Humanidades, Universidad Nacional de Mar del Plata [email protected] FERNANDO SUAREZ Facultad de Humanidades, Universidad Nacional de Mar del Plata [email protected] RESUMEN En este art´ıculo se aplican m´etodos de inferencia ecol´ogica a un an´alisis de asociaci´on entre variables socio-econ´omicas y voto al Partido Justicialista en la provincia argentina de Buenos Aires, en tres elecciones consecutivas a gobernador (1983, 1987 y 1991) o sea a partir de la recuperaci´on de la democracia, cuando en la provincia de Buenos Aires se pusieron de manifiesto los conflictos pol´ıticopartidarios que atravesaban a toda la Naci´on. Se hace un estudio comparativo de aquellos m´etodos que han sido los m´as representativos de la inferencia ecol´ogica en diferentes momentos debidos a Duncan, Goodman, King e Imai; se comentan las ventajas y desventajas de cada uno de ellos, ilustr´andolas con los resultados obtenidos para los datos mencionados. Palabras clave Inferencia ecol´ogica, datos electorales, Partido Justicialista. ABSTRACT In this article methods of Ecological inference are applied to an analysis of association between socioeconomic variables and Peronist vote in three consecutive elections for governor (1983, 1987 and 1991) in the State of Buenos Aires in Argentina. The study period agrees with the re-emergency of the democracy in Argentina and when the State of Buenos Aires displayed the political conflicts affecting the entire country. The article presents a comparative study of the best known ecological inference methods due to Duncan, Goodman, King and Imai.

46

ESTADÍSTICA (2010), 62, 179, pp. 45-57

2 Advantages and disadvantages of each method are given and they are illustrated with results obtained from these data. Key words Ecological inference, electoral data, Justicialist Party. 1. Introducci´ on La Inferencia Ecol´ogica (IE ) es un m´etodo estad´ıstico que ha sido desarrollado con el fin de estimar par´ametros correspondientes a comportamientos individuales que no son observables, partiendo de datos agrupados o ecol´ogicos. Para abordar este tipo de problemas en el a˜ no 1953 fue presentado el m´etodo de los l´ımites de Duncan y Davis (1953), que brinda intervalos para las proporciones a estimar. Luego en 1959 se propuso el m´etodo de regresi´on de Goodman (1959) que ajusta a los datos un modelo lineal agregando las herramientas de diagn´ostico e inferencia propias de estos modelos pero sin considerar que los estimadores solo deber´ıan tomar valores en el intervalo (0, 1). Pese a la necesidad de superar las limitaciones de estos m´etodos, no hubo avances notorios en el tema por muchos a˜ nos. Finalmente en 1997 la investigaci´on relacionada con la IE se dinamiz´o notablemente con la presentaci´on del modelo de King (1997), que integra y supera las propuestas precedentes. A partir de ese momento se publicaron numerosos trabajos que complementan la propuesta de King, la extienden, ilustran sus posibles aplicaciones y permiten su implementaci´on computacional. Algunos de ´estos fueron compilados en King (2004). En un art´ıculo reciente, Imai, Lu y Strauss (2008) presentan un marco te´orico en el que se formula el problema de inferencia ecol´ogica en t´erminos de datos agregados; el modelo param´etrico es una variante de modelo de King y est´a implementado en paquetes de software libre (en prensa). Los resultados que se obtienen suelen ser num´ericamente pr´oximos a los de King. Un caso t´ıpico que se beneficia con la aplicaci´on de IE es el an´alisis de resultados electorales, ya que en este tipo de estudios se cuenta con totales agrupados por distrito y no se observan los comportamientos individuales. El objetivo de este art´ıculo es ilustrar las ventajas y desventajas de cuatro m´etodos de IE a trav´es de su aplicaci´on a resultados de elecciones a gobernador en la provincia argentina de Buenos Aires en el per´ıodo 1983-1991. A partir de la recuperaci´on de la democracia en la Argentina en 1983, la provincia de Buenos Aires fue un espacio donde se pusieron de manifiesto los conflictos pol´ıtico-partidarios que atravesaban a toda la Naci´on, sumados a los particulares del distrito. En la convocatoria de1983 el peronismo, un partido de base sindical que hab´ıa sido organizado desde el Estado en 1946 por el entonces presidente Juan Domingo Per´on (v´ease Germani, 1973 o Romero, 2001), por primera vez en su historia perd´ıa los comicios en elecciones libres de toda proscripci´on. Tras el impacto inicial sus dirigentes iniciaron un proceso de transformaci´on interna y en 1987, luego de desplazar a los cuadros tradicionales asociados al sindicalismo ortodoxo, lograron recuperar la confianza

RICCI et al.: Inferencia ecológica en elecciones a Gobernador de la Provincia...

47

3 de la mayor´ıa de los votantes y acceder al gobierno de la provincia. Con posterioridad, el peronismo continu´o afianzando su primac´ıa y volvi´o a ganar las elecciones de 1991 (Prates, 1999). Se ha afirmado que, dado el proceso de desindustrializaci´on y desindicalizaci´on que afectaba a la Argentina a lo largo del per´ıodo, el partido encontr´o sus bases electorales en otros sectores sociales (Levitzky, 2003). Un an´alisis detallado del contexto hist´orico correspondiente puede leerse en Ferrari (2009). Se analizar´a ac´a si esa transformaci´on en los cuadros dirigentes fue acompa˜ nada por un cambio en la composici´on social del electorado peronista. El trabajo citado, junto con el presente, forman parte de un proyecto multidisciplinario denominado “Veinte a˜ nos de democracia en Argentina: desaf´ıos, transformaciones, actores, conflictos; una aproximaci´on desde las provincias” subsidiado por la Agencia Nacional de Promoci´on Cient´ıfica y Tecnol´ogica. No son muchos a´ un los autores que han usado los m´etodos actuales de IE para explicar el voto en Argentina: Calvo y Escolar (2005) los aplicaron a la estimaci´on de matrices de transici´on entre elecciones mientras que Lupu y Stokes (2009) analizaron usando esta t´ecnica la polarizaci´on del sistema de partidos en Argentina a trav´es de las clases sociales; tanto Brusco, Nazareno y Stokes (2004) como Canton y Jorrat (2007) utilizaron en cambio modelos de regresi´on log´ıstica. El presente trabajo aporta un estudio comparativo de los m´etodos que han sido m´as representativos de IE en diferentes momentos, mediante su aplicaci´on a un an´alisis de asociaci´on entre variables socio-econ´omicas y voto al Partido Justicialista en la provincia argentina de Buenos Aires, en tres elecciones consecutivas a gobernador (1983, 1987 y 1991). Se comentan las ventajas y desventajas de cada uno de ellos, ilustr´andolas con los resultados obtenidos para dichos datos. Un esquema de trabajo similar fue seguido por Hudson y colaboradores (2010) para analizar el voto femenino en Nueva Zelanda entre 1893 y 1919. En la Secci´on 2 se describe el problema que motiv´o el presente trabajo y se define la notaci´on que se usar´a; en la Secci´on 3 se describen los intervalos de Duncan, el m´etodo de regresi´on de Goodman y los param´etricos de King y de Imai. En la Secci´on 4 se muestran en forma comparativa los resultados obtenidos y finalmente en la Secci´on 5 se dan conclusiones y futuras l´ıneas de trabajo. 2. Datos Se aplicar´an los m´etodos de IE detallados en la Secci´on 1 al an´alisis de resultados electorales en la provincia de Buenos Aires (Argentina) en elecciones a gobernador de los a˜ nos 1983, 1987 y 1991. Dado que el inter´es se centra en analizar el cambio en la composici´on social del electorado peronista, las opciones de voto fueron agrupadas en: voto al partido justicialista (PJ ) y voto a otros partidos (OP ). Los datos socio-econ´omicos para los 135 distritos que componen las secciones electorales de la provincia fueron tomados para las dos primeras elecciones del censo de 1980 y para la u ´ltima del censo de 1991. Las variables socio-econ´omicas seleccionadas fueron: (i) Proporci´on de habitantes con ocupaci´on empleado/obrero (eo-otra oc), (ii) Proporci´on de hogares con necesidades b´asicas insatisfechas (NBI ), (iii) Pro-

48

ESTADÍSTICA (2010), 62, 179, pp. 45-57

4 porci´on de habitantes con educaci´on universitaria, y (iv) Proporci´on de poblaci´on urbana. El criterio de selecci´on seguido fue tomar ejemplos con diferentes proporciones y diferente evoluci´on a lo largo de las tres elecciones consideradas. En la Tabla 1 se pueden ver los valores de estas variables en cada uno de los censos. Tabla 1. Proporciones observadas en los censos de 1980 y 1991

Censo Empleado/obrero NBI Universitario Poblaci´on urbana

1980 0.36 0.19 0.02 0.76

1991 0.63 0.14 0.06 0.82

En cuanto a los porcentajes que obtuvo el PJ en cada elecci´on ´estos fueron 32.64% en 1983; 39.23% en 1987 y 36.02% en 1991. La relaci´on entre las variables socioecon´omicas consideradas y los porcentajes obtenidos por el PJ en cada distrito es ilustrada en la Figura 1. Un problema esencial para el an´alisis de estos datos (que es justamente el que motiv´o el desarrollo de la IE) consiste en que la asociaci´on entre la intenci´on individual de voto al PJ y las caracter´ısticas socio-econ´omicas del votante no puede ser obtenida en forma directa, pues s´olo se cuenta con datos agregados por distrito. Tomando como ejemplo a la categor´ıa ocupacional empleado/obrero, se ilustra a continuaci´on la notaci´on que se usar´a, siguiendo a King. Las variables cuyos valores pueden ser observados son: • Ti : proporci´on de votos al PJ en el distrito i, donde i = 1, . . . , 135, • Xi : proporci´on de empleados/obreros en el distrito i. Y las que no se observan en forma directa son: • βieo : proporci´on de empleados/obreros que votaron al PJ en el distrito i, • βiotra oc : proporci´on de habitantes con otras ocupaciones que votaron al PJ en el distrito i. La informaci´on de cada distrito electoral para cada variable socio-econ´omica puede representarse con una tabla de 2 × 2 (ver Tabla 2). 3. Inferencia ecol´ ogica 3.1 L´ımites de Duncan Duncan y Davis (1953) obtuvieron los l´ımites que determinan el menor intervalo dentro del cual se encuentra con certeza el verdadero valor de las variables de

49

RICCI et al.: Inferencia ecológica en elecciones a Gobernador de la Provincia...

5 Figura 1. Diagramas de dispersi´ on de las proporciones de habitantes empleados/obreros, con necesidades b´ asicas insatisfechas, universitarios y urbanos versus proporci´on de votos al PJ en cada votaci´on

0.3

0.4

0.7

0.8

0.5 0.3 0.4

0.8

0.0

0.4

0.8

0.0

0.4

0.8

0.05

0.15

0.25

0.0

0.2

0.4

0.6

0.0

0.2

0.4

0.6

0.0

0.2

0.4

0.6

0.4 0.5

0.3

0.4 0.3

0.4

0.5

0.3

0.4 0.5 0.4 0.6

0.0

0.5

0.2

0.3 0.5

0.4

0.5 0.4 0.1

0.3

0.4 0.4

0.5

0.3

PJ ’87

0.4

0.4

0.45

0.3

0.3

0.35

0.2

0.5

0.25

0.1

0.5

0.45

univ

0.3

0.4 0.3

0.4

PJ ’83

0.3

0.35

0.5

0.25

0.3

PJ ’91

urb

0.5

NBI

0.5

eo

inter´es βieo y βiotra oc , dados los valores observados de Ti y de Xi . Los intervalos son los siguientes:    Ti Ti − (1 − Xi ) eo ≤ βi ≤ min ,1 , max 0, Xi Xi     T i − Xi Ti otra oc max 0, ≤ βi ≤ min ,1 . 1 − Xi 1 − Xi 

(1)

El enfoque de estos autores es determin´ıstico, ya que no hace ning´ un supuesto de naturaleza probabil´ıstica sobre los datos. En la pr´actica dichos l´ımites suelen resultar poco informativos, especialmente cuando Xi o (1 − Xi ) toman valores peque˜ nos, sin embargo proporcionan una idea aproximada de la informaci´on contenida en los datos.

50

ESTADÍSTICA (2010), 62, 179, pp. 45-57

6 Tabla 2. Ejemplo de la notaci´ on utilizada

PJ βieo βiotra oc. Ti

Empleado/obrero Otra ocupaci´on

OP 1 − βieo 1 − βiotra oc. 1 − Ti

Xi 1 − Xi 1

3.2 Regresi´ on de Goodman Las variables no observadas, que fueran definidas en la Secci´on 2, est´an vinculadas entre s´ı por la identidad conocida como accounting identity que fuera definida por Goodman (1959). Por ejemplo, para las proporciones de eo y de otra oc que votaron al PJ, su forma es la siguiente Ti = βieo Xi + βiotra oc (1 − Xi ).

(2)

A partir de esta expresi´on queda claro que la proporci´on observada de votos al PJ en cada distrito es un promedio ponderado de los valores no observables. Reordenando (2) se obtiene: Ti = βiotra oc + (βieo − βiotra oc )Xi , ahora el verdadero valor Ti puede expresarse, agregando una componente aleatoria, como (3) Ti = α + βXi + εi donde εi es un error aleatorio con media cero. El problema as´ı expresado es un caso particular de regresi´on lineal simple, se ajusta un modelo para el complemento de la variable, es decir Ti = α + β (1 − Xi ) donde los coeficientes admiten la siguiente interpretaci´on: (i) α es la proporci´on de eo que votaron al PJ y (ii) (α + β) es la proporci´on de otras ocupaciones que votaron al PJ. Como es sabido, para que este tipo de modelos sea v´alido es necesario el cumplimiento de los siguientes supuestos: • existe una relaci´on lineal entre la proporci´on de votos al PJ y la proporci´on de eo, • la proporci´on de eo que votan al PJ es constante a trav´es de los distritos, • la proporci´on de eo que votan al PJ es independiente de la proporci´on total de eo.

RICCI et al.: Inferencia ecológica en elecciones a Gobernador de la Provincia...

51

7 En la pr´actica, la validez de estas afirmaciones no siempre es sustentable (es m´as, la mayor´ıa de las veces no se cumplen). Por ejemplo, es esperable que aquellos distritos con mayor proporci´on de habitantes eo tengan a su vez otras caracter´ısticas que har´an que var´ıe la opci´on de voto entre dichos electores. Otra seria objeci´on a este modelo es que considera como dominio de variaci´on para las umeros reales, cuando en realidad deber´ıa ser el intervalo [0; 1] o, m´as Xi a los n´ precisamente, los l´ımites de Duncan. Se llega as´ı en algunos casos a resultados absurdos como estimadores de las proporciones que toman valores negativos o mayores que 1. No obstante podemos decir a favor del m´etodo de Goodman que, al contar con todo el soporte te´orico y gr´afico que acompa˜ na al diagn´ostico de un modelo lineal, ciertamente enriquece el an´alisis mediante la detecci´on de valores at´ıpicos, puntos influyentes, etc. Este aspecto fue destacado en el estudio por simulaciones llevado a cabo por Silva y Matos (2004). 3.3 M´ etodo de King de coeficientes aleatorios Para superar los inconvenientes de la regresi´on de Goodman, que fueran detallados en la Secci´on (1959), King (1997) en lugar de considerar a los coeficientes βieo y βiotra oc como fijos (iguales para todos los distritos) los consider´o como variables aleatorias. Supuso que los mismos siguen una distribuci´on normal bivariada restringida al cuadrado [0, 1] × [0, 1] (T BVN ), condicional al valor de Xi conocida como distribuci´on normal bivariada truncada; de este modo incorpor´o tambi´en las restricciones contempladas por los l´ımites de Duncan. Formalmente:  eo otra oc  βi , βi ∼ T BVN (μ, Σ) ,  σeo-otra oc 2 μotra oc σeo-otra oc σotra oc representan al vector de medias y a la matriz de varianza-covarianza respectivamente. Estos par´ametros pueden resumirse en el vector   2 2 , σeo-otra oc , σotra Ψ = μeo , μotra oc , σeo oc . 

donde

μ=

μeo





,

Σ=

2 σeo

Ahora las proporciones observadas se expresan de la siguiente manera βieo = μeo + εeo i oc βiotra oc = μotra oc + εotra i

donde

(4)

 otra oc  E (εeo = 0. i ) = E εi

Volviendo a la identidad (2), reemplazando de acuerdo a (4) y reordenando:   otra oc oc Ti = (μeo + εeo (1 − Xi ) + εotra i ) Xi + μ i oc X + εotra (1 − Xi ). = μeo Xi + μotra oc (1 − Xi ) + εeo i

i i εi

52

ESTADÍSTICA (2010), 62, 179, pp. 45-57

8 De acuerdo a King (1997) la funci´on de verosimilitud para el vector de par´ametros Ψ es la siguiente: L (Ψ | T, X) = P (Ti | Ψ) Xi ∈[0,1]

=

 S (μ, Σ)  , N Ti | μi , σi2 R (μ, Σ) Xi ∈[0,1]

(5)



oc t μotra donde μi = μeo y σi son par´ametros correspondientes al ´ı−simo disi i trito,    1 1 R (μ, Σ) = 0 0 BN βieo , βiotra oc | μ, Σ dβ eo dβ otra oc es el factor normalizador y    min Ti ,1 Xi wi 2 wi eo eo N  βi | μ + 2 , σeo − 2 dβ eo , S (μ, Σ) = T −(1−X ) σi σi max 0, i X i i

wi =

2 σeo Xi

+ σeo-otra oc (1 − Xi ) .

restringe el a´rea de integraci´on al intervalo de Duncan. Los resultados del m´etodo de King ser´an v´alidos para el presente ejemplo siempre que • βieo , βiotra oc sean independientes de Xi , • la proporci´on de votos al PJ entre los eo del distrito i sea independiente de la proporci´on de votos al PJ entre los eo de otro distrito j. Es decir Ti | Xi independientes de Tj | Xj , ∀i = j. Los intervalos de King no presentan las incoherencias de los de Goodman y son m´as precisos que los de Duncan. 3.4 Enfoque de Imai como datos incompletos En un trabajo reciente, Imai, Lu y Strauss (2008) abordan el problema de IE bas´andose en un enfoque de datos incompletos y proponen una variaci´on al m´etodo param´etrico de King que, en lugar de usar la distribuci´on normal bivariada truncada, aplica a los coeficientes una transformaci´on log´ıstica llev´andolos as´ı del cuadrado [0, 1] × [0, 1] al plano R2 . Definen el vector aleatorio t  β otra oc β eo , log δ = log 1 − β eo 1 − β otra oc y suponen que δ tiene distribuci´on normal bivariada con media μ y matriz de covarianza Σ, que no necesariamente ser´a diagonal; es decir que est´a contemplado que pueda haber asociaci´on entre β eo y β otra oc . Para obtener los estimadores desarrollaron un algoritmo tipo EM.

RICCI et al.: Inferencia ecológica en elecciones a Gobernador de la Provincia...

53

9 Tabla 3. D: l´ımites de Duncan; G, K e I: estimador e intervalo de 95% de confianza de Goodman, King e Imai respectivamente

eo

NBI

Univ.

Urb.

D G K I D G K I D G K I D G K I

1983 (0.00; 0.93) 0.53 (0.31; 0.74) 0.48 (0.28; 0.68) 0.69 (0.54; 0.81) (0.00, 1.00) 0.91 (0.78; 0.99) 0.72 (0.53; 0.91) 0.83 (0.72; 0.92) (0.00, 1.00) −3.30 (−4.01; −2.58) 0.01 (0.00; 0.01) 0.36 (0.08; 0.70) (0.26; 0.42) 0.38 (0.37; 0.40) 0.37 (0.30; 0.42) 0.38 (0.37; 0.39)

1987 (0.00; 0.99) 1.36 (0.92; 1.79) 0.52 (0.41; 0.64) 0.77 (0.57; 0.89) (0.00, 1.00) 0.88 (0.64; 0.96) 0.72 (0.57; 0.86) 0.80 (0.67; 0.91) (0.00, 1.00) −2.99 (−3.64; −2.35) 0.01 (0.00; 0.03) 0.34 (0.07; 0.74) (0.27; 0.56) 0.47 (0.45; 0.48) 0.45 (0.42; 0.48) 0.47 (0.46; 0.47)

1991 (0.00; 0.96) 0.31 (0.24; 0.39) 0.34 (0.30; 0.39) 0.25 (0.21; 0.33) (0.00; 1.00) 0.65 (0.40; 0.79) 0.43 (0.35; 0.41) 0.45 (0.23; 0.66) (0.01; 0.95) 0.36 (0.30; 0.42) 0.31 (0.13; 0.48) 0.31 (0.19; 0.43) (0.26; 0.48) 0.42 (0.41; 0.44) 0.48 (0.44; 0.51) 0.43 (0.42; 0.44)

4. Resultados En la Tabla 3 pueden verse los l´ımites de Duncan obtenidos para la proporci´on de votos al PJ, en las tres elecciones y para cada una de las variables consideradas. En 5 de los 12 casos el m´etodo no proporciona para ´estos ninguna informaci´on dado que el intervalo obtenido es el (0, 1). Se ajustaron luego en las tres elecciones, modelos de Goodman, usando la funci´on lm del programa R (2009). En la Tabla 3 se enumeran los estimadores y los intervalos de 95% de confianza para el par´ametro α que fuera definido en la Secci´on 3.2. Se obtuvieron valores negativos para lo proporci´on de universitarios que vot´o al PJ en las dos primeras elecciones. Ambas corresponden al censo de 1980 que revel´o una proporci´on de universitarios muy baja (2%). Para los votantes eo, num´ericamente en el otro extremo, en 1987 se obtuvo un estimador mayor que 1. Analizando los residuos se detectaron algunos distritos con comportamiento at´ıpico: en la elecci´on de 1983 Berisso, distrito industrial con alta tasa obrera cuya cercan´ıa a La Plata (que adem´as de ser capital de la provincia es una ciudad universitaria) le da caracter´ısticas particulares, y Villarino que es un distrito rural peque˜ no con una proporci´on muy baja de votos al PJ; en la elecci´on de 1987 los distritos mal

54

ESTADÍSTICA (2010), 62, 179, pp. 45-57

10 Tabla 4. Distritos con residuos altos

Berisso Villarino La Matanza Vicente L´opez H. Irigoyen Vicente L´opez

Votos al PJ 0.52 0.19 0.55 0.28 0.50 0.26

e/o 0.39 0.34 0.41 0.34 0.37 0.38

NBI 0.23 0.26 0.22 0.08 0.09 0.08

Univ. 0.01 0.01 0.01 0.06 0.01 0.35

Pob. Urbana 0.98 0.44 0.99 1.00 0.86 1.00

ajustados fueron La Matanza (distrito industrial, con alta tasa obrera) y Vicente L´opez, que tiene una proporci´on muy baja de hogares con necesidades b´asicas insatisfechas y una muy alta de universitarios por u ´ltimo en 1991 tuvieron comportamiento at´ıpico Hip´olito Irigoyen, partido que hist´oricamente ha votado al peronismo desplazando a los distritos tradicionales, y nuevamente Vicente L´opez. La descripci´on de estos partidos puede verse en la Tabla 4. En cuanto a los m´etodos param´etricos, para obtener los estimadores de la proporci´on de votos al PJ aplicando el m´etodo de King descripto en la Secci´on 3.3, se us´o la versi´on 2.7 del paquete EzI de King y Benoit (2003). Para aplicar el m´etodo de Imai Lu y Strauss descripto en la Secci´on 3.4, se us´o la funci´on ecoML del paquete eco implementado en el programa R. En la Tabla 3 se enumeran los resultados obtenidos, como era de esperar los de ambos m´etodos fueron pr´oximos en la mayor´ıa de los casos y los l´ımites de los intervalos no contradicen en ning´ un caso los l´ımites de Duncan. Las amplitudes para ambos m´etodos son razonables y cuando las proporciones de la variable socio-econ´omica son altas, como es el caso de la poblaci´on urbana, se obtienen estimaciones precisas y robustas. No ocurre as´ı cuando son peque˜ nas, como es el caso de la poblaci´on universitaria cuya proporci´on es baja: para esta variable se observaron resultados muy diferentes entre los distintos m´etodos, sobre todo para las dos primeras elecciones. En la Figura 2 se grafican las amplitudes obtenidas por los tres m´etodos param´etricos, para los doce pares “variable socio-econ´omica - votaci´on”. Salvo en el caso de la poblaci´on universitaria que, como dijimos, es num´ericamente muy inestable, la tendencia a trav´es de las tres votaciones es muy similar para todos los m´etodos: la adhesi´on al PJ de los sectores menos favorecidos disminuy´o de 1983 a 1991 mientras que la de los sectores universitarios y poblaci´on urbana parece haber aumentado en dicho lapso. 5. Conclusiones y futuras l´ıneas de trabajo Si bien los m´etodos param´etricos de anteriores, cada uno de aquellos hace al an´alisis de datos. As´ı los l´ımites informaci´on contenida en los datos, a

King y de Imai integran y superan a los aportes enriquecedores y complementarios de Duncan permiten evaluar la potencial partir de una cuenta muy simple y accesi-

RICCI et al.: Inferencia ecológica en elecciones a Gobernador de la Provincia...

55

11 Figura 2. Amplitudes de los intervalos de Goodman (G), King (K) e Imai (I)

K

I

G

K

I

G

K

I

G

K

I

1.2 0.8 0.4 0.0 G

K

I

G

K

I

G

K

I

G

K

I

G

K

I

G

K

I

G

K

I

G

K

I

0.04

0.00 0.04 0.08 0.12

0.06

0.00

0.10

0.20

0.0 0.2 0.4 0.6 0.8

0.08

0.02

0.06

0.00

0.02

0.04

0.00 0.10 0.20 0.30

0.00

NBI

0.04 0.00 1.2 0.8

univ

0.4 0.0 0.4 0.3 0.2 0.0

0.1

urb

1991

0.00 0.10 0.20 0.30 G

0.12

eo

1987

0.0 0.1 0.2 0.3 0.4

1983

ble; tambi´en es f´acilmente comprensible la teor´ıa que sustenta a este m´etodo. La regresi´on de Goodman presenta limitaciones que el mismo autor explicit´o claramente, sin embargo al inscribir el problema en el marco de las regresiones lineales permite el acceso a herramientas muy u ´tiles, como son las asociadas al diagn´ostico del modelo. Por ejemplo, permiti´o detectar el papel que juega el distrito de La Plata en la estimaci´on del proporci´on de universitarios que votan al PJ. Varios autores han insistido (ver por ejemplo Freedman, 2001) en que la correlaci´on que se observa en los datos agrupados, no siempre es trasladable a comportamientos individuales. Al hacerlo se puede caer en la llamada falacia ecol´ogica, conocida en la literatura estad´ıstica como paradoja de Simpson (1951). Por ejemplo, si la proporci´on de empleados/obreros que votan al PJ tomara valores muy diferentes entre los distritos, estar´ıamos buscando un modelo unificado para realidades que no son homog´eneas. Otra posible fuente de inferencias err´oneas es la presencia de “confounders” o terceras variables que no son tenidas en cuenta en forma expl´ıcita, pero que interact´ uan con los factores que se est´an analizando. Podr´ıa suceder por ejemplo, que los distritos con mayor concentraci´on urbana sean, a su vez, los que tienen una alta proporci´on de universitarios y que

56

ESTADÍSTICA (2010), 62, 179, pp. 45-57

12 fuera esta u ´ltima caracter´ıstica la que, a nivel individual, est´e correlacionada negativamente con votos al PJ. Podr´ıa suceder entonces que, a nivel individual, la correlaci´on entre “urbano” y “voto al PJ ” sea positiva, dando lugar a una falacia ecol´ogica. No hay remedio para este tipo de situaciones, salvo el ojo experto del investigador que estudia el fen´omeno y advierte esta posibilidad. La identificaci´on de distritos con comportamiento at´ıpico podr´ıa ayudar en este sentido. En cuanto a futuras l´ıneas de trabajo, en el an´alisis de estos datos electorales, consideramos que los pr´oximos pasos a seguir son: (i) incorporar covariables en un modelo multivariado, (ii) considerar medidas repetidas, analizando las tres votaciones en conjunto, y (iii) incorporar las correlaciones espaciales. Referencias KING, G. and BENOIT, K. (2003). “EzI A(n easy) program for ecological inference.” Harvard University, Cambridge, http://gking.harvard.edu.au. BRUSCO, V., NAZARENO, M., and STOKES, S. (2004). “Vote buying in Argentina.” Latin American Research Review. 39: 66–88 CALVO, E. y ESCOLAR, M. (2005). La Nueva Pol´ıtica de Partidos en la Argentina. Editorial Prometeo. CANTON, D. y JORRAT, J. R. (2007). Elecciones en la Ciudad 1864–2007. Instituto Hist´orico de la Ciudad de Buenos Aires. DUNCAN, O. D. and DAVIS, B. (1953). “An Alternative to Ecological Correlation.” American Sociological Review. 18: 665–666. ´ FERRARI, M. RICCI, L. y SUAREZ, F. (2009). “El voto peronista bonaerense entre los comienzos y la consolidaci´on de la transici´on democr´atica. An´alisis de resultados electorales en los comicios provinciales (1983–1991)”. IX Congreso Nacional de Ciencia Pol´ıtica. SAAP. Santa F´e, 2009. Publicado en actas. FREEDMAN, D. A. (2001). “Ecological inference and the ecological fallacy.” En N. J. Smelser y P. B. Baltes (ed.) International Enciclopedia of the Social and Behavioral Sciences. 6. Elsevier, New York. GERMANI, G. (1973). “El surgimiento del peronismo: El rol de los obreros y de los migrantes internos”. Desarrollo Econ´omico. 13 (51): 435–488. GOODMAN, L. (1959). “Some Alternatives to Ecological Correlation.” American Journal of Sociology. 64: 610–624. HUDSON, L., MOORE, L. et al (2010). “Ecological inference techniques: an empirical evaluation using data describing gender and voter turnout at New Zealand

RICCI et al.: Inferencia ecológica en elecciones a Gobernador de la Provincia...

57

13 elections, 1893–1919.” Journal Royal Statististical Society, Series A. 173: 185– 213. IMAI, K., LU, Y., and STRAUSS, A. (en prensa). “ eco: R Package for Ecological Inference in 2 × 2 Tables.” Journal of Statistical Software. IMAI, K., LU, Y., and STRAUSS, A. (2008). “Bayesian and Likelihood Inference for 2 × 2 Ecological Tables: An Incomplete Data Approach.” Political Analysis. 16: 41–69. KING, G. (1997). A Solution to the Ecological Inference Problem. Princeton University Press, Princeton NJ. KING, G., ROSEN, O., and TANNER, M. A. (2004). Ecological Inference. New methodological strategies. Cambridge University Press, Cambridge. LEVITZKY, S. (2003). Transforming Labor-Based Parties in Latin America: Argentine Peronism in Comparative Perspective. Cambridge University Press, Cambridge. LUPU, N. and STOKES, S. (2009). “The Social Bases of Political Parties in Argentina, 1912–2003.” Latin American Research Review. 44: 58–87. PRATES, A. (1999). An´alisis de los Resultados Electorales de la Provincia de Buenos Aires (1983–1997). Editorial Centro de Estudios para la Nueva Mayor´ıa, Buenos Aires. R DEVELOPMENT CORE TEAM (2009). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, http://www.R-project.org. ROMERO, L. A. (2001). Breve Historia Contempor´ anea de la Argentina, 2da. Edici´on Ampliada. Fondo de Cultura Econ´omica, Buenos Aires. ´ (2004). “A structured comparison of SILVA DE MATOS, R. and VEIGA, A. Goodman regression, the truncated normal and the binomial-beta hierarchical methods for ecological inference.” Ecological Inference. New methodological strategies. Cambridge University Press, Cambridge. SIMPSON, E. H. (1951). “The interpretation of interaction in contingency tables.” Journal of the Royal Statistical Society, Series B. 2: 238–41.

Received November 2009 Revised September 2010

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.