Head/tails breaks para análisis de proporción poblacional histórica

July 8, 2017 | Autor: Francisco Pesante | Categoría: Economic History, Population Dynamics, Social History, Census data, Geographic Information Systems (GIS)
Share Embed


Descripción

Head/tails breaks para análisis de proporción poblacional histórica Francisco J. Pesante González, MA. Instituto de Estadísticas de Puerto Rico Conferencia de Estudios Poblacionales, UPR-Cayey (15 de noviembre de 2013) Figura 2. Clases en Cuantiles

Introducción

En la revisión de la literatura se identificó y se probó la propuesta de Bin Jiang en su esquema de head/trails break para establecer los intervalos de clase (2011). Esto con miras a identificar el efecto del método en la representación de los datos con proporción de población sesgados (ver figura 1) para la población histórica de Puerto Rico.

El uso de los Sistemas de Información Geográfica (GIS en inglés) en los estudios históricos de población, enriquecen la capacidad de investigación al aportar el elemento espacial de análisis a la historia (disciplina que se vale principalmente del elemento temporal). Algunos de los retos al analizar los productos históricos del censo a través de los GIS, están en la capacidad de comparar sus resultados a lo largo de las décadas. Este trabajo buscó generar, mediante el programa Quantum GIS 1.8.0 (QGIS), mapas coropletas que permitan una buena representación de las proporciones poblacionales, y que permitan comparar la proporción poblacional a través de las décadas. En el ejercicio se probaron los intervalos de clase que genera QGIS y se exploró una nueva metodología de intervalos de clase: el método head/tails (Jiang, 2011) para conocer cuál de estos facilita la representación y la comparación de la información poblacional a lo largo del tiempo.

Figura 5. Proporción poblacional por municipios (1899, 1940, 1980 y 2010)

Para efectos de incluir en las representaciones gráficas, grupos de proporción poblacional mayor, Jing nos presentó su modelo de head/tails breaks para establecer una jerarquía de datos que resulte más representativa. En lo que sería una distribución normal sesgada, la cabeza contiene menos datos de mayor valor, mientras la cola de la distribución cuenta con más datos de menor valor (2011).

Figura 3. Clases en Natural Breaks

Habitantes

Para efectos de la clasificación de datos en intervalos “naturales” que demuestre las propiedades de una distribución sesgada, el método propuesto por Jiang corresponde en determinar la media aritmética de todos los datos, tomando como base de esta la primera clase la proporción poblacional más baja y como tope de la clase la media. Se identifica la media aritmética para aquellos datos mayores a la media, generando el segundo intervalo de clase. El proceso se repite para el Datos grupo de datos cuyo valor sea mayor a esta segunda media, Al generar los mapas de proporción poblacional para cada década, se generando el tercer intervalo de clase, repitiendo el proceso descrito Al utilizar los datos del censo decenal de población generados por el pudo percibir una variación en los intervalos de clases que dificulta la hasta que el máximo valor constituya una clase en sí. U.S. Census Bureau (Centro de Datos Censales, 2012), la comparación comparación de la proporción poblacional a lo largo de las décadas2. de población municipal para las distintas décadas presenta la También se observó que las proporciones poblacionales más altas dificultad de establecer intervalos de clase comparables. Esto debido pueden quedar agrupadas en la misma clase junto a aquellas más Resultados al gran crecimiento poblacional experimentado en el siglo XX (ver pequeñas (ver tabla 1). Figura 1). En el ejercicio de generar las clases a partir del método de head/tails breaks en QGIS, se logró la gradación progresiva o jerárquica de las Tabla 1. Intervalos de clase en Cuantiles y Natural Breaks Figura 1. Cantidad de habitantes por municipios 1899-2010 proporciones poblacionales de los municipios, a lo largo de las 1899 1940 1980 2010 décadas. A su vez en las clases generadas no se presentó variaciones Conclusiones Cuantiles 0.4 – 0.84 0.05 – 0.63 0.04 – 0.59 0.05 – 0.548 500,000 1899 sustanciales provocadas por los valores extremos (ver tabla 2). 0.84 – 1.11 0.63 – 0.86 0.59 - 0.698 0.548 - 0.806 450,000 1910 El método de head/tails break resultó útil para dar mayor jerarquía a 1.11 – 1.34 0.86 – 1.06 0.698 - 0.92 0.806 - 1.08 1920 400,000 los datos de los municipios de mayor proporción poblacional. Además Tabla 2. Clases para proporciones poblacionales por municipios, clases 1.34 – 1.9 1.06 – 1.53 0.92 - 1.228 1.08 - 1.366 1930 350,000 head/tails 1.9 – 5.82 1.53 – 12.7 1.228 - 13.6 1.366 - 10.61 permitió establecer intervalos de clase comparables para la 1940 300,000 Jenks Natural 0.4 – 1.0 0.05 – 0.79 0.04 – 0.83 0.05 – 0.83 representación de las proporciones poblacionales para cada década. 1950 250,000 200,000

1960

150,000

1970

100,000

1980

50,000

1990 2000

0 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77

2010

Ranking

Breaks

1.0 - 1.69 1.69 - 2.93 2.93 – 4.81 4.81 - 5.82

0.79 - 1.29 1.29 - 2.28 2.28 - 5.62 5.62 - 12.7

0.83 - 1.71 1.71 - 3.69 3.69 - 6.14 6.14 - 13.6

0.83 - 1.64 1.64 - 2.63 2.63 - 5.59 5.59 - 10.61

El problema de comparación de proporciones y de agrupación se puede atender aumentando la cantidad de clases. Pero, al aumentar la cantidad de clases se diluye el efecto de contraste dificultando la identificación de cada clase en el mapa.

Debido a la gran variación poblacional de los municipios a lo largo del siglo XX, se utilizó las proporciones de población por municipio (Porta, La dificultad para comparar las proporciones poblacionales a lo largo de las décadas y combinar grandes proporciones poblacionales con 2008) para los datos individuales de cada década donde: aquellas no tan grandes, se debe a la disparidad en las proporciones poblacionales y la existencia de valores extremos (ver figura 4). Esto afecta la distribución de los datos en los distintos intervalos de clase, afectando la representación gráfica en los mapas coropletas. Metodología El uso de proporciones de población por municipio de Puerto Rico por década permitió mediante el uso de QGIS la generación de intervalos de clases en los mapas coropletas1 para las décadas de 1899 a 2010. Los intervalos de clase Jenks Natural y Cuantiles ilustraron efectivamente la distribución poblacional de la isla (ver figuras 2 y 3).

1899 0.4 – 1.52 1.52 – 2.59 2.59 – 4.14 4.14 – 5.08 5.08 – 5.82

1940 0.05 – 1.32 1.32 – 2.68 2.68 – 5.79 5.79 – 12.71

1980 0.04 – 1.28 1.28 – 3.61 3.61 – 6.91 6.91 – 13.6

2010 0.05 – 1.28 1.28 – 2.98 2.98 – 5.85 5.85 – 10.61

Para establecer intervalos de clase que permitan comparar y analizar las proporciones poblacionales por municipios, se aplicó el método head/tails break. Esto a 900 datos de proporción poblacional para los municipios desde 1899 al 2010. Para estos intervalos de clase generados se identificó la frecuencia de la proporción poblacional habida para las distintas décadas (tabla 3). Tabla 3. Distribución de frecuencia de proporciones poblacionales por municipio, clases head/tails

Figura 4. Proporción poblacional por cuartiles 0.02 – 1.33 1.33 – 2.93 2.93 – 5.98 5.98 – 11.12 11.12 – 19.22

1899 (ƒ) 39 22 5 0 0

1940 (ƒ) 55 16 3 0 1

1980 (ƒ) 64 8 4 1 1

2010 (ƒ) 61 12 4 1 0

Aplicando los intervalos de clase head/tails para la serie 1899-2010 a la representación gráfica de proporción poblacional de municipio por década, se generaron los resultados contenidos en la Figura 5.

En la aplicación del método head/tails breaks se logró generar mapas coropletas que sintetizan gráficamente observaciones recogidas en la literatura sobre migración interna histórica de Puerto Rico. En particular, sobre la mayor concentración y disparidad en la proporción poblacional de los municipios según se fue desarrollando el siglo XX. Lo anterior es un punto de partida para poder analizar en futuros estudios mediante las herramientas del GIS, los movimientos y concentración históricos de población en Puerto Rico a la luz de otras variables culturales, sociales, políticas o económicas. Referencias • Centro de Datos Censales y Estadísticas de Salud. (2012) Población total por municipios, Puerto Rico: 1899-2010. Programa Graduado de Demografía. UPR-Ciencias Médicas. • Jiang, B. (November 2011). Head/tails Breaks: A New Classification Scheme for Data with a Heavy-tailed Distribution. Extraído de http://arxiv.org/ftp/arxiv/papers/1209/1209.2801.pdf • León, L. (Septiembre 1998). Crecimiento y distribución de la población de Puerto Rico durante el presente siglo. CIDE 2(2). • Peterson, M. (2008). Choropleth map. En K. Karen (Ed.), Encyclopedia of Geographic Information Science (p. 38). SAGE Publications, Inc. Extraído de http://dx.doi.org.ezproxy.apollolibrary.com/10.4135/9781412953962 • Proportion. En (2008). M. Porta, S. Greenland & J. (Eds.), A Dictionary of Epidemiology (p. 197). New York, NY: Oxford University Press. • Rosado, I. (Noviembre 2011). Crecimiento, concentración y distribución de la población de Puerto Rico: 1899-2000. Revista Electrónica CIDE digital 2(2). • Ruggles, S. & Menard, R. (1995). The Minnesota Historical census projects. Historical Methods, 28(1), 610. Choropleth Map: A methods of statistical mapping, common in quantitative mappings that involve the progression of gray shadings or sequence of colors to represent interval or ratio data over areas (Peterson, 2008). 2 Por limitación de espacio se representan los datos del inicio y fin de la serie histórica, en adición a la información para dos décadas intermedia. 1

Contacto: [email protected] / [email protected]

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.