Análisis estadístico de la población de la provincia de Imbabura

June 24, 2017 | Autor: M. Ruiz Hinojosa | Categoría: Statistics, Probability and statistics, Estadistica, Estadística y probabilidad
Share Embed


Descripción








ESCUELA POLITÉCNICA NACIONAL
Facultad de Ingeniería Química y Agroindustria
Probabilidad y Estadística
Proyecto No. 1
ANÁLISIS ESTADÍSTICO DE LA POBLACIÓN DE LA PROVINCIA DE IMBABURA. PRIMERA PARTE
Asesor:
Ing. Patricio Flor
Integrantes:
Ana María Álvarez
Elvia Verónica Guachambala
María Gabriela Ruiz
Grupo No. 6
POBLACIÓN RURAL POR AÑOS DE LA PROVINCIA DE IMBABURA
Año
Población
1981
163509
1982
163681
1983
165071
1984
164515
1985
165847
1986
167048
1987
168322
1988
169651
1989
171024
1990
172426
1991
173211
1992
174050
1993
174917
1994
175799
1995
176677
1996
176514
1997
176539
1998
176509
1999
176425
2000
176354
2001
176456
2002
176424
2003
176350
2004
176276
2005
176209
2006
175816
2007
175413
2008
175016
2009
174625
2010
174241

Introducción
La población afecta a todos los aspectos de nuestro mundo, desde las oportunidades económicas hasta los cambios en el medio ambiente y en las experiencias de la vida cotidiana. La comprensión de las tendencias a largo plazo resulta esencial para efectuar las proyecciones necesarias para una planificación inteligente en las áreas de economía, protección del medio ambiente y sanidad. Las preferencias culturales, los incentivos económicos y las políticas gubernamentales que generan los cambios demográficos presentan ciertas analogías, pero no se pueden reducir a una simple fórmula o generalización.
Una de las tendencias de la población global, la rápida urbanización, proporciona una mejor calidad de vida. Tres cuartas partes de la población de los países industrializados y un tercio de los que están en vías de desarrollo vive en núcleos urbanos. Para el año 2025, dos tercios de la población mundial tendrá carácter urbano, y Ecuador no puede ser la excepción.
Ecuador es uno de los países de Sudamérica con mayor porcentaje de población indígena. Por este motivo, hemos decidido analizar el crecimiento (o decrecimiento) de la población de Imbabura, una de las provincias con una significativa cantidad de indios puros. Nos interesa saber que ha pasado, está pasando y pasará con la población rural en esta provincia y, de ser posible, realizar algunas predicciones respecto a ello.
El censo de población y viviendas es un instrumento fundamental para conocer la realidad demográfica y socio - económica de un país. El tamaño de la población y su estructura por edades, sus condiciones de vida, cómo se distribuye en el territorio nacional, la situación de la educación de los niños y jóvenes, el estado del empleo, la cantidad y calidad de las viviendas y cobertura de los servicios básicos, son algunos de los aspectos que el Censo permite conocer.
En este sentido, los censos de población y vivienda dan cuenta de la evolución demográfica del país y por lo tanto de las transformaciones sociales y económicas que vive en cada período intercensal. Además, a partir de las informaciones recogidas en los mismos, se construye una base de datos que ayuda a conformar, junto con otras fuentes de información, el Sistema Estadístico Nacional.
El censo constituye la única fuente de información que proporciona datos a nivel de distritos y localidades, indispensable para el proceso de descentralización, que permitirá la mejor asignación de recursos, planificación de actividades y organización de los esfuerzos colectivos a nivel local.
Objetivos
Objetivo General
El presente proyecto estadístico tiene por objetivo general producir información confiable para el conocimiento de las características más relevantes de la población rural de la provincia de Imbabura desglosada por años. Esta información permitirá obtener una visión general del crecimiento demográfico en dicha provincia.
Objetivos Específicos
Recolectar, organizar, describir y analizar la información obtenida acerca de la población rural de la provincia de Imbabura.
Predecir el comportamiento de la población rural de la provincia de Imbabura, en base a la muestra analizada.
Utilizar algunos de los beneficios de los censos para realizar el análisis de los datos. Entre éstos, están a los siguientes:
Recuento de la población
Mediante el Censo de Población se determina el número de habitantes del Estado, de las comunidades autónomas, de las provincias y de los municipios, así como de las entidades y núcleos de población.
Conocimiento de la estructura de la población
El Censo de Población, mediante la investigación de las características geográficas, demográficas, culturales, económicas y sociales de los habitantes, facilita una imagen estructural de la población que sirve de base para la elaboración de políticas demográficas, económicas y sociales, que, ineludiblemente, tienen como referencia básica el factor humano.
Servir de base para estudios demográficos
El Censo de Población permite obtener datos que son indispensables para el estudio de la evolución de la población.
Servir de base para la elaboración de estadísticas por muestreo
Los Censos de Población y Viviendas han suministrado tradicionalmente el marco para las encuestas por muestreo. Por una parte, permiten calcular los parámetros que son necesarios para orientar la metodología muestral; por otra, los distintos directorios censales, perfectamente informatizados, podrán utilizarse para la selección directa de las distintas unidades estadísticas (municipio, sección, manzana, vivienda familiar, persona).
Proceso Estadístico
Definición de características, población y parámetros
Característica: Población (número total de habitantes) rural anual de la provincia de Imbabura.
Población: Habitantes de la provincia de Imbabura.
En el presente análisis estadístico no vamos a circunscribir nuestra población, en el sentido de que no se va a considerar un sector en especial, sino estudiaremos a toda la población rural imbaburense.
Sin embargo, sí se va a limitar la muestra en lo que se refiere a los años que se van a examinar. Es decir, el estudio se lo hará a partir del año 1981 hasta el año 2010.
Parámetros: En la historia del Ecuador sólo se han realizado 4 censos de población debido a los altos costos. Sin embargo, en lo que se refiere a nuestro análisis estadístico, nuestra inversión consiste únicamente en las copias de los datos obtenidos por el INEC.
Diseño Muestral
La información fue obtenida a partir de los datos recolectados por el INEC en cada uno de los censos de población que se han realizado (Anexo 1). Además, acudiremos a varias fuentes de Internet para completar los datos y lograr así un análisis estadístico confiable a partir de datos confiables.
Periodos de referencia
El trabajo estadístico se realizará a medida que transcurra el bimestre. La información fue obtenida el día martes, 23 de septiembre de 2008, en las instalaciones del Instituto Nacional de Estadísticas y Censos (INEC).
Tratamiento de los datos
Ordenación
163509
175016
163681
175413
164515
175799
165071
175816
165847
176209
167048
176276
168322
176350
169651
176354
171024
176424
172426
176425
173211
176456
174050
176509
174241
176514
174625
176539
174917
176677
Máximo: 176677
Mínimo: 163509
Tamaño de la muestra: 30
Rango
R=máx-mín
R=176677-163509
R=13168
Intervalos
i=n
i=30
i=5.48 5i=1+3.322logn
i=1+3.322log30
i=5.9 6
Analizando cada una de las respuestas que hemos obtenido con los diferentes métodos, hemos decidido escoger el número de intervalos impar, es decir 5, pues estamos conscientes de las ventajas que nos traerá a lo largo de la realización del trabajo.
Ancho de Clase
A=Ri
A=131685
A=2633.6
A 2634
Límites de Clase
Límite Inferior de Clase
Límite Superior de Clase
LIC
LSC
163509
166143
166144
168778
168779
171413
171414
174048
174049
176683
Frecuencia Absoluta
Límite Inferior de Clase
Límite Superior de Clase
Frecuencia Absoluta
LIC
LSC
Fab
163509
166143
5
166144
168778
2
168779
171413
2
171414
174048
2
174049
176683
19


30
Fronteras de Clase
Precisión (P): 1
FIC=LIC-P2
FSC=LSC+P2
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Absoluta
FIC
FSC
Fab
163508.5
166143.5
5
166143.5
168778.5
2
168778.5
171413.5
2
171413.5
174048.5
2
174048.5
176683.5
19


30
Marca de Clase
x=FSC+FIC2
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Absoluta
Marca de Clase
FIC
FSC
Fab
x
163508.5
166143.5
5
164826
166143.5
168778.5
2
167461
168778.5
171413.5
2
170096
171413.5
174048.5
2
172731
174048.5
176683.5
19
175366


30

Ancho Real
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Absoluta
Marca de Clase
Ancho Real
FIC
FSC
Fab
x

163508.5
166143.5
5
164826
2635
166143.5
168778.5
2
167461
2635
168778.5
171413.5
2
170096
2635
171413.5
174048.5
2
172731
2635
174048.5
176683.5
19
175366
2635


30


Frecuencia Relativa
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Absoluta
Frecuencia Relativa
FIC
FSC
Fab
Frel
163508.5
166143.5
5
16.66
166143.5
168778.5
2
6.67
168778.5
171413.5
2
6.67
171413.5
174048.5
2
6.67
174048.5
176683.5
19
63.33


30
100
Frecuencias Acumuladas Absolutas
Frecuencia Acumulada "Menos"
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Absoluta
Frecuencia Acumulada "menos"
FIC
FSC
Fab
Fac "menos"
163508.5
166143.5
5
5
166143.5
168778.5
2
7
168778.5
171413.5
2
9
171413.5
174048.5
2
11
174048.5
176683.5
19
30
Frecuencia Acumulada "Más"
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Absoluta
Frecuencia Acumulada "más"
FIC
FSC
Fab
Fac "más"
163508.5
166143.5
5
30
166143.5
168778.5
2
25
168778.5
171413.5
2
23
171413.5
174048.5
2
21
174048.5
176683.5
19
19
Frecuencias Acumuladas Relativas
Frecuencia Acumulada "Menos" Relativa
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Acumulada "menos"
Frecuencia Acumulada "menos" Relativa
FIC
FSC
Fac "menos"
Fac "menos" rel
163508.5
166143.5
5
8.06
166143.5
168778.5
7
11.29
168778.5
171413.5
9
14.52
171413.5
174048.5
11
17.74
174048.5
176683.5
30
48.39


62
100
Frecuencia Acumulada "Más" Relativa
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Acumulada "más"
Frecuencia Acumulada "más" Relativa
FIC
FSC
Fac "más"
Fac "más" rel
163508.5
166143.5
30
25.42
166143.5
168778.5
25
21.19
168778.5
171413.5
23
19.49
171413.5
174048.5
21
17.80
174048.5
176683.5
19
16.10


118
100
Histogramas y polígonos de frecuencia

Frecuencia Absoluta
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Absoluta
Marca de Clase
FIC
FSC
Fab
x
163508.5
166143.5
5
164826
166143.5
168778.5
2
167461
168778.5
171413.5
2
170096
171413.5
174048.5
2
172731
174048.5
176683.5
19
175366


30



Frecuencia Relativa
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Relativa
Marca de Clase
FIC
FSC
Frel
x
163508.5
166143.5
16.66
164826
166143.5
168778.5
6.67
167461
168778.5
171413.5
6.67
170096
171413.5
174048.5
6.67
172731
174048.5
176683.5
63.33
175366


100



Frecuencias Acumuladas Absolutas
Frecuencia Acumulada "Menos"
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Acumulada "menos"
Marca de Clase
FIC
FSC
Fac "menos"
x
163508.5
166143.5
5
164826
166143.5
168778.5
7
167461
168778.5
171413.5
9
170096
171413.5
174048.5
11
172731
174048.5
176683.5
30
175366


Frecuencia Acumulada "Más"
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Acumulada "más"
Marca de Clase
FIC
FSC
Fac "más"
x
163508.5
166143.5
30
164826
166143.5
168778.5
25
167461
168778.5
171413.5
23
170096
171413.5
174048.5
21
172731
174048.5
176683.5
19
175366


Frecuencias Acumuladas Relativas
Frecuencia Acumulada "Menos" Relativa
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Acumulada "menos" Relativa
Marca de Clase
FIC
FSC
Fac "menos" rel
x
163508.5
166143.5
8.06
164826
166143.5
168778.5
11.29
167461
168778.5
171413.5
14.52
170096
171413.5
174048.5
17.74
172731
174048.5
176683.5
48.39
175366


100



Frecuencia Acumulada "Más" Relativa
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Acumulada "más" Relativa
Marca de Clase
FIC
FSC
Fac "más" rel
x
163508.5
166143.5
25.42
164826
166143.5
168778.5
21.19
167461
168778.5
171413.5
19.49
170096
171413.5
174048.5
17.80
172731
174048.5
176683.5
16.10
175366


100



Ojivas
Ojiva "Menos"
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Acumulada "menos"
Marca de Clase
FIC
FSC
Fac "menos"
x
163508.5
166143.5
5
164826
166143.5
168778.5
7
167461
168778.5
171413.5
9
170096
171413.5
174048.5
11
172731
174048.5
176683.5
30
175366


Ojiva "Más"
Frontera Inferior de Clase
Frontera Superior de Clase
Frecuencia Acumulada "más"
Marca de Clase
FIC
FSC
Fac "más"
x
163508.5
166143.5
30
164826
166143.5
168778.5
25
167461
168778.5
171413.5
23
170096
171413.5
174048.5
21
172731
174048.5
176683.5
19
175366


Medidas de Tendencia Central
Media Aritmética
x=130j=130xj
x=130j=110xj+j=1120xj+j=2130xj
j=110xj=163509+163681+164515+165071+165847+167048+168322+169651+171024+172426
j=110xj=1671094
j=1120xj=173211+174050+174241+174625+174917+175016+175413+175799+175816+176209
j=1120xj=1749297
j=2130xj=176276+176350+176354+176424+176425+176456+176509+176514+176539+176677
j=2130xj=1764524
x=1301671094+1749297+1764524
x=1305184915
x=172830.5
xsa=172830.5
Media Aritmética de Datos Agrupados
Frecuencia Absoluta
Marca de Clase
Fab
x
5
164826
2
167461
2
170096
2
172731
19
175366
x=130j=15fjxj
x=1305×164826+2×167461+2×170096+2×172731+19×175366
x=1305176660
x=172555.33
xda=172555.33
Media Aritmética Codificada
Frecuencia Absoluta
Marca de Clase

Fab
x
v
5
164826
-4
2
167461
-3
2
170096
-2
2
172731
-1
19
175366
0
x=x0+wnj=14fjvj
x=175366+2635305×-4+2×-3+2×-2+2×-1
x=175366+263530-32
x=175366-2810.67
x=172555.33
xcod=172555.33
Mediana
n=30 n es par
n2=15 Dato=174917
n2+1=16 Dato=175016
m=Daton2+Daton2+12
m=174917+1750162
m=174966.5
msa=174966.5
Mediana a partir de datos agrupados
Determinación de la clase mediana:

w=2635
A1=2635×5=13175
A2=2635×2=5270
A3=2635×2=5270
A4=2635×2=5270
A5=2635×19=50065
A1+A2+A3+A4=28985
A1+A2+A3+A4B=0.0893
Mediante el uso de la tabla:
P0.0893=B=1.73

Mediante la ecuación:
Pz,1,0=12πe-z22
0.0893=12πe-z22
z=±1.73
Muestreo
En el presente trabajo de investigación, a pesar de que se han utilizado datos obtenidos mediante censos, podemos decir que hemos preferido un muestreo, y en este caso ha sido de juicio. Decimos que hemos trabajado con una muestra, pues de la población total que se ha consultado en los censos, analizamos únicamente la población rural de la provincia de Imbabura, y en un período determinado de tiempo (1981 – 2010).
En cuanto a que el muestreo que empleamos es de juicio, hacemos esta afirmación pues elegimos los elementos que van a formar parte de la muestra de acuerdo al objetivo, negándoles a los demás elementos de la población la oportunidad de ser elegidos.
Sin embargo, para la aplicación de muestreo en el trabajo, a partir de este punto vamos a suponen una población de 30 datos.
Muestreo aleatorio
Sea la población:
Número Asignado
Dato
1
163509
2
163681
3
164515
4
165071
5
165847
6
167048
7
168322
8
169651
9
171024
10
172426
11
173211
12
174050
13
174241
14
174625
15
174917
16
175016
17
175413
18
175799
19
175816
20
176209
21
176276
22
176350
23
176354
24
176424
25
176425
26
176456
27
176509
28
176514
29
176539
30
176677
Seleccionaremos una muestro de 7 datos, para lo cual acudiremos a la tabla de números aleatorios: Columna 7 y de ésta la columna 4:
Número Aleatorio
Dato
17
175413
75
No disponible
14
174625
40
No disponible
90
No disponible
80
No disponible
98
No disponible
29
176539
05
165847
31
No disponible
88
No disponible
61
No disponible
74
No disponible
22
176350
42
No disponible
36
No disponible
45
No disponible
86
No disponible
37
No disponible
11
173211
69
No disponible
96
No disponible
65
No disponible
79
No disponible
48
No disponible
93
No disponible
28
176514
Sin embargo, como esta selección de los elementos de la muestra nos puede traer problemas en la realización del presente trabajo, no la utilizaremos es los cálculos posteriores.
Tamaño de la Muestra
Tamaño de la muestra en el total poblacional
Considerando a los datos con los que hemos trabajado hasta el momento como una población, tenemos que:
N=30
σ=4545,214
Para un nivel de confianza de ±2σ, es decir de 95.5%.
E=0.045
η=4N2σ2E2+4Nσ2
η=43024545,21420.0452+4304545,2142
η=30
Tamaño de la muestra para la media poblacional
Considerando a los datos con los que hemos trabajado hasta el momento como una población, tenemos que:
N=30
σ=4545,214
Para un nivel de confianza de ±2σ, es decir de 95.5%.
E=0.045
η=4Nσ2NE2+4σ2
η=4304545,2142300.0452+44545,2142
η=30
Error Estándar
Utilizando las medias
Sea la población:
163509
163681
165071
164515
165847
167048
168322
169651
171024
172426
173211
174050
174917
175799
176677
176514
176539
176509
176425
176354
176456
176424
176350
176276
176209
175816
175413
175016
174625
174241
Donde cada fila representa una muestra.
Muestra 1
163509
163681
165071
164515
165847
167048
Muestra 2
168322
169651
171024
172426
173211
174050
Muestra 3
174917
175799
176677
176514
176539
176509
Muestra 4
176425
176354
176456
176424
176350
176276
Muestra 5
176209
175816
175413
175016
174625
174241
Media de cada muestra
x=1ni=1nxi
x1=16163509 + 163681 + 165071 + 164515 + 165847 + 167048
x1=16989671
x1=164945,167
x2=16168322 + 169651 + 171024 + 172426 + 173211 + 174050
x2=161028684
x2=171477,333
x3=16174917 + 175799 + 176677 + 176514 + 176539 + 176509
x3=161056955
x3=176159,167
x4=16176425 + 176354 + 176456 + 176424 + 176350 + 176276
x4=161058285
x4=176380,833
x5=16176209 + 175816 + 175413 + 175016 + 174625 + 174241
x5=161051320
x5=175220







x
Muestra 1
163509
163681
165071
164515
165847
167048
164945,167
Muestra 2
168322
169651
171024
172426
173211
174050
171447,333
Muestra 3
174917
175799
176677
176514
176539
176509
176159,167
Muestra 4
176425
176354
176456
176424
176350
176276
176380,833
Muestra 5
176209
175816
175413
175016
174625
174241
175220
xx=1nj=1nxj
xx=15164945,167 + 171447,333 + 176159,167 + 176380,833 + 175220
xx=15864152,5
xx=172830,5

x
x-xx
x-xx2
Muestra 1
164945,167
– 7885,33333
62178481,8
Muestra 2
171447,333
– 1383,16667
1913150,03
Muestra 3
176159,167
3328,66667
11080021,8
Muestra 4
176380,833
3550,33333
12604866,8
Muestra 5
175220
2389,5
5709710,25
σx=1nj=1nxj-xx2
σx=62178481,8 + 1913150,03 + 11080021,8 + 12604866,8 + 5709710,255
σx=1593486230,6
σx=4324,03
Utilizando la fórmula
σ=4545,214
N=30
n=6
σx=σn
σx=4545,2146
σx=1855,58
Utilizando el factor corrector:
σx=σnN-nN-1
σx=4545,214630-630-1
σx=1688,05
Porcentaje de Error
Sean:
σxmedias=4324,03
σxformula=1688,05
E=σxmedias-σxformulaσxmedias×100%
E=4324,03-1688,054324,03×100%
E=60,96%
Como notamos que el porcentaje de error es inaceptable, procuraremos disminuirlo aumentando el número de muestras:
Utilizando las medianas
Sea la población:
163509
163681
165071
164515
165847
167048
168322
169651
171024
172426
173211
174050
174917
175799
176677
176514
176539
176509
176425
176354
176456
176424
176350
176276
176209
175816
175413
175016
174625
174241
Donde cada fila representa una muestra.
Muestra 1
163509
163681
165071
164515
165847
Muestra 2
167048
168322
169651
171024
172426
Muestra 3
173211
174050
174917
175799
176677
Muestra 4
176514
176539
176509
176425
176354
Muestra 5
176456
176424
176350
176276
176209
Muestra 6
175816
175413
175016
174625
174241
Media de cada muestra
x=1ni=1nxi
x1=15163509+163681+165071+164515+165847
x1=15822623
x1=164524,6
x2=15167048+168322+169651+171024+172426
x2=15848471
x2=169694,2
x3=15173211+174050+174917+175799+176677
x3=15874654
x3=174930,8
x4=15176514+176539+176509+176425+176354
x4=15882341
x4=176468,2
x5=15176456+176424+176350+176276+178209
x5=15881715
x5=176343
x6=15175816+175413+175016+174625+174241
x6=15875111
x6=175022,2






x
Muestra 1
163509
163681
165071
164515
165847
164524,6
Muestra 2
167048
168322
169651
171024
172426
169694,2
Muestra 3
173211
174050
174917
175799
176677
174930,8
Muestra 4
176514
176539
176509
176425
176354
176468,2
Muestra 5
176456
176424
176350
176276
176209
176343
Muestra 6
175816
175413
175016
174625
174241
175022,2
xx=1nj=1nxj
xx=16164524,6+169694,2+174930,8+176468,2+176343+175022,2
xx=161036983
xx=172830,5

x
x-xx
x-xx2
Muestra 1
164524,6
– 8305,9
68987974,8
Muestra 2
169694,2
– 3136,3
9836377,69
Muestra 3
174930,8
2100,3
4411260,09
Muestra 4
176468,2
3637,7
13232861,3
Muestra 5
176343
3512,5
12337656,3
Muestra 6
175022,2
2191,7
4803548,89
σx=1nj=1nxj-xx2
σx=68987974,8+9836377,69+4411260,09+13232861,3+12337656,3+4803548,896
σx=16113609679
σx=4351,43
Utilizando la fórmula
σ=4545,214
N=30
n=5
σx=σn
σx=4545,2145
σx=2032,68
Utilizando el factor corrector:
σx=σnN-nN-1
σx=4545,214530-530-1
σx=1887,3
Porcentaje de Error
Sean:
σxmedias=4351,43
σxformula=1887,3
E=σxmedias-σxformulaσxmedias×100%
E=4351,43-1887,34351,43×100%
E=56,63%
Como el porcentaje de error continúa siendo inaceptable, aumentaremos en número de muestras a 10 para disminuirlo:
Utilizando las medias
Sea la población:
163509
163681
165071
164515
165847
167048
168322
169651
171024
172426
173211
174050
174917
175799
176677
176514
176539
176509
176425
176354
176456
176424
176350
176276
176209
175816
175413
175016
174625
174241
Donde cada fila representa una muestra.
Muestra 1
163509
163681
165071
Muestra 2
164515
165847
167048
Muestra 3
168322
169651
171024
Muestra 4
172426
173211
174050
Muestra 5
174917
175799
176677
Muestra 6
176514
176539
176509
Muestra 7
176425
176354
176456
Muestra 8
176424
176350
176276
Muestra 9
176209
175816
175413
Muestra 10
175016
174625
174241
Media de cada muestra
x=1ni=1nxi
x1=13163509 + 163681 + 165071
x1=13492261
x1=164087
x2=13164515 + 165847 + 167048
x2=13497410
x2=165803,333
x3=13168322 + 169651 + 171024
x3=13508997
x3=169665,667
x4=13 172426 + 173211 + 174050
x4=13519687
x4=173229
x5=13174917 + 175799 + 176677
x5=13527393
x5=175797,667
x6=13 176514 + 176539 + 176509
x6=13529562
x6=176520,667
x7=13176425 + 176354 + 176456
x7=13529235
x7=176411,667
x8=13 176424 + 176350 + 176276
x8=13529050
x8=176350
x9=13176209 + 175816 + 175413
x9=13527438
x9=175812,667
x10=13 175016 + 174625 + 174241
x10=13523882
x10=174627,333




x
Muestra 1
163509
163681
165071
164087
Muestra 2
164515
165847
167048
165803,333
Muestra 3
168322
169651
171024
169665,667
Muestra 4
172426
173211
174050
173229
Muestra 5
174917
175799
176677
175797,667
Muestra 6
176514
176539
176509
176520,667
Muestra 7
176425
176354
176456
176411,667
Muestra 8
176424
176350
176276
176350
Muestra 9
176209
175816
175413
175812,667
Muestra 10
175016
174625
174241
174627,333
xx=1nj=1nxj
xx=110164087+165803,333+169665,667+173229+175797,667+176520,667+176411,667+176350+175812,667+174627,333
xx=1101728305
xx=172830,5

x
x-xx
x-xx2
Muestra 1
164087
– 8743,5
76448792,3
Muestra 2
165803,333
– 7027,16667
49381071,4
Muestra 3
169665,667
– 3164,83333
10016170
Muestra 4
173229
398,5
158802,25
Muestra 5
175797,667
2967,16667
8804078,03
Muestra 6
176520,667
3690,16667
13617330
Muestra 7
176411,667
3581,16667
12824754,7
Muestra 8
176350
3519,5
12386880,3
Muestra 9
175812,667
2982,16667
8893318,03
Muestra 10
174627,333
1796,83333
3228610,03
σx=1nj=1nxj-xx2
σx=11076448792,3+49381071,4+10016170+158802,25+8804078,03+13617330+12824754,7+12386880,3+8893318,03+3228610,03
σx=110195759807
σx=4424,475
Utilizando la fórmula
σ=4545,214
N=30
n=3
σx=σn
σx=4545,2143
σx=2624,18
Utilizando el factor corrector:
σx=σnN-nN-1
σx=4545,214330-330-1
σx=2532,075
Porcentaje de Error
Sean:
σxmedias=4424,475
σxformula=2532,075
E=4424,475-σxformulaσxmedias×100%
E=4424,475-2532,0754424,475×100%
E=44,77%
Es decir, se nota que a medida que aumenta el tamaño de la muestra, el error disminuye notablemente. Para llegar a un error menor trabajaremos con 15 muestras:
Utilizando las medias
Sea la población:
163509
163681
165071
164515
165847
167048
168322
169651
171024
172426
173211
174050
174917
175799
176677
176514
176539
176509
176425
176354
176456
176424
176350
176276
176209
175816
175413
175016
174625
174241
Donde cada fila representa una muestra.
Muestra 1
163509
163681
Muestra 2
165071
164515
Muestra 3
165847
167048
Muestra 4
168322
169651
Muestra 5
171024
172426
Muestra 6
173211
174050
Muestra 7
174917
175799
Muestra 8
176677
176514
Muestra 9
176539
176509
Muestra 10
176425
176354
Muestra 11
176456
176424
Muestra 12
176350
176276
Muestra 13
176209
175816
Muestra 14
175413
175016
Muestra 15
174625
174241
Media de cada muestra
x=1ni=1nxi
x1=12163509+163681
x1=12327190
x1=163595
x2=12165071+164515
x2=12329586
x2=164793
x3=12165847+167048
x3=12332895
x3=166447,5
x4=12168322+169651
x4=12337973
x4=168986,5
x5=12171024+172426
x5=12343450
x5=171725
x6=12173211+174050
x6=12347261
x6=173630,5
x7=12174917+175799
x7=12350716
x7=175358
x8=12 176677+176514
x8=12353191
x8=176595,5
x9=12176539+176509
x9=12353048
x9=176524
x10=12176425+176354
x10=12352779
x10=176389,5
x11=12176456+176424
x11=12352880
x11=176440
x12=12176350+176276
x12=12352626
x12=176313
x13=12176209+175816
x13=12352025
x13=176012,5
x14=12175413+175016
x14=12350429
x14=175214,5
x15=12174625 + 174241
x15=12348866
x15=174433



x
Muestra 1
163509
163681
163595
Muestra 2
165071
164515
164793
Muestra 3
165847
167048
166447,5
Muestra 4
168322
169651
168986,5
Muestra 5
171024
172426
171725
Muestra 6
173211
174050
173630,5
Muestra 7
174917
175799
175358
Muestra 8
176677
176514
176595,5
Muestra 9
176539
176509
176524
Muestra 10
176425
176354
176389,5
Muestra 11
176456
176424
176440
Muestra 12
176350
176276
176313
Muestra 13
176209
175816
176012,5
Muestra 14
175413
175016
175214,5
Muestra 15
174625
174241
174433
xx=1nj=1nxj
xx=115163595+164793+166447,5+168986,5+171725+173630,5+175358+176595,5+176524+176389,5+176440+176313+176012,5+175214,5+174433
xx=1152592457,5
xx=172830,5

x
x-xx
x-xx2
Muestra 1
163595
– 9235,5
85294460,3
Muestra 2
164793
– 8037,5
64601406,3
Muestra 3
166447,5
– 6383
40742689
Muestra 4
168986,5
– 3844
14776336
Muestra 5
171725
– 1105,5
1222130,25
Muestra 6
173630,5
800
640000
Muestra 7
175358
2527,5
6388256,25
Muestra 8
176595,5
3765
14175225
Muestra 9
176524
3693,5
13641942,3
Muestra 10
176389,5
3559
12666481
Muestra 11
176440
3609,5
13028490,3
Muestra 12
176313
3482,5
12127806,3
Muestra 13
176012,5
3182
10125124
Muestra 14
175214,5
2384
5683456
Muestra 15
174433
1602,5
2568006,25
σx=1nj=1nxj-xx2
σx=11585294460,3+64601406,3+40742689+14776336+1222130,25+640000+6388256,25+14175225+13641942,3+12666481+13028490,3+12127806,3+10125124+5683456+2568006,25
σx=115297681809
σx=4454,823
Utilizando la fórmula
σ=4545,214
N=30
n=5
σx=σn
σx=4545,2142
σx=3213,95
Utilizando el factor corrector:
σx=σnN-nN-1
σx=4545,214230-230-1
σx=3158,052
Porcentaje de Error
Sean:
σxmedias=4454,823
σxformula=3158,052
E=σxmedias-σxformulaσxmedias×100%
E=4454,823-3158,0524454,823×100%
E=29,11%
Y este es el mínimo porcentaje de error que se logró obtener para nuestro error estándar.
Estadística Inferencial
Estimación
Estimación Puntual
De la media
Sean:
x=172830,5
m=174966,5
E=m-xx×100%
E=174966,5-172830,5172830,5×100%
E=1,23%
Por lo tanto el error es aceptable, muy cercano a despreciable.
σ=4545,214
cv=2,63%
Probabilidad de exactitud=100%-cv
Probabilidad de exactitud=100%-2,63%
Probabilidad de exactitud=97,37%
MD=3814.067
HET=2.2% El grupo de datos es muy homogéneo.
Como el error que cuantifica la diferencia entre la media y la mediana es casi despreciable, el grupo de datos es muy homogéneo y la probabilidad de exactitud es 97,37% (mayor a 90%), entonces podemos decir que:
media de la muestra media poblacional
x μ
μ=172830,5
De la varianza y de la desviación estándar
σ=4545,214
σ2=20658975,38
cv=2,63%
Probabilidad de exactitud=100%-cv
Probabilidad de exactitud=100%-2,63%
Probabilidad de exactitud=97,37%
MD=3814.067
HET=2.2% El grupo de datos es muy homogéneo.
Dado que el grupo de datos es muy homogéneo y la probabilidad de exactitud es 97,37% (mayor a 90%), entonces podemos decir que:
desviación estándar de la muestra desviación estándar de la población
σ S
S=4545,214
Así, también se puede estimar que:
varianza de la muestra varianza de la población
σ2 S2
S2=20658975,38
De la porción de la población
Si de la cantidad de habitantes del sector rural de la provincia de Imbabura se desea conocer cuántos tenían deseos de migrar hacia el área urbana pero no lo hicieron por diversos factores que no nos conciernen, tomamos la muestra de 30 y averiguamos p=0,12, concluimos que de toda la población del área rural que deseaba migrar hacia la ciudad, sólo el 12% no lo pudo hacer.
Estimación del total poblacional
N=30
μ=172830,5
T=N×μ
T=30×172830,5
T=5184915
Intervalo de Confianza
Intervalo para el total poblacional con un 95,5% de confianza
Muestra 1
163509
163681
165071
164515
165847
Muestra 2
167048
168322
169651
171024
172426
Muestra 3
173211
174050
174917
175799
176677
Muestra 4
176514
176539
176509
176425
176354
Muestra 5
176456
176424
176350
176276
176209
Muestra 6
175816
175413
175016
174625
174241
N=30
η=5
σ=4545,214
T=±2σNηN-ηN
T=±24545,21430530-530
T=±111334,55
Intervalo de Confianza:
T±T
5184915±111334,55
5073580,45-5296249,55
Intervalo de confianza para la media poblacional
N=30
η=5
σ=4545,214
T=±2σ1ηN-ηN
T=±24545,2141530-530
T=±3711,15
Intervalo de Confianza
T±T
172830,5±3711,15
169119,35-176541,65
Porción poblacional
Se desea conocer la porción (p) de los 30 años, en los que se determinó el total de habitantes del área rural de la provincia de Imbabura, en los que el gobierno implantó una serie de medidas o incentivaciones para evitar esta migración a un nivel de confianza del 95,5%.
Para esto tomamos una muestra de 14 años (aquellos en los que la información solicitada estaba disponible).
Sea:
N=30
n=14
y=6
p=yn
p=614
p=37
Cálculo de q
q=1-p
q=1-37
q=47
Cálculo de p
p=±2pqn-1 N-nN
p=±2374714-1 30-1430
p=±0,2
Intervalo de la porción poblacional
p±p=37±0,2
835-2235
0,2285-0,6285
Tamaño de la muestra para una porción poblacional
A continuación estableceremos el tamaño de la muestra para un error (E) prefijado a un nivel de confianza del 59,5% ±2σ:
E=0,05
Sea:
N=30
n0=14
y=6
p=yn0
p=614
p=37
Cálculo de q
q=1-p
q=1-37
q=47
Cálculo de n
n=4NpqNE2+4pq
n=4303747300,052+43747
n=27,86 28
Por lo tanto, tendríamos que analizar 28 de los 30 años para un error prefijado de 0,05 y un nivel de confianza del 95,5%.
Tamaño máximo de la muestra
Sea:
N=30
E=0,05
n=NNE2+1
n=30300,052+1
n=27,90 28
Estimación de Intervalos de confianza
x=172830,5
σ=4545,214
Finalmente, tomaremos en este caso a la que hasta el momento hemos considerado como población como muestra, pues en realidad es una muestra y para esta parte final del trabajo hay que considerarla así. Por lo tanto:
n=30
σx=σn
σx=4545,21430
σx=829,839
Así, la población rural de la provincia de Imbabura real está en un rango:
Con un intervalo de confianza del 68,3%
x±σx
172830,5±829,839
172000,661-173660,339
Pero como nos referimos a personas:
172001-173660
Con un intervalo de confianza del 95,5%
x±2σx
172830,5±2829,839
171170,822-174490,178
Pero como nos referimos a personas:
171171-174490
Con un intervalo de confianza del 99,7%
x±3σx
172830,5±3829,839
170340,984-175320,016
Pero como nos referimos a personas:
170341-175320
Conclusiones
Nuestro grupo de datos es muy homogéneo, pues el valor de su desviación media no sobrepasó el 10% (2,2%).
De acuerdo al valor del coeficiente de variación (2,53%), podemos decir que los datos no están demasiado dispersos con respecto a la medida de tendencia central.
El valor negativo del sesgo nos reveló que la distribución de nuestros datos es sesgada hacia la izquierda, conclusión que fue confirmada por el diagrama de caja.
El porcentaje de habitantes del área rural de la provincia de Imbabura mayor a 176000 es 24,293%.
El porcentaje de habitantes del área rural de la provincia de Imbabura menor a 170000 es 26.67%.
El porcentaje de habitantes del área rural de la provincia de Imbabura entre 166800 y 180000 es 85.03%
El 20.36% de la población rural de la provincia de Imbabura durante los últimos 30 años se encuentra entre los 164600 y 169600 habitantes.
El 31.78% de la población rural de la provincia de Imbabura durante los últimos 30 años se encuentra entre los 174000 y 179200 habitantes.
Si deseáramos analizar alguna característica tomando como población a los datos de la cantidad de habitantes del área rural de Imbabura durante los últimos 30 años con una confiabilidad del 95,5%, tendríamos que tomar una muestra de 30 datos, es decir que la misma población sea la muestra. Esto significa que, como el tamaño de la población es tan pequeño y la confiabilidad que esperamos es alta, tendríamos que incluir a todos los datos en el análisis estadístico.
A medida que aumentamos el número de muestras de una población, la variación entre el error estándar calculado mediante las medias y el error estándar calculado mediante la fórmula disminuye.
Dado que nuestro grupo de datos es muy homogéneo y el coeficiente de variación que presentan también lo es, podemos estimar que:
La media de la muestra constituye la media de la población.
La desviación estándar de la muestra constituye la desviación estándar de la población.
La varianza de la muestra constituye la varianza de la población.
Así, la población rural de la provincia de Imbabura real está en un rango:
172001-173660 con un intervalo de confianza del 68,3%
171171-174490 con un intervalo de confianza del 95,5%
170341-175320 con un intervalo de confianza del 99,7%
Anexo 1
Fuentes: INEC, Ecuador:
ECUADOR: PROYECCIÓN DE LA POBLACIÓN TOTAL, SEGÚN REGIONES, PROVINCIAS, CANTONES Y ÁREAS. 1982 – 1995
PROYECCIÓN DE POBLACIÓN TOTAL POR AÑOS CALENDARIO SEGÚN PROVINCIAS.
Período 1990 – 2000
PROYECCIÓN DE POBLACIÓN URBANA POR AÑOS CALENDARIO SEGÚN PROVINCIAS.
Período 1900 - 2000
ECUADOR: DISTRIBUCIÓN RELATIVA DE LA PROYECCIÓN DE POBLACIÓN URBANA PROYECTADA POR AÑOS CALENDARIO SEGÚN PROVINCIAS, ORDENADA EN FORMA DESCENDENTE DE ACUERDO A SU MODIFICACIÓN RELATIVA EN EL PERÍODO 1990 – 2000.
PROYECCIÓN DE LA POBLACIÓN ECUATORIANA, POR AÑOS CALENDARIO, SEGÚN REGIONES, PROVINCIAS Y ÁREA.
PERÍODO 2001 – 2010
POBLACIÓN TOTAL DEL ÁREA RURAL
PROYECCIÓN DE LA POBLACIÓN ECUATORIANA, POR AÑOS CALENDARIO, SEGÚN REGIONES, PROVINCIAS Y ÁREA.
PERÍODO 2001 – 2010.
POBLACIÓN TOTAL DEL ÁREA URBANA
PROYECCIÓN DE LA POBLACIÓN ECUATORIANA, POR AÑOS CALENDARIO, SEGÚN REGIONES Y PROVINCIAS.
PERÍODO 2001 – 2010
POBLACIÓN TOTAL
A pesar de que no todos los datos proporcionados por la fuente forman parte del proyecto de estadística, los incluimos porque la ayuda que nos proporcionaron en la decisión del tema fue relevante.

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.