Estadística Inferencial

October 7, 2017 | Autor: M. Marcote González | Categoría: Economics, Matemáticas y estadistica
Share Embed


Descripción

Estadística Inferencial

Estudio de grupos pequeños (muestras), a fin de sacar conclusiones
respecto a grandes grupos de personas (poblaciones)

La utilidad de la muestra viene de la imposibilidad de acceder al
total de la población.

El objeto de la sociología es el estudio de colectivos humanos,
desde su observación, hasta el conocimiento de sus características y
leyes de distribución, incluyendo la interdependencia y conexiones
entre ellos y dentro de ellos así como del valor de la inferencia que
se haga acerca de ese colectivo, basándose en las muestras observadas.

Vamos a hablar de estimaciones de valores de las poblaciones
(parámetros poblacionales) a través de datos obtenidos mediante
muestras (estadísticos o estimadores).

Tambien hablaremos de la fiabilidad o confianza de estos
estadísticos a la hora de estimar los parámetros.

Técnicas inferenciales:

Estimación por parámetros para los distintos niveles de
medición

Nominal y ordinal: porcentaje

Intervalo: medias

Pruebas de hipótesis para los diferentes niveles de medición.
Las mismas, mediante análisis univariable o bivariable.

Elementos básicos:

Teoría de las probabilidades

Teoría del muestreo

Probabilidad

Fenómeno aleatorio: Un fenómeno es aleatorio si puede dar lugar a
varios resultados, sin que pueda ser posible enunciar con certeza real
cual va a ser el resultado del fenómeno.

Espacio muestral :conjunto de los posibles resultados de ese
fenómeno. El suceso de un experimento aleatorio será un subconjunto
del espacio muestral.

Características de un fenómeno aleatorio:

Probabilidad de repetición indefinida de un
fenómeno en condiciones similares.

Imposibilidad de predecir exactamente el
resultado de cada experimento particular.

Variable aleatorio

En una magnitud que puede aparecer en un experimento aleatorio.
Asigna un número al resultado de cada experimento aleatorio. Los
valores que toma son números reales.

Cada variable puede tomar diversos valores dependiendo del azar. Así
pues, no basta con conocer los posibles valores que puede tomar, sino
la probabilidad de que estos ocurran.

Tipos de variables aleatorias

Discreta: puede tomar determinado nº de valores.

Continua: Puede tomar un conjunto continuo de valores



Probabilidad apriorística

En una población cada uno de sus elementos tiene las mismas opciones
de ser seleccionado en una muestra. Todos tienen la misma probabilidad
individual, son equiprobables.

Probabilidad a priori de elección de un elemento con una
característica determinada es igual a la frecuencia relativa de esa
característica.

P(A)= a/n = casos favorables/casos posibles

La probabilidad al igual que la frecuencia relativa, oscila entre 0
y 1. Si P=1 ocurrirá seguro, si P=0 no ocurrirá nunca.

Probabilidad empírica
Se basa en el supuesto de que la proporción de apariciones de los
sucesos observada en el pasado, persistirá en el futuro. Son tan solo
estimaciones de las probabilidades verdaderas,`pero cuanto sea mayor
sea el número de casos total observados más precisa será la
estimación.

Apoyándonos en la experiencia previa, es posible obtener buenas
estimaciones de los sucesos


Sucesos que se excluyen mutuamente

Dos sucesos A y B se excluyen mutuamente si no tienen elementos en
común. A y B no pueden acontecer juntos.

Vamos a introducir los términos unión (() e intersección (().

A ( B : Ocurrencia de A ó B

A ( B : Ocurrencia de A y B

Propiedades de las probabilidades

1. La probabilidad oscila entre 0 y 1.

0 P(A) 1

2. Regla de la adición.
1. Si los sucesos A y B son mutuamente excluyentes, la probabilidad
de obtener A o B es igual a la suma de sus probabilidades. P(A o
B) = P(A(B)= P(A)+P(B) P(A(B (C)= P(A)+P(B) +P(C)

2. Fenómenos no mutuamente excluyentes.

P(A(B)= P(A)+P(B)-P(A(B)

3. Regla de la multiplicación

a. Fenómenos mutuamente excluyentes

P(A(B)=0

Fenómenos no mutuamente excluyentes

1) Sucesos independientes

P(A(B)= P(A) · P(B)

1) Sucesos dependientes

P(A(B)= P(A) · P(B/A) *(probabilidad condicionada)

P(B/A)= P(B(A)/ P(A)

Puede ampliarse a más sucesos, A, B, C, D...



Combinatoria

El análisis combinatorio se utiliza para la obtención de
probabilidades de sucesos complejos cuando la enumeración de los casos
es difícil y laboriosa. Se refiere a la forma en que pueden asociarse
un conjunto de elementos.

Vamos a ver la variaciones, permutaciones y combinaciones.



Variaciones

Se refiere a los distintos grupos que pueden formarse con m
elementos tomados de n en n. Siendo n Muestra pequeña

Estratos heterogéneos(( grande) --> Muestra mayor

Desagregación

A veces es preciso diseñar muestras para estimas no solo la
población tomada como un todo sino también de diferentes partes del
universo de estudio.

Según analizamos grupos mas pequeños de la muestra, el grado de
error en las estimaciones aumenta. Para resolver esto se pueden
adoptar varias decisiones:

Aumentar el tamaño de la muestra total, hasta que el de la
submuestra sea el adecuado. Es muy costoso y poco eficiente.

Afijación no proporcional tratando cada subdivisión como si
fuera un universo diferente. Solo se incrementa la muestra en
aquellas áreas que interesa estudiar. Ejemplo de la EPA.

Ponderación de la muestra

Las técnicas de afijación no proporcional hacen que las fracciones
de muestreo sean distintas y, por lo tanto, si se quieren tabular
conjuntamente las diferentes submuestras, hay que proceder a su
ponderación, si no quieren deformarse las estimaciones. Se pretende
devolver a cada subpoblación o estrato, la proporcionalidad que tiene
en la realidad con el objeto de poder agregarlas.

Elevadores: otra forma de homogeneizar las sumbuestras, para poder
agregarlas es recurrir al sistema de elevadores (la inversa de la
fracción de muestreo), con lo que se consigue trasladar los resultados
al universo total. Para utilizarlos hay que conocer el tamaño real del
universo, sino se falsearían los datos del estudio.

Estimaciones de parámetros

En el diseño de la muestra se determinan el tamaño de la misma, la
afijación, el tipo de muestreo y el proceso de selección de los
individuos, conjugando las técnicas de muestreo y el conocimiento del
universo. Posteriormente, y en base a la muestra diseñada, se realiza
la recogida de la información mediante el trabajo de campo, al que se
le aplican los correspondientes controles para que no se distorsione
la muestra proyectada. Mas tarde se graba la información, se somete a
procesos de control y verificación y, finalmente se realiza la
tabulación que dará como resultado la estimación de los parámetros
poblacionales.

Entre el diseño de la muestra y la estimación de parámetros, está el
proceso de muestreo y tabulación, pasándose de los supuestos a la
realidad de los datos y de la aproximación a la concreción de los
datos.

De la formula del tamaño muestral, el tamaño n y el nivel de
confianza K se mantienen invariables, pero seguramente los valores
reales de P no tiene porque ser 0,5, lo que supone que el error de
muestreo e ha variado y, por tanto el nivel de precisión de las
estimaciones. Por ello una vez realizada la encuesta, hay que pasar de
las aproximaciones efectuadas en el diseño a concreciones
individualizadas.

Hay que pasar de la estimación puntual a la estimación por
intervalo.

La estimación

Supongamos que siguiendo el procedimiento aleatorio simple, hemos
obtenido una muestra de n unidades. La expresión es un
estimador de la proporción P.

a es el total de individuos que tiene una característica.

El estimador ha sido calculado en base a las n unidades de la
muestra, en lugar de las N unidades que constituyen la población. Así
cometemos un error que llamaremos error típico de muestreo. La
estimación del error típico de muestreo se hace mediante la fórmula:






Error típico de muestreo

Universos pequeños

Media
Proporción






Universos grandes

Media
Proporción


( (2= s2 )




Como En muestras grandes n/N=0



Con la estimación de parámetros, deseamos estimar el valor de un
parámetro a través de un estadístico calculado en la muestra. Ej: edad
media de una población o el % de abstención en una votación.

Estimación puntual: Se estima un parámetro poblacional a través de
la media o la proporción calculados en la muestra. Un problema es que
no podemos establecer la probabilidad de que el estimador sea igual al
parámetro.

Estimación por intervalo: Dado que la estimación del parámetro
poblacional depende del error y del nivel de confianza, el valor
estimado no será único, sino que estará comprendido en un intervalo
cuyos límites serán el estimador ( nivel de confianza por error típico
del muestreo. El tamaño de la muestra determina la amplitud del
intervalo.

Intervalo de confianza

A partir de la estimación del error típico del muestreo se pueden
determinar los intervalos de confianza, que son del tipo (p-ks, p+ks).



El valor que se trata de estimar se encuentra dentro de ese
intervalo con una "confianza" medida en términos de probabilidad.
Determinada por el valor que tome k.

Así, para la proporción a un nivel de confianza del 95,5% el
intervalo será





Para le media será





Ejemplo

Supongamos que hacemos una encuesta para estimar el nivel de
parados. La muestra es de 1.000 entrevistas. con un margen de error
de 3,16% para un nivel de confianza del 95,5%=2 sigma y para P=Q=50%.

Una vez realizada la encuesta el porcentaje de parados es del 12%.
¿Entre que valores oscilará el parámetro poblacional?





Significado del intervalo

Como P es un valor fijo, la probabilidad de encontrarse entre 9,94 y
14,06 es 1 o 0. Es decir, o bien está dentro de esos limites o no
está. Lo que varía de muestra a muestra es el estadístico p, dado que
al no conocer P, se construye el intervalo alrededor de p, la posición
del intervalo en relación al parámetro depende de la localización del
valor particular de p que se ha utilizado a partir de la distribución
muestral. Dado que el 95,5% de las proporciones p se encuentran dentro
de ( 2 unidades de desviacion de la proporción de la población y como
hemos utilizado ( 2 sp para construir el intervalo alrededor de p,
cualquier p dentro de dichos límites dará lugar a un intervalo de
confianza que incluirá a P.



Z=-2
P Z=2

Las proporciones p1, p2, p3, p4 y p6 se encuentran dentro del
intervalo ±2 sp, mientras que la proporción p5 se encuentra fuera de
dicho intervalo. La probabilidad del 95,5 por 100 utilizada en nuestro
ejemplo significa que si se realizara un gran número de estimaciones
por intervalo, tales como las que aparecen en el gráfico anterior, y
cada una de ellas basada en una muestra p, el 95,5 por 100 de los
intervalos de confianza incluirían el parámetro y sólo el 4,5 por 100
de ellos lo dejarían fuera.

Además de servir como indicación del grado de exactitud de una
estimación, la colocación de un intervalo de confianza alrededor de
una estimación puede servir, implícitamente, para contrastar una serie
de hipótesis. En efecto, en un intervalo de confianza se contiene una
prueba implícita para cada posible valor del parámetro, por ejemplo la
media, que se desea contrastar. La hipótesis alternativa se establece
de forma que el valor del parámetro que se desea estimar quede dentro
del intervalo de confianza para el nivel de probabilidad elegido. Así,
por ejemplo, si establecemos un nivel de significación del 0,05,
sabemos que el intervalo de confianza, en el caso de estimación de una
media, tendrá como límites ± 1,96 error de la media. Pues bien, si la
media muestral queda dentro de dichos límites se aceptará la
hipótesis, mientras que si se obtiene un valor que queda fuera se
rechazará la hipótesis.



-----------------------













































Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.