INTRODUCCIÓN A LA ESTADÍSTICA
Descripción
INTRODUCCIÓN A LA ESTADÍSTICA Ing. Raúl Acurio del Pino
1-2
¿Qué significa estadística? Estadística es la ciencia que se encarga de recolectar, organizar, presentar, analizar e interpretar datos con el propósito de ayudar a una toma de decisiones más efectiva.
1-3
¿Quién usa estadística? Las técnicas estadísticas se usan ampliamente por personas en áreas de ingeniería comercialización, contabilidad, control de calidad, consumidores, deportes, administración de hospitales, educación, política, medicina, etcétera...
1-4
Tipos de estadísticas Estadística descriptiva: métodos para organizar, resumir y presentar datos de manera informativa. EJEMPLO 1: un sondeo de opinión encontró que 49% de las personas en una encuesta sabían el nombre del primer libro en la Biblia. La estadística “49” describe el número de cada 100 personas que saben la respuesta. EXAMPLE 2: según el Consumer Reports, los dueños de lavadoras de ropa Whirlpool reportaron 9 problemas por cada 100 máquinas durante 1995. La estadística “9” describe el número de problemas por cada 100 máquinas.
1-5
Tipos de estadísticas Estadística inferencial: una decisión, estimación, predicción o generalización sobre una población, con base en una muestra. Una población es un conjunto de todos los posibles individuos, objetos o medidas de interés. Una muestra es una porción, o parte, de la población de interés.
1-6
Tipos de estadísticas (Ejemplos de inferencia estadística)
EJEMPLO 1: las cadenas de TV monitorean la popularidad de sus programas contratando a Nielsen y otras organizaciones para muestrear las preferencias de televidentes. EJEMPLO 2: el departamento de contabilidad de una empresa elegirá una muestra de facturas para verificar la exactitud de todas las facturas de la compañía. EJEMPLO 3: los catadores de vino prueban unas cuantas gotas para tomar la decisión de liberar todo el vino para la venta.
1-7
Tipos de variables Variable cualitativa o de atributos: la característica o variable que se estudia no es numérica. EJEMPLOS: sexo, afiliación religiosa, tipo de automóvil que se posee, lugar de nacimiento, color de los ojos.
1-8
Tipos de variables Variable cuantitativa: la variable se puede registrar numéricamente. EJEMPLO: saldo en una cuenta de cheques, minutos que faltan para que termine la clase, número de niños en una familia.
1-9
Tipos de variables Las variables cuantitativas se pueden clasificar como discretas o continuas. Variables discretas: sólo pueden adquirir ciertos valores y casi siempre hay “brechas” entre esos valores. EJEMPLO: el número de habitaciones en una casa (1,2,3,..., etc.).
1-10
Tipos de variables Las variables cuantitativas se pueden clasificar como discretas o continuas. Variables continuas: pueden tomar cualquier valor dentro de un intervalo específico. EJEMPLO: el tiempo que toma volar de Quito a Nueva York.
1-11
Resumen de tipos de variables DATOS Cualitativos o de atributos (tipo de auto que posee)
Cuantitativos o numéricos
discretos (número de hijos)
continuos (tiempo para resolver el examen)
1-12
Fuentes de datos estadísticos
Los problemas de investigación suelen requerir datos publicados. Se pueden encontrar estadísticas relacionadas en artículos publicados, revistas y periódicos. No todos los temas disponen de datos publicados. En esos casos, la información deberá recolectarse y analizarse. Una manera de recolectar datos es mediante encuestas.
1-13
Niveles de medición Nivel nominal: los datos sólo se puede clasificar en categorías, no se pueden ordenar. ELEMPLOS: color de los ojos, sexo, afiliación religiosa.
1-14
Niveles de medición Mutuamente excluyente: un individuo, objeto o artículo, al ser incluido en una categoría, debe excluirse de las demás. EJEMPLO: color de los ojos. Exhaustivo: cada persona, objeto o artículo debe clasificarse en al menos una categoría. ELEMPLO: afiliación religiosa.
1-15
Niveles de medición Nivel ordinal: involucra datos que se pueden ordenar, pero no es posible determinar las diferencias entre los valores de los datos o no tienen significado. EJEMPLO: en una prueba de sabor de 4 refrescos de cola, el C se clasificó como número 1, el B como número 2, el A como 3 y el D como número 4.
1-16
Niveles de medición Nivel de intervalo: similar al nivel ordinal, con la propiedad adicional de que se pueden determinar cantidades significativas de las diferencias entre los valores. No existe un punto cero natural. EJEMPLO: temperatura en la escala de grados Fahrenheit.
1-17
Niveles de medición Nivel de razón: el nivel de intervalo con un punto cero inicial inherente. Las diferencias y razones son significativas para este nivel de medición. EJEMPLOS: dinero, altura de los jugadores de basquetbol de la NBA.
1-17
Niveles de medición Reglas: a) Puede decirse que un valor es igual o diferente del de otro valor de la variable. b) Puede decirse que un valor es igual, mayor o menor que otro. c) Puede decirse que la diferencia entre dos valores de la variable es igual, mayor o menos que la diferencia entre los valores de otros dos pares de valores de la variable. O sea pueden efectuarse válidamente divisiones entre intervalos.
1-17
Niveles de medición Reglas: d) Puede decirse que un valor es tantas veces mayor o menor que otro. O sea pueden dividirse con válidamente valores de la variable.
1-17
Ejercicios
2-2
Distribución de frecuencias
Agrupamiento de datos en categorías que muestran el número de observaciones en cada categoría mutuamente excluyente.
2-3
Elaboración de una distribución de frecuencias pregunta que recolección se desea de datos responder (datos originales)
organización de datos
distribución de frecuencias
presentación de datos (gráfica)
obtención de conclusiones
2-4
Distribución de frecuencias Marca de clase (punto medio): punto que divide a la clase en dos partes iguales. Es el promedio entre los límites superior e inferior de la clase. Intervalo de clase: para una distribución de frecuencias que tiene clases del mismo tamaño, el intervalo de clase se obtiene restando el límite inferior de una clase del límite inferior de la siguiente.
2-5
EJEMPLO 1 Dr. Acosta es el director de la escuela de ingeniería y desea determinar cuánto estudian los alumnos en ella. Selecciona una muestra aleatoria de 30 estudiantes y determina el número de horas por semana que estudia cada uno: 15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6. Organice los datos en una distribución de frecuencias.
2-6
EJEMPLO 1
continuación
Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15. El intervalo de clase es 5 (13 - 8).
Horas de estudio 8-12 13-17 18-22 23-27 28-32 33-37
Frecuencia, f 1 12 10 5 1 1
2-7
Sugerencias para elaborar una distribución de frecuencias Los intervalos de clase usados en la distribución de frecuencias deben ser iguales. Determine un intervalo de clase sugerido con la fórmula: i = (valor más alto - valor más bajo)/número de clases.
2-8
Sugerencias para elaborar una distribución de frecuencias Use el intervalo de clase calculado sugerido para construir la distribución de frecuencias. Nota: este es un intervalo de clase sugerido; si el intervalo de clase calculado es 97, puede ser mejor usar 100. Cuente el número de valores en cada clase.
2-9
Distribución de frecuencia relativa La frecuencia relativa de una clase se obtiene dividiendo la frecuencia de clase entre la frecuencia total. Horas 8 -1 2
F re c u e n c ia , f 1
F re c u e n c ia re la tiv a 1 /3 0 = .0 3 3 3
1 3 -1 7
1 2
1 2 /3 0 = .4 0 0
1 8 -2 2
1 0
1 0 /3 0 = .3 3 3
2 3 -2 7
5
5 /3 0 = .1 6 6 7
2 8 -3 2
1
1 /3 0 = .0 3 3 3
3 3 -3 7
1
1 /3 0 = .0 3 3 3
T O T A L
3 0
3 0 /3 0 = 1
T
2-10
Representaciones de tallo y hoja Representaciones de tallo y hoja: técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos principales son el tallo y el dígito siguiente es la hoja. Nota: una ventaja de la representación de tallo y hoja comparado con la distribución de frecuencias es que no se pierde la identidad de cada observación.
2-11
EJEMPLO 2 Pedro logró las siguientes calificaciones en el doceavo examen de contabilidad del semestre: 86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construya una representación de tallo y hoja para los datos.
tallo
hoja
6
9
7
89
8
234568
9
126
2-12
Presentación gráfica de una distribución de frecuencias Las tres formas de gráficas más usadas son histogramas, polígonos de frecuencia y distribuciones de frecuencias acumuladas (ogiva). Histograma: gráfica donde las clases se marcan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase se representan por las alturas de las barras y éstas se trazan adyacentes entre sí.
2-13
Presentation gráfica de una distribución de frecuencias Un polígono de frecuencias consiste en segmentos de línea que conectan los puntos formados por el punto medio de la clase y la frecuencia de clase. Una distribución de frecuencias acumulada (ogiva) se usa para determinar cuántos o qué proporción de los valores de los datos es menor o mayor que cierto valor.
2-14
Histograma para las horas de estudio
Frecuencia
14 12 10 8 6 4 2 0 10
15
20
25
Horas de estudio
30
35
2-15
Polígono de frecuencias para las horas de estudio 14 Frecuencia
12 10 8 6 4 2 0 10
15
20
25
Horas de estudio
30
35
2-16
Distribución de frecuencias acumuladas menor que para las horas de estudio 35
Frecuencia
30 25 20 15 10 5 0 10
15
20
25
Horas de estudio
30
35
2-17
Gráfica de barras Una gráfica de barras se puede usar para describir cualquier nivel de medición (nominal, ordinal, de intervalo o de razón). EJEMPLO 3: construya una gráfica de barras para el número de personas desempleadas por cada 100.000 habitantes de ciertas ciudades en 2005.
2-18
EJEMPLO 3
continuación
Ciudad
Número de desempleados por 100 000 habitantes
Quito Guayaquil Cuenca Machala Tulcán Ambato
7300 5400 6700 8900 8200 8900
2-19
# desempleados/100 000
Gráfica de barras para los datos de desempleados 10000 8000
8900 7300
8200
8900
6700 Quito Guayaquil Machala Machala Tulcán Ambato
5400
6000 4000 2000 0 1
2
3
4
Ciudades
5
6
2-20
Gráfica circular Una gráfica circular es en especial útil para desplegar una distribución de frecuencias relativas. Se divide un círculo de manera proporcional a la frecuencia relativa y las rebanadas representan los diferentes grupos. EJEMPLO 4: se pidió a una muestra de 200 corredores que indicaran su tipo favorito de zapatos para correr.
2-21
EJEMPLO 4
continuación
Dibuje una gráfica circular basada en la siguiente información.
Tipo de zapato
# de corredores
Nike
92
Adidas
49
Reebok
37
Asics
13
Otros
9
2-22
Gráfica cicular para tipos de zapatos Reebok
Asics Otros Nike Adidas Reebok Asics Otros
Adidas Nike
Lihat lebih banyak...
Comentarios