INTRODUCCIÓN A LA ESTADÍSTICA

July 3, 2017 | Autor: Andrés Chausá | Categoría: Estadistica
Share Embed


Descripción

INTRODUCCIÓN A LA ESTADÍSTICA Ing. Raúl Acurio del Pino

1-2

¿Qué significa estadística? Estadística es la ciencia que se encarga de recolectar, organizar, presentar, analizar e interpretar datos con el propósito de ayudar a una toma de decisiones más efectiva.

1-3

¿Quién usa estadística?  Las técnicas estadísticas se usan ampliamente por personas en áreas de ingeniería comercialización, contabilidad, control de calidad, consumidores, deportes, administración de hospitales, educación, política, medicina, etcétera...

1-4

Tipos de estadísticas  Estadística descriptiva: métodos para organizar, resumir y presentar datos de manera informativa.  EJEMPLO 1: un sondeo de opinión encontró que 49% de las personas en una encuesta sabían el nombre del primer libro en la Biblia. La estadística “49” describe el número de cada 100 personas que saben la respuesta.  EXAMPLE 2: según el Consumer Reports, los dueños de lavadoras de ropa Whirlpool reportaron 9 problemas por cada 100 máquinas durante 1995. La estadística “9” describe el número de problemas por cada 100 máquinas.

1-5

Tipos de estadísticas  Estadística inferencial: una decisión, estimación, predicción o generalización sobre una población, con base en una muestra.  Una población es un conjunto de todos los posibles individuos, objetos o medidas de interés.  Una muestra es una porción, o parte, de la población de interés.

1-6

Tipos de estadísticas (Ejemplos de inferencia estadística)

 EJEMPLO 1: las cadenas de TV monitorean la popularidad de sus programas contratando a Nielsen y otras organizaciones para muestrear las preferencias de televidentes.  EJEMPLO 2: el departamento de contabilidad de una empresa elegirá una muestra de facturas para verificar la exactitud de todas las facturas de la compañía.  EJEMPLO 3: los catadores de vino prueban unas cuantas gotas para tomar la decisión de liberar todo el vino para la venta.

1-7

Tipos de variables Variable cualitativa o de atributos: la característica o variable que se estudia no es numérica. EJEMPLOS: sexo, afiliación religiosa, tipo de automóvil que se posee, lugar de nacimiento, color de los ojos.

1-8

Tipos de variables Variable cuantitativa: la variable se puede registrar numéricamente. EJEMPLO: saldo en una cuenta de cheques, minutos que faltan para que termine la clase, número de niños en una familia.

1-9

Tipos de variables  Las variables cuantitativas se pueden clasificar como discretas o continuas.  Variables discretas: sólo pueden adquirir ciertos valores y casi siempre hay “brechas” entre esos valores.  EJEMPLO: el número de habitaciones en una casa (1,2,3,..., etc.).

1-10

Tipos de variables  Las variables cuantitativas se pueden clasificar como discretas o continuas.  Variables continuas: pueden tomar cualquier valor dentro de un intervalo específico.  EJEMPLO: el tiempo que toma volar de Quito a Nueva York.

1-11

Resumen de tipos de variables DATOS Cualitativos o de atributos (tipo de auto que posee)

Cuantitativos o numéricos

discretos (número de hijos)

continuos (tiempo para resolver el examen)

1-12

Fuentes de datos estadísticos

 Los problemas de investigación suelen requerir datos publicados. Se pueden encontrar estadísticas relacionadas en artículos publicados, revistas y periódicos.  No todos los temas disponen de datos publicados. En esos casos, la información deberá recolectarse y analizarse.  Una manera de recolectar datos es mediante encuestas.

1-13

Niveles de medición Nivel nominal: los datos sólo se puede clasificar en categorías, no se pueden ordenar. ELEMPLOS: color de los ojos, sexo, afiliación religiosa.

1-14

Niveles de medición  Mutuamente excluyente: un individuo, objeto o artículo, al ser incluido en una categoría, debe excluirse de las demás.  EJEMPLO: color de los ojos.  Exhaustivo: cada persona, objeto o artículo debe clasificarse en al menos una categoría.  ELEMPLO: afiliación religiosa.

1-15

Niveles de medición Nivel ordinal: involucra datos que se pueden ordenar, pero no es posible determinar las diferencias entre los valores de los datos o no tienen significado. EJEMPLO: en una prueba de sabor de 4 refrescos de cola, el C se clasificó como número 1, el B como número 2, el A como 3 y el D como número 4.

1-16

Niveles de medición  Nivel de intervalo: similar al nivel ordinal, con la propiedad adicional de que se pueden determinar cantidades significativas de las diferencias entre los valores. No existe un punto cero natural.  EJEMPLO: temperatura en la escala de grados Fahrenheit.

1-17

Niveles de medición Nivel de razón: el nivel de intervalo con un punto cero inicial inherente. Las diferencias y razones son significativas para este nivel de medición. EJEMPLOS: dinero, altura de los jugadores de basquetbol de la NBA.

1-17

Niveles de medición Reglas: a) Puede decirse que un valor es igual o diferente del de otro valor de la variable. b) Puede decirse que un valor es igual, mayor o menor que otro. c) Puede decirse que la diferencia entre dos valores de la variable es igual, mayor o menos que la diferencia entre los valores de otros dos pares de valores de la variable. O sea pueden efectuarse válidamente divisiones entre intervalos.

1-17

Niveles de medición Reglas: d) Puede decirse que un valor es tantas veces mayor o menor que otro. O sea pueden dividirse con válidamente valores de la variable.

1-17

Ejercicios

2-2

Distribución de frecuencias

Agrupamiento de datos en categorías que muestran el número de observaciones en cada categoría mutuamente excluyente.

2-3

Elaboración de una distribución de frecuencias pregunta que recolección se desea de datos responder (datos originales)

organización de datos

distribución de frecuencias

presentación de datos (gráfica)

obtención de conclusiones

2-4

Distribución de frecuencias  Marca de clase (punto medio): punto que divide a la clase en dos partes iguales. Es el promedio entre los límites superior e inferior de la clase.  Intervalo de clase: para una distribución de frecuencias que tiene clases del mismo tamaño, el intervalo de clase se obtiene restando el límite inferior de una clase del límite inferior de la siguiente.

2-5

EJEMPLO 1  Dr. Acosta es el director de la escuela de ingeniería y desea determinar cuánto estudian los alumnos en ella. Selecciona una muestra aleatoria de 30 estudiantes y determina el número de horas por semana que estudia cada uno: 15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.  Organice los datos en una distribución de frecuencias.

2-6

EJEMPLO 1

continuación

Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15. El intervalo de clase es 5 (13 - 8).

Horas de estudio 8-12 13-17 18-22 23-27 28-32 33-37

Frecuencia, f 1 12 10 5 1 1

2-7

Sugerencias para elaborar una distribución de frecuencias Los intervalos de clase usados en la distribución de frecuencias deben ser iguales. Determine un intervalo de clase sugerido con la fórmula: i = (valor más alto - valor más bajo)/número de clases.

2-8

Sugerencias para elaborar una distribución de frecuencias  Use el intervalo de clase calculado sugerido para construir la distribución de frecuencias. Nota: este es un intervalo de clase sugerido; si el intervalo de clase calculado es 97, puede ser mejor usar 100.  Cuente el número de valores en cada clase.

2-9

Distribución de frecuencia relativa  La frecuencia relativa de una clase se obtiene dividiendo la frecuencia de clase entre la frecuencia total. Horas 8 -1 2

F re c u e n c ia , f 1

F re c u e n c ia re la tiv a 1 /3 0 = .0 3 3 3

1 3 -1 7

1 2

1 2 /3 0 = .4 0 0

1 8 -2 2

1 0

1 0 /3 0 = .3 3 3

2 3 -2 7

5

5 /3 0 = .1 6 6 7

2 8 -3 2

1

1 /3 0 = .0 3 3 3

3 3 -3 7

1

1 /3 0 = .0 3 3 3

T O T A L

3 0

3 0 /3 0 = 1

T

2-10

Representaciones de tallo y hoja  Representaciones de tallo y hoja: técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos principales son el tallo y el dígito siguiente es la hoja.  Nota: una ventaja de la representación de tallo y hoja comparado con la distribución de frecuencias es que no se pierde la identidad de cada observación.

2-11

EJEMPLO 2  Pedro logró las siguientes calificaciones en el doceavo examen de contabilidad del semestre: 86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construya una representación de tallo y hoja para los datos.

tallo

hoja

6

9

7

89

8

234568

9

126

2-12

Presentación gráfica de una distribución de frecuencias  Las tres formas de gráficas más usadas son histogramas, polígonos de frecuencia y distribuciones de frecuencias acumuladas (ogiva).  Histograma: gráfica donde las clases se marcan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase se representan por las alturas de las barras y éstas se trazan adyacentes entre sí.

2-13

Presentation gráfica de una distribución de frecuencias  Un polígono de frecuencias consiste en segmentos de línea que conectan los puntos formados por el punto medio de la clase y la frecuencia de clase.  Una distribución de frecuencias acumulada (ogiva) se usa para determinar cuántos o qué proporción de los valores de los datos es menor o mayor que cierto valor.

2-14

Histograma para las horas de estudio

Frecuencia

14 12 10 8 6 4 2 0 10

15

20

25

Horas de estudio

30

35

2-15

Polígono de frecuencias para las horas de estudio 14 Frecuencia

12 10 8 6 4 2 0 10

15

20

25

Horas de estudio

30

35

2-16

Distribución de frecuencias acumuladas menor que para las horas de estudio 35

Frecuencia

30 25 20 15 10 5 0 10

15

20

25

Horas de estudio

30

35

2-17

Gráfica de barras  Una gráfica de barras se puede usar para describir cualquier nivel de medición (nominal, ordinal, de intervalo o de razón).  EJEMPLO 3: construya una gráfica de barras para el número de personas desempleadas por cada 100.000 habitantes de ciertas ciudades en 2005.

2-18

EJEMPLO 3

continuación

Ciudad

Número de desempleados por 100 000 habitantes

Quito Guayaquil Cuenca Machala Tulcán Ambato

7300 5400 6700 8900 8200 8900

2-19

# desempleados/100 000

Gráfica de barras para los datos de desempleados 10000 8000

8900 7300

8200

8900

6700 Quito Guayaquil Machala Machala Tulcán Ambato

5400

6000 4000 2000 0 1

2

3

4

Ciudades

5

6

2-20

Gráfica circular  Una gráfica circular es en especial útil para desplegar una distribución de frecuencias relativas. Se divide un círculo de manera proporcional a la frecuencia relativa y las rebanadas representan los diferentes grupos.  EJEMPLO 4: se pidió a una muestra de 200 corredores que indicaran su tipo favorito de zapatos para correr.

2-21

EJEMPLO 4

continuación

 Dibuje una gráfica circular basada en la siguiente información.

Tipo de zapato

# de corredores

Nike

92

Adidas

49

Reebok

37

Asics

13

Otros

9

2-22

Gráfica cicular para tipos de zapatos Reebok

Asics Otros Nike Adidas Reebok Asics Otros

Adidas Nike

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.