INTRODUCCIÓN: CONCEPTOS PREVIOS Objetivos del módulo 1

October 6, 2017 | Autor: M. Barros Numa | Categoría: Psicología
Share Embed


Descripción

INTRODUCCIÓN: CONCEPTOS PREVIOS




Objetivos del módulo 1:
1. Presentar la disciplina Estadística como ciencia y como ciencia
auxiliar, resaltando su utilidad en los estudios empíricos de las
ciencias sociales y en particular en el área de las relaciones
laborales.


2. Hacer una lectura global de los contenidos del curso, los alcances y
límites del mismo, así como el fundamento de los temas que se van a
tratar.


3. Familiarizarse con algunos conceptos básicos de la estadística y la
metodología cuya comprensión es fundamental para seguir el curso.


4. Complementario: Repasar o incorporar algunos conocimientos matemáticos
necesarios para una mejor comprensión de los contenidos del curso.

Conceptos clave del módulo 1:
Estadística
Estadística descriptiva y Estadística inferencial
Estadístico
Población y muestra
Unidades de análisis
Variables, sistema de categorías
Matriz de datos y estructura tripartita de los datos
Medición
Escalas de medición
Escala nomina,
Escala ordinal
Escala interval
Escala de razón


1.1 INTRODUCCION

Para muchos parece una materia lejana, pero la Estadística y muchas de sus
herramientas nos acompañan diariamente, aunque no nos percatemos de ello.
Durante el curso tendremos oportunidad de ver ejemplos muy familiares y
entender algunos términos que escuchamos y manejamos diariamente.
Este primer módulo nos introducirá en el mundo de la estadística,
particularmente la estadística descriptiva, aprendiendo el vocabulario y
los conceptos fundamentales para poder abordar los próximos temas. También
repasaremos algunos procedimientos matemáticos que usaremos durante todo el
curso..


1.2 LA CIENCIA ESTADISTICA


¿Qué es la ESTADISTICA? Estadística, es algo más que la recolección y
publicación (tal cual se ven en revistas y diarios) de hechos y datos
numéricos. Es la aplicación del método científico de análisis de datos
numéricos, con el fin de tomar decisiones racionales.
Estadística será tratada aquí como una Ciencia que trata de la
recopilación, presentación, análisis e interpretación de datos numéricos
(estadísticas) con el fin de realizar una toma de decisiones más efectiva.

Si quieres ver algunas definiciones adicionales, puedes acceder a:
Carrasco Arroyo, S (2005): Aproximación a la Estadística desde
las Ciencias Sociales.Valencia, España.
http://www.uv.es/carrascs/PDF/aproximacion%20estadistica.pdf


Zavrostsky, A: Varias definiciones de la Estadística. Revista
de Economía. Facultad de Ingeniería.Universidad de Los Andes,
Venezuela.
http://iies.faces.ula.ve/Revista/Articulos/Revista_02/Pdf/Rev02Z
avrotsky.pdf


Su origen en la historia… La estadística científica tal como se entiende
actualmente tiene sus origenes en el SXIX, cada vez más vinculada a la
teoría de la probabilidad. Dos puntos de referencia básicos son los
trabajos de F. Galton, fundador de la biometría, y de K. Pearson que sentó
las bases de la estadística moderna.
Sin embargo, los orígenes de las herramientas estadísticas pueden ser
rastreados al menos hasta el antiguo Egipto y más atrás aún. El interés por
el registro sistemático sobre la población y los recursos económicos y la
elaboración de instrumentos matemáticos de resumen de la información
aparecen desde la antigüedad vinculados con la administración y la política
de los gobiernos.


Si te interesa conocer más sobre la historia de la estadística te
recomendamos leer:

Ruiz Muñoz, David (2004):Manual de Estadística. Ediciones
Eumed·net. Cap. 1. Historia de la estadística.
http://www.eumed.net/cursecon/libreria/drm/cap1.pdf




El origen de la palabra… La palabra "estadística" procede del latín
statisticum collegium ("consejo de Estado") y de ella deriva el término
italiano statista ("hombre de Estado" o "político"). A su vez, el término
alemán Statistik es introducido por Gottfried Achenwall en 1749 al publicar
su obra Compendio de la constitución política de los principales países y
pueblos europeos, asociándolo con el análisis de datos del Estado, es
decir, "la ciencia del Estado" . Sin embargo, recién a partir del siglo XIX
el término comienza a ser utilizado en su acepción moderna.


Papel de la Estadística para las ciencias sociales
Para las ciencias sociales la estadística se ha convertido en una ciencia
auxiliar fundamental, permitiendo:
- Encontrar relaciones y características no previstas en una población,
que permiten pensar en nuevas teorías e hipótesis.
- Resumir los datos y extraer información relevante, esto es de las
mediciones observadas
- Ayudar en la búsqueda y evaluación de los modelos y pautas que
ofrecen los datos, pero que se encuentran ocultos por la inherente
variabilidad de los mismos.
- Facilitar la comunicación entre los científicos, ya que siempre será
más fácil comprender la referencia a un procedimiento estándar, sin
necesidad de mayor detalle.


Estadística Descriptiva y Estadística Inferencial

Para entender el alcance que tiene el presente curso debemos en primer
lugar entender los conceptos de ESTADISTICA DESCRIPTIVA y ESTADISTICA
INFERENCIAL o INDUCTIVA.

Estadística Descriptiva: Consiste en un conjunto de instrumentos y temas
relacionados con la descripción de colecciones de observaciones
estadísticas, se refiere tanto al total de la población como a la muestra,
y su finalidad es "resumir" un conjunto de datos numéricos.

Estadística Inferencial o Inductiva: Se ocupa de la lógica y el
procedimiento para la inferencia y la inducción de propiedades de una
población en bases a resultados obtenidos de una muestra conocida.

¿Porqué es importante esta distinción?

Nuestro curso, por la carga horaria y los objetivos que se ha planteado, va
a realizar un recorrido básico por herramientas de estadística descriptiva.
Sin embargo, es necesario considerar que una parte fundamental de la
disciplina estadística está dedicada a la INFERENCIA. En ella, se
incorporan los conceptos de variable aleatoria, distribuciones de
probabilidad, estimadores e intervalos de confianza, entre otros, que no
utilizaremos en el curso.


"Si el único propósito del investigador es describir los resultados de un
experimento concreto, los métodos descriptivos pueden considerarse
suficientes. No obstante, si lo que se pretende es utilizar la información
obtenida para extraer conclusiones generales sobre todos aquellos objetos
del tipo de los que han sido estudiados, entonces estos métodos constituyen
sólo el principio del análisis, y debe recurrirse a métodos de inferencia
estadística, los cuales implican el uso de la teoría de la probabilidad.La
probabilidad constituye por sí misma un concepto básico que refleja su
relación con la faceta del mundo exterior que pretende estudiar: los
fenómenos aleatorios, que suponen unas ciertas reglas de comportamiento.
El nexo que une la teoría de la probabilidad y la estadística es la noción
de variable aleatoria, mostrando de esta manera cómo puede emplearse la
teoría de la probabilidad para extraer conclusiones precisas acerca de una
población sobre la base de una muestra extraída de ella. Muchos de los
análisis estadísticos son, de hecho, estudio de las propiedades de una o
más variables aleatorias."

Rodriguez, Mayte: Estadística aplicada a las Ciencias Sociales
II.Licenciatura de Sociología. Curso 2001/02.Universidad autónoma de Madrid
http://www.uam.es/personal_pdi/ciencias/mayter/docencia/sociolog/apuntes.pdf





Con las herramientas estadísticas que vamos a trabajar durante este curso
vamos a describir el comportamiento de conjuntos de individuos,
instituciones, países, etc. pero no vamos a utilizarlas para generalizar
los resultados a una población mayor. Esto lo veremos con detenimiento al
hablar del concepto de POBLACION y MUESTRA.

Sin embargo, veremos que estos instrumentos y métodos nos habilitan a
realizar análisis sumamente útiles, a partir de la descripción de nuestra
población. Y, por otra parte, como plantea el texto de Mayte Rodríguez,
constituyen el punto de partida para los procedimientos de la Estadística
Inferencial.

Por ejemplo:
Cuando queremos conocer el perfil de los trabajadores de una empresa
podemos averiguar las características de todos los empleados, con lo
cual no necesitamos "inferir" ninguno de los resultados. Alcanza con
generar formas de resumen de la información para describir el
comportamiento de toda la plantilla de trabajadores. Es una aplicación
de la estadística descriptiva.


Pero, si la empresa fuera muy grande, podríamos optar por encuestar o
averiguar la información sólo de un subconjunto de esos trabajadores.
En este caso, tendríamos que recurrir a la teoría de muestreo para
tener mecanismos que me "garanticen" una elección al azar de los
empleados entrevistar y a la teoría de la probabilidad para a partir
de los resultados obtenidos para ese grupo, generalizar a toda la
plantilla de trabajadores. En este caso, entonces, estaríamos frente a
procedimientos propios de la Estadística Inferencial.

1.3 ¿ CUÁLES INSTRUMENTOS VEREMOS EN EL CURSO?

Por una parte, en lo que queda de este módulo veremos algunos conceptos
fundamentales que nos permiten comenzar a trabajar con las herramientas
estadísticas. Entender qué es una población y una unidad y cómo caracterizo
a esas unidades a través de variables, que tienen un sistema de categorías
y una escala de medición. A partir de estos conceptos podemos elaborar la
idea de matriz de datos originales, que contiene toda la información que
tengo sobre la población.

En los módulos 1, 2, 3 y 4 aprenderemos cómo describir una población en
base a una de sus características (descripción univariada), sea a través de
tablas, gráficos y medidas resumen (estadísticos).
En el módulo 5, veremos como describir una población en base a dos
características simultáneamente.
Los últimos 3 módulos incluyen herramientas más específicas, que pueden ser
de mucha utilidad para la investigación y los análisis en el ámbito de las
relaciones laborales:
En el módulo 6, veremos una forma de medir y comparar el grado de
concentración de recursos que se distribuyen en una población (por ejemplo,
qué grado de desigualdad hay en la distribución del ingreso total del país,
o la masa salarial de una empresa, entre todos los miembros de esa
población).
El módulo 7 está dedicado a la presentación de algunos estadísticos que nos
permiten analizar el comportamiento del mercado de trabajo. Los
estadísticos que vamos a estudiar habitualmente se construyen en base a
muestras y constituyen estimaciones de los valores de la población
(parámetros), pero no vamos a profundizar en este aspecto sino que
trataremos de entender su construcción y uso.
Finalmente, el módulo 8 presenta dos herramientas que están vinculadas al
análisis temporal de datos. Veremos en primer lugar los números índice nos
permiten analizar la evolución de una característica numérica en el tiempo.
Algunos números índice tienen incidencia cotidiana en nuestra vida, como
tendremos oportunidad de ver al llegar a ese módulo final del curso.
También nos familiarizaremos con los conceptos de inflación, precios
corrientes y precios constantes, y obtendremos una herramienta que nos
permite comparar precios tomados en distintos momentos del tiempo.



1.4 TERMINOS Y CONCEPTOS BASICOS

Es importante que conozcamos algunos términos especializados de la
disciplina estadística.
En primer lugar, muchas veces se confunden los términos "Estadística" con
"estadísticas" o "estadísticos".
Cuando hablamos de Estadística, nos estamos refiriendo a la disciplina
científica.

Los estadísticos, en cambio, son medidas de resumen calculadas sobre los
datos provenientes de una muestra, que en estadística inferencial se
utilizan para estimar los valores correspondientes a nivel de la población
(parámetros). Es decir, son herramientas que asumen determinados valores,
construidas en base a los datos de observaciones. También podemos
encontrarlas mencionadas como estadísticas.

En el curso aprenderemos a calcular varios estadísticos. No los veremos,
sin embargo, en su "función" de estimación de los valores poblacionales, ya
que no trabajaremos con la inferencia estadística.


Antes de seguir adelante, veamos el concepto de POBLACION Y MUESTRA.



POBLACIÓN o UNIVERSO: Es el conjunto de elementos sobre el que se realiza
el estudio. Debe estar acotada en espacio y tiempo.

Ejemplos de poblaciones en estudios de ciencias sociales:
habitantes de un barrio o un país, alumnos de una escuela, empresas,
organizaciones, partidos políticos, ciudades, países, etc.
Lo fundamental al definir una población es que sea acorde a los objetivos
que nos planteamos en el estudio y que esté delimitada en el tiempo y en el
espacio, de modo que sea identificable y podamos distinguir entre quienes
componen la población y quienes no.

MUESTRA: Al recoger datos relativos a las características de una población
muchas veces es difícil, costoso o poco práctico observar todo el grupo,
sobre todo cuando se trata de conjuntos grandes.
En ese caso, se relevan los datos sólo para una parte de la población, a la
cual se le llama MUESTRA.
Una muestra tomada con determinados criterios de aleatoriedad (para ello
nos servimos de la teoría del muestro) puede considerarse representativa de
la población y los estadísticos que construyamos a partir de ella permiten
realizar estimaciones sobre lo que sucede con esas características en toda
la población.
Como ya dijimos, estas estimaciones corresponden a la estadística
inferencial, que se basa en la teoría de las probabilidades. Existe un
margen de incertidumbre sobre las conclusiones que se sacan para la
población y se trabaja bajo determinados supuestos sobre la pertinencia de
generalizar a la población a partir de la información obtenida en al
muestra. En estos casos, la estadística descriptiva se encarga de resumir
la información y analizar solamente la muestra, sin inferir conclusiones
sobre la población.

CENSO: Es un relevamiento de todos los elementos de la población. Puede
considerarse un caso especial de muestra, cuando el tamaño de la misma
coincide con el de la población.

Por ejemplo: para estudiar el mercado de trabajo en Uruguay periódicamente,
no se entrevista a todos los habitantes del país sino que se toma una
muestra de hogares e integrantes de los mismos, a los cuales se les aplica
la Encuesta Continua de Hogares.
En cambio, cuando se realiza un Censo de Población, se entrevista a todas
las personas que se encuentran en el país ese día. Dentro de los temas que
releva el Censo de Población se incluye el del mercado de trabajo.
En el caso de la Encuesta de Hogares, obtenemos el número de desocupados de
la muestra, el cual sirve para estimar la desocupación a nivel de toda la
población (por lo cual hay una margen de error, una incertidumbre sobre en
qué medida ese valor es el que corresponde a la población). En el caso del
Censo, el número de desocupados nos indica (salvo errores de relevamiento)
la desocupación en el país, sin esa "incertidumbre".

Durante este curso vamos a trabajar bajo el supuesto que siempre estamos
observando a todos los elementos de la población, es decir, realizando un
CENSO.


Extraído de Bueno, Concepción y Escudero, Tomás: Apuntes de Estadística
para profesores.Curso 2006/2007.Instituto de Ciencias de la
Educación.Universidad de Zaragoza



La población está compuesta por las UNIDADES DE ANALISIS.
La UNIDAD DE ANALISIS es el elemento mínimo de una población y de una
muestra, en tanto se lo considera como poseedor de ciertas propiedades,
atributos o características denominadas variables. Por ejemplo: los
estudiantes univesitarios son unidades de análisis si consideramos su año
de ingreso, su centro de estudios o su edad. O, por ejemplo, los centros de
estudio universitario son unidades de análisis si consideramos su número de
estudiantes; cantidad de salones; números de docentes por materia. En
nuestros estudios, nos interesará relevar las carácterísticas de la
unidades de análisis y sacar conclusiones sobre la población en base a esta
información.

Para obtener los datos de las unidades de análisis debemos relevar la
información. Las herramientas para relevar la información pueden ser
entrevistas (encuestas) pero también podemos obtener información de
registros administrativos, documentos, artículos de prensa, observación
directa.
La UNIDAD DE RELEVAMIENTO es la Unidad que aporta la información para la
construcción del dato estadístico. Muchas veces coincide con la unidad de
análisis, pero en otros casos no. Por ejemplo, si estamos interesados en
estudiar características de los hogares (por ejemplo: los ingresos del
hogar, el número de miembros que trabajan, etc.) nuestro relevamiento lo
haremos sobre los miembros del hogar (les preguntaremos por sus ingresos y
su condición laboral). Pero cuando construyamos los datos, tomaremos esa
información y caracterizaremos con ella al hogar. En este caso, la unidad
de relevamiento son los miembros del hogar pero la unidad de análisis (que
es la que queremos estudiar) son hogares.

Hemos visto que nos interesa caracterizar a nuestra unidades de análisis.
De ahora en adelante hablaremos de VARIABLES, como los instrumentos que nos
permiten hacer esa caracterización. Una VARIABLE es una propiedad,
atributo o característica de una unidad de análisis, susceptible de adoptar
diferentes valores o categorías.
Los valores o categorías que adopta una variable constituyen un SISTEMA DE
CATEGORIAS. Este sistema tiene dos propiedades fundamentales: sus
categorías deben ser MUTUAMENTE EXCLUYENTES y el sistema debe ser
EXHAUSTIVO para la población en estudio.
Sigamos con el ejemplo del estudio de los hogares de acuerdo a su nivel de
ingresos y al número de miembros del hogar que trabajan.
Tenemos dos variables.
La primera podemos llamarla INGRESOS DEL HOGAR, y vamos a construir un
sistema de categorías para ella. Supongamos que relevamos los ingresos de
todos los miembros de un hogar. Con esta información podemos obtener el
dato que corresponde a ese hogar. Deberemos hacer lo mismo con cada uno de
los hogares que constituyen nuestra población en estudio.
Obtenidos nuestros datos para todos los hogares, queremos expresar el
sistema de categorías de esta variable.
Un sistema de categorías posible podría ser cada uno de los valores
obtenidos, por ejemplo: $2000, $4500, $ 7000, etc.
Para explicitar un sistema de categorías así (que tiene muchos valores
posibles), lo mejor es buscar el valor más bajo y el más alto y expresarlo
como:
$ 2000, ….., $ 70000.
Otro sistema de categorías posible, si no nos interesa tener tan
desagregada la información, podría ser identificar a los hogares en esta
variable en tramos de ingreso.
Por ejemplo: $ 2000 a $10000, $10001 a $40000, $40001 a 70000.
En este caso tendríamos tres categorías en nuestro sistema y los hogares
tendrían como valor o categoría en esta variable su pertenencia a uno de
los tres tramos (nos "olvidamos" de sus valores originales.
Pero nos interesa entender las propiedades del sistema de categorías.
Supongamos que tenemos este segundo sistema.
Si hubiéramos armado los tramos de esta manera: $2000-10000, $10000-40000,
$40000-70000, tendríamos dificultades para saber a qué categoría
corresponde un hogar que tiene $10000 como ingreso. ¿En qué categoría lo
coloco? ¿En la primera (2000 a 10000) o en la segunda (10000 a 40000)? A
esto nos referimos con la idea que las categorías deben ser mutuamente
excluyentes. Frente al sistema, no tengo que tener duda de cuál es la
categoría que le corresponde a cada unidad.
Supongamos ahora que mi sistema es $ 5000 a $10000, $10001 a $40000, $40001
a 70000. ¿Cuál es la categoría que le corresponde al hogar que gana $2000?
No tengo ninguna categoría que lo incluya. La idea de exhaustividad implica
que mi sistema debe "cubrir" todos los valores posibles de la variable para
mi población.
La exhausitividad de un sistema de categorías está relacionado con la
población en estudio: si por ejemplo estamos estudiando el nivel educativo
de un país, nuestro sistema de categorías para esa variable tendría que
tener por ejemplo, las siguientes categorías:
Sin instrucción, Primaria, Secundaria-UTU, Terciaria y posterciaria.
Sin embargo si estoy estudiando el nivel educativo de una población de
menores de 16 años, alcanza con tener el siguiente sistema: Sin
instrucción, Primaria, Secundaria-UTU, ya que la educación terciaria no ha
de aparecer como categoría para ninguna de las unidades de análisis de esta
población por la edad que tienen.

La información sobre nuestra población la vamos organizar en una MATRIZ DE
DATOS. Una matriz de datos contiene en sus filas a cada una de las
unidades, en sus columnas a las variables que caracterizan a esas unidades.
Y cada celda está compuesta por el valor que asume la variable de esa
columan para la unidad de análisis de esa fila.
Un DATO, en el contexto de nuestra disciplina es el valor que toma una
variable en una unidad de análisis. Por esta razón se dice que su
estructura es "tripartita": refiere simultáneamente a la unidad de
análisis, a la variable y a la categoría o valor.

En la matriz de datos esta estructura tripartita se hace visible, al
presentar las unidades en las filas, las variables en las columnas y el
DATO como "cruce" de esos dos "vectores".

Siguiendo nuestro ejemplo de los hogares, una matriz de datos podría ser:
" "Ingresos "Número de miembros "
" "del hogar"que trabajan "
"Hogar 1 "$2000 "2 "
"Hogar 2 "$70000 "4 "
"Hogar 3 "$ 4500 "0 "
"…. " " "

Que indica que el hogar uno tiene $ 2000 de ingreso y trabajan 2 de sus
miembros, en el hogar 2, el ingreso es $ 70000 y trabajan 4 miembros, etc.
La matriz de datos tiene tantas filas como el tamaño de la población y
tantas columnas como variables.

«MEDICIÓN Y ESCALAS DE MEDICIÓN»

¿Qué se mide?

Respecto a este problema encontramos referencias tales como:

«La medición es un método que permite establecer correspondencias entre
magnitudes de un mismo género, y ciertas clases de números (integrales,
racionales o reales)» en Russell (1938);

«Medir es asignar numerales a las propiedades de los sistemas materiales
según las leyes que presiden esos atributos» (Campbell, 1938);

«Es la atribución de numerales a los objetos o sucesos conforme con leyes o
reglas» (Stevens, 1951).

Lo que destaca de cualquiera de estas definiciones es que si bien la
medición se realiza sobre los elementos u objetos (unidades de estudio) son
las variables las que posibilitan la división en clases. Esto nos abre a la
necesidad de conocer la naturaleza de las variables para conocer como medir
sus propiedades.


2.1 Las Escalas y los Niveles de Medición




Comenzaremos con un ejemplo que nos introducirá en la idea de naturaleza
distinta de las variables. Dada una población puede decirse cuáles de los
individuos son solteros, casados, divorciados o cualquiera otra categoría
de la variable "estado civil". Pero sobre estos mismos individuos se puede
decir cuáles no tienen hijos y cuales sí. Sobre este segundo atributo de
las unidades de registro se puede, además medir cuales no tienen hijos,
cuales tienen un hijo, cuales dos, etc…. Ahora bien, si relevamos la
característica "tener o no tener hijos" es diferente de si relevamos
cuantos hijos tiene, a pesar que las característica de interés es la misma.
Lo que difiere son las mediciones en los modos en que se manifiesta la
variable.

En el caso de "tener hijos", el acto queda restringido a clasificar las
unidades de registro y/o análisis que muestran la presencia o ausencia de
un atributo; se le puede asignar un número a esta característica, pero no
es cuantificable. Son características cualitativas. En el segundo caso, se
puede estimar objetivamente no sólo la presencia o ausencia de determinado
atributo (tener hijos), sino también la intensidad con que la propiedad se
manifiesta, propiedad que se asume en cantidades.

Basándose en esta diferencia entre las formas de clasificar variables por
referencia a este criterio de calidad-cantidad, la Estadística distingue,
ya en un grado mayor de complejidad, la medición de acuerdo al tipo de
escala o nivel de medición, en que se encuentran expresados los atributos
que queremos medir.

Se trata de operaciones clasificatorias, o sea, ubicación de las unidades
de análisis en clases, clases que tienen ciertas propiedades formales. De
estas propiedades se deducen definiciones exactas de las características de
la escala mucho más precisas de lo que pueden darse en términos verbales.
Estas propiedades pueden formularse en forma más abstracta de lo hasta aquí
expresado, mediante un conjunto de axiomas que delinean las operaciones
para elaborar las escalas y las relaciones entre los objetos a que se
aplican.

Se distinguen cuatro tipos de escala:
nominal
ordinal
interval
de razón


"A. LA ESCALA NOMINAL "

Consiste en clasificar objetos o fenómenos, según ciertas características,
tipologías o nombres, dándoles una denominación o símbolo, sin que implique
ninguna relación de orden, distancia o proporción entre los objetos o
fenómenos.

En la escala nominal los números sólo sirven para distinguir categorías,
estos no poseen propiedades cuantitativas y sirven solamente para
identificar las clases. Por lo tanto, los numerales utilizados en la
clasificación no son cuantitativos. Ni siquiera se puede realizar un orden
de las observaciones con sentido.

La medición se da a nivel elemental en estos casos (se dice que es el nivel
más bajo de medición)

En una escala nominal, la operación de escalamiento consiste en partir de
una característica dada y formar un subconjunto de clases que se excluyen
mutuamente. La única relación implicada es la de equivalencia. Esto es, los
miembros de cualquier clase deben ser equivalentes en la propiedad medida.
La relación de equivalencia es reflexiva (x = x para todo x), simétrica (x
= y luego y = x) y transitiva (x = y et y = z luego x = z).

Los símbolos que designan a los diferentes grupos en una escala nominal
pueden intercambiarse sin alterar la información esencial de la escala;
debido a esto, las estadísticas de tipo descriptivo admisibles son aquellas
que no se alteran por este proceso: el modo, la frecuencia, el conteo, la
proporción, etc. Se pueden desarrollar procesos analíticos acerca de la
distribución de las categorías, así como la posible relación entre dos o
más características clasificadas mediante este tipo de escala que
llamaremos "variables cualitativas".

"Ejemplo de escala nominal: variable "
"estado civil "
























Otros ejemplos de escala nominal:


"Sexo (1. masculino; 2. femenino) "
"Tipo de propiedad (1. oficial; 2. privada; 3. mixta; 4. "
"cooperativa) "
"Departamento de origen (1. Artigas; 2. Canelones; 3. "
"Colonia, etc….) "
"Conformidad (1. Si; 0. No) "


"B. LA ESCALA ORDINAL "

Para las mismas personas también se pueden medir propiedades donde la
clasificación debe seguir un orden jerárquico. Se trata de la escala
ordinal. Con ella se establecen posiciones relativas de los objetos o
fenómenos en estudio respecto a alguna característica de interés, sin que
se reflejen distancias entre ellos.


"Suponga que a los clientes en un negocio se les hace unas"
"preguntas para valorar la calidad del servicio. Los "
"clientes valoran la calidad de acuerdo a las siguientes "
"respuestas: 1 (Muy satisfecho), 2 (satisfecho), 3 "
"(Insatisfecho), 4 (Muy insatisfecho). Estos datos son "
"ordinales. Note que una valoración de 1 no indica que el "
"servicio es dos veces mejor que cuando se da una "
"valoración de 2. Sin embargo podemos decir que la "
"valoración de 1 es preferiblemente mejor que 2, y así en "
"los demás casos. "


Puede suceder que los objetos de una categoría de las escala no sean
precisamente diferentes a los objetos de otra categoría de la escala, sino
que están relacionados entre sí, guardan una relación de jerarquía. Los
numerales empleados en las escalas ordinales no son cuantitativos, sino que
indican exclusivamente la posición en la serie ordenada y no "cuantifican"
la diferencia entre posiciones sucesivas de la escala.


Las relaciones entre los elementos en clasificación, pueden formularse con
el signo >, mayor que, o sea que axiomáticamente la diferencia fundamental
entre una escala nominal y una ordinal es que esta última incorpora no
solamente la relación de equivalencia (=) sino también la relación ''mas
grande que'' (>). Esta relación es irreflexiva (no es verdad para ninguna x
tal que x > x), asimétrica ( x > y luego x < y ) y transitiva (x > y et y >
z luego x > z ).

Puesto que cualquier transformación tendiente a conservar el orden no
altera la información contenida en una escala ordinal, se dice que la
escala es "única hasta una transformación monotónica". Esto es, no importa
que números se den a una pareja de clases o a los miembros de esas clases,
siempre que el número mayor sea dado a los miembros de la clase mayor o mas
preferida. Por supuesto, pueden usarse números menores para grados mas
preferidos (3. de primera clase, 2. de segunda clase, 1 de tercera clase);
en tanto se sea consecuente, es indiferente el uso del número mayor o menor
para denotar "mayor" o "mas preferido".

Fundamentalmente, las escalas ordinales se estudian en Estadística, con
base en las llamadas "estadísticas de orden" o "estadísticas de rango":
máximos, mínimos, mediana, percentiles, etc…





"Ejemplo de escala ordinal: satisfacción con el "
"resultado "


"1º "Muy Satisfecho "
" " "
" "Satisfecho "
" " "
"2º "Insatisfecho "
" " "
" " "
" " "
"3º "Muy insatisfecho "
" " "
"4º " "
" " "








" C. LA ESCALA DE "
"INTERVALO "


Representa un nivel de medición más preciso, matemáticamente hablando, que
las anteriores. No sólo se establece un orden en las posiciones relativas
de los objetos o individuos, sino que se mide también la distancia entre
los intervalos o las diferentes categorías o clases. En este caso, la
medición se ejecuta en el sentido de una escala de intervalo; esto es, si
la asignación de números a varias clases de objetos es tan precisa que se
sabe la magnitud de los intervalos (distancias) entre todos los objetos de
la escala, se ha obtenido una medida de intervalo. Una escala de intervalo
está caracterizada por una unidad de medida común y constante que asigna un
número real a todos los pares de objetos en un conjunto ordenado. En esta
clase de medida, la proporción de dos intervalos cualesquiera es
independiente de la unidad de medida y del punto cero. En una escala de
intervalo, el punto cero y la unidad de medida son arbitrarios.

Axiomáticamente se puede ver que las operaciones y las relaciones en que se
origina la estructura de una escala de intervalo son tales que las
diferencias en la escala son isomórficas a la estructura de la aritmética.
Los números pueden asociarse con las posiciones de los objetos de tal
manera que las operaciones de la aritmética puedan realizarse
significativamente con las diferencias entre los números.

La consecuencia de cualquier cambio de los números asociados con los
objetos medidos en una escala de intervalo debe preservar no solamente el
orden de los objetos sino también las diferencias relativas entre ellos.
Esto es, la escala de intervalo es "única hasta una transformación lineal".
La escala de intervalo es la primera escala verdaderamente cuantitativa.
Las estadísticas paramétricas, son las aplicables a estudios en estas
escalas.


"Ejemplo de variable interval: etapas "
"cronológicas "




"2050 "
"2000 "
"1950 "
"1900 "




Suponga que se está interesado en algún período histórico específico y se
están haciendo proyecciones demográficas. Se quiere conocer el crecimiento
poblacional cada 50 años. Obviamente los datos pueden ser ordenados
(semejante a los datos ordinales) en orden ascendente indicando pasado/s y
futuro/s sucesivamente. Además , las diferencias entre los valores
ordenados pueden ser comparadas. Aquí el intervalo entre los valores de los
datos 1900 y 1950 representan un incremento en la historia de 50 años, y lo
mismo en los demás intervalos. Hay que tener encuentra que en esta escala
no hay un cero absoluto o real, el cero es arbitrario; depende del tipo de
calendario que estemos usando.

"La presente base de datos tiene por objeto presentar "
"información detallada de la población de los 20 países de "
"América Latina, desglosada por edades simples y años "
"calendario, correspondiente al período 1950 - 2050. Estas "
"estimaciones se generan a partir de las proyecciones "
"nacionales utilizando un procedimiento diseñado en el Área "
"de Demografía del Centro Latinoamericano y Caribeño de "
"Demografía- División de Población (CEPAL/CELADE). Una "
"parte de esta información (1995 - 2005) se publica en este"
"Boletín Demográfico (No. 66) y corresponde a las "
"estimaciones y proyecciones vigentes, sustituyendo así las "
"publicadas en el Boletín Demográfico No. 60 de julio de "
"1997. "
" "
" "
" "
" "
"año "
"Población Total América Latina "
" "
"1950 "
"160.685.269 "
" "
" "
"2000 "
"507.932.043 "
" "
" "
"2050 "
"800.592.305 "
" "
" "
" "




" D: LA ESCALA DE "
"RAZON "


Cuando una escala tiene todas las características de una escala de
intervalo y además un punto cero real en su origen, se llama escala de
razón. Además de distinción, orden y distancia, ésta es una escala que
permite establecer en que proporción es mayor una categoría de una escala
que otra. El cero absoluto o natural representa la nulidad de lo que se
estudia. Las operaciones y relaciones hechas con los valores numéricos en
una escala de razón son correspondientes a una escala isomórfica de la
estructura de la aritmética. Por consiguiente las operaciones de la
aritmética son permisibles en los valores numéricos asignados a los objetos
mismos, así como también en los intervalos entre los números como sucede en
las escalas de intervalo. Implican que las relaciones de equivalencia,
relación de mayor a menor, proporción conocida de dos intervalos y
proporción conocida de dos valores de la escala, sean posibles de obtener
operacionalmente. Los números asociados con los valores de la escala de
razón son "verdaderos" números con un verdadero cero; solo la unidad de
medida es arbitraria. Así la escala de razón es "única hasta la
multiplicación por una constante positiva". Además de los procesos
paramétricos básicos de las escalas de intervalo, en las de razón pueden
utilizarse estadísticas como la media geométrica, el coeficiente de
variación, las que requieren el conocimiento del verdadero valor cero

"Ejemplo de variable de razón: número de miembros del "
"hogar ocupados "




"3 "
"2 "
"1 "
"0 "




Suponga que se quiere medir los ingresos percibidos por las distintas
personas empleadas en una empresa de servicios. Los valores relevados han
sido, 2, 1 – 2, 2 – 2,3 …… en miles de pesos. El orden (ordinal) y la
diferencia (intervalo) en el ingreso percibido puede ser comparado, pero
también el incremento de lo percibido de 2.0 a 2.1 es de 100 pesos (o 0,1
miles de pesos), el cual es el mismo que el que existe entre 2.2 y 2.3
miles de pesos. También, cuando comparamos los pesos de 2.0 a 2.2 miles de
pesos, se encuentra una razón significativa, quien gana 2,2 gana 10 % más
que quien gana 2, 0 miles de pesos.


" "
"El Número como Nombre, Orden o Medida (tomado de Bar; 2000) "
"Para Cohen y Nagel (1979), los números pueden tener por lo menos "
"tres usos distintos, como rótulos o marcas de identificación; como "
"signos que indican la posición de un grado en una serie de grados; "
"o como signos que indican las relaciones cuantitativas entre "
"cualidades. De lo dicho se desprende que sólo la última de las "
"acepciones relaciona el número con la medición. "
"Esta forma de concebir los números conduce a una clasificación de "
"variables o escalas en función de los atributos que presenta una "
"serie numérica. Dichos atributos son, el orden, la distancia y el "
"origen. "
"Las escalas nominales carecen de todas estas propiedades, y en este"
"caso el número sólo puede adoptarse como nombre o identificación. "
"Las escalas ordinales, como su nombre lo indica, sólo poseen orden,"
"es decir que organizan sus datos a través de las relaciones de "
"igualdad, mayor o menor. Las escalas interválicas poseen atributos "
"de orden, y distancia o estimación precisa de las unidades. Pero "
"carecen de origen, o cero natural, o ausencia de la propiedad. No "
"obstante estas escalas acuden a la utilización del cero "
"convencional. Las escalas proporcionales o racionales son las "
"únicas que cuentan con las tres propiedades y, por lo tanto, se "
"constituyen en verdaderas series numéricas. Las dos últimas clases "
"de escalas son las que realmente miden, no obstante, al carecer las"
"interválicas de cero natural, no pueden establecerse proporciones. "
" "

" "
"A menudo, datos provenientes de escalas ordinales numéricas "
"son tratados como si fuera información verdaderamente "
"cuantitativa, lo que constituye una falacia, pues no miden, "
"aunque sí clasifican. En este caso se encuadran los tests "
"psicométricos, (las evaluaciones de desempeño, las "
"calificaciones de los alumnos en la facultad[1]), los cuales "
"únicamente pueden estimar el orden de puntuación, pero nunca "
"la distancia entre dos valores. Con mucha frecuencia, las "
"puntuaciones de dichos procedimientos reciben tratamiento de "
"variables interválicas y, consecuentemente, el cálculo de "
"medidas de tendencia central y dispersión, además de otras "
"operaciones derivadas de ellas. Dichas operaciones no son "
"válidas por cuanto asignan a las escalas un status que en "
"realidad no tienen. "
EJERCICIOS

1. En este módulo es importante entender algunos conceptos básicos antes de
seguir adelante. Responde las preguntas y realiza las actividades
siguientes, que sintetizan los principales aspectos del módulo.

¿Cuál es la diferencia entre Estadística y Estadísticos?


Piensa ejemplos de Estadísticos que puedan resultar útiles para aplicar
en el campo de las relaciones laborales.


Explica la diferencia entre Estadística Descriptiva y Estadística
Inferencial.


Distingue entre población y muestra. Cita ejemplos de estudios para los
cuales sea factible trabajar con toda la población (censo) o con
muestras. Fundamenta.


¿Qué relación hay entre las unidades de análisis y la población?


Piensa ejemplos de variables con sus sistemas de categorías. Identifica
el nivel de medición.


2. Identifica las escalas de medición de las siguientes variables, de
acuerdo al sistema de categorías que se les ha asignado.

"Variable "Categorías "Escala de "
" " "medición "
"Nivel "Ninguno " "
"educativo "Primaria " "
" "Secundaria " "
" "Terciaria " "
"Nivel "0 año aprobado " "
"educativo "1 año aprobado " "
" "2 años aprobados " "
" "…… " "
"Categoría "Patrón " "
"de "Empleado público " "
"ocupación "Empleado privado " "
" "Cooperativista " "
" "Trabajador por cuenta propia " "
" "Trabajador familiar no " "
" "remunerado " "
" " " "
" " " "
" " " "

3. Se quiere realizar un estudio para conocer el perfil de la plantilla de
trabajadores de una empresa comercial del área del supermercadismo.
Imagina qué características podrían ser de interés estudiar. Identifica las
variables que se corresponden con esas características y el sistema de
categorías que les asignarías. Menciona el nivel de medición de cada
variable.
Construye la estructura de la matriz de datos en la cual se volcaría la
información recogida.

4.La figura siguiente muestra una de las páginas del formulario de la
Encuesta Nacional de Hogares Ampliada, con preguntas que se relevan de cada
integrante del hogar.


Identifica las variables que aparecen, así como sus sistemas de
categorías y niveles de medición.
ANEXO: REPASANDO ALGUNOS CONCEPTOS MATEMATICOS

Sumatoria:

Cuando queremos escribir en forma simplificada la suma de un conjunto
grande (e incluso infinito) de sumandos utilizamos una notación especial
representada por la letra griega sigma ( Σ )

Si tenemos n sumandos, representamos a cada uno con la letra X.
El primer sumando es X1, el segundo es X2, … el último es Xn.

Entonces, una suma de X1+ X2+…+ Xn la representamos de la forma:



Xi es el "i-ésimo" sumando. En la notación de sumatoria estamos expresando
que vamos a ir sumando las X, desde la que tiene subíndice 1 (i=1) hasta la
que tiene subíndice n (i=n). La letra "i" representa el índice de la
sumatoria.
Por ejemplo:
Tenemos los siguientes datos y queremos obtener su suma:
3, 8, 17, 5 . La forma "no simplificada" de representar esta suma sería: 3+
8 + 17 + 5
Pero si identificamos cada dato de la siguiente forma:
X1=3; X2=8; X3=17; X4=5;
Podemos expresar la suma como una sumatoria: , lo cual simplifica la
notación y está representando la misma suma:

Veremos que esta notación es importante para expresar varias de las
herramientas estadísticas que veremos durante el curso.
Algunas propiedades de las sumatorias que utilizaremos en el curso:
La suma de una expresión que es la suma de dos ó más términos es igual
a la suma de las sumas de los términos por separado:

Ejemplo: X1=2, X2=4; Y1=5, Y2=1, Z1=8, Z2=1.


La suma de una constante multiplicada por una variable es igual que la
constante multiplicada por la suma de la variable, esto es



Donde a es una constante, es decir, un número que no está "indexado" en la
sumatoria.

Ejemplo:

a=3; X1=5; X2=4; X3=2



La suma de una constante, es igual a n veces la constante, esto es:



Ejemplo:
Sea a=4, y n=3,

Fracciones, Razones, Proporciones y Porcentajes:

En el curso es importante manejar el concepto de proporcionalidad y algunas
herramientas matemáticas asociadas.

Operando con fracciones

Recordemos algunas propiedades de la operatoria con fracciones:

ejemplo:
ejemplo:

Uniendo ambas propiedades:

ejemplo:


Proporcionalidad y regla de tres
Una razón entre dos cantidades es una comparación por cociente, para lo
cual nos servimos de las fracciones: , tanto para expresarla como para
calcularla. Sin embargo, muchas veces encontramos esta otra notación: a:b.

En las razones el numerador no es necesariamente un subconjunto del
denominador.

Por ejemplo:
Decimos que hay una razón de 12 obreros cada 5 administrativos en una
determinada empresa. En este caso los obreros están en un conjunto distinto
al de los administrativos. En cambio si decimos hay una razón de 8 obreros
cada 20 empleados de la empresa, estamos comparando un subconjunto
(obreros) con el conjunto total (empleados).
La igualdad entre dos razones se denomina proporción.
La propiedad:, se denomina propiedad fundamental de las proporciones.
La forma de verificar la proporcionalidad es comprobar que los productos
cruzados son iguales.
Por ejemplo, el jornal diario de una determinada categoría laboral en una
empresa es de $200 por 4 horas de trabajo. Se paga por hora trabajada, sin
que el valor hora se modifique por jornadas con distinta carga horaria.
Entonces, el trabajador que realiza una jornada de 6 horas, va a ganar
$300.
En este caso, utilizamos la idea de proporcionalidad:

y esto lo podríamos verificar haciendo el producto cruzado, que debe dar el
mismo resultado: 200*6=300*4=1200.
La propiedad fundamental de la proporcionalidad permite aplicar la llamada
"regla de tres", para hallar un valor que es proporcional a otro.
En el ejemplo que utilizamos, si sabemos que por 4 horas de trabajo pagan
$200, y que el jornal es proporcional al número de horas, entonces podemos
hallar cuánto gana alguien que trabaja 6 horas usando la regla de tres:
4 ----- 200
6 ------ x
Que leemos como: "4 es a 200, como 6 es a x", haciendo referencia a la idea
de proporcionalidad.

Como sabemos que los productos cruzados deben ser iguales:
6*200=4*x, lo cual nos permite despejar nuestra incógnita (x):
Es decir: a ---- b
c ---- x


Nos van a interesar en particular dos tipos de razones:

Las proporciones a 1: Estas proporciones son fracciones que comparan un
número con 1.
Para hallar la proporción de a en relación a n: . Por ejemplo, si
queremos saber qué proporción de integrantes de un hogar trabajan, a sería
el número de integrantes del hogar y n el total de integrantes del hogar
(dentro de los cuales están incluidos los miembros que trabajan).

Proporción que trabaja = número de integrantes que trabajan/total
integrantes del hogar
Los porcentajes: son fracciones que se obtienen al comparar un número con
100.


En el ejemplo anterior:
% que trabaja = número de integrantes que trabajan*100/total integrantes
del hogar

Cuando se tiene una proporción, alcanza con multiplicar ésta por 100 para
obtener el porcentaje.

En el próximo módulo utilizaremos estas dos herramientas para construir las
distribuciones de frecuencias relativas y las frecuencias relativas
porcentuales

-----------------------
[1] El texto entre paréntesis es agregado del autor
Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.