Estadística básica para educación física

Share Embed


Descripción

                                                                                                                      

                                                                                                    !    "#$%"    &                     !       ' ()    )   * (  + , ()  -       .  -     

            .&../01

      

      

    

& 2    3      -    #   *   "    41                      5     5 2    -   &    *      6   .+ * 

  

   

     

      

 

    

      

    

       

        

    

                                    

 !      "        #      $  !%  !      &  $   '      '    ($     '   # %  % )   % *   % '   $  '      +      " %        &  '  !#       $,  ( $    - .            /                -            .       .     !  0     1          . (      -       %            1                            /  -      %      %    %      %        %  %        -    %            2                        1   -   -  1% %     2  3   $$$    4 5  5 " 6 5  7       8& )*93 +) * !: !& ;!=&  %  "  5 35 -  ? !   *   &     @ .  31    A>B=C8& )*93 +) "D   0       &  >B=C

Dedicado a mis hermanas Miriam y Yessenia

FERNANDO MAUREIRA CID

2

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

AGRADECIMIENTOS

Este libro se gestó en base a las necesidades y dudas relacionadas con los análisis estadísticos de mis estudiantes del Grupo de Neurociencia Cognitiva y Educación Física, para quienes espero este libro sea de utilidad. Agradezco enormemente a Elizabeth Flores Ferro Magíster en Docencia e Investigación Universitaria y Profesora de Educación Física por su paciencia y compromiso en la revisión de cada uno de los análisis estadísticos de este libro, sin ella este libro hubiese tardado mucho más en ver la luz.

3

FERNANDO MAUREIRA CID

4

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

CONTENIDOS ABREVIADOS

Introducción……………………………………………………….

19

Capítulo 1: Características de la estadística…………………

21

Capítulo 2: Estadística descriptiva….…………………………

37

Capítulo 3: Distribuciones de probabilidades………………..

89

Capítulo 4: Introducción a la estadística inferencial…………..

113

Capítulo 5: Estadística paramétrica para una y dos poblaciones………………………………………..

135

Capítulo 6: Estadística paramétrica para tres y más poblaciones………………………………………..

181

Capítulo 7: Asociación de variables en estadística paramétrica………………………………………..

203

Capítulo 8: Estadística no paramétrica………………………..

219

Capítulo 9: Análisis estadísticos en SPSS….……………….. 261 Referencias bibliográficas……………………………………… 32 Anexos…………………………………………………………… 32

5

FERNANDO MAUREIRA CID

6

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

INDICE DE CONTENIDOS

Introducción…………………………………………………….

19

CAPÍTULO 1 CARACTERÍSTICAS DE LA ESTADÍSTICA………………… I. Conceptos en estadística.….…………………………… 1. Definiciones básicas..……………………………… 2. Niveles de medición..………………………………. 2.1 Datos categóricos.…………………………… 2.1.1 Variables categóricas nominales..…… 2.1.2 Variables categóricas ordinales……… 2.2 Datos numéricos……………………………. 2.2.1 Variables intervalares…………………. 2.2.2 Variables de razón…………………….. 3. Análisis de datos……………………………………. II. Desarrollo histórico de la estadística…………………

21 23 23 26 26 26 27 27 27 28 28 31

CAPÍTULO 2 ESTADÍSTICA DESCRIPTIVA…………………………………. I. Representación de datos………………………………. 1. Tablas de frecuencia………………………………… 2. Gráficos de barra y torta…………………………… 3. Histograma………………………………………….... 4. Polígonos de frecuencia…………………………… 5. Ojiva…………………………………………………… II. Medidas de tendencia central………………………… 1. Media………………………………………………… 2. Mediana……………………………………………… 3. Moda…………………………………………………. III. Medidas de dispersión y posición…………………… 1. Amplitud o Rango…………………………………… 2. Varianza……………………………………………… 3. Desviación estándar…………………………………

37 39 39 42 44 50 52 55 55 57 60 63 63 64 65 7

FERNANDO MAUREIRA CID

4. Percentiles…………………………………………… 5. Cuartiles……………………………………………… 6. Quintiles y deciles…………………………………… IV. Medidas de forma……………………………………… 1. Asimetría……………………………………………… 2. Curtosis………………………………………………. 3. Distribuciones según su forma……………………. V. Gráfico de caja y dispersión…………………………… 1. Gráfico de caja (Box-plot)…………………………… 2. Gráfico de dispersión (Scatter-plot)………………. CAPÍTULO 3 DISTRIBUCIONES DE PROBABILIDADES……..…………. I. Distribuciones discretas………………………………… 1. Distribución de Bernoulli…………………………… 2. Distribución binominal……………………………… 3. Distribución de Poisson……………………………. 4. Distribución hipergeométrica……………………… II. Distribuciones continúas………………………………. 1. Distribución normal…………………………………. 2. Distribuciones con muestras pequeñas…………… 2.1 La distribución t de Student o distribución t………………………………… 2.2 La distribución Chi cuadrada (X2)…………. 2.3 Distribución F de Fisher……………………. 3. Distribución Z………………………………………… CAPÍTULO 4 INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL……. I. Conceptos en estadística inferencial…………………. 1. Nivel de significancia………………………………… 2. Métodos en inferencia estadística………………… 2.1 Estimaciones puntuales…………………… 2.2 Estimaciones por intervalos……………….. 2.3 Contraste de hipótesis……………………… 8

68 69 70 73 73 76 78 81 81 85

89 91 93 94 97 99 103 103 104 105 106 106 108

113 115 115 118 118 120 120

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

II. Muestra y muestreo……………………………………… 1. Cálculos de muestras………………………………. 1.1 Poblaciones infinitas…….…………………. 1.2 Poblaciones finitas…………………………… 1.3 Muestras para construir un instrumento de medición………………….. 2. Muestreo……………………………………………… 2.1 Muestras probabilísticas……………………. 2.2 Muestras no probabilísticas………………… CAPÍTULO 5 ESTADÍSTICA PARAMÉTRICA PARA UNA Y DOS POBLACIONES………………………………………………… I. Normalidad de datos……………………………………. 1. Prueba KS de normalidad…………………………. II. Intervalos de confianza para una población……… 1. Error estándar de la media………………………… 2. Intervalos de confianza para la media de una población con S conocida…………………………. 3. Contraste de hipótesis para la media de una población con S conocida…………………………. 4. Intervalos de confianza para la media de una población con S desconocida………………………. 5. Contraste de hipótesis para la media de una población con S desconocida……………………… 6. Intervalos de confianza para una proporción…… 7. Contraste de hipótesis para una proporción……… III. Homogeneidad de varianzas…………………………. 1. Igualdad de varianzas de dos grupos……………. 2. Igualdad de varianzas de tres o más grupos de igual tamaño…………………………………………. 2.1 Prueba de Cochran…………………………. 2.2 Prueba de Hartley…………………………… 3. Igualdad de varianzas de tres o más grupos de diferentes tamaños………………………………….

121 124 125 127 128 129 129 132

135 137 137 143 143 146 147 148 150 151 152 155 155 157 157 159 160 9

FERNANDO MAUREIRA CID

IV. Prueba t de Student para muestras independientes………………………………………… 1. Error estándar de la diferencia de medias independientes……………………………………… 2. Intervalos de confianza para la diferencia de medias independientes……………………………… 3. Valor t para muestras independientes……………………………………… 4. Tamaño del efecto de la prueba t para muestras independientes………………………………………. V. Prueba t de Student para muestras relacionadas……………………………………………… 1. Error estándar de la diferencia de medias relacionadas………………………………………… 2. Intervalos de confianza para la diferencia de medias relacionadas………………………………… 3. Valor t para muestras relacionadas…………………………………………. 4. Tamaño del efecto de la prueba t para muestras relacionadas….………………………………………

165 166 168 169 170 173 174 177 177 178

CAPÍTULO 6 ESTADÍSTICA PARAMÉTRICA PARA TRES O MAS POBLACIONES………………………………………………… I. Análisis de varianza de un factor……………………… 1. Comparaciones posteriores a F…………………… II. Análisis de varianza de un factor de medidas repetidas………………………………………………….. 1. Comparaciones posteriores a F……………………

193 200

CAPÍTULO 7 ASOCIACIÓN DE VARIABLES EN ESTADÍSTICA PARAMÉTRICA…………………………………………………. I. Coeficiente de correlación de Pearson………………. II. Regresión lineal simple………………………………… 1. Contraste de hipótesis de la regresión lineal…….

203 205 211 215

10

181 183 189

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

CAPÍTULO 8: ESTADÍSTICA NO PARAMÉTRICA…………………………. I. Comparación de medias de dos grupos……………… 1. Prueba U de Mann-Whitney………………………… 2. Prueba de rangos de Wilcoxon…………………… 3. Prueba de Chi cuadrado (X2)……………………… 3.1 Prueba de Chi cuadrado 2x2………………. 4. Prueba de McNemar………………………………… II. Comparación de medias de tres o más grupos….. 1. Prueba de análisis de la varianza unifactorial de Kruskal Wallis………………………………………… 1.1 Comparaciones múltiples…………………… 2. Prueba de varianza por rangos de Friedman……. 2.1 Comparaciones múltiples…………………… 3. Prueba Q de Cochran……………………………… III. Asociaciones no paramétricas……………………….. 1. Coeficiente de correlación de Spearman de rangos ordenados…………………………………… 2. Coeficiente de correlación Phi………………………

CAPÍTULO 9 ANÁLISIS ESTADÍSTICOS EN SPSS………………………. I. Estadística descriptiva………………………………….. 1. Tabla de frecuencia y gráficos……………………… 2. Medidas de tendencia central, dispersión, posición y forma…………………………………….. 3. Gráfico de caja (Box-plot)…………………………… II. Estadística paramétrica………………………………… 1. Prueba de normalidad KS…………………………. 2. Prueba de homogeneidad de varianzas…………. 3. Prueba t de Student para una muestra……………. 4. Prueba t de Student para muestras independientes………………………………………. 5. Prueba t de Student para muestras relacionadas………………………………………….

219 221 221 225 229 232 234 237 237 241 243 247 249 253 253 257

261 263 266 268 270 273 273 274 276 278 281 11

FERNANDO MAUREIRA CID

6. Análisis de varianza de un factor (ANOVA)………. 6.1 Pruebas post hoc…………………………… 7. ANOVA de medidas repetidas……………………… 7.1 Pruebas post hoc…………………………… 8. Correlación de Pearson……………………………. 9. Correlaciones parciales……………………………. 10. Regresión lineal simple…………………………… III. Estadística no paramétrica en SPSS………………… 1. Prueba U de Mann-Whitney………………………… 2. Prueba de Wilcoxon………………………………… 3. Prueba de Chi cuadrado…..………………………. 3.1 Prueba de Chi cuadrado 2x2………………. 4. Prueba de McNemar………………………………… 5. Prueba de Kruskal-Wallis…………………………… 6. Prueba de Friedman………………………………… 7. Prueba Q de Cochran……………………………… 8. Correlación de Spearman…………………………… 9. Correlación Phi………………………………………

284 287 290 295 297 298 300 307 307 309 310 313 314 316 319 320 322 324

Referencias bibliográficas……………………………………

327

ANEXOS………………………………………………………….

329

12

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

INDICE DE FORMULAS

Fórmula 1. Frecuencia relativa………………………………..

40

Fórmula 2. Escala de densidad…………………………………

49

Fórmula 3. Media…………………………………………………

55

Fórmula 4. Mediana………………………………………………

57

Fórmula 5. Rango………………………………………………...

63

Fórmula 6. Varianza……………………………………………...

64

Fórmula 7. Desviación estándar………………………………..

66

Fórmula 8. Percentil………………………………………………

68

Fórmula 9. Cuartil…….…………………………………………..

69

Fórmula 10. Corrección cuartil………………………………….

70

Fórmula 11. Coeficiente de asimetría de Fisher………………

75

Fórmula 12. Coeficiente de apuntamiento de Fisher…………

76

Fórmula 13. Distancia inter-cuartil………………………………

82

Fórmula 14. 1° Cota…….………………………………………..

82

Fórmula 15. 2° Cota…….………………………………………..

83

Fórmula 16. Probabilidades……………………………………..

92

Fórmula 17. Probabilidad binominal……………………………

95

Fórmula 18. Posibilidad de Poisson……………………………

98

Fórmula 19. Modelo hipergeométrico………………………….

100

Fórmula 20. Grados de libertad…………………………………

106

Fórmula 21. Calificación Z……………………………………….

109

Fórmula 22. Tamaño muestra de población infinita………….

126

Fórmula 23. Tamaño muestra de población finita…………….

127

Fórmula 24. Muestreo probabilístico estratificado…………….

130

13

FERNANDO MAUREIRA CID

Fórmula 25. Error estándar de la media con desviación estándar conocida………………………………..

143

Fórmula 26. Error estándar de la media con desviación estándar desconocida……………………………

143

Fórmula 27. Diferencia de la media muestral y poblacional…

145

Fórmula 28. Intervalos de confianza para la media de una población con desviación estándar conocida….

146

Fórmula 29. Intervalos de confianza para la media de una población con desviación estándar desconocida……………………………………….

148

Fórmula 30. Intervalos de confianza para proporciones…….

151

Fórmula 31. Contraste de hipótesis para proporciones………

152

Fórmula 32. Valor F de homogeneidad de varianza de dos grupos………………………………………………

155

Fórmula 33. Prueba de Cochran de homogeneidad de varianza de tres o más grupos………………….

157

Fórmula 34. Prueba de Hartley de homogeneidad de varianza de tres o más grupos………………….

159

Fórmula 35. Prueba de Bartlett de homogeneidad de varianza de tres o más grupos………………….

160

Fórmula 36. Valor C……………………………………………..

160

S2p……………………………………………

160

Fórmula 38. Diferencia de medias independientes…………..

167

Fórmula 37. Valor

Fórmula 39. Error estándar de la diferencia de medias independientes con población con desviación estándar conocida………………………………..

14

167

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Fórmula 40. Error estándar de la diferencia de medias independientes con población con desviación estándar desconocida……………………………

167

Fórmula 41. Intervalos de confianza para diferencia de medias independientes…………………………..

168

Fórmula 42. Valor t para muestras independientes…………..

169

Fórmula 43. Tamaño del efecto de diferencia de medias de dos muestras independientes……………………

170

Fórmula 44. Desviación típica combinada…………………….

170

Fórmula 45. Suma de cuadrados de la diferencia...………….

175

Fórmula 46. Desviación estándar de la diferencia de medias relacionadas………………………………………

176

Fórmula 47. Error estándar de la diferencia de medias relacionadas………………………………………

176

Fórmula 48. Intervalos de confianza de la diferencia de medias relacionadas……………………………..

177

Fórmula 49. Valor t de muestras relacionadas……………….

177

Fórmula 50. Tamaño del efecto de diferencia de medias de dos muestras relacionadas………………………

178

Fórmula 51. Suma de cuadrados totales………………………

185

Fórmula 52. Suma de cuadrados inter-grupos………………..

186

Fórmula 53. Suma de cuadrados intra-grupos………………..

187

Fórmula 54. Cuadrados medios inter-grupos………………….

187

Fórmula 55. Cuadrados medios intra-grupos………………….

187

Fórmula 56. Valor F………………………………………………

188

Fórmula 57. Cuadrado medio intra-grupo promedio………….

190

Fórmula 58. Error estándar de una media…………………….

190 15

FERNANDO MAUREIRA CID

Fórmula 59. Valor D……………………………………………..

191

Fórmula 60. Suma de cuadrados totales MR…………………

195

Fórmula 61. Suma de cuadrados inter-grupos MR…………..

196

Fórmula 62. Suma de cuadrados inter-sujetos……………….

196

Fórmula 63. Suma de cuadrados residuales………………….

197

Fórmula 64. gl inter-grupos……………………………………...

197

Fórmula 65. gl inter-sujetos……………………………………..

197

Fórmula 66. gl residual…………………………………………..

197

Fórmula 67. gl total……………………………………………….

197

Fórmula 68. Media cuadrática inter-grupos……………………

198

Fórmula 69. Media cuadrática residual………………………...

198

Fórmula 70. Valor F de MR……………………………………...

199

Fórmula 71. Intervalos de confianza de Bonferroni…………..

200

Fórmula 72. Covarianza………………………………………….

207

Fórmula 73. Correlación de Pearson…………………………...

208

Fórmula 74. Coeficiente de determinación…………………….

210

Fórmula 75. Ecuación de la línea recta………………………..

212

Fórmula 76. Método de mínimos cuadrados…………………..

213

Fórmula 9DORUȕ1……………………………………………..

213

Fórmula 78. Valor SSxy…………………………………………..

213

Fórmula 79. Valor SSxx…………………………………………..

213

Fórmula 9DORUȕ0……………………………………………..

213

Fórmula 81. Varianza residual………………………………….

215

Fórmula 82. Valor t para regresión lineal………………………

216

Fórmula 83. Valor U de Mann-Whitney………………………...

223

Fórmula 84. Valor Z de U de Mann-Whitney………………….

224

Fórmula 85. Valor Z de Wilcoxon……………………………….

227

16

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Fórmula 86. Media de la T de Wilcoxon……………………….

227

Fórmula 87. Desviación estándar de la T de Wilcoxon………

228

Fórmula 88. Frecuencia esperada……………………………...

230

2

Fórmula 89. Valor X ……………………………………………..

230

2

231

2

Fórmula 90. gl de X …………………………………………….. Fórmula 91. Valor X en tabla de 2x2………………………….

233

Fórmula 92. Valor X2 de McNemar……………………………..

235

Fórmula 93. Valor de Kruskal-Wallis sin empates…………….

239

Fórmula 94. Valor de Kruskal-Wallis con empates……………

240

Fórmula 95. Valor crítico de diferencias de KW……………....

242

Fórmula 96. Valor de Friedman sin empates………………….

246

Fórmula 97. Valor de Friedman con empates…………………

246

Fórmula 98. Valor crítico de diferencias de Friedman………..

248

Fórmula 99. Valor Q……………………………………………...

250

Fórmula 100. Correlación de Spearman sin empates………..

256

Fórmula 101. Correlación de Spearman con empates……….

256

Fórmula 102. Correlación de Phi……………………………….

258

17

FERNANDO MAUREIRA CID

18

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

INTRODUCCIÓN

La estadística es un elemento fundamental para desarrollar nuestras investigaciones científicas, ya que ella nos permite clasificar, comparar y asociar nuestros datos, de manera tal que podamos generar conclusiones e inferencias. Una vez que determinamos nuestro tipo de investigación (exploratoria, descriptiva, correlacional o explicativa), nuestro diseño (experimental o no experimental), nuestros instrumentos y recogemos los datos1 debemos proceder a aplicar diversos análisis estadísticos para obtener nuestros resultados. Existen falencias en los conocimientos y aplicaciones de la estadística por parte de los estudiantes y profesionales de la educación física, por lo que surge la idea de este libro con los aspectos básicos de esta ciencia, orientado a los lectores que estudian por primera vez esta área de conocimiento, ya sea por la exigencia de un curso o por la necesidad de realizar una investigación orientada a la obtención de una licenciatura o magíster. El libro está compuesto de 9 capítulos: en el primero se mencionan algunos conceptos fundamentales para la estadística y se presenta una clasificación de los principales análisis. En el segundo capítulo se explica la estadística descriptiva de datos con los principales análisis de tendencia central, dispersión, posición y forma. Todo lo necesario para presentar los datos de nuestra investigación. En el capítulo tercero se estudia brevemente las principales distribuciones de datos, tanto discretas como continuas. En el capítulo cuarto se realiza una introducción a los conceptos más

1

Para más detalles leer Maureira, F. y Flores, E. (2012) Manual de investigación científica para estudiantes de educación física. Editorial Académica Española. 19

FERNANDO MAUREIRA CID

relevantes en estadística inferencial: nivel de significancia, estimaciones, contraste de hipótesis, cálculo de muestras y tipos de muestreos. En el capítulo cinco, seis y siete se explican los análisis inferenciales paramétricos para una, dos, tres y más poblaciones como la prueba de normalidad, cálculos de intervalos de confianza, pruebas de homogeneidad de varianzas, pruebas t para una muestra, para muestras independientes y para muestras relacionadas, análisis de varianza de un factor, análisis de varianza de un factor de medidas repetidas, correlaciones de Pearson y regresión lineal simple. En el capítulo ocho se explican los análisis inferenciales no paramétricos como la prueba de Mann-Whitney, de Wilcoxon, Chicuadrado, Kruskal-Wallis, Friedman, correlación de Spearman, etc. En el capítulo nueve se realizan todos los análisis estudiados en capítulos anteriores mediante el programa estadístico SPSS 16.0. Es importante destacar que los ejemplos mostrados en cada uno de los capítulos y temas de este libro son FICTICIOS y solo formulados para ilustrar los análisis correspondientes. Espero que este libro pueda ser una guía para estudiantes de pre-grado y magíster en educación física, como así también para profesionales del área que deseen explorar la investigación científica y ayuden de este modo al crecimiento de esta disciplina.

20

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

CAPÍTULO 1 CARACTERISTICAS DE LA ESTADÍSTICA

I.

Conceptos en estadística

II. Desarrollo histórico de la estadística

21

FERNANDO MAUREIRA CID

22

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

I CONCEPTOS EN ESTADISTICA

La estadística es una rama de las matemáticas que reúne y clasifica los datos numéricos para poder, a partir de ellos generar conclusiones e inferencias. Generalmente se cuenta sólo con un pequeño conjunto de datos, pero a partir de ellos es posible inferir las características de conjuntos más grandes de datos, por ejemplo, es posible predecir con cierta precisión la estatura promedio de todos los estudiantes de un colegio, aun cuando sólo evaluemos a algunos de ellos. Para comenzar nuestro estudio de la estadística es necesario aclarar algunos conceptos fundamentales que se utilizarán a lo largo de este libro.

1. DEFINICIONES BÁSICAS a) Población: conjunto total de sujetos o unidades de análisis sobre los que deseamos hacer conclusiones. En general este conjunto es demasiado grande para abarcarlo en su totalidad. Por ejemplo: los 10.000 estudiantes de enseñanza media de los colegios de la comuna de Santiago Centro, los 5.000 adultos mayores de la zona oriente de Santiago, los 700 estudiantes de enseñanza básica de un colegio de Iquique, las 1.200 personas que asisten a un gimnasio de la comuna de Providencia, etc. b) Muestra: subconjunto de la población a la cual tenemos acceso y sobre quienes se realizarán verdaderamente las mediciones. 23

FERNANDO MAUREIRA CID

Por ejemplo: 250 estudiantes de enseñanza media de 5 colegios de la comuna de Santiago Centro, 160 adultos mayores de la zona oriente de Santiago, 80 estudiantes de enseñanza básica de un colegio de Iquique, 130 personas que asisten a un gimnasio de la comuna de Providencia, etc. c) Variable: es una característica observable que varía entre los diferentes individuos de una población. Por ejemplo: la edad, estatura, peso, porcentaje de grasa corporal, fuerza, resistencia, etc. d) Dato: un valor particular de una variable. También llamado observación o medición. Por ejemplo: 28 años, 1,82 mts. de estatura, 84 kilos, 21% de grasa corporal, 7 minutos en el test de Naveta, etc. e) Parámetro: Cantidad numérica calculada sobre una población. Por ejemplo: la estatura media de los 10.000 estudiantes de enseñanza media de los colegios de la comuna de Santiago Centro, la fuerza del tren superior de los 5.000 adultos mayores de la zona oriente de Santiago, la resistencia de los 700 estudiantes de enseñanza básica de un colegio de Iquique, el porcentaje de grasa de las 1.200 personas que asisten a un gimnasio de la comuna de Providencia, etc. f) Estadístico: Cantidad numérica calculada sobre la muestra. Por ejemplo: la estatura media de 250 estudiantes de enseñanza media de los colegios de la comuna de Santiago Centro, la fuerza del tren superior de 160 adultos mayores de la zona oriente de Santiago, la resistencia de 80 estudiantes de enseñanza básica de un colegio de Iquique, el porcentaje de grasa de 130 personas que asisten a un gimnasio de la comuna de Providencia, etc. g) Censo: datos de una o más variables de toda la población. Por

24

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

ejemplo: el CENSO poblacional que se realizan en nuestro país cada 10 años. h) Unidad de análisis: corresponde al objeto estudiado. Por ejemplo: una persona, una familia, un colegio, una región, un país, etc. i) Caso o registro: corresponde al conjunto de mediciones realizadas sobre una unidad de análisis. Por ejemplo: el sexo, la edad, el curso y el IMC de una persona; la fuerza, velocidad, resistencia y flexibilidad de un deportista, etc.

Figura 1. Conceptos importantes en un conjunto de datos.

25

FERNANDO MAUREIRA CID

2. NIVELES DE MEDICION Los datos obtenidos de nuestras variables evaluadas pueden ser de dos tipos: a) categóricos o b) numéricos. Determinar correctamente el nivel de medición (o naturaleza de los datos) es fundamental en estadística, ya que esto determinará finalmente que tipos de análisis podemos realizar con ellos.

2.1

Datos categóricos

Las variables categóricas son las que registran la presencia de un atributo. Es importante destacar que las categorías deben ser excluyentes, es decir, un mismo sujeto no puede estar en dos categorías al mismo tiempo. La cantidad de categorías va a depender de las características del atributo medido. Son ejemplos de datos categóricos la puntuación baja, media y alta de un test; la presencia y ausencia de una cualidad; el tipo de colegio (municipal, subvencionado y particular), etc. Las variables categóricas se dividen a su vez en dos grupos:

2.1.1 Variables categóricas nominales Son aquellas donde las categorías no poseen un orden, todas valen lo mismo. Estas variables pueden ser dicotómicas (cuando poseen dos categorías) o policotómicas (tres o más categorías). Por ejemplo: x Sexo de un sujeto: masculino-femenino (variable dicotómica) x Presencia o ausencia de un atributo: embarazada – no embarazada (variable dicotómica) x Religión: cristiano, musulmán, protestante, budista, etc. (variable policotómica) x Estado civil: soltero, casado, separado, viudo (variable policotómica). 26

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

x Comuna de residencia: Santiago Centro, Recoleta, Providencia, Ñuñoa, Maipú, etc. (variable policotómica).

2.1.2 Variables categóricas ordinales

x x x x

2.2

Son aquellas donde las categorías poseen un orden jerárquico, hay categorías mayores o más importantes que otras. Por ejemplo: Cursos del colegio (1°, 2°, 3°, 4°, etc.) Nivel de desarrollo de patrones motores (bajo, medio y alto) IMC (bajo-peso, normal, sobrepeso, obeso) Puesto de trabajo (rector, director, subdirector, jefe de UTP, profesor, etc.)

Datos numéricos

También conocidas como variables continuas o discretas. Las variables numéricas son las que presentan el resultado de sus observaciones como números, permiten ordenar los valores en un continuo y el intervalo entre cada par de valores es siempre el mismo independiente del lugar donde este (el intervalo entre el 4 y el 5 es el mismo que entre 81 y 82). Estas variables se clasifican en dos grupos:

2.2.1 Variables intervalares Son aquellas que miden atributos donde el cero es arbitrario y no significa la ausencia del atributo. También puede tomar valores negativos. Por ejemplo: x Las puntuaciones en las pruebas x Las puntuaciones de coeficiente intelectual 27

FERNANDO MAUREIRA CID

x Las puntuaciones de un test cognitivo (atención, memoria, planificación, etc.) x La temperatura x Las puntuaciones de un test de motricidad, agilidad, coordinación, etc.

2.2.2 Variables de razón

x x x x

Son aquellas que miden atributos donde el cero no es arbitrario, sino que indica la ausencia de un atributo. No existen los valores negativos. Por ejemplo: Edad, peso, estatura, etc. Número de hermanos (el cero indica que no se tiene hermanos) Velocidad, fuerza, resistencia, etc. Número de ingreso y egreso de una carrera, etc.

Como se dijo anteriormente, es muy importante definir correctamente al tipo de datos que corresponden nuestros valores medidos, ya que eso determina que tipos de análisis estadísticos son posibles de realizar y cuáles no. Por ejemplo, obtener el promedio de una variable numérica tiene sentido en cambio determinar el promedio de una variable categórica no lo tiene.

3. ANALISIS DE DATOS La estadística se divide en dos grandes áreas: la estadística descriptiva o análisis exploratorio de datos (presentación de los datos organizados y resumen de los mismos) y la estadística inferencial (conjunto de métodos que permiten predecir características de un fenómeno). La estadística descriptiva contiene las tablas de frecuencia, gráficos, medidas de tendencia central, medidas de dispersión, medidas de posición y medidas de forma (Fig. 2). 28

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Figura 2. Divisiones de la estadística descriptiva.

Por su parte, la estadística inferencial se divide en Univariada (cuando en la investigación existe una sola variable dependiente, pudiendo existir 1 o más variables independientes) y Multivariada (cuando en la investigación existen dos o más variables dependientes, pudiendo existir una o más variables independientes). Este libro trata de la estadística univariada, la que a su vez se divide en paramétrica y no paramétrica, existiendo en ambos casos prueba para comparar grupos y para realizar asociaciones entre variables (Fig. 3).

29

FERNANDO MAUREIRA CID

Figura 3. Divisiones de la estadística inferencial univariada.

30

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

II DESARROLLO HISTÓRICO DE LA ESTADISTICA

La estadística es tan antigua como la escritura y corresponde a un elemento complementario a todas las ciencias. La historia de esta disciplina puede clasificarse en 4 etapas: Censos, Aritmética política, Cálculo de probabilidades y Estadística moderna. a) La primera etapa de la estadística se conoce como los censos, ya que se basa en la descripción de la población y riquezas por parte de los gobernantes para lograr mejorar la administración de los estados. A continuación se presentan los hechos más relevantes de esta etapa: x Los primeros indicios se remontan al antiguo Egipto unos 3.050 años A.C., con los censos de población y registro de las riquezas. x Situación similar ocurre en China en el año 2238 A.C. x Los romanos fueron quienes más utilizaron la estadística con censos, registros de nacimientos, defunción, matrimonios, riquezas, etc.

b) La segunda etapa de la estadística: la aritmética política. x Durante los mil años posteriores a la caída del imperio romano se realizó muy pocas operaciones estadísticas, con la excepción

31

FERNANDO MAUREIRA CID

x

x

x x

de las compilaciones de tierras de la iglesia realizada por Pipino el Breve en 758 D.C. En el año 1532 Enrique VII exige el registro de las defunciones en Inglaterra, debido al temor que tenía a la peste. Misma época en que los clérigos franceses debían registrar los nacimientos, defunciones y matrimonios. En 1540 Sebastián Muster realiza una compilación de datos sobre la organización política, comercio y recursos militares de Alemania. En 1632 se publican las Cuentas de Mortalidad en Inglaterra con los datos de nacimientos y defunciones. En 1662 John Graunt publica Observaciones Políticas y Naturales hechas a partir de las Cuentas de Mortalidad, donde utiliza registros de 30 años para efectuar predicciones sobre la muerte de personas por diversas enfermedades, siendo el primer intento de inferencia estadística del que se tiene registro.

c) La tercera etapa de la estadística es denominada cálculo de probabilidades. x Las probabilidades comenzaron a ser formalizada por Blaise Pascal y Pierre Fermat en 1654 quienes encontraron la solución a cómo repartir las apuestas de un juego que no había finalizado, mediante las probabilidades de ganar que tuviese cada participante en ese momento. x En 1665 Blaise Pascal publica Tratado sobre el triángulo aritmético que se basa en las propiedades combinatorias del posteriormente llamado triángulo de Pascal (una representación de los coeficientes binominales ordenados en forma de triángulo). x En 1687 se publica la obra póstuma El arte de la Conjetura de Jacob Bernoulli, matemático Suizo, donde se encuentra entre otras cosas, las bases del teorema de Bernoulli (frecuencia aproximada que un suceso a la probabilidad p ocurra a medida que se repite un experimento). 32

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

x En 1760 Godofredo Achenwall, profesor alemán, acuño el término estadística que proviene del latín status que significa estado o situación. x En 1764 se publica la obra póstuma de Thomas Bayes Ensayo sobre la resolución de un problema en la doctrina del azar, la cual fue ignorada por sus contemporáneos, pero 2 siglos después sirvió para formulación de la inferencia bayesiana, la cual asigna probabilidades a fenómenos no aleatorios, pero cuyos resultados no son conocidos. x En 1812 Pierre Simón Laplace publica Teoría analítica de probabilidades donde estudia los problemas de las probabilidades continuas. También descubre y demuestra el teorema de límite central y fusiona el cálculo de probabilidades y la estadística. x En 1823 Karl Friedrich Gauss desarrolla la teoría de errores (conjuntamente con Bessel y Laplace) estableciendo el método de mínimos cuadrados. Además de esto, el estudio de la distribución normal fue el gran aporte de Gauss al cálculo de probabilidades. x En 1835 Jacques Quételect es quien aplica por primera vez la estadística a las ciencias sociales.

d) La cuarta etapa de la estadística es denominada Estadística moderna. x En 1837 Simeón Poisson publicó Tratado de probabilidades que contiene la ley de probabilidades conocida como distribución de Poisson y la generalización de la ley de los grandes números de Bernoulli. x En 1888 Francis Galton introdujo el término correlación para hacer referencia a la influencia relativa de una variable sobre otra. También trabajo en regresión lineal, componentes de varianza y diseño curvas normales inversas llamadas ojivas. Sus trabajos en la ley normal bivariada de probabilidades dieron 33

FERNANDO MAUREIRA CID

x

x

x

x

x

x x

x

x x 34

origen a la ley normal multivariada, base de la estadística multivariante. En 1892 Karl Pearson publica La gramática de la ciencia, donde estudió curvas asimétricas y generó el test de Chi-cuadrado. También trabajó y perfeccionó los análisis de correlación de Galton, desarrollando la correlación de Pearson. En 1902 William Sealey Gosset publica un artículo con las bases de la distribución t de Student (seudónimo con el cual publicó dicho artículo). En 1925 Ronald Arnold Fisher publica su libro Métodos estadísticos para investigadores. Desarrolló el análisis de varianza, numerosos análisis multivariados y del método de máxima verosimilitud para la estimación de parámetros. Instauró el diseño experimental en bloques, la aleatorización y los diseños factoriales. Considerado el más grande estadístico del siglo XX. En 1933 Andrei Kolmogorov desarrolló una teoría de probabilidades totalmente basada en axiomas fundamentales totalmente rigurosos. En 1934 Jerzy Neyman introduce la teoría de los intervalos de confianza. También publica el primer trabajo en muestreos de poblaciones finitas. En 1936 Jerzy Neyman y Egon Pearson (hijo de Karl Pearson) presentan una teoría sobre la prueba de hipótesis en estadística. La década de 1930-1940 fue el auge de la estadística multivariada con Mahalanobis (1936), Fisher (1936), Hotteling (1936), Bartlett (1938), etc. En 1945 Frank Wilcoxon publicó un trabajo donde reemplazó los datos por sus rangos, de manera que fue posible conocer propiedades distribucionales de los mismos, creando así la prueba de rangos de Wilcoxon. Esta idea es la base de la estadística no paramétrica. En 1952 William Kruskal y Allen Wallis publican el análisis de rangos que lleva su nombre. A partir de la segunda mitad del siglo XX, la estadística esta fuertemente asociada a la computación, ya que el desarrollo de

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

software estadísticos permite la realización de cientos o miles de cálculos en tiempos reducidos o el trabajo con decenas de variables al mismo tiempo. Por ejemplo el programa SPSS fue creado en 1968 y en el 2013 se lanzó su versión 22.0. Los programas estadísticos más usados en la actualidad son: SPSS, SAS, R, Stata, Matlab, Minitab, etc.

35

FERNANDO MAUREIRA CID

36

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

CAPÍTULO 2 ESTADISTICA DESCRIPTIVA

I.

Representación de datos

II. Medidas de tendencia central III. Medidas de dispersión y posición IV. Medidas de forma V. Gráfico de caja y dispersión

37

FERNANDO MAUREIRA CID

38

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

I REPRESENTACION DE DATOS

La estadística descriptiva o análisis exploratorio de datos ofrece modos de presentar y evaluar las características más importantes de los datos. Esto a través de tablas, gráficos y medidas resúmenes.

1. TABLAS DE FRECUENCIA NIVEL DE MEDICIÓN: NOMINAL, ORDINAL, INTERVALAR y DE RAZON La tabla de frecuencia es el modo más sencillo de presentar los datos, en ella se observa el nombre de las categorías, la frecuencia absoluta (número de sujetos que componen cada categoría), la frecuencia relativa (porcentaje que representa ese número de sujetos en relación al total de observaciones) y la frecuencia acumulada (porcentaje acumulado que corresponde a la suma de los porcentajes de cada categoría).

ƒ Ejemplo 1 Un profesor busca conocer el IMC de 15 estudiantes de primer año básico de un colegio de Santiago, para ello mide la talla y el peso de ellos y luego calcula el IMC obteniendo los siguientes resultados: 39

FERNANDO MAUREIRA CID

Sujeto 1 2 3 4

IMC 19,2 26,7 17,4 20,0

Sujeto 5 6 7 8

IMC 21,5 25,8 32,5 23,2

Sujeto 9 10 11 12

IMC Sujeto IMC 28,3 13 22,6 20,1 14 37,1 34,6 15 42,3 29,3

¾ Paso 1: Para elaborar la tabla de frecuencia debemos agrupar los valores obtenidos en diversas categorías: Bajo peso (40) = 1 sujeto

¾ Paso 2: Calculamos la frecuencia relativa (fr) de cada categoría con la siguiente fórmula: fr = n1 *100 (fórmula 1) N n1 = número de observaciones de una categoría N = número de todas las observaciones Aplicamos la fórmula 1 a los datos obtenidos en el paso 1: Bajo peso = (1/15)*100 = 6,7 Normal = (6/15)*100 = 40,0 Sobre-peso = (4/15)*100 = 26,7 Obesidad I = (2/15)*100 = 13,2 Obesidad II = (1/15)*100 = 6,7 Obesidad III = (1/15)*100 = 6,7 40

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

¾ Paso 3 Calculamos la frecuencia acumulada con la frecuencia relativa de la primera categoría, luego la frecuencia relativa de la segunda más la primera categoría, luego la tercera más la segunda y más la primera, así sucesivamente. Bajo peso = 6,7 Normal = 40,0 + 6,7 = 46,7 Sobre-peso = 26,7 + 40,0 + 6,7 = 73,4 Obesidad I = 13,2 + 26,7 + 40,0 + 6,7 = 86,6 Obesidad II = 6,7 + 13,2 + 26,7 + 40,0 + 6,7 = 93,3 Obesidad III = 6,7 + 6,7 + 13,2 + 26,7 + 40,0 + 6,7 = 100,0

¾ Paso 4 Elaboramos la tabla de frecuencia con los datos anteriores:

Categoría

Frecuencia Frecuencia absoluta relativa Bajo-peso (40) 1 6,7 Total 15 100

Frecuencia acumulada 6,7 46,7 73,4 86,6 93,3 100

En la tabla de frecuencia podemos observar que la categoría normal presenta el mayor número de sujetos (6) y por ende la mayor frecuencia relativa (40,0%). Por otra parte, la categoría bajopeso, normal y sobre-peso presentan una frecuencia acumulada de 73,4%, es decir, las tres categorías suman ese porcentaje de sujetos de la muestra. 41

FERNANDO MAUREIRA CID

2. GRAFICOS DE BARRA Y TORTA NIVEL DE MEDICIÓN: NOMINAL y ORDINAL Una vez que hemos desarrollado una tabla de frecuencias es posible generar una representación de esta mediante gráficos. El gráfico de barras se utiliza para representar variables categóricas nominales u ordinales. La altura de cada barra indica un valor de frecuencia relativa (Fig. 4), por lo tanto, es posible comparar visualmente las diferencias entre cada categoría. También es posible utilizar el gráfico de barra para comparar dos o más distribuciones (Fig. 5).

Figura 4. Gráfico de barra del IMC en estudiantes de primer año medio de un colegio de la ciudad de Santiago.

El gráfico de torta representa la frecuencia relativa como un ángulo y una porción dentro de un círculo (Fig. 6). Este tipo de grafico es igual de útil que el de barra para representar la distribución de un grupo, pero resulta menos eficiente para representar a dos o 42

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

más grupos, siendo necesario utilizar varios gráficos (uno por cada población o muestra).

Figura 5. Gráfico de barra del IMC comparando estudiantes de sexo masculino y femenino de primer año medio de un colegio de la ciudad de Santiago.

Figura 6. Gráfico de torta del IMC en estudiantes de primer año medio de un colegio de la ciudad de Santiago. 43

FERNANDO MAUREIRA CID

3. HISTOGRAMA NIVEL DE MEDICIÓN: INTERVALAR y DE RAZON Es el más conocido de los gráficos para representar variables numéricas (intervalares o de razón). A diferencia del gráfico de barra, en un histograma no existe separación entre categorías (a menos que una categoría tenga valor cero), ya que sus valores son continuos.

ƒ Ejemplo 2 Un profesor evaluó los patrones motores en 42 estudiantes de tercer año básico de un colegio de Santiago. El test presenta una puntuación de 1 a 5, siendo uno un mal desempeño y cinco un buen desempeño. A continuación se presenta la tabla de frecuencia con los resultados.

Puntaje 1 2 3 4 5 Total

Número de sujetos 3 4 12 15 8 42

Frecuencia relativa (%) 7,1 9,5 28,6 35,7 19,1 100,0

Frecuencia acumulada (%) 7,1 16,6 45,2 80,9 100,0

La frecuencia relativa de las puntuaciones del test de patrones motores de tercer año básico se presenta en el siguiente histograma:

44

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Figura 7. Histograma de las puntuaciones de los patrones motores en 42 estudiantes de tercer básico de un colegio de la ciudad de Santiago.

Es importante destacar que la representación visual del histograma depende de la cantidad de clases que utilicemos (divisiones de los datos como categorías). Muchas clases provocarán que pocos datos queden dentro de cada clase y por ende el histograma presentará una distribución uniforme (Fig. 8). Por el contrario, pocas clases provocarán que muchos datos queden dentro de una clase y el histograma mostrará pocas características importantes (Fig. 9). El número ideal de clases se ha calculado entre 6 y 15. Cuando realizamos un histograma sobre clases que poseen la misma longitud (cada clase tiene igual duración o tamaño) es posible realizar dicho histograma con sus frecuencia relativas. Por ejemplo, en la figura 10 se observa un histograma del tiempo que realizaron los sujetos de segundo año medio en un test de Naveta, aquí se observa que la mayor parte de los estudiantes lograron tiempos entre 5 y 7 minutos en el test. En este caso la duración de cada clase tiene la misma longitud (1 minuto), de la misma forma cuando las clases son cursos (1° medio, 2° medio, etc.). 45

FERNANDO MAUREIRA CID

Figura 8. En el histograma se observan demasiadas clases por ende la figura tiende a ser uniforme.

Figura 9. En el histograma existen pocas clases razón por la cual no se aprecia bien la distribución de los datos.

46

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Figura 10. Tiempos en el test de Naveta, donde se aprecian 12 clases, las que permiten ver más claramente los detalles de la distribución de la variable.

Sin embargo, en ocasiones las clases poseen distintos tamaños y entonces las frecuencias relativas no son buenos valores para graficar porque se produce una distorsión del tamaño de las áreas de cada barra, lo que no muestra correctamente cual es la categoría que posee mayor frecuencia de sujetos.

ƒ Ejemplo 3 Las edades de una muestra de 131 personas de ambos sexos se clasificó en 5 categorías: personas entre 1 y 2 años, personas entre 3 años y 9 años, personas entre diez años y 19 años, personas entre 20 años y 49, personas entre 50 años y 80 años. De esta manera se obtuvo la siguiente tabla:

47

FERNANDO MAUREIRA CID

Categoría 1-2 años 3-9 años 10-19 años 20-49 años 50-80 años

Número de sujetos 35 47 23 17 9 131

Frecuencia relativa (%) 26,7 35,9 17,6 12,9 6,9 100

Frecuencia acumulada (%) 26,7 62,6 80,2 93,1 100

Con estos datos de frecuencia relativa procedemos a realizar un histograma para observar la distribución de esta variable (Fig. 11). Sin embargo, el histograma parece representar que la mayor cantidad de sujetos se encuentran en las clases o intervalos de 20 a 49 años y de 50 a 80 años, ya que se observan áreas de mayor tamaño (donde se encuentra el 19,9% de los sujetos), en cambio parece haber menos individuos en el intervalo de 1 a 9 años (donde se encuentra el 62,6% de los sujetos).

Figura 11. Histograma que representa la frecuencia relativa de los datos. 48

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Para evitar este tipo de distorsiones, cuando las categorías o clases poseen distintas longitudes es necesario realizar una escala de densidad que se calcula con la siguiente fórmula: Escala de densidad = fr Lin

(fórmula 2)

fr = frecuencia relativa Lin = longitud del intervalo, que corresponde al valor superior del intervalo menos el valor menor del mismo intervalo.

¾ Paso 1 Calcular la escala de densidad para los intervalos del ejemplo 3: 1 a 2 años = 26,7 / (2 – 1) = 26,7 / 1 = 26,7 3 a 9 años = 35,9 / (9 – 3) = 35,9 / 6 = 5,98 10 a 19 años = 17,6 / (19 – 10) = 17,6 / 9 = 1,95 20 a 49 años = 13,0 / (49 – 20) = 13,0 / 29 = 0,45 50 a 80 años = 6,9 / (80 – 50) = 6,9 / 30 = 0,23

¾ Paso 2 Elaboramos la tabla de frecuencia con los datos anteriores:

Categoría 1-2 años 3-9 años 10-19 años 20-49 años 50-80 años

Número de sujetos 35 47 23 17 9 131

Frecuencia relativa (%) 26,7 35,9 17,6 13,0 6,9 100

Escala de densidad (%) 26,7 5,98 1,95 0,45 0,23

49

FERNANDO MAUREIRA CID

¾ Paso 3 Elaboramos el histograma con la escala de densidad anterior:

Figura 12. Histograma que representa la escala de densidad de las edades de la muestra. Cuando calculamos la escala de densidades la barra del histograma indica el número de datos contenida en ella y la imagen visual se ajusta más a la realidad de los datos. En la figura 12 se observa de mejor forma que en los intervalos de 20 a 80 años existen menos sujetos (19,6%) que en los intervalos de 1 a 9 años (62,6%).

4. POLIGONOS DE FRECUENCIA NIVEL DE MEDICIÓN: INTERVALAR y DE RAZON Es similar al histograma pero entrega una imagen de la curva que genera la distribución de la variable. Para los datos de las edades de las personas entre 1 y 80 años se presenta el polígono de frecuencia en la figura 13, donde puede apreciarse fácilmente la disminución del número de sujetos a partir de los dos años. 50

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Figura 13. Polígono de frecuencia de la distribución del número de sujetos de una muestra con edades entre uno y ochenta años. Este tipo de representación de datos numéricos también puede utilizarse para comparar dos o más variables, resultando más útil que el histograma (Fig. 14).

Figura 14. Polígonos de frecuencia comparando los tiempos en un test de Naveta de varones (línea continua) y damas (línea de puntos) de 2° año medio. En el eje horizontal de observan los minutos y en el vertical la cantidad de alumnos. 51

FERNANDO MAUREIRA CID

Finalmente, los polígonos de frecuencia se utilizan para mostrar la evolución de una característica a través del tiempo (Fig. 15).

Figura 15. Polígonos de frecuencia comparando los niveles de fuerza de varones (línea continua) y de damas (línea de puntos) a través del tiempo.

5. OJIVA NIVEL DE MEDICIÓN: INTERVALAR y DE RAZON Es un gráfico semejante al polígono de frecuencia, pero en lugar de mostrar las frecuencias relativas de los datos presenta las frecuencias acumuladas. En el eje horizontal se consideran las clases y en el vertical las frecuencias.

ƒ Ejemplo 4 Se evaluó la coordinación de 15 niños de 6 años de un colegio de Santiago y se obtuvo la siguiente tabla de frecuencia: 52

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Categoría 1 punto 2 puntos 3 puntos 4 puntos 5 puntos

Número de sujetos 3 3 5 3 1 15

Frecuencia relativa (%) 20,0 20,2 33,3 20,0 6,7 100

Frecuencia acumulada (%) 20,0 40,0 73,3 93,3 100

Ahora construimos la ojiva ubicando en la primera categoría la frecuencia acumulada (en este caso 20,0%), luego en la segunda categoría ubicamos la suma de la primera y la segunda frecuencia (40,0%) y así sucesivamente. Al unir los puntos con una línea, resulta ser una curva ascendente que comienza con la 1° frecuencia acumulada y termina con un 100%. En este gráfico es posible conocer cómo van sumando las categorías y tener una visión de la evolución de la frecuencia de los datos.

Figura 16. Ojiva mostrando la frecuencia acumulada de las puntuaciones de la coordinación. 53

FERNANDO MAUREIRA CID

54

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

II MEDIDAS DE TENDENCIA CENTRAL

NIVEL DE MEDICIÓN: INTERVALAR y DE RAZON Son medidas resúmenes de posición central alrededor de los cuales se encuentran las observaciones realizadas. También pueden ser definidas como el comportamiento más común en un conjunto de datos. Las medidas de tendencia central más empleadas son la media, la mediana y la moda.

1. MEDIA La media o promedio es la medida de posición más utilizada. Se obtiene con la siguiente fórmula: Ш = ™[i n

(fórmula 3)

™[ i = suma del valor de todas las observaciones o datos. n = número total de observaciones.

ƒ Ejemplo 1 Se ha evaluado la velocidad en 30 metros lanzados de nueve estudiantes de primer año medio de un colegio de Santiago y se han encontrado los siguientes resultados: 55

FERNANDO MAUREIRA CID

Sujeto 1 2 3 4 5

Tiempo 7,30 8,15 4,60 9,10 6,40

Sujeto 6 7 8 9

Tiempo 5,50 7,25 6,30 8,05

Para obtener la media se reemplaza en la fórmula 3: Ш = 7,30 + 8,15 + 4,60 + 9,10 + 6,40 + 5,50 + 7,25 + 6,30 + 8,05 9 = 6,96 La media de velocidad en el test de 30 mts. es de 6,96 segundos. La media de una muestra se designa con la letra Ш y la media de una población se designa con la letra griega μ (mu). La media se utiliza con datos numéricos, representa el punto de equilibrio de los datos y es muy sensible a los datos extremos (outliers), es decir, datos demasiado atípicos o extremos producen cambios importantes en ella.

ƒ Ejemplo 2 En un partido de básquetbol de la liga nacional ocho jugadores de un equipo realizan lanzamientos a la canasta (independiente que estos terminen en puntos o no) y su entrenador registra el número de intentos de cada uno de ellos y obtiene la siguiente tabla:

56

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Jugador 1 2 3 4 5 6 7 8 Media

Lanzamientos 1 4 6 2 3 7 2 8 10 5,25

Lanzamientos 2 4 6 2 3 7 75 8 10 14,38

En la primera columna vemos el número de jugadores, en la segunda los lanzamientos a la canasta de cada uno de ellos que generan una media de 5,25. Finalmente, en la tercera columna observamos la misma cantidad de lanzamientos excepto en el jugador seis que de 2 lanzamiento aumento a 75, por lo tanto, la media aumento a 14,38. Esto sirve para graficar como un solo dato outlier produce grandes variaciones en la media.

2. MEDIANA Es el dato que ocupa la posición central al ordenar las observaciones de menor a mayor. Se obtiene con la siguiente fórmula: X = (n + 1) (fórmula 4) 2 n = número de datos

ƒ Ejemplo 3 Se evaluó la motricidad de 15 niños de edades pre-escolares de un jardín infantil de Santiago y los resultados del test se presentan ordenados de menor a mayor en la siguiente tabla: 57

FERNANDO MAUREIRA CID

Niño 1 2 3 4 5

Puntaje 3 4 6 7 7

Niño 6 7 8 9 10

Puntaje 8 9 10 11 13

Niño 11 12 13 14 15

Puntaje 14 14 15 17 19

Ahora deseamos conocer la mediana de estos datos, para ello reemplazamos en la fórmula 4: X = (15 + 1) / 2 =8 La mediana es el valor del lugar 8 en el orden de menor a mayor (marcada con un cuadro) y que en esta base de datos corresponde a una puntuación de 10 en el test de motricidad. Niño 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

58

Test de motricidad 3 4 6 7 7 8 9 10 11 13 14 14 15 17 19

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Si la cantidad de datos es impar la mediana es el valor que queda en el centro (Ejemplo 3), pero si la cantidad de datos es par la mediana es el valor promedio de los dos datos centrales, como se verá a continuación:

ƒ Ejemplo 4 Se presentan los mismos resultados de motricidad anteriores, pero se ha eliminado un caso con el fin que el número de observaciones sea par. La mediana se encuentra en el centro de los valores del lugar 7 y 8, que son los números 9 y 10 (marcados con un cuadrado) por lo tanto la mediana es el promedio entre 9 y 10 = 9,5

Niño 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Test de motricidad 3 4 6 7 7 8 9 10 11 13 14 14 15 17

La mediana de una muestra se designa con la letra X y la mediana de una población de designa con la letra griega μ. 59

FERNANDO MAUREIRA CID

La mediana se utiliza con datos numéricos, pero también con datos ordinales y es una medida robusta, muy poco sensible a los datos outliers.

3. MODA Es el dato que ocurre con mayor frecuencia en el conjunto de observaciones.

ƒ Ejemplo 5 Se evaluó la cantidad de abdominales en un minuto que realizan 18 seleccionados universitarios de fútbol como parte del proceso de evaluación de su condición física y los resultados fueron los siguientes: Sujeto 1 2 3 4 5 6 7 8 9

Abdominales 56 60 58 64 60 55 53 58 59

Sujeto 10 11 12 13 14 15 16 17 18

Abdominales 60 57 60 57 54 56 58 60 63

La moda es el número 60, ya que es el valor que se presenta más veces en este conjunto de datos (5 en total). La moda se puede usar para datos numéricos y datos categóricos. Cuando una distribución presenta una sola moda recibe el nombre de unimodal, cuando presenta dos modas se denomina

60

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

bimodal y cuando presenta tres o más modas se designa como distribución multimodal (Fig. 17).

Figura 17. Distribuciones según sus modas. En la imagen izquierda se grafica una distribución unimodal, en la imagen central distribución bimodal y en la imagen derecha una distribución multimodal.

61

FERNANDO MAUREIRA CID

62

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

III MEDIDAS DE DISPERSION Y POSICION

NIVEL DE MEDICIÓN: INTERVALAR y DE RAZON Las medidas de dispersión o variabilidad describe cuan cerca se encuentran los datos entre sí o cuan cerca se encuentran de alguna medida de tendencia central.

1. AMPLITUD O RANGO Corresponde a la diferencia de las observaciones extrema de un conjunto de datos, se obtiene con siguiente fórmula: Rango = Vmayor – Vmenor

(fórmula 5)

Vmayor = valor mayor de los datos Vmenor = valor menor de los datos

ƒ Ejemplo 1 Se evaluó la fuerza del tren superior en 14 seleccionados de Judo. Esto se realizó a través de una RM en press banca y los resultados fueron los siguientes:

63

FERNANDO MAUREIRA CID

Seleccionado 1 2 3 4 5 6 7

Fuerza (kls) 90 105 85 120 100 103 94

Seleccionado 8 9 10 11 12 13 14

Fuerza (kls) 128 78 92 85 105 80 95

Para determinar el rango de estos datos se reemplaza en la fórmula 5: Rango = 128 – 78 = 50 50 kilos corresponde al rango de estos datos. El rango es muy sensible a los valores outliers. Es común que en los resultados se presenten el valor menor, el mayor y el rango.

2. VARIANZA La varianza (S2) es la media del cuadrado de las desviaciones respecto a la media de los datos. Se obtiene con la fórmula siguiente: S2 = ™ [i – Ш)2 (fórmula 6) n–1 ™ [i – Ш)2 = suma de los cuadrados de la diferencia entre cada puntuación y la media de las puntuaciones n = número de datos

ƒ Ejemplo 2 Se desea conocer los niveles de memoria visual de 11 estudiantes de pedagogía en educación física de una universidad 64

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

de Santiago y para ello se aplica un test neuropsicológico. Los resultados de las observaciones y suma de cuadrados se aprecian en la tabla siguiente: Sujeto 1 2 3 4 5 6 7 8 9 10 11 Ш=

Memoria (xi) 6 7 9 3 4 6 4 5 7 5 6 5,64

(xi – Ш) 0,36 1,36 3,36 -2,64 -1,64 0,36 -1,64 -0,64 1,36 -0,64 0,36

(xi – Ш)2 0,13 1,85 11,29 6,97 2,69 0,13 2,69 0,41 1,85 0,41 0,13 ™28,55

La media de las observaciones fue 5,64 y la suma de cuadrados fue 28,55. Ahora se reemplaza en la fórmula 6: S2 = 28,55 / (11 – 1) = 28,55 / 10 = 2,855 En el ejemplo la varianza es de 2,855.

3. DESVIACIÓN ESTÁNDAR Corresponde al grado en que las puntuaciones de la variable se alejan de la media. Se calcula con la raíz cuadrada de la varianza (S2).

65

FERNANDO MAUREIRA CID

S = S2

(fórmula 7)

Del ejemplo anterior: S = 2,855 = 1,689 El promedio o media de los datos sobre la memoria de estudiantes de educación física fue de 5,64 y poseen una desviación estándar de 1,689 esto quiere decir que el 68% de los datos recolectados caerán entre 3,951 y 7,329 (5,64 – 1,689 y 5,64 + 1,689). La desviación estándar de la muestra se designa con la letra S y la desviación estándar de la población con la letra ı Este análisis es muy útil para conocer cuánto se alejan los datos de la media de una muestra cuando esta posee una distribución simétrica. Esto ocurre cuando la mayoría de los datos obtenidos se encuentran en los puntajes centrales y muy pocos datos se encuentran en los extremos (Fig. 18). Por ejemplo, en un test de fuerza muy pocas personas tendrán valores muy bajos o muy altos, la mayoría obtendrán puntuaciones medias. Esta situación ocurre en la mayoría de los procesos naturales si la muestra es lo suficientemente grande (tiende a infinito). Si la desviación estándar de la muestra se encuentra entre la cuarta y quinta parte del rango se considera que la distribución es homogénea, es decir, los datos obtenidos de todos los sujetos evaluados se encuentran cercanos a la media. Si la desviación estándar se encuentra por debajo o sobre la cuarta o quinta parte del rango, la muestra se considera heterogénea. Cuando ocurre esta segunda opción podría ser interesante comparar los resultados de los grupos extremos de datos que hemos obtenido, para saber si existen diferencias entre las puntuaciones más altas y más bajas.

66

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Figura 18. Distribución simétrica. En estos datos la cantidad de observaciones que se encuentra entre una desviación estándar a la derecha y a la izquierda es del 68,26%, en dos desviaciones estándar es del 95,45% y en tres desviaciones es del 99,73%.

Para el ejemplo 2: Rango = 6 S = 1,689 1/4 rango= 6/4= 1,5 1/5 rango= 6/5= 1,2 Como S (1,689) es mayor a la cuarta parte (1,5) y quinta parte (1,2) del rango esta muestra se considera heterogénea.

67

FERNANDO MAUREIRA CID

Las medidas de posición se basadas en el orden que poseen ciertos valores de las observaciones, comúnmente reciben el nombre de cuantiles y se define como el valor de la variable por GHEDMRGHODFXDOVHHQFXHQWUDXQDIUHFXHQFLDDFXPXODGDĮ

4. PERCENTILES Es un valor p% que deja una cantidad de p% de datos de bajo de él y 1-p% sobre él. Por ejemplo, un percentil 30 deja por debajo el 30% de las observaciones o datos y por encima un 70% de las observaciones. Los percentiles separan a la muestra en grupos de 1%. La mediana siempre corresponde al percentil 50. Para calcular los percentiles se ordenan los valores de menor a mayor y luego se utiliza la siguiente fórmula: Percentil = (n*k) 100

(fórmula 8)

n = número de datos k = percentil que se desea conocer

ƒ Ejemplo 3 Se midió la estatura de 21 estudiantes de cuarto año medio de un colegio de la comuna de Santiago en la clase de educación física. Los resultados fueron los siguientes: Sujeto Estatura Sujeto Estatura Sujeto Estatura 1 1,60 8 1,70 15 1,77 2 1,62 9 1,71 16 1,77 3 1,62 10 1,72 17 1,79 4 1,65 11 1,74 18 1,79 5 1,68 12 1,74 19 1,80 6 1,69 13 1,75 20 1,82 7 1,70 14 1,75 21 1,85 68

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Si tenemos 21 datos y queremos determinar el percentil 20, reemplazamos en la fórmula 8. p20= (21 * 20) / 100 = 4,2 Si el resultado es una fracción, el valor del percentil corresponde al lugar inmediatamente superior, en este caso el lugar 5 (1,68 mts.) corresponderá al percentil 20. Esto quiere decir que el 20% de los estudiantes medidos están bajo 1,68 de estatura y el 80% restante está sobre 1,68.

5. CUARTILES Son valores que dividen a las observaciones en cuatro grupos con frecuencias similares (25%). El primer cuartil corresponde al percentil 25 (cuantil 0,25), el segundo cuartil corresponde al percentil 50 (cuantil 0,5) y el tercer cuartil corresponde al percentil 75 (cuantil 0,75). Los cuartiles sirven para establecer cuatro niveles de los datos, por ejemplo, los valores iguales o bajo el cuartil 0,25 corresponden a un nivel bajo, valores entre el cuartil 0,25 y 0,50 a un nivel medio bajo, valores entre el cuartil 0,50 y 0,75 a un nivel medio alto y valores sobre 0,75 a un nivel alto. De esta forma es posible establecer categorías a los datos de nuestra investigación. Los cuartiles (Q) se obtienen con la siguiente fórmula: Qx = k*(n + 1) 4

(fórmula 9)

k = valor del cuartil (1, 2 o 3) n = número de datos En caso que el cálculo no corresponda con la posición exacta se utiliza la siguiente corrección: 69

FERNANDO MAUREIRA CID

Qx = Li + k*(Ls – Li) 4

(fórmula 10)

Li = Límite inferior del intervalo Ls = Límite superior del intervalo

Por ejemplo, utilizando los mismos datos de la estatura de 21 estudiantes de cuarto año reemplazamos en la fórmula 9: Q1 = 1*(21 + 1) / 4 = 5,5 (posición 5 y 6 = 1,68 y 1,69) Q2 = 2*(21 + 1) / 4 = 11 (posición 11 = 1,74) Q3 = (3*(21+1)) / 4 = 16,5 (posición 16 y 17 = 1,77 y 1,79) Para el cuartil 1 y 3 utilizamos la fórmula 10 de corrección: Q1 = 1,68 + [(1*(1,69 – 1,68)/4)] = 1,68 + [(1*0,01)/4] = 1,68 + 0,0025 = 1,6825 Q3 = 1,77 + [(3*(1,79 – 1,77)/4)] = 1,77 + [(3*0,02)/4] = 1,77 + 0,015 = 1,785 El cuartil 1 es 1,6825 mts., el cuartil 2 es 1,74 y el cuartil 3 es 1,785. Con esto es posible establecer que las estaturas iguales o menores de 1,6825 son bajas, entre 1,69 y 1,785 es media y de 1,79 o mayores son altos dentro del grupo evaluado.

6. QUINTILES Y DECILES a) Quintiles: son valores que dividen a las observaciones en cinco grupos con frecuencias similares (20%). El primer quintil corresponde la percentil 20 (quintil 0,2), el segundo quintil corresponde al percentil 40 (quintil 0,4), el tercer quintil corresponde al percentil 60 (quintil 0,6) y el cuarto quintil corresponde al percentil 80 (quintil 0,8). 70

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

b) Deciles: son valores que dividen a las observaciones en diez grupos con frecuencias similares (10%). El decil 1 coincide con el percentil 10, el decil 2 con el percentil 20 y así sucesivamente. La finalidad de los quintiles y deciles es la misma que cuartiles, es decir, poder establecer grupos y categorías, pero en estos casos más detallados, de los datos de nuestra investigación.

71

FERNANDO MAUREIRA CID

72

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

IV MEDIDAS DE FORMA

NIVEL DE MEDICIÓN: INTERVALAR y DE RAZON

1. ASIMETRÍA Una distribución de datos es simétrica si la mitad izquierda es igual a su mitad derecha (Fig. 18) y por lo tanto, la mayor parte de los datos se encuentran cercanos a la media, existiendo pocos casos en los extremos. En este tipo de distribuciones la media, la mediana y la moda poseen igual valor. Una distribución asimétrica es aquella donde los datos tienden a agruparse hacia alguno de los lados. Existen dos tipos de distribuciones asimétricas: x Distribución asimétrica positiva: es aquella donde los datos se agrupan hacia la izquierda, dejando una cola hacia la derecha, por lo tanto, la mayoría de los datos se encuentran cerca de las puntuaciones más bajas. En estas distribuciones la media es mayor que la mediana (Fig. 19). x Distribución asimétrica negativa: es aquella donde los datos se agrupan hacia la derecha, dejando una cola hacia la izquierda, por lo tanto, la mayoría de los datos se encuentran cerca de las puntuaciones más altas. En estas distribuciones la media es menor que la mediana (Fig. 19).

73

FERNANDO MAUREIRA CID

Figura 19. Distribuciones asimétricas. La figura superior corresponde a una distribución positiva y la figura inferior a una distribución negativa.

Para calcular la asimetría de una distribución existen varios análisis estadísticos, nosotros utilizaremos el coeficiente de asimetría de Fisher.

COEFICIENTE DE ASIMETRÍA DE FISHER (g1) Se basa en la relación entre las distancias a la media y la desviación estándar. Se obtiene con la siguiente fórmula: 74

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

g1 = ™ (xi – Ш)3 n * S3x

(fórmula 11)

™ [ i – Ш)3 = suma de cada observación menos la media de todas las observaciones elevada al cubo n = número de datos S3 = desviación estándar de los datos al cubo

ƒ Ejemplo 1 Se evaluó la capacidad de planificación de los estudiantes de pedagogía en educación física de una universidad de Santiago. Los resultados de las puntuaciones y la suma de cubos se presentan en la siguiente tabla: Sujeto 1 2 3 4 5 6 7 8 9 Ш= S=

Planificación (xi) 5 2 3 3 5 4 6 7 5 4,44 1,59

Para obtener el coeficiente reemplazamos en la fórmula 11:

(xi – Ш) 0,56 -2,44 -1,44 -1,44 0,56 -0,44 1,56 2,56 0,56

de

(xi – Ш)3 0,18 -14,53 -2,99 -2,99 0,18 -0,09 3,80 16,78 0,18 ™

asimetría

de

Fisher

g1 = 0,52 / [9 * (1,59)3] = 0,52 / 9 * 4,02 = 0,52 / 36,18 = 0,014 El coeficiente de asimetría de Fisher es de 0,014 (distribución simétrica). 75

FERNANDO MAUREIRA CID

Valores de cero o cercanos indican una distribución simétrica, valores sobre cero indican una asimetría positiva y valores bajo cero indican una asimetría negativa.

2. CURTOSIS La curtosis corresponde al grado de apuntamiento o aplastamiento de una distribución. Existen tres tipos de curtosis: x Platicúrtica: es aquella distribución cuyo valor es menor a cero. Esta curva presenta muchos casos lejos de la media y pocos cerca de ella (Fig. 20a). x Mesocúrtica: es aquella distribución cuyo valor es igual o cercana a cero. Esta curva presenta un grado medio de concentración de los datos alrededor de la media (Fig. 20b). x Leptocúrtica: es aquella distribución cuyo valor es mayor a cero. Esta curva presenta pocos casos lejos de la media y muchos cerca de ella (Fig. 20c).

COEFICIENTE DE APUNTAMIENTO DE FISHER (g2) Para calcular la curtosis se puede utilizar el coeficiente de apuntamiento de Fisher (g2), que se obtiene con la siguiente fórmula: g2 = ™(xi – Ш)4 – 3 (fórmula 12) n * S4 ™ [i – Ш)4 = suma de cada observación menos la media elevada a la cuarta n = número de observaciones S4 = desviación estándar elevada a cuatro 76

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Figura 20. Tipos de curtosis. Una distribución platicúrtica (A), una distribución mesocúrtica (B) y una distribución leptocúrtica(C). Por ejemplo, utilizaremos nuevamente los datos de la planificación de los estudiantes de educación física. Sujeto 1 2 3 4 5 6 7 8 9 Ш= S=

xi 5 2 3 3 5 4 6 7 5 4,44 1,59

(xi – Ш) 0,56 -2,44 -1,44 -1,44 0,56 -0,44 1,56 2,56 0,56

(xi – Ш)4 0,10 35,45 4,30 4,30 0,10 0,04 5,92 42,95 0,10 ™ 77

FERNANDO MAUREIRA CID

Reemplazamos en la fórmula 12: g2 = [93,25 / [9 * (1,59)4]] – 3 = [93,25 / 9 * 6,39] – 3 = (93,24 / 57,51) – 3 = 1,62 – 3 = -1,38 El coeficiente de apuntamiento de Fisher es de -1,38 (distribución platicúrtica). En la curtosis los valores de cero o cercanos indican una distribución mesocúrtica, valores sobre cero indican una distribución leptocúrtica y valores bajo cero indican una distribución platicúrtica.

3. DISTRIBUCIONES SEGÚN SU FORMA Una distribución posee un valor de asimetría y curtosis, por lo tanto, puede tener nueve formas: x Simétrica-mesocúrtica: asimetría y curtosis de cero. Corresponde a una distribución normal. Los datos se encuentran distribuidos de igual manera a la derecha e izquierda de la media y se alejan medianamente de ella (Fig. 21a). x Simétrica-platicúrtica: asimetría de cero y curtosis negativa. Los datos se encuentran distribuidos de igual manera a la derecha e izquierda de la media y muchos se alejan de ella (Fig. 21b). x Simétrica-leptocúrtica: asimetría de cero y curtosis positiva. Los datos se encuentran distribuidos de igual manera a la derecha e izquierda de la media y pocos se alejan de ella (Fig. 21c).

78

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Figura 21. Distribuciones simétricas. A= simétrica-mesocúrtica. B= simétrica-platicúrtica. C= simétrica-leptocúrtica.

x Asimétrica positiva-mesocúrtica: asimetría negativa y curtosis de cero. Los datos se encuentran distribuidos hacia la izquierda (valores menores) y se alejan medianamente de la media (Fig. 22a). x Asimétrica positiva-platicúrtica: asimetría negativa y curtosis negativa. Los datos se encuentran distribuidos hacia la izquierda (valores menores) y muchos se alejan de la media (Fig. 22b). x Asimétrica positiva-leptocúrtica: asimetría negativa y curtosis positiva. Los datos se encuentran distribuidos hacia la izquierda (valores menores) y pocos se alejan de la media (Fig. 22c).

Figura 22. Distribuciones asimétricas positivas. A= asimétrica positiva-mesocúrtica. B= asimétrica positiva-platicúrtica. C= asimétrica positiva-leptocúrtica. 79

FERNANDO MAUREIRA CID

x Asimétrica negativa-mesocúrtica: asimetría positiva y curtosis de cero. Los datos se encuentran distribuidos hacia la derecha (valores mayores) y se alejan medianamente de la media (Fig. 23a). x Asimétrica negativa-platicúrtica: asimetría positiva y curtosis negativa. Los datos se encuentran distribuidos hacia la derecha (valores mayores) y muchos se alejan de la media (Fig. 23b). x Asimétrica negativa-leptocúrtica: asimetría positiva y curtosis positiva. Los datos se encuentran distribuidos hacia la derecha (valores mayores) y pocos se alejan de la media (Fig. 23c).

Figura 23. Distribuciones asimétricas negativas. A= asimétrica negativa-mesocúrtica. B= asimétrica negativa-platicúrtica. C= asimétrica negativa-leptocúrtica.

80

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

V GRAFICO DE CAJA Y DISPERSION

1. GRAFICO DE CAJA (BOX-PLOT) NIVEL DE MEDICIÓN: INTERVALAR y DE RAZON El grafico de caja, gráfico de caja y bigotes o box-plot es un gráfico propuesto por Tukey (1977) que se basa en medidas robustas de posición y dispersión, que muestra la distribución de los datos señalando donde caen la mayoría de ellos y la existencia de datos extremos. Para construirlo es necesario en primer lugar ordenar los datos de menor a mayor y calcular la mediana, el cuartil inferior, el cuartil superior y la distancia intercuartil.

ƒ Ejemplo 1 Se evaluó la motivación hacia la clase de educación física de 12 estudiantes de tercer año de enseñanza media de un colegio de Santiago. De ello se obtuvo la siguiente tabla ordenada de menor a mayor:

Posición 1 2 3 4

Datos 10 12 13 15

Posición 5 6 7 8

Datos 17 19 22 25

Posición 9 10 11 12

Datos 28 30 38 55 81

FERNANDO MAUREIRA CID

¾ Paso 1: Determinar el dato menor y mayor, la mediana (fórmula 4), el cuartil inferior y el cuartil superior (fórmula 9) y la distancia intercuartil (Di) que se obtiene con la siguiente fórmula: Di = Cs – Ci

(fórmula 13)

Cs = valor del cuartil superior Ci = valor del cuartil inferior Al realizar los cálculos del ejemplo 1 nos queda: Dato menor = 10 Dato mayor = 55 Mediana = 20,5 Cuartil inferior (0,25) = 13,5 Cuartil superior (0,75) = 29,5 Distancia intercuartil = 29,5 – 13,5 = 16

¾ Paso 2: Luego debemos determinar las cotas (límites de separación de los datos de la mediana) para decidir si un dato es outlier (extremo, anómalos o atípicos) cuando caiga entre la 1° y 2° cota inferior o superior o si un dato es outlier severo cuando caiga fuera de la 2° cota inferior o superior. La primera cota inferior y superior se obtiene con la siguiente fórmula: 1° cota = Cis + 1,5 Di Cis = Cuartil inferior y superior + = más en la cota superior y menos en la cota inferior Di = distancia intercuartil

82

(fórmula 14)

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Con los datos del ejemplo 1: 1° cota inferior = 13,5 – (16 * 1,5) = -10,5 1° cota superior = 29,5 + (16 * 1,5) = 53,5

La segunda cota inferior y superior se obtienen con la siguiente fórmula: (fórmula 15) 2° cota = Cis + 3 Di Cis = Cuartil inferior y superior + = más en la cota superior y menos en la cota inferior Di = distancia intercuartil Con los datos del ejemplo 1: 2° cota inferior = 13,5 – (16 * 3) = -34,5 2° cota superior = 29,5 + (16 * 3) = 77,5

¾ Paso 3: Con estos datos se debe dibujar una escala con el rango de variación de los datos, marcar la mediana y los cuartiles (inferior y superior) dibujando una caja entre los cuartiles.

¾ Paso 4: Desde el cuartil inferior se traza una línea con bigotes hasta el dato menor de la muestra y de igual forma del cuartil superior se traza una línea hasta el dato mayor de la muestra. Esto siempre y cuando ningún dato sobrepase la 1° o 2° cota inferior o superior, ya que de ser así la línea se traza hasta el dato mayor antes de la 1° cota y se marcan estos datos outlier con un * y los datos outlier extremos con un °.

83

FERNANDO MAUREIRA CID

Dato outlier

Máximo Cuartil 0,75 Mediana Cuartil 0,25 Menor

Figura 24. Box-plot, donde se observa la mediana (20,5), el cuartil inferior (13,5), el cuartil superior (29,5), el dato menor (10), el dato mayor antes de la 1° cota superior (38) y un dato outlier (55).

Este tipo de gráficos son muy útiles para comparar grupos diferentes (por ejemplo damas y varones) o un mismo grupo en diversas mediciones (por ejemplo antes y después de un tratamiento). En la figura 25 se muestran los gráficos de caja de las puntuaciones de una prueba entre dos grupos, donde se aprecia que el grupo 1 posee una mediana de 38 con una distancia intercuartil de 22 puntos, en comparación del grupo 2 que posee una mediana de 55 y una distancia intercuartil de 31 puntos. De esto se concluye que el grupo 1 posee puntuaciones más bajas y con menor dispersión que el grupo 2. Además, el grupo 1 posee una puntuación mínima de 15 y máxima de 68, en tanto el grupo 2 logro un mínimo de 12 y un máximo de 95 puntos. Finalmente, el grupo 1 posee un dato outlier de 96 puntos.

84

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Figura 25. Gráfico de caja para comparar dos grupos.

2. GRAFICO DE DISPERSION (SCATTER-PLOT) NIVEL DE MEDICIÓN: INTERVALAR y DE RAZON Es un gráfico simple y útil para estudiar la relación entre dos variables numéricas. Se caracteriza por representar una nube de puntos (forma en que se distribuyen los datos en el gráfico) que permite evaluar la naturaleza de la relación de ambas variables (dirección, forma y fuerza de la relación). Puntos dispersos en el gráfico representan la falta de relación entre las variables, en cambio puntos agrupados o en líneas indican relación entre ellas.

ƒ Ejemplo 2 Se evaluó la agilidad y el desarrollo motor de 11 estudiantes de 5° año básico de un colegio de Santiago. En la tabla siguiente se observan los puntajes obtenidos: 85

FERNANDO MAUREIRA CID

Sujeto 1 2 3 4 5 6 7 8 9 10 11

Agilidad 2 4 5 3 2 3 1 3 4 4 5

Motricidad 4 6 8 5 3 4 2 6 5 7 7

¾ Paso 1: Construimos un gráfico en cuyo eje X colocaremos la variable agilidad y en el eje Y la variable motricidad. Luego ubicaremos un punto en la intersección de las dos puntuaciones que obtuvo cada sujeto del ejemplo 2 (Fig. 26).

Figura 26. Gráfico de dispersión de las puntuaciones de agilidad y motricidad. 86

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Se puede observar que los puntos se ordenan en una especie de línea diagonal que asciende. Esta dispersión de datos muestra una relación entre las dos variables, ya que a medida que una puntuación aumenta (agilidad) la otra también lo hace (motricidad). Las representaciones de nubes difusas no muestran relación entre las variables. Las representaciones lineales muestran una fuerte relación entre variables, además esta relación puede ser positiva (cuando una variable aumenta la otra también aumenta o cuando una disminuye la otra también disminuye) o negativa (cuando una variable aumenta la otra disminuye o viceversa). Las representaciones exponenciales no son lineales, aunque muestran relación entre las variables (positiva o negativa) pero se caracterizan porque una variable posee valores constantes o existen modificaciones pequeñas (aumento o disminución), pero de pronto se producen cambios de gran envergadura en la variable produciendo una curva en el gráfico. En la figura 27 se observan diferentes dispersiones de datos, en el ejemplo A se aprecia una distribución de nube difusa, que podría ser la relación entre la práctica de ejercicio físico y el sueldo de los trabajadores de una planta manufacturera, ya que ambas no se conectan y por ende la variación en una de ellas no provocará necesariamente cambios en la otra. En el ejemplo B se observa una distribución lineal positiva, por ejemplo la relación entre la práctica de ejercicio físico aeróbico y la resistencia cardiovascular, ya que al aumentar la primera la segunda también aumenta por adaptación fisiológica. En el ejemplo C se aprecia una distribución lineal negativa, por ejemplo la relación de la práctica de ejercicio físico y el porcentaje de grasa corporal, ya que al aumentar la primera disminuye la segunda. Finalmente, en el ejemplo D se muestra una distribución exponencial, como sería la relación entre el uso del gimnasio para mejorar la apariencia física y los meses del año, ya que entre los meses de marzo y agosto existe un número constante y bajo de personas que asisten regularmente al gimnasio, situación que cambia radicalmente a partir de septiembre, cuando la cantidad 87

FERNANDO MAUREIRA CID

de personas que asisten al gimnasio aumenta, duplicándose o triplicándose.

Figura 27. Dispersiones de los datos. En la imagen A se observa una representación de nube difusa de datos. En la imagen B y C una distribución lineal (B es positiva y C es negativa) y en la imagen D una distribución exponencial.

88

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

CAPÍTULO 3 DISTRIBUCIONES DE PROBABILIDADES

I. Distribuciones discretas II. Distribuciones continuas

89

FERNANDO MAUREIRA CID

90

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

I DISTRIBUCIONES DISCRETAS

La estadística inferencial resulta de aplicar las probabilidades a la estadística descriptiva. En este libro no estudiaremos probabilidades, ya que eso resultaría un libro en sí mismo, sólo explicaremos algunos conceptos básicos. x Probabilidad: es una medida numérica que cuantifica la posibilidad que un evento ocurra. Por ejemplo, en el noticiario indican un 80% de probabilidad de que llueva, esto representa una posibilidad muy alta de que ese evento ocurra y por lo tanto deberíamos salir preparados con un paraguas. Las probabilidades fluctúan entre 0 y 1 (0% y 100%). x Evento: es el resultado futuro de una decisión. Por ejemplo, decidimos lanzar un dado y para ello existen seis eventos posibles (las seis caras de un dado). En el ejemplo anterior de la lluvia existen dos eventos posibles respecto del paraguas: llevarlo o no llevarlo. x Evento aleatorio: es aquel resultado que se logra por azar o al menos podemos atribuirlo a él. Por ejemplo, en el caso del lanzamiento de un dado, ya que el número que se obtiene es resultado del azar (claro si no tomamos en cuenta, la fuerza, dirección y otra enorme cantidad de variables al momento de lanzar el dado)

91

FERNANDO MAUREIRA CID

x Evento no aleatorio: es aquel resultado que no se produce por azar. Por ejemplo, en el caso del paraguas y la lluvia el resultado no es producto del azar, ya que depende de nuestra preferencia de llevar o no el paraguas. x Espacio muestral: corresponde a todos los posibles eventos aleatorios que puedan existir. Por ejemplo, seis eventos aleatorios en el caso de un dado: sus seis caras. La estadística inferencial trata sobre los eventos aleatorios, por lo tanto, todas las futuras referencias a eventos serán de este tipo. La probabilidad (px) de que un evento ocurra se puede calcular con la siguiente fórmula: px = na Em

(fórmula 16)

na = número de eventos aleatorios Em = tamaño de espacio muestral

En el caso del dado reemplazamos en la fórmula 16: p(x) = 1 / 6 = 0,16666 La probabilidad de obtener un número cualquiera del dado (un dos por ejemplo) al lanzarlo es de 16,666%. El 1 representan el evento que deseamos, como el número dos (que por ende es un evento) y el 6 es el total de posibles eventos o espacio muestral (seis caras del dado). Desde el punto de vista de la investigación científica, usando los estadísticos descriptivos de una muestra y con la ayuda de las probabilidades podemos determinar parámetros en una población, función principal de la estadística inferencial. 92

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Las variables aleatorias de un espacio muestral pueden ser de dos tipos: discretas o continuas. Las variables discretas son por ejemplo, el lanzamiento de una moneda, la cantidad de elementos erróneos en una serie de elementos, el lanzamiento de un dado, etc. Estas variables corresponden a los datos de tipo categóricos. Estas variables discretas poseen una distribución de probabilidades que puede ser de varios tipos.

1. DISTRIBUCION DE BERNOULLI Es la distribución más simple donde existen solamente dos posibles resultados: éxito y fracaso. Por ejemplo, un jugador de fútbol frente al balón en un lanzamiento penal tiene dos posibilidades: a) convierte el gol; b) falla el lanzamiento. El proceso de Bernoulli consiste en un experimento, que a su vez consiste en una serie de ensayos independientes, idénticos y dicotómicos. El éxito (p) o fracaso (q) de un ensayo corresponde a la expresión: p + q = 1 por lo tanto, p=1–q q=1–p Es decir, éxitos más fracasos es igual a 1 (100%) o lo que es lo mismo, la cantidad de éxitos es igual a 1 menos la cantidad de fracasos y por lo tanto, la cantidad de fracasos es igual a 1 menos la cantidad de éxitos.

ƒ Ejemplo 1 Un delantero de fútbol posee un 70% de aciertos en sus lanzamientos penales y por ende presenta un 30% de fracasos. En la figura 28 se observa el grafico de barra de la distribución de Bernoulli del delantero.

93

FERNANDO MAUREIRA CID

Figura 28. Distribución de Bernoulli de los lanzamientos penales de un delantero de fútbol.

2. DISTRIBUCIÓN BINOMINAL Esta distribución produce una descripción adecuada a las probabilidades de ocurrencia de los resultados de un experimento generado en un proceso de Bernoulli. Un experimento puede ser dicotómico o teniendo muchos resultados puede dicotomizarse, por ejemplo, en el lanzamiento de un dado tenemos 6 posibles resultados pero podemos reducirlo a obtener un número 2 (éxito) o no obtener un número 2 (fracaso). En un experimento de Bernoulli con dos etapas tenemos la existencia de dos posibilidades en la 1° etapa (éxito o fracaso) y tenemos cuatro posibilidades en la 2° etapa (éxito-fracaso-éxitofracaso).

94

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Si p es igual al 80% y q es igual al 20% tenemos que: p*p p*q q*p q*q

= 0,80 * 0,80 = 0,64 (64%) = 0,80 * 0,20 = 0,16 (16%) = 0,20 * 0,80 = 0,16 (16%) = 0,20 * 0,20 = 0,04 (4%)

Por lo tanto, la posibilidad de obtener dos éxitos en este experimento es de un 64%, de obtener 1 éxito es de 32% y de obtener 0 éxito es de un 4%. Cuando necesitamos conocer algún resultado en particular y no toda la distribución de un experimento binominal, es posible calcularlo con la siguiente fórmula:

p(X|n,p) =

n! px q n-x x! (n – x)!

(fórmula 17)

p(x|n,p) = probabilidad total n! = número factorial de ensayos del experimento x! = número factorial de errores de los n ensayos n = número de ensayos del experimento x = número de errores de los n ensayos p = probabilidad de éxito de cualquier ensayo q = probabilidad de fracaso de cualquier ensayo

ƒ Ejemplo 2 Un voleibolista tiene una probabilidad de acierto en su saque de un 75% (0,75). Si en un partido se escogen al azar 5 saques, calcular la posibilidad que cero, uno, dos, tres, cuatro y cinco saques sean correctos. 95

FERNANDO MAUREIRA CID

Reemplazamos en la fórmula 17 para cada posibilidad: p(5|5,0.75) = [5! / 0!*(5 – 0)!] * (0,75)5 * (0,25)0 = [5! / 0!*5!] * (0,237*1) = (120 / 120) * 0,237 = 1 * 0,237 = 0,237 p(4|5,0.75) = [5! / 1!*(5 – 1)!] * (0,75)4 * (0,25)1 = [5! / 1!*4!] * (0,316*0,25) = (120 / 24) * 0,079 = 5 * 0,079 = 0,395 p(3|5,0.75) = [5! / 2!*(5 – 2)!] * (0,75)3 * (0,25)2 = [5! / 2!*3!] * (0,422*0,0625) = (5! / 12) * 0,026 = 10 * 0,026 = 0,260 p(2|5,0.75) = [5! / 3!*(5 – 3)!] * (0,75)2 * (0,25)3 = [5! / 3!*2!] * (0,563*0,016) = (120 / 12) * 0,009 = 10 * 0,009 = 0,09 p(1|5,0.75) = [5! / 4!*(5 – 4)!] * (0,75)1 * (0,25)4 = [5! / 4!*1!] * (0,75*0,0039) = (5! / 24) * 0,0039 = 5 * 0,0039 = 0,02 p(0|5,0.75) = [5! / 5!*(5 – 5)!] * (0,75)0 * (0,25)5 = [5! / 5!*0!] * (1*0,00098) = (5! / 120) * 0,0098 = 1 * 0,00098 = 0,00098 96

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

De esto es posible concluir que el voleibolista tiene 23,7% de probabilidades de realizar correctamente los 5 saques, 39,5% de realizar correctamente 4 saques, 26% de realizar correctamente 3 saques, 9% de realizar correctamente 2 saques, 2% de realizar correctamente sólo un saque y 0,098% de no realizar correctamente ninguno de los saques. En la figura 29 se observa la distribución binominal para el ejemplo 2.

Figura 29. Distribución binominal, donde se aprecia la posibilidad de éxito de una cantidad n de saques del voleibolista del ejemplo 2 (barras) y la curva de dicha distribución (línea).

3. DISTRIBUCIÓN DE POISSON Esta distribución es una de las más importantes en variables discretas. Se caracteriza por modelar situaciones en las que interesa determinar el número de ciertos hechos que se pueden producir en un intervalo de tiempo o espacio, bajo ciertas características. También se utiliza para determinar límites de procesos dicotómicos reiterados cuando la probabilidad de obtener éxito es muy pequeña. 97

FERNANDO MAUREIRA CID

Este proceso se utiliza por ejemplo para determinar el número de fallas de un sistema, la cantidad de autos que pasan por una caseta de peajes, número de gente que sube y baja en un terminal de buses, etc. La posibilidad de Poisson se calcula con la siguiente fórmula: p(X) = e–(np) (np)x X!

(fórmula 18)

p(x) = probabilidad total e = 2,71828 (constante, base de los logaritmos naturales) p = probabilidad de ocurrencia X! = 1, 2, 3,…factorial

ƒ Ejemplo 3 En un partido de básquetbol de la liga amateur el 20% de los lanzamientos realizados desde fuera de la zona se convierten en canastas de 3 puntos. Calcular la posibilidad que en un partido donde se realizan 30 lanzamientos fuera de la zona, 8 de ellos se convierta en canastas de tres puntos. n = 30 p = 20% = 0,2 X! = 8 np = 30 * 0,2 = 6 Reemplazamos en la fórmula 18: p(x) = (2,71828)-6 * 6 8 8! = (0,0025 * 1679616) / 8! = 4199,04 / 8! = 0,104

98

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Esto significa que existe un 10,4% de posibilidades que en el partido 8 lanzamientos desde fuera de la zona se conviertan en canastas de 3 puntos. También es posible calcular las posibilidades con diferente cantidad de canastas (5, 6, 7, 8, 9, etc.) y así construir una curva de distribución.

Figura 30. Distribución de Poisson para la cantidad de aciertos en lanzamientos de tiro libre en básquetbol en 15 segundos de un equipo amateur de Santiago. Se observa que un 40% de los jugadores logra encestar 3 tiros en ese tiempo y ninguna alcanza 6 aciertos o más.

4. DISTRIBUCIÓN HIPERGEOMETRICA En una distribución binominal las observaciones son independientes entre sí y es un proceso estacionario, que resulta de una población infinita. Cuando la población es finita los ensayos sucesivos no son independientes entre sí, ni tampoco estacionarios y por ende la probabilidad de éxito varia de ensayo en ensayo. En estos casos se utiliza una distribución hipergeométrica. 99

FERNANDO MAUREIRA CID

El modelo hipergeométrico se calcula con la siguiente fórmula: P(x=k) = R x

N–R n–x

(formula 19)

N n R= éxitos en la población x= éxitos en la muestra n= muestra N= total de la población

ƒ Ejemplo 4 En una bodega de gimnasio sin luz, hay 10 balones de los cuales 7 son de color negro y 3 de color blanco. De una muestra de 4 balones calcule la posibilidad de sacar 2 de color negro. N= 10 n= 4

R= 7 balones negros x= 2 balones negros

Reemplazamos en la fórmula 19: P(x=2) = 7 2

=

10 – 7 4–2 10 4

=

7! 2! 5!

3! 2! 1! 10! 4! 6!

= (21 * 3) / 201 = 63 / 210 = 0,30 100

7 3 2 2 10 4 =

7! 3! = 2! (7 – 2)! 2! (3 – 2)! 10! 4! (10 – 4)!

5040 6 2 * 120 2 * 1 3628800 24 * 720

= 5040 * 6 240 2 3628800 17280

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Las posibilidades de sacar 2 balones negros al escoger balones al azar y en la oscuridad son del 30%.

101

FERNANDO MAUREIRA CID

102

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

II DISTRIBUCIONES CONTINUAS

Las variables continuas son aquellas que pueden adquirir un número finito de posibilidades dentro de una escala continua como puntos en una línea. Por ejemplo, el tiempo, la temperatura, la fuerza, la velocidad, etc. Estas variables corresponden a los datos de tipo numéricos. Estas variables continuas poseen una distribución de probabilidades que puede ser de varios tipos.

1. DISTRIBUCIÓN NORMAL Los datos que recolectamos de la muestra poseen una distribución observable en los histogramas o polígonos de frecuencia, cuya área bajo la curva representa el 100% de los casos estudiados o de la población. Los datos pueden presentar un sinnúmero de distribuciones siendo la más conocida e importante la distribución normal (Fig. 31). Mediante la utilización de histogramas y los cálculos de la asimetría y curtosis podemos tener una idea de la forma de distribución de nuestros datos (una simetría de cero o cercana y una curtosis de cero o cercana representan una distribución normal o gaussiana). En las distribuciones normales la media, la mediana y la moda son iguales, con una media 0 y varianza 1. Recordemos que en una distribución normal el 68,26% de los datos caen dentro de la primera desviación estándar, el 95,45% cae dentro de dos desviaciones estándar y el 99,73% cae dentro de tres desviaciones estándar. 103

FERNANDO MAUREIRA CID

Figura 31. Una distribución normal es aquella cuya asimetría y curtosis es igual a cero. Estas distribuciones presentan una forma acampanada.

El teorema del límite central dice que aumentando el número de observaciones en una muestra que no presenta una distribución normal, esta se logra. Para esto es necesario que el número de observaciones de la muestra sea mayor a 30 y en poblaciones muy grandes (infinitas) el número debe ser menor o igual al 5% de la población. La mayor parte de los fenómenos naturales tienden a generar una distribución normal siempre que el número de observaciones sea suficientemente grande.

2. DISTRIBUCIONES CON MUESTRAS PEQUEÑAS Una distribución normal contiene una gran cantidad de casos observados, pero puede suceder que nuestra muestra posea menos de 30 observaciones y entonces resulta necesario utilizar otros tipos de distribuciones para trabajar con nuestros datos:

104

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

2.1

La distribución T de Student o distribución T

Para muestras de menos de 30 casos, es una distribución simétrica con media 0 y varianza 1, es más achatada que la normal (mesocúrtica) y adopta diferentes formas según los grados de libertad (Fig. 32).

Figura 32. Distribución t. La línea continua representa la curva normal de distribución (más de 30 casos), la línea cortada representa la distribución de una muestra de 15 casos y la línea de puntos una muestra de 10 casos. Como se puede observar a medida que aumenta el n de la muestra más se acerca a una curva normal.

Los grados de libertad son el número de valores de una muestra que podemos especificar libremente, una vez que se conoce la media de la muestra. Para explicar lo anterior imaginemos que le piden escoger dos números que sumen 10, una vez que ha escogido libremente el primero (un 5 o 7 o 2, etc.) ya no puede escoger el segundo, ya que va a existir un único número que sumado al que escogió sumen 10. Por lo tanto, en esa situación se dice que existe 1 grado de libertad (la posibilidad de escoger un número). Ahora, si debe escoger 3 105

FERNANDO MAUREIRA CID

números que sumen 20, usted puede escoger libremente los dos primeros, ya que una vez hecho esto solo existe un único tercer número que sumado a los dos que usted escogió sumen 20, por lo tanto tiene 2 grados de libertad. Así se continúa dependiendo de la cantidad de números a escoger. Los grados de libertad (gl) se pueden calcular con la siguiente fórmula: gl = n – 1 (fórmula 20) n = número de la muestra En una distribución t a medida que aumentan los grados de libertad se aproxima a una distribución normal.

2.2

La distribución Chi Cuadrada (X2)

Se le conoce como distribución chi cuadrado o distribución ji cuadrado. Corresponde a una distribución para muestras de menos de 30 casos, es una distribución asimétrica positiva y adopta diferentes formas según los grados de libertad (Fig. 33), por lo tanto, existen infinitas curvas de esta distribución. A medida que aumenta el tamaño de la muestra la distribución Chi cuadrado se vuelve menos asimétrica acercándose a una distribución normal. Cuando la muestra es mayor a 2 casos, la media de X2 corresponde a n – 1 y la varianza a 2(n – 1).

2.3 La distribución F de Fisher Se le conoce como distribución F de Fisher, distribución F de Snedecor o distribución F de Fisher-Snedecor. Corresponde a una distribución para dos muestras aleatorias independientes de tamaño n1 y n2 que poseen una distribución Chi cuadrada. Es una distribución asimétrica positiva y adopta diferentes formas según los grados de libertad (Fig. 34). 106

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

A medida que aumentan los grados de libertad de ambas muestras la distribución F se vuelve menos asimétrica acercándose a una distribución normal.

Figura 33. Distribución Chi Cuadrada. La línea continua representa una distribución Chi cuadrada con 1 grado de libertad, la línea cortada con 3 grados de libertad y la línea de puntos con 6 grados de libertad.

Figura 34. Distribución F. La línea continua representa una distribución F con 10 grados de libertad en el grupo 1 e infinitos grados de libertad en el grupo 2, la línea cortada con 10 grados de libertad en el grupo 1 y 10 grados de libertad en el grupo 2 y la línea de puntos con 10 grados de libertad en el grupo 1 y 4 grados de libertad en el grupo 2. 107

FERNANDO MAUREIRA CID

3. DISTRIBUCIÓN Z En ocasiones debemos comparar variables con medidas diferentes y como no es posible determinar sus medias y simplemente comparar, debemos convertir ambos grupos en una distribución estándar, proceso que recibe el nombre de estandarización.

ƒ Ejemplo 1 Un profesor evaluó la motricidad de niños de tercer año básico de un colegio de Maipú utilizando un test de 30 puntos y usted evaluó la misma variable (motricidad) en niños de tercer año básico de un colegio de Independencia, pero utilizó un test de 100 puntos. Sin embargo, ahora quiere comparar los resultados de los niños de los dos colegios.

Colegio 1 1 2 3 4 5 6 7 8 9 10 Ш= S=

Motricidad 22 24 26 25 24 26 27 23 25 24 24,6 1,51

Colegio 2 1 2 3 4 5 6 7 8 9 10 Ш= S=

Motricidad 80 90 65 70 95 80 70 90 80 70 79,0 10,22

Las puntuaciones de los dos colegios se observan en la tabla anterior y donde cualquier estudiante del segundo colegio aparece con una puntuación mayor que los del primer establecimiento. 108

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

En estos casos es necesario estandarizar los datos mediante una calificación Z que se obtiene con la fórmula siguiente: Z = (x i – Ш) S

(fórmula 21)

xi = valor de cada observación Ш = media de las observaciones S = desviación estándar Una puntuación Z corresponde a una desviación estándar. Al aplicar la fórmula 21 en cada caso observado en ambos colegios obtenemos una tabla como la siguiente: Motricidad colegio 1 22 24 26 25 24 26 27 23 25 24 24,6 1,50

Z -1,72 -0,40 0,93 0,26 -0,40 0,93 1,59 -1,06 0,26 -0,40

Motricidad colegio 2 80 90 65 70 95 80 70 90 80 70 79,0 10,21

Z 0,10 1,08 -1,37 -0,88 1,57 0,10 -0,88 1,08 0,10 -0,88

Ahora podemos observar que un estudiante del colegio 1 con una puntuación de 27 en el test de motricidad posee una puntuación Z de 1,59 y un estudiante del colegio 2 con una puntuación de 80 en el test de motricidad posee una puntuación Z de 0,10. Por lo tanto, 109

FERNANDO MAUREIRA CID

podemos concluir que el estudiante 1 pese a tener menos puntuación bruta que el estudiante 2 posee mejor nivel de motricidad, ya que su puntuación Z es mayor. Ahora también es posible calcular áreas bajo la curva normal estandariza gracias a las puntuaciones Z.

ƒ Ejemplo 2 Un profesor evaluó a la flexibilidad de tronco a 562 estudiantes de enseñanza media, obteniendo una media de 17,22 cms. y una desviación estándar de 4,28. Ahora desea conocer cuántos estudiantes tienen entre 17,22 y 25,78 cms de flexibilidad.

Figura 35. Adaptación de una curva normal estandarizada a los datos de flexibilidad de estudiantes de enseñanza media. 110

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Ahora sabemos que al utilizar la curva normal estandarizada en los datos de flexibilidad en estudiantes de enseñanza media, los sujetos que poseen valores entre 17,22 y 25,78 cms corresponden al 47,5% del total de la muestra, por lo tanto en ese rango existen 267 estudiantes.

111

FERNANDO MAUREIRA CID

112

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

CAPÍTULO 4 INTRODUCCIÓN A LA ESTADISTICA INFERENCIAL

I.

Conceptos en estadística inferencial

II. Muestras y muestreo

113

FERNANDO MAUREIRA CID

114

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

I CONCEPTOS EN ESTADISTICA INFERENCIAL

1. NIVEL DE SIGNIFICACIA El nivel de significancia o valor p tiene que ver con la probabilidad de que un evento ocurra y se mide entre 0 y 1, siendo 0 la imposibilidad absoluta que dicho evento ocurra y 1 la certeza absoluta que ocurra. Como vimos al comienzo del capítulo 4, la probabilidad que salga un número determinado en el lanzamiento de un dado es de 0,16666 (16,666%). Cuando un investigador desea estimar los parámetros poblacionales desde los estadísticos de la muestra debe preocuparse de que ambos valores sean cercanos (por ejemplo la media de la muestra y la población), ya que si esto es así, resulta posible generalizar los resultados hacia la población, de lo contrario es necesario dudar de la generalización de dichos valores. En este ámbito, el nivel de significancia (nivel Į  HV OD probabilidad de equivocarse al generalizar los resultados obtenidos en la muestra hacia la población. /RV QLYHOHV Į Pás utilizados en ciencias sociales son 0,05 (95% de probabilidades de acierto y 5% de probabilidad de error) y 0,01 (99% de acierto y 1% de error). También es posible utilizar niveles Į Pás pequeños (0,001 ó 0,0001). x La interpretación de un análisis estadístico inferencial se basa en la aceptación o rechazo de la hipótesis nula (H0) de nuestra investigación. 115

FERNANDO MAUREIRA CID

Al representar el nivel de significancia bajo la curva normal (p=0,05) se produce un área de aceptación de la H 0 y un área de rechazo de ella (Fig. 36). Si nuestro resultado cae dentro del área de aceptación de H 0 (p>0,05) debemos aceptar igualdad en los resultados y si cae en el área de rechazo (p Ш2 En caso que se rechace la hipótesis nula es posible predecir que el grupo de varones (Ш1) presentará niveles mayores de fuerza que las damas, por lo tanto, esta hipótesis es de una cola. Para una prueba de dos colas el 95% del área bajo la curva (área de aceptación de la hipótesis nula) se valora en términos de puntajes Z a 1,96 desviaciones estándar (Į    8Q  GHO área bajo la curva se valora en 2,58 desviaciones estándar (Į  0,01) y el 99,9% área bajo la curva se valora en 3,90 desviaciones estándar (Į   117

FERNANDO MAUREIRA CID

Para una prueba de una cola el 95% del área bajo la curva (área de aceptación de la hipótesis nula) se valora en términos de 1,64 desviaciones estándar en sentido positivo o negativo (Į  0,05). Un 98% del área bajo la curva se valora en 2,32 desviaciones estándar (Į 0,01) y el 99,9% área bajo la curva se valora en 3,70 desviaciones estándar (Į  

2. METODOS EN INFERENCIA ESTADISTICA La estadística inferencial nos permite hacer afirmaciones sobre más elementos de los que vamos a medir, existiendo dos métodos de inferencia: la estimación (donde proponemos estimaciones de los valores de los parámetros de la población) y el contraste de hipótesis (donde establecemos una hipótesis respecto al valor de un parámetro de la población y se evalúa con la información obtenida de la muestra). La estimación pretende determinar parámetros en base a estadísticos, es decir, conocer los valores de una característica de la población en base a unos pocos sujetos extraídos de ella (muestra) y a los cuales medimos. Por ejemplo, hemos determinado la media y la desviación estándar de la velocidad en una carrera de100 mts. planos de una muestra aleatoria de 360 estudiantes de segundo año medio y ahora queremos conocer esos mismos valores de la población de 2.500 estudiantes de segundo medio de donde se extrajo la muestra. Para esto necesitamos realizar una estimación de la media y la desviación estándar de la población. La estimación de parámetros se divide en estimaciones puntuales y estimaciones por intervalos.

2.1 Estimaciones puntuales La estimación puntual trata de asignar un solo valor lo más cercano posible al valor del parámetro de la población. Estas estimaciones requieres de un estimador que no es otra cosa que 118

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

un estadístico que permite conocer características de la población. Para cada parámetro pueden existir varios estimadores y la forma de seleccionar el correcto es en base a cuatro propiedades: x Carencia de sesgo: Un estimador será insesgado si su valor esperado coincide con el parámetro a estimar. Por ejemplo, la media de una muestra aleatoria es un estimador insesgado de la media de la población, ya que el valor esperado de la media muestral coincide con el valor de la media poblacional. x Consistencia: Un estimador será consistente si a medida que aumenta el tamaño de la muestra, el valor del estimador se aproxima al valor del parámetro de la población. x Eficiencia: Un estimador es más eficiente (preciso) que otro si presenta una varianza menor. x Suficiencia: Un estimador será suficiente si resume toda la información relevante contenida en la muestra, de manera que ningún otro estimador pueda entregar información adicional sobre el parámetro. Para obtener un estimador puntual se selecciona una muestra que permita minimizar el error de la diferencia del parámetro y el estadístico (esto se logra con el muestreo adecuado, situación que se analizará en el capítulo 6). Luego se calcula el estadístico muestral y se utiliza como estimación del parámetro verificando las cuatro propiedades mencionadas anteriormente.

ƒ Ejemplo 3 Un investigador desea conocer la edad promedio de egreso de los estudiantes de la carrera de educación física de una Universidad de Santiago y para ello selecciona una muestra de 119

FERNANDO MAUREIRA CID

50 estudiantes. El valor de la media de la muestra será un estimador puntual de la media de la población de egresados.

2.2 Estimaciones por intervalo Es una forma de establecer dos valores entre los cuales se encuentra el parámetro que deseamos conocer con una confianza GH Į -1. Esto ayuda en la precisión y confiabilidad del estimador puntual. A este intervalo se le denomina intervalo de confianza. Por ejemplo, una media poblacional nunca será conocida, pero con la información de la muestra podemos determinar dos valores entre los cuales se incluirá la verdadera media poblacional con una confianza del 95% (esto se verá en detalle en el capítulo 5).

2.3 Contraste de Hipótesis El contraste de hipótesis es el proceso de decisión donde contrastamos o comparamos la hipótesis nula con los datos empíricos y determinamos si es o no compatible con ellos. Recuerde que las hipótesis siempre preguntan por la población, aunque solo contemos con los estadísticos de la muestra. Una vez determinado el nivel de confianza (95%, 99%, etc.) procedemos a rechazar la hipótesis nula si el estadístico cae en la región de rechazo y la mantenemos si cae en la región de aceptación (Fig. 36). Cuando se toma una decisión estadística hay que tener cuidado de no cometer los errores tipo I y tipo II. El error tipo I también OODPDGRHUURUDOID Į HVHOHUURUTXHVH comete cuando un investigador no acepta la hipótesis nula siendo esta verdadera, es decir, se concluye que existe una diferencia entre grupos, existe relación entre ellos o existe diferencia entre la muestra y la población, cuando en realidad no existe. El error tipo II OODPDGR HUURU EHWD ȕ  es el error que se comete cuando un investigador no rechaza la hipótesis nula siendo 120

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

esta falsa, es decir, se concluye que no existe diferencia entre grupos, no existe relación entre ellos o no existe diferencia entre la muestra y la población, cuando en realidad si existe. La potencia de un contraste es la probabilidad de rechazar una hipótesis nula cuando esta es incorrecta. Esto se puede definir como 1- ȕ&XDQWRPD\RUes la varianza de la población menor es la potencia y cuanto mayor sea el tamaño de la muestra mayor es la potencia del contraste. El error tipo I y tipo II no se pueden cometer simultáneamente, ya que el primero solo se puede dar si H 0 es correcta y el segundo si H 0 es incorrecta. Si la probabilidad del error tipo I aumenta, la probabilidad del error tipo II disminuye. Para disminuir la probabilidad de cometer un error tipo I es necesario aumentar el nivel de confianza, por lo menos debe ser de un 0,05. Por su parte, para disminuir la probabilidad de cometer un error tipo II es necesario aumentar el tamaño de la muestra.

Decisión No rechazar H0 Rechazar H0

H 0 Correcta

H 0 incorrecta

No hay error (1 – Į

(UURU7LSR,, ȕ

(UURU7LSR, Į

No hay error (1 – ȕ

Figura 37. Error tipo I y tipo II.

121

FERNANDO MAUREIRA CID

122

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

II MUESTRA Y MUESTREO

Cuando planteamos nuestra investigación hemos formulado hipótesis sobre una población que deseamos estudiar. Por ejemplo, queremos saber si existen diferencias en los niveles de resistencia cardiovascular de los estudiantes de primer año medio de colegios municipalizados y de colegios particulares de la comuna de Providencia. Una vez que conocemos la población (en el ejemplo, el total de los estudiantes de primer año medio de colegios municipalizados y de colegios particulares de la comuna de Providencia) debemos determinar la muestra en la cual realizaremos las mediciones (Fig. 38).

Figura 38. Representación de una población y una muestra.

123

FERNANDO MAUREIRA CID

Es importante recordar que para obtener la muestra es necesario establecer los criterios de inclusión y exclusión de la misma. a) Criterios de inclusión de la muestra: corresponde a las características que deben poseer los sujetos o unidades de análisis para poder ser considerados como parte de la muestra. En el ejemplo anterior de la resistencia cardiovascular, serían criterios de inclusión: x Que los sujetos fuesen estudiantes de un colegio municipal o particular de providencia x Que se encuentren cursando primer año medio. b) Criterios de exclusión de la muestra: corresponde a las características que de poseer el sujeto o unidad de análisis serán excluidos de poder formar parte de la muestra. En el mismo ejemplo anterior, serían criterios de exclusión: x Los estudiantes de primer año medio de colegios municipales o particulares de Providencia que posean enfermedades respiratorias que puedan afectar su resistencia cardiovascular x Aquellos estudiantes que formen parte de equipos o clubes deportivos con altos niveles de entrenamiento físico, lo cual también podría afectar su rendimiento en la medición. x Estudiantes de primer año medio de colegios municipales o particulares de Providencia que se encuentren lesionados, etc.

1. CALCULOS DE MUESTRAS Una vez establecidos los criterios de inclusión y exclusión, debemos determinar el tamaño de la muestra, es decir, el número de sujetos que debemos medir en la realidad. Las muestras pueden ser probabilísticas (sujetos elegidos al azar entre todos los de la población, por lo tanto, todos tienen las mismas posibilidades de formar parte de la muestra y los casos son representativos de la 124

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

población) o no probabilísticas (sujetos que son escogidos por la facilidad de acceso a ellos, no todos los sujetos de la población tiene posibilidades de ser escogidos y no pretende que los casos sean representativos de la población, aunque pudiesen serlo). En ambos casos resulta necesario determinar un número de sujetos que vamos a evaluar y esto depende de tres aspectos: x Del error muestral permitido: es el valor de equivocación que aceptamos para los estadísticos de la muestra al ser extrapolados con los parámetros de la población. Los niveles habituales van desde 0,05 (5% de error), hasta 0,01 (1% de error). A medida que disminuye el error permitido aumenta el tamaño de la muestra. x Del nivel de confianza: corresponde al grado de certeza que un evento ocurra. Recordemos que la probabilidad se mide entre 0 y 1, siendo 0 una absoluta desconfianza de que un evento ocurra y 1 una absoluta confianza que dicho evento ocurra. Los niveles de confianza más utilizados en ciencias sociales son 0,05 y 0,01. x Del carácter finito o infinito de la población: las poblaciones finitas son aquellas de tamaños reducidos y cuyo valor conocemos (generalmente bajo 100.000 unidades de análisis) y las poblaciones infinitas son aquellas de gran tamaño y cuyo valor desconocemos (generalmente sobre 100.000 unidades de análisis). Por ejemplo, una población finita son los estudiantes de enseñanza media de un colegio de la comuna de Santiago Centro y una población infinita son los estudiantes de enseñanza media de todos los colegios de Chile.

1.1 Poblaciones infinitas Para calcular el tamaño de la muestra de una población infinita (n) utilizamos la siguiente fórmula: 125

FERNANDO MAUREIRA CID

n = (Z2 * pq) e2

(fórmula 22)

Z2 = nivel de confianza expresada en valor Z (1,96 para 0,05 y 2,58 para 0,01) elevada al cuadrado pq = varianza de la población (como no conocemos ese dato utilizamos una constante de 0,25) e2 = error muestral permitido elevado al cuadrado (por ejemplo un error del 3% corresponde a un valor de 0,032 en la fórmula).

ƒ Ejemplo 1 Un investigador desea conocer si existe diferencia en los niveles de fuerza de tren superior de los estudiantes de cuarto año medio de colegios de la ciudad de Santiago. Para ello determina un nivel de confianza del 95% (0,05), por ende un valor Z = 1,96 y un error permitido del 5% (0,05). Reemplazamos en la fórmula 22: n = (1,96)2 * (0,25) (0,05)2 = 3,8416 * 0,25 0,0025 = 384 Por lo tanto, es necesario medir a 384 estudiantes de cuarto medio de colegios de la ciudad de Santiago.

ƒ Ejemplo 2 Ahora el investigador desea realizar el mismo estudio, pero con un nivel de confianza del 95% (0,05), por ende un valor Z= 1,96 y 126

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

un error permitido del 1% (0,01) la fórmula quedaría de la siguiente forma: n = (1,96)2 * (0,25) (0,01)2 = 3,8416 * 0,25 0,0001 = 9604 Por lo tanto, el investigador debería medir ahora a 9604 estudiantes de cuarto medio de colegios de la ciudad de Santiago. El tamaño de la muestra aumenta si aumentamos el nivel de confianza y si disminuimos nuestro error muestral permitido.

1.2 Poblaciones finitas Para calcular el tamaño de la muestra de una población finita (n) utilizamos la siguiente fórmula: n=

N 1+ (e2*(N – 1) Z2*pq

(fórmula 23)

N = tamaño de la población e2 = error muestral permitido elevado al cuadrado Z2 = nivel de confianza elevado al cuadrado pq = varianza de la población

ƒ Ejemplo 3 Un investigador desea conocer los hábitos de estudio de los estudiantes de primer año de la carrera de educación física de 127

FERNANDO MAUREIRA CID

una Universidad. La población es de 200 estudiantes, el nivel de confianza es de 95% (0,05), por ende un valor Z = 1,96 y un error permitido del 5% (0,05).

n=

200 = 2 1 + (0,05) * (200-1) (1,96)2 * (0,25)

1+

200 0,0025 * 199 3,8416 * 0,25

= 200 / 1 + [0,4975 / 0,9604] = 200 / 1,51 = 132 Por lo tanto, es necesario medir a 132 estudiantes de primer año de educación física de la Universidad. El aumento de tamaño de la población no produce un aumento proporcional del tamaño de la muestra. Por ejemplo, con un nivel de confianza del 95% y un error permitido de 0,05 en poblaciones de 100 sujetos la muestra es de 80, con poblaciones de 500 sujetos la muestra es de 217 y con poblaciones de 100.000 sujetos la muestra es de 383. Cuando las poblaciones son muy pequeñas (25 a 40 sujetos) la muestra es muy similar a la población. En poblaciones de 15 a 25 sujetos la muestra es n-1 y en poblaciones de menos de 15 sujetos la muestra es igual a la población (Morales, 2012).

1.3 Muestras para construir un instrumento de medición Cuando se construye un test o una escala de actitudes debe haber al menos 5 sujetos por ítems. Por ejemplo, si el instrumento cuenta con 35 ítems serán necesarios 175 sujetos escogidos de forma aleatoria entre la población de estudio. Cuando se desea llevar a cabo un análisis factorial del instrumento es necesaria una muestra grande, ya que este análisis 128

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

se basa en coeficientes de correlación y el error típico de las correlaciones disminuye si aumenta el número de sujetos (Morales, 2012). Algunos autores recomiendan muestras 10 veces mayores que el número de ítems, es decir, para un instrumento de 40 ítems serían necesarios 400 sujetos. Otros autores recomiendan muestras 3 veces mayor, pero que no bajen de 150 o 200 sujetos. Por ejemplo, para un instrumento de 80 ítems bastaría con 240 sujetos, pero si un instrumento posee 20 ítems 60 sujetos no sería suficiente, aquí el número mínimo debería estar entre 150 y 200 sujetos.

2. MUESTREO Una vez que tenemos claro el tamaño de la muestra debemos decidir la forma en la cual escogeremos a los sujetos para formar parte de la muestra, este proceso recibe el nombre de muestreo.

2.1 Muestras probabilísticas a) Muestreo aleatorio simple: corresponde a la elección al azar de una muestra donde todos los sujetos o unidades de análisis tienen las mismas probabilidades de ser escogidos. Por ejemplo, la selección de 210 estudiantes de primer año medio de colegios particulares de la comuna de Providencia. Lo métodos más utilizados para este tipo de muestreo son la tómbola (enumerar los sujetos del 1 a n y escogen al azar los números que formarán parte de la muestra), las tablas Randómicas e incluso muchos programas estadísticos como el SPSS poseen sistemas para calcular muestras aleatorias (ver detalles en Maureira & Flores, 2012). La muestra obtenida mediante este tipo de muestreo recibe el nombre de muestra irrestricta aleatoria. 129

FERNANDO MAUREIRA CID

b) Muestreo probabilístico estratificado: corresponde a una división de la muestra en segmentos de diferentes tamaños y de una selección al azar en cada segmento. Para esto utilizamos la siguiente fórmula: fh = n (fórmula 24) N fh = factor de cada grupo de la muestra n = tamaño de la muestra N = tamaño de la población

ƒ Ejemplo 4 Para conocer las diferencias en el desarrollo de patrones motores de niños de NB1 de colegios particulares, particularessubvencionados y municipales de la comuna de Recoleta debemos conocer: x El tamaño de la población (vamos a suponer que 5000 niños) x Calcular el tamaño de la muestra (384 niños) x Conocer la cantidad de niños en NB1 en los colegios particulares (950 niños), particulares subvencionado (2800 niños) y municipales (1250 niños). Como no existe la misma cantidad de estudiantes de NB1 en los colegios municipales, subvencionado y particulares en la comuna de Recoleta, debemos reemplazar en la fórmula 24: fh = 384 / 5000 = 0,077 Ahora multiplicamos el 0,077 por la cantidad de sujetos de cada grupo y obtenemos la muestra de cada grupo: Colegios particulares = 950 * 0,077 = 73 niños Colegios subvencionados = 2800 * 0,077 = 215 niños Colegios municipales = 1250 * 0,077 = 96 niños 130

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Así al sumar el total de los niños que deben ser evaluados de cada grupo se obtienen los 384 de la muestra total. c) Muestreo por conglomerados: se utiliza cuando las unidades de muestreo están muy dispersas y su acceso es dificultoso o cuando no existe un marco de muestreo (lista de todos los integrantes de una población). En este tipo de muestreo aleatorio las unidades están compuestos por grupos de elementos (conglomerado), los que pueden ser de igual o diferente tamaño. Cuando se observan todos los integrantes de cada uno de los n conglomerados elegidos recibe el nombre de muestreo por conglomerado monoetápico, ya que el proceso se realiza en una sola etapa. En cambio cuando se seleccionan al azar integrantes dentro de los n conglomerados elegidos recibe el nombre de muestreo por conglomerado bietápico o en dos etapas. Finalmente, si dentro de los n conglomerados se seleccionan al azar n grupos y dentro de cada grupo se eligen los sujetos a observar recibe el nombre de muestreo por conglomerado polietápico.

ƒ Ejemplo 5 Un investigador quiere conocer las cualidades físicas de los estudiantes de tercero medio de los colegios de Santiago de Chile. La población está compuesta por todos los estudiantes de 3° medio de la ciudad lo que hace muy dificultosa la elección de los sujetos a evaluar, por lo tanto decide escoger al azar cinco comunas y dentro de ellas evalúa a todos los estudiantes de 3° medio (muestreo monoetápico). Como segunda opción puede ahora escoger al azar los colegios dentro de cada una de las cinco comunas elegidas y solo en esos colegios medir a todos los estudiantes de 3° medio (muestreo bietápico). Finalmente, el investigador puede elegir al azar a los estudiantes de 3° medio que medirá en cada uno de los colegios escogidos de las 5 comunas seleccionadas para el estudio (muestreo polietápico). 131

FERNANDO MAUREIRA CID

2.2 Muestras no probabilísticas a) Muestreo por criterio o juicio: es donde el tamaño de la muestra y la elección de las unidades de análisis se realiza por el juicio del investigador, es decir, el investigador mediante su experiencia determina los elementos a estudiar. b) Muestreo por cuotas: corresponde a un muestreo similar al juicio de expertos, pero permite obtener muestras representativas en cuanto a la distribución de algunas variables de la población. Primero se identifican las variables a las cuales se le asignarán cuotas (por ejemplo: edad, cursos, sexo, etc.) y luego se busca información sobre la distribución de esas cuotas en la población para así asignar dichos porcentajes a las cuotas de la muestra (por ejemplo: de los seleccionados universitarios de hándbol de una ciudad el 60% corresponde a hombres y el 40% a mujeres, por lo tanto la muestra deberá estar conformada por un 60% de hombres y 40% de mujeres). Es importante recordar que los sujetos no son escogidos al azar y por lo tanto, la muestra no es probabilística. c) Muestreo bola de nieve: es aquel donde la muestra se obtiene porque los primeros sujetos medidos traen a los demás para su evaluación. Este sistema es muy útil cuando el investigador quiere conformar una muestra con sujetos con características muy particulares y de difícil acceso, entonces los primeros individuos invitan a otros sujetos con esas características a participar en el estudio. Por ejemplo, un investigador quiere conocer los niveles de potencia de cuádriceps en atletas seleccionados nacionales que hayan participado en al menos un campeonato internacional. Para ellos se pone en contacto con 3 atletas e incita a que estos inviten a deportistas conocidos suyos con las características requeridas a participar de la investigación.

132

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

d) Muestreo por conveniencia: es aquel donde los sujetos que formarán la muestran están disponibles para el investigador. Se utilizan principalmente para hacer estudios sobre las propias muestras, ya que resulta difícil extrapolar los resultados a la población (que no necesariamente se encuentra representada en la muestra). En otras palabras este muestreo corresponde a los sujetos que se tiene acceso.

133

FERNANDO MAUREIRA CID

134

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

CAPÍTULO 5 ESTADISTICA PARAMETRICA PARA UNA Y DOS POBLACIONES

I.

Normalidad de datos

II. Intervalos de confianza para una población III. Homogeneidad de varianzas IV. Prueba T de Student para muestras independientes V. Prueba T de Student para muestras relacionadas

135

FERNANDO MAUREIRA CID

136

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

I NORMALIDAD DE DATOS

Recordemos que la estadística inferencial univariada puede dividirse en estadística paramétrica y no paramétrica, dependiendo de las características de distribución y naturaleza de los datos. La elección de una y otra resulta fundamental para nuestro trabajo de investigación, ya que la aplicación de análisis inadecuados conllevará a errores en nuestras conclusiones. Los análisis paramétricos para una población siempre necesitan cumplir con dos supuestos para su aplicación y es obligación del investigador confirmar que estas dos características se cumplan: x LA VARIABLE DEPENDIENTE DEBE PRESENTAR UNA DISTRIBUCIÓN NORMAL. x LA VARIABLE DEPENDIENTE (INTERVALAR O DE RAZON).

DEBE

SER

NUMÉRICA

1. PRUEBA KS DE NORMALIDAD Antes de comenzar los análisis paramétricos debemos constatar que se cumplen los supuestos mencionados anteriormente. El primer supuesto es posible de confirmar con análisis estadísticos, en tanto, el segundo se logra simplemente confirmando el nivel de medida de los datos que tenemos.

137

FERNANDO MAUREIRA CID

Como en los análisis de una población no existe comparación entre grupos no debemos confirmar la homocedasticidad, pero si es necesario determinar si los datos poseen una distribución normal y para ello utilizamos el estadístico de Kolmogorov-Smirnov (prueba KS).

ƒ Ejemplo 1 Un investigador evaluó la agilidad de 35 estudiantes de tercer año medio de un colegio de Santiago. Ahora quiere saber si estos datos poseen una distribución normal. Consideraciones: x Variable: agilidad x 1 grupo: 35 estudiantes x H0 = No existen diferencias estadísticamente significativas entre la distribución teórica y la distribución observada. En la tabla a continuación se observan los puntajes del test, la frecuencia relativa (número de sujetos que obtuvieron dicho puntaje) y acumulada con la cantidad de niños que obtuvieron dicho puntaje. Puntaje 1 2 3 4 5 6 7 8 9 10 138

% relativo 1 2 2 4 8 8 5 3 1 1

% acumulado 1 3 5 9 17 25 30 33 34 35

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

¾ Paso 1: Cada frecuencia acumulada (fac) se divide por la frecuencia acumulada total (en este caso 35) para obtener la frecuencia observada (fo).

Puntaje 1 2 3 4 5 6 7 8 9 10

fac 1 3 5 9 17 25 30 33 34 35

frelativa 1 2 2 4 8 8 5 3 1 1

fo 1/35 = 0,029 3/35 = 0,086 5/35 = 0,143 9/35 = 0,257 17/35 = 0,486 25/35 = 0,714 30/35 = 0,857 33/35 = 0,943 34/35 = 0,971 35/35 = 1

¾ Paso 2: La frecuencia acumulada total (en este caso 35) se divide por la cantidad de categorías (en este caso 10) para obtener la frecuencia relativa teórica (frt). Puntaje 1 2 3 4 5 6 7 8 9 10

frelativa 1 2 2 4 8 8 5 3 1 1

fac 1 3 5 9 17 25 30 33 34 35

fo 0,029 0,086 0,143 0,257 0,486 0,714 0,857 0,943 0,971 1

frt 35/10 = 3,5 35/10 = 3,5 35/10 = 3,5 35/10 = 3,5 35/10 = 3,5 35/10 = 3,5 35/10 = 3,5 35/10 = 3,5 35/10 = 3,5 35/10 = 3,5 139

FERNANDO MAUREIRA CID

¾ Paso 3: La frecuencia acumulada teórica (fat) se obtiene con la suma de una categoría más las anteriores de la frecuencia relativa teórica. Puntaje frelativa 1 1 2 2 3 2 4 4 5 8 6 8 7 5 8 3 9 1 10 1

fac 1 3 5 9 17 25 30 33 34 35

fo 0,029 0,086 0,143 0,257 0,486 0,714 0,857 0,943 0,971 1

frt 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5

fat 3,5 3,5+3,5 = 7,0 7,0+3,5 = 10,5 10,5+3,5 = 14 14+3,5 = 17,5 17,5+3,5 = 21 21+3,5 = 24,5 24,5+3,5 = 28 28+3,5 = 31,5 31,5+3,5 = 35

¾ Paso 4: Ahora cada fat se divide por la frecuencia acumulada total (en este caso 35) para obtener la frecuencia teórica (ft). Puntaje frelativa 1 1 2 2 3 2 4 4 5 8 6 8 7 5 8 3 9 1 10 1

140

fac 1 3 5 9 17 25 30 33 34 35

fo 0,029 0,086 0,143 0,257 0,486 0,714 0,857 0,943 0,971 1

frt 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5

fat 3,5 7,0 10,5 14 17,5 21 24,5 28 31,5 35

ft 3,5/35 = 0,1 7,0/35 = 0,2 10,5/35 = 0,3 14/35 = 0,4 17,5/35 = 0,5 21/35 = 0,6 24,5/35 = 0,7 28/35 = 0,8 31,5/35 = 0,9 35/35 = 1

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

¾ Paso 5: Finalmente a cada frecuencia observada (fo) se le resta la frecuencia teórica (ft) y así obtenemos cada valor de diferencia (D). fac 1 3 5 9 17 25 30 33 34 35

fo 0,029 0,086 0,143 0,257 0,486 0,714 0,857 0,943 0,971 1

frt 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5

fat 3,5 7,0 10,5 14 17,5 21 24,5 28 31,5 35

ft 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

D=fo – ft 0,029-0,1 = -0,071 0,086-0,2 = -0,114 0,143-0,3 = -0,157 0,257-0,4 = -0,143 0,486-0,5 = -0,014 0,714-0,6 = 0,114 0,857-0,7 = 0,157 0,943-0,8 = 0,143 0,971-0,9 = 0,071 1-1= 0

¾ Paso 6 La diferencia máxima (Dmáx) corresponde al valor KS (en este caso es de -0,157). Ahora el investigador debe contrastar el valor KS obtenido (sin importar su signo positivo o negativo) con los valores críticos de D (Anexo 1) según el nivel de confianza escogido y seguir la siguiente regla de decisión: x Si el valor D obtenido es menor o igual al valor D de la tabla se debe aceptar la H0. x Si el valor D obtenido es mayor al valor D de la tabla se debe rechazar la H 0. En este ejemplo, el valor KS obtenido fue de 0,157 < 0,230 YDORUGHODWDEODFRQXQĮ \GDWRVGHPXHVWUD SRUORWDQWR debemos aceptar H 0 que plantea una distribución teórica igual a la observada, es decir, los datos poseen una distribución normal. 141

FERNANDO MAUREIRA CID

142

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

II INTERVALOS DE CONFIANZA PARA UNA POBLACION

Una vez corroborada la normalidad y la naturaleza numérica de los datos podemos realizar análisis de intervalos de confianza y contraste de hipótesis de la media poblacional.

1. ERROR ESTÁNDAR DE LA MEDIA Corresponde a la diferencia de la media de la muestra y la media de la población. Los análisis para determinar este error dependen si conocemos o desconocemos la desviación estándar de la población. En el primer caso el error estándar (e.e.) se obtiene con la siguiente fórmula: e.e. ı (fórmula 25) n ı GHVYLDFLón estándar de la población n = raíz cuadrada del número de datos Cuando se desconoce la desviación estándar de la población, el error estándar se obtiene con la siguiente fórmula: e.e. = S n

(fórmula 26)

S = desviación estándar de la muestra n = raíz cuadrada del número de datos 143

FERNANDO MAUREIRA CID

ƒ Ejemplo 2 Un investigador evaluó la fuerza de 252 adultos mayores de entre 65 y 75 años de diversos centros y fundaciones de Santiago, obteniendo una media de 35,8 y una desviación estándar de 7,36. Ahora se desea conocer cuál será error estándar de la media. La población presenta una variación de 8,5 puntos. ¾ Paso 1 Calcular la desviación estándar de la población con la fórmula 7: ı  

¾ Paso 2 Calcular el error estándar de la media con la fórmula 25: e.e. = 2,915 / 252 = 2,915 / 15,87 = 0,184 Con esto el investigador puede concluir que el error estándar de la media es de 0,184.

ƒ Ejemplo 3 Un investigador evaluó la agilidad de 52 estudiantes de tercer año básico de 2 colegios de Santiago, obteniendo una media de 6,50 y una desviación estándar de 2,14. Ahora se desea conocer cuál será la diferencia de la media de la muestra y de la población. Para ello reemplazamos en la fórmula 26: e.e. = 6,50 / 52 = 6,50 / 7,21 = 0,901 144

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Con esto el investigador puede concluir que el error estándar de la media es de 0,901. Los ejemplos anteriores muestran como calcular el error de la media, pero también es posible establecer un contraste de hipótesis sobre la diferencia de la media muestral con la poblacional, mediante una puntuación Z que se obtiene con la siguiente fórmula: Z = (Ш – ȝ  e.e

(fórmula 27)

Ш = media de la muestra μ = media de la población e.e.= error estándar de la media (fórmula 25 o 26)

ƒ Ejemplo 4 Un entrenador de fútbol evaluó los tiros al arco realizado por sus 3 jugadores delanteros durante los partidos de la liga nacional, obteniendo una media de 9,5 lanzamientos por partido. En el torneo existe una media de 12,1 lanzamientos por partido con una desviación estándar de 2,8. Ahora se desea conocer si existen diferencias entre los resultados obtenidos por el equipo en relación con la media nacional. Para ello se establecen las hipótesis: H 0 = Ш1 = Ш2 H 1 = Ш1 Ш2 Reemplazamos en la fórmula 27: Z = 9,5 – 12,1 2,8 / 3 = -2,6 / 1,62 = -1,605 145

FERNANDO MAUREIRA CID

De lo anterior el entrenador puede concluir que siendo -1,605 menor a -1,96 (una desviación Z) se debe aceptar la H 0 de igualdad y por lo tanto, no existen diferencias significativas entre el rendimiento de tiros al arco de los 3 delanteros del equipo y la media nacional.

2. INTERVALOS DE CONFIANZA PARA LA MEDIA DE

UNA POBLACIÓN CON S CONOCIDA Los intervalos de confianza (IC) de una población con desviación estándar conocida se obtiene con la siguiente fórmula: IC = Ш + (Z * e.e.)

(fórmula 28)

Ш = media de la muestra + = más para el IC superior y menos para el IC inferior Z = nivel de confianza expresado en desviaciones estándar e.e.= error estándar de la media (fórmula 25)

ƒ Ejemplo 5 Un investigador desea estimar los intervalos de confianza al extrapolar la media de su muestra aleatoria a los de la población y para ello evaluó la flexibilidad a 108 niños de cuarto básico de tres colegio de Santiago obteniendo una media de 15,7 cms y una desviación estándar muestral de 3,29. Según los registros la población de estudiantes de esos cursos posee una desviación estándar de 5,89. El investigador determinó un nivel de confianza de 0,05 (por ende un valor Z= 1,96). Datos: Ш = 15,7 S = 3,29 ı = 2,89 146

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

e.e. = 2,89 / 108 = 0,278 (fórmula 25) Determinar los intervalos de confianza utilizando la fórmula 28: IC i= 15,7 – (1,96 * 0,278) = 15,7 – 0,545 = 15,155 IC s = 15,7 + (1,96 * 0,278) = 15,7 + 0,545 = 16,245 Por lo tanto: 15,155 < μ < 16,245 Esto significa que el intervalo de confianza 15,155 a 16,245 contiene la media de la flexibilidad de la población con una confianza del 95%.

3. CONTRASTE DE HIPOTESIS PARA LA MEDIA DE UNA POBLACIÓN CON S CONOCIDA Siguiendo con el ejemplo 5, se sabe que la media de la población es de 16,4 entonces el investigador se pregunta ¿los estudiantes de la muestra tendrán una media de flexibilidad menor que la población? Datos: Ш = 15,7 S = 3,29 μ = 16,4 ı = 2,89 e.e. = 0,278 H 0 = Ш1 = Ш2 H 1 = Ш1 Ш2 Realizamos el contraste de hipótesis utilizando la fórmula 27:

147

FERNANDO MAUREIRA CID

Z = (15,7 – 16,4) / 0,278 = -0,7 / 0,278 = -2,518 De lo anterior el investigador puede concluir que siendo -2,518 mayor a -1,96 (una desviación Z) se debe rechazar la H0 de igualdad y por lo tanto, existen diferencias significativas entre la flexibilidad de los estudiantes evaluados y la flexibilidad media poblacional.

4. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN CON S DESCONOCIDA Los intervalos de confianza de una población con una desviación estándar desconocida se obtiene con la siguiente fórmula: (fórmula 29) IC = Ш + (t * e.e.) Ш = media de la muestra + = más para el IC superior y menos para el IC inferior t = valor t e.e.= error estándar de la media (fórmula 26). El valor t se obtiene de una tabla t student (Anexo 2) donde es necesario ubicar el valor de significancia a utilizar y los grados de libertad de la muestra (fórmula 20), el valor de intersección corresponde al valor t en la fórmula. Por ejemplo, para 7 gl y un nivel de confianza de 0,05 el valor t es 2,37.

148

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

ƒ Ejemplo 6 Un profesor evaluó la ejecución de la voltereta adelante en 18 niños de quinto año básico de un colegio de Santiago. La media de la evaluación fue de 3,17 y una desviación estándar de 1,21. Ahora se desea establecer los intervalos de confianza de la media de la población (a un nivel de 0,05). Datos: Ш = 3,17 S = 1,21 gl = 18-1 = 17 (fórmula 20) e.e. = 1,21 / 18 = 0,285 (fórmula 26) t = 2,11

Determinar los intervalos de confianza utilizando la fórmula 29: ICi = 3,17 – (2,11 * 0,285) = 3,17 – 0,601 = 2,569 ICs = 3,17 + (2,11 * 0,285) = 3,17 + 0,601 = 3,771 Por lo tanto: 2,569 < μ < 3,771

149

FERNANDO MAUREIRA CID

Esto significa que el intervalo de confianza 2,569 a 3,771 contiene la media de la ejecución de la voltereta de la población con una confianza del 95%.

5. CONTRASTE DE HIPOTESIS PARA LA MEDIA DE UNA POBLACIÓN CON S DESCONOCIDA Siguiendo con el ejemplo 6, se sabe que la media de la población es de 2,31 entonces el investigador se pregunta ¿los estudiantes de la muestra tendrán una media en la ejecución de la voltereta mayor que la población? Datos: Ш = 3,17 S = 2,21 ȝ 2,31 e.e. = 0,285 t = 2,11 H 0 = Ш1 = Ш2 H 1 = Ш1 Ш2

Realizar el contraste de hipótesis utilizando la fórmula 27: Z = (3,17 – 2,31) / 0,285 = 0,86 / 0,285 = 3,018 De lo anterior el investigador puede concluir que siendo 3,018 mayor a 1,96 (una desviación Z) se debe rechazar la H0 de igualdad y por lo tanto, existen diferencias significativas entre la puntuación de la ejecución de la voltereta en la muestra y la población. 150

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

6. INTERVALOS DE CONFIANZA PARA UNA

PROPORCIÓN De igual forma que en los intervalos de confianza para media, es posible establecer intervalos de confianza para proporciones. Estos se obtienen con la siguiente fórmula: IC = p + Z * p*(1 – p) n

(fórmula 30)

p= valor de la proporción expresada en valores enteros (0,18; 0,75, etc.) + = más para el IC superior y menos para el IC inferior Z = nivel de confianza expresado en desviaciones estándar n = número de datos.

ƒ Ejemplo 7 Un investigador desea conocer los intervalos de confianza de la proporción de niños con obesidad a partir de su muestra aleatoria de 357 estudiantes de primer año de enseñanza básica de diversos colegios de la ciudad de Santiago. El porcentaje de obesos de la muestra fue del 20,5% (0,205) y el nivel de confianza determinado fue de 0,05 (Z = 1,96). Datos: p = 20,5% = 0,205 n = 357 Determinar los intervalos de confianza utilizando la fórmula 30: IC i = 0,205 - 1,96 * 0,205 * (1 – 0,205) 357 = 0,205 – (1,96 * 0,021) = 0,205 – 0,041 = 0,164 151

FERNANDO MAUREIRA CID

ICs = 0,205 + 1,96 * 0,205 * (1 – 0,205) 357 = 0,205 + (1,96 * 0,021) = 0,205 + 0,041 = 0,246 Por lo tanto: 0,164 < μ < 0,246 Esto significa que el intervalo de confianza 0,164 (16,4%) a 0,246 (24,6%) contiene el porcentaje de obesidad de la población con una confianza del 95%.

7. CONTRASTE DE HIPOTESIS PARA UNA PROPORCION El contraste de hipótesis con proporciones se realiza con la siguiente fórmula: Z= p–P P (1 – P) n (fórmula 31) p = proporción de la muestra expresada en valores enteros P = proporción de la población n = número de datos Siguiendo con el ejemplo 7, se sabe que el porcentaje de obesidad de la población es de 24,0% entonces el investigador se pregunta ¿los estudiantes de la muestra tendrán un porcentaje menor de obesidad que la población? Datos: p = 20,5% = 0,205 P = 24,8% = 0,248 n = 357 152

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

H0 = p = P H 1 = p 3 Realizar el contraste de hipótesis utilizando la fórmula 31: Z = 0,205 – 0,248 0,248 * (1 – 0,248) 357 = -0,043 / (0,248 * 0,752) / 357

= -0,043 / 0,186 / 357 = -0,043 / 0,000521 = -0,043 / 0,0228 = -1,89 De lo anterior el investigador puede concluir que siendo -1,89 menor a -1,96 (una desviación Z) se debe aceptar la H0 de igualdad y por lo tanto, no existen diferencias significativas entre la proporción de obsesos de la muestra y de la población.

153

FERNANDO MAUREIRA CID

154

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

III HOMOGENEIDAD DE VARIANZAS

Los análisis paramétricos para dos poblaciones necesitan cumplir con tres supuestos: x LA VARIABLE DEPENDIENTE DEBE PRESENTAR UNA DISTRIBUCIÓN NORMAL. x LA VARIABLE DEPENDIENTE DEBE SER NUMÉRICA. x DEBE CUMPLIRSE LA HOMOCEDASTICIDAD HOMOGENEIDAD DE VARIANZA ENTRE LOS GRUPOS.

U

La homocedasticidad u homogeneidad de varianza se refiere a la existencia de varianza semejantes entre grupos con respecto a la variable dependiente. Existen diversos análisis para constatar la esto como la prueba de F-Max de Hartley, la prueba de Cochran, la prueba de Bartlett, la prueba Box y la prueba de Levene.

1. IGUALDAD DE VARIANZA DE DOS GRUPOS Para determinar si dos varianzas son iguales es necesario obtener un valor F con la siguiente fórmula: F = S21 S22 S21 = varianza mayor de los dos grupos S22 = varianza menor de los dos grupos

(fórmula 32)

155

FERNANDO MAUREIRA CID

ƒ Ejemplo 1 Un investigador evalúo las estrategias de aprendizaje de los alumnos de 2 cursos, obteniendo una media de 3,16 (d.e.=0,97) con los puntajes de los 32 estudiantes del curso A y una media de 3,74 (d.e.=1,11) con los puntajes de los 35 estudiantes del curso B. Ahora se desea saber si existe diferencia entre las varianzas de los grupos. Consideraciones: x Variable: estrategias de aprendizaje x 2 grupos: curso A y curso B x H0 = No existen diferencias estadísticamente significativas entre las varianzas del curso A y B.

¾ Paso 1 x Desviación estándar Grupo1= 0,97 Varianza Grupo1= 0,941 x Desviación estándar Grupo 2= 1,11 Varianza Grupo 2= 1,232

¾ Paso 2 Obtener valor F con la fórmula 32 F = 1,232 / 0,941 = 1,309

¾ Paso 3 Ahora el investigador debe contrastar el valor F obtenido con los valores críticos de F (Anexo 3) según el nivel de confianza escogido y los grados de libertad (n – 1) de cada grupo y seguir la siguiente regla de decisión: 156

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

x Si el valor F obtenido es menor o igual al valor F de la tabla se debe aceptar la H0. x Si el valor F obtenido es mayor al valor F de la tabla se debe rechazar la H 0. En este ejemplo, el valor F obtenido fue de 1,309 < 1,80 (valor GHODWDEODFRQXQĮ \JO1= 31 y gl2= 34) por lo tanto, debemos aceptar H0 que plantea la igualdad de varianza entre los dos grupos.

2. IGUALDAD DE VARIANZA DE TRES O MÁS GRUPOS DE IGUAL TAMAÑO Para determinar si tres o más varianzas de grupos del mismo tamaño son iguales se utiliza la prueba de Cochran o la de Hartley. Si los grupos son de diferente tamaño se utiliza la prueba de Bartlett.

2.1

Prueba de Cochran La prueba de Cochran (R) se obtiene con la siguiente fórmula: R = S2máx ™62

(fórmula 33)

S2máx = varianza mayor de entre los grupos ™62 = suma de las varianzas de todos los grupos

ƒ Ejemplo 2 Un profesor evalúo la capacidad de aciertos en lanzamientos a la canasta en básquetbol en estudiantes de enseñanza media de un colegio. Cada curso estuvo constituido por 40 alumnos. El 157

FERNANDO MAUREIRA CID

primer año obtuvo una media de 15,7 (d.e.=2,45), segundo año 14,8 (d.e.=1,95), tercer año 17,2 (d.e.=3,80) y cuarto año 16,4 (d.e.=2,96). Ahora se desea saber si las varianzas de los cuatro grupos son iguales. Consideraciones: x Variable: aciertos en lanzamientos en básquetbol x 4 grupos: 1°, 2°, 3° y 4° año x H0 = No existen diferencias estadísticamente significativas entre las varianzas de los cuatro cursos.

¾ Paso 1 x Desviación estándar Grupo 1= 2,45 Varianza Grupo 1= 6,00 x Desviación estándar Grupo 2= 1,95 Varianza Grupo 2= 3,80 x Desviación estándar Grupo 3= 3,80 Varianza Grupo 3= 14,44 x Desviación estándar Grupo 4= 2,96 Varianza Grupo 4= 8,76

¾ Paso 2 Obtener valor R de Cochran con la fórmula 33: R = 14,44 / (6,00 + 3,80 + 14,44 + 8,76) = 14,44 / 33 = 0,438

¾ Paso 3 Ahora el profesor debe contrastar el valor R obtenido con los valores críticos de R (Anexo 4) según el nivel de confianza escogido y los valores correspondientes al número de muestra y número de grupos y seguir la siguiente regla de decisión: 158

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

x Si el valor R obtenido es menor al valor R de la tabla se debe aceptar la H0. x Si el valor R obtenido es igual o mayor al valor R de la tabla se debe rechazar la H0. En este ejemplo, el valor R obtenido fue de 0,437 > 0,3720 YDORU GHODWDEODFRQXQĮ  \ 1ƒ  \1ƒ    SRUORWDQWR debemos rechazar H0 que plantea la igualdad de varianza entre los cuatro grupos.

2.2

Prueba de Hartley

La prueba de Hartley (Fmáx) se obtiene con la siguiente fórmula: (fórmula 34) Fmáx = S2máx S2min S2máx = varianza mayor de entre los grupos S2min = varianza menor de entre los grupos Si utilizamos la prueba de Hartley con el ejemplo 2: ¾ Paso 1 Obtener valor Fmáx de Hartley con la fórmula 34: Fmáx = 14,44 / 3,80 = 3,8

¾ Paso 2 Ahora el profesor debe contrastar el valor F obtenido con los valores críticos de F (Anexo 3) según el nivel de confianza escogido y los valores correspondientes al número de muestra y número de grupos y seguir la siguiente regla de decisión: 159

FERNANDO MAUREIRA CID

x Si el valor F obtenido es menor o igual al valor F de la tabla se debe aceptar la H0. x Si el valor F obtenido es mayor al valor F de la tabla se debe rechazar la H 0. En este ejemplo, el valor F obtenido fue de 3,8 > 2,61 (valor GH OD WDEOD FRQ XQ Į  \ 1ƒ   \ 1ƒ    SRU OR WDQWR debemos rechazar H0 que plantea la igualdad de varianza entre los cuatro grupos.

3. IGUALDAD DE VARIANZA DE TRES O MÁS GRUPOS DE DIFERENTES TAMAÑOS Para determinar si tres o más varianzas de grupos de diferentes tamaños son iguales se utiliza la prueba de Bartlett. La prueba de Bartlett (B) se obtiene con la siguiente fórmula: B= 2,3026 * [ (N – k) log S2p - ™ Q1 – 1) log S2i ] C

(fórmula 35)

2,3026 = una constante N = número total de las muestras log= logaritmo común de base 10 ni = número de sujetos de cada muestra k = número de grupos C se obtiene con la siguiente fórmula: C= 1 +

1 3*(k – 1)

™– 1 ni – 1 N – k

(fórmula 36)

S2p se obtiene con la siguiente fórmula: S2p = ™(n i – 1)*S2i N–k 160

(fórmula 37)

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

ƒ Ejemplo 3 Un investigador evalúo la capacidad de atención en seleccionados universitarios de cuatro deportes. El primer grupo estuvo constituido por 15 seleccionados de voleibol con una media de 7,97 ptos. en la atención (d.e.=1,05), el segundo grupo de 18 seleccionados de fútbol con 8,03 (d.e.=1,96), el tercer grupo de 16 seleccionados de básquetbol con 9,12 (d.e.=0,98) y el cuarto grupo de 14 seleccionados de hándbol con 8,54 (d.e.=1,45). Ahora se desea saber si las varianzas de los cuatro grupos son iguales. Consideraciones: x Variable: atención x 4 grupos: seleccionados de voleibol, fútbol, básquetbol y hándbol. x H0 = No existen diferencias estadísticamente significativas entre las varianzas de los cuatro grupos.

¾ Paso 1 x Desviación estándar Grupo 1= 1,05 Varianza Grupo 1= 1,10 n1= 15 x Desviación estándar Grupo 2= 1,96 Varianza Grupo 2= 3,84 n2= 18 x Desviación estándar Grupo 3= 0,98 Varianza Grupo 3= 0,96 n3= 16 x Desviación estándar Grupo 4= 1,45 Varianza Grupo 4= 2,10 n4= 14 161

FERNANDO MAUREIRA CID

¾ Paso 2 Calcular S2p con la fórmula 37: S2p= [ (15-1)*1,10 + (18-1)*3,84 + (16-1)*0,96 + (14-1)*2,10 ] (15+18+16+14) – 4 S2p= [ 15,4 + 65,28 + 14,4 + 27,3 ] 63 – 4 S2p= 122,38 59 S2p= 2,074

¾ Paso 3 Calcular el valor C con la fórmula 36: C= 1 + 1 / (3*3) * [[1/15-1 + 1/18-1 + 1/16-1 + 1/14-1] – 1 / 63-4] C= 1 + 1 / 9 * [[1/14 + 1/17 + 1/15 + 1/13] – 1 / 59] C= 1 + 0,111 * [[0,071 + 0,059 + 0,067 + 0,077] – 0,017] C= 1 + 0,111 * [0,274 – 0,017] C= 1,111 * 0,257 C= 0,286

¾ Paso 4 Calcular (N – k) log S2p log S2p = log 2,074 = 0,317 = (63 – 4) * 0,317 = 59 * 0,317 = 18,703

¾ Paso 5 Calcular ™ Q1 – 1) log S2i 162

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

(n1 – 1) log S21 = (15 – 1)*log 1,10 = 14 * 0,041 = 0,574 (n2 – 1) log S22 = (18 – 1)*log 3,84 = 17 * 0,584 = 9,928 (n3 – 1) log S23 = (16 – 1)*log 0,96 = 15 * -0,018 = -0,270 (n4 – 1) log S24 = (14 – 1)*log 2,10 = 13 * 0,322 = 4,186 ™ Q1 – 1) log S2i = 0,574+9,928+(-0,270)+4,186 = 14,418

¾ Paso 6 Calcular el valor B con la fórmula 35: B= 2,3026 * [18,703 – 14,418] 0,286 B= 8,051 * 4,285 B= 34,50

¾ Paso 7 Ahora el investigador debe contrastar el valor X2 obtenido con los valores críticos de X2 (Anexo 5) según el nivel de confianza escogido y los gl (n – 1) y seguir la siguiente regla de decisión: x Si el valor X2 obtenido es menor al valor X2 de la tabla se debe aceptar la H0. x Si el valor X2 obtenido es igual o mayor al valor X2 de la tabla se debe rechazar la H0.

En este ejemplo, el valor X2 obtenido fue de 34,50 > 7,815 YDORU GH OD WDEOD FRQ XQ Į  \ JO    SRU OR WDQWR GHEHPRV rechazar H0 que plantea la igualdad de varianza entre los cuatro grupos.

163

FERNANDO MAUREIRA CID

164

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

IV PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES

La prueba t para muestras independientes se utiliza para comparar la media de dos muestras que no están relacionadas entre sí (por ejemplo: sexo, curso, colegio, comuna, país, etc.) y determinar si la diferencia entre ambos son estadísticamente significativas (no se debe al azar). NIVEL DE MEDICIÓN: INTERVALAR O DE RAZON SUPUESTOS: x LA VARIABLE DEPENDIENTE DEBE PRESENTAR UNA DISTRIBUCIÓN NORMAL. x LA VARIABLE DEPENDIENTE DEBE SER NUMÉRICA. x DEBE CUMPLIRSE LA HOMOCEDASTICIDAD HOMOGENEIDAD DE VARIANZA ENTRE LOS GRUPOS.

U

ƒ Ejemplo 1 Un investigador midió la fuerza prensil en 9 varones de 15 años y 7 varones de 17 años de un colegio de Santiago. Las puntuaciones se observan en la tabla siguiente: 165

FERNANDO MAUREIRA CID

Grupo 1 1 2 3 4 5 6 7 8 9 Ш= S=

Puntaje 12 15 13 15 14 15 16 12 14 14,0 1,41

Grupo 2 1 2 3 4 5 6 7

Ш= S=

Puntaje 15 18 19 18 17 20 15

17,4 1,90

Ahora se desea establecer los intervalos de confianza de la media y saber si existen diferencias entre la media de ambos grupos. Datos: Ш1 = 14,0 S1 = 1,41 n1 = 9

Ш2 = 17,4 S2 = 1,90 n2 = 7

H 0 = Ш1 = Ш2 H 1 = Ш1 Ш2

1. ERROR ESTÁNDAR DE LA DIFERENCIA DE MEDIAS INDEPENDIENTES El error estándar de diferencia de medias corresponde al error posible entre la diferencia de dos o más grupos que forman la muestra y de dos o más grupos que conforman la población. ¾ Paso 1 La diferencia de medias independientes (D) se obtiene con la siguiente fórmula: 166

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

D = Ш1 – Ш2

(fórmula 38)

Ш1 = media del grupo 1 Ш2 = media del grupo 2 Para el ejemplo 1 reemplazamos en la fórmula 38: D = 14,0 – 17,4 = -3,4

¾ Paso 2 Calcular el error estándar (e.e.) de la diferencia de medias independientes. Cuando se conoce la desviación estándar de la población el error se obtiene con la siguiente fórmula:

e.e. ı12 ı22 n1 n 2

(fórmula 39)

ı12 = desviación estándar al cuadrado de la población 1 ı22 = desviación estándar al cuadrado de la población 2 n1 = número de sujetos del grupo 1 n2 = número de sujetos del grupo 2

Si la desviación estándar de la población es desconocida, el error estándar se obtiene con la siguiente fórmula: e.e. = S12 + S22 n1 n 2

(fórmula 40)

S12 = desviación estándar al cuadrado del grupo 1 S22 = desviación estándar al cuadrado del grupo 2 n1 = número de sujetos del grupo 1 n2 = número de sujetos del grupo 2 167

FERNANDO MAUREIRA CID

Para el ejemplo 1 reemplazamos en la fórmula 40: e.e. = (1,41)2 + (1,90)2 9 7 =

(1,988/9) + (3,61/7)

= 0,221 + 0,516 = 0,737 = 0,858 Se obtiene un error estándar de diferencia de medias de 0,858.

2. INTERVALOS DE CONFIANZA PARA DIFERENCIA DE MEDIAS INDEPENDIENTES Los intervalos de confianza de diferencia de medias independientes se obtienen con la siguiente fórmula: IC = D + (Z * e.e.)

(fórmula 41)

D = diferencia de medias independientes (fórmula 38) Z = puntuación Z (por ejemplo 1,96) e.e.= error estándar de diferencia de medias independientes (fórmula 39 o 40). Siguiendo con el ejemplo 1, tenemos una diferencia de medias independientes de -3,4 y un error estándar de diferencia de medias independientes de 0,858. Ahora reemplazamos en la fórmula 41: ICs = -3,4 + (1,96*0,858) = -3,4 + 1,682 = -1,718 ICi = -3,4 – (1,96*0,858) = -3,4 – 1,682 = -5,082 168

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Por lo tanto: -5,082 ”ȝD •-1,718 Esto significa que la media poblacional de la diferencia de medias de la fuerza prensil de la población de estudiantes de 15 y 17 años de un colegio de Santiago se encuentre entre -5,082 y -1,718 con una confianza del 95%.

3. VALOR T PARA MUESTRAS INDEPENDIENTES Para saber si la diferencia de medias es significativa debemos calcular el valor t de muestras independientes que se obtiene con la siguiente fórmula: t = Ш1 – Ш2 e.e.

(fórmula 42)

Ш1 = media del grupo 1 Ш2 = media del grupo 2 e.e.= error estándar de diferencia de medias independientes (fórmula 39 o 40).

Para el ejemplo 1 reemplazamos en la fórmula 42: t = 14,0 – 17,4 / 0,858 = -3,4 / 0,858 = -3,963 El valor t de muestras independientes fue de 3,963 (no importa el signo del valor obtenido). Luego calculamos los grados de libertad ((n1 – 1) + (n2 – 1)) y obtenemos 14. Con ambos datos vamos a la tabla de valores críticos de t (Anexo 2) y vemos que con 14 gl y un nivel de confianza de 0,05 el valor t es de 2,15. Ahora utilizamos la siguiente regla de decisión: 169

FERNANDO MAUREIRA CID

x Si el valor t calculado es menor al valor t de la tabla se debe aceptar la H 0. x Si el valor t calculado es igual o mayor al valor t de la tabla se debe rechazar la H0. 3,963 > 2,15 por lo tanto se debe rechazar H0 y podemos decir que existen diferencias entre las medias de los grupos. Por lo anterior, es que el investigador puede concluir que los estudiantes de 17 años del colegio poseen mayor fuerza prensil que los de 15 años.

4. TAMAÑO DEL EFECTO DE LA PRUEBA T PARA MUESTRAS INDEPENDIENTES La información que entrega el tamaño del efecto sirve para conocer la magnitud de la diferencia de dos medias, es decir, nos índica si la diferencia es pequeña, mediana o grande. El tamaño del efecto (ES) corresponde a una comparación en desviaciones típicas (Z) y en dos muestras independientes se calcula con la siguiente fórmula: ES = Ш1 – Ш2 ı

(fórmula 43)

Ш1 = media grupo 1 Ш2 = media grupo 2 ı GHVYLDFLón típica combinada La desviación típica combinada se obtiene con la siguiente fórmula: ı = (N 1 * S1) + (N 2 * S2) (fórmula 44) N 1 + N2 N1 y N 2 = número de sujetos grupo 1 y 2 respectivamente S1 y S2 = desviación estándar grupo 1 y 2 respectivamente 170

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Para el ejemplo 1 reemplazamos en la fórmula 44: ı (9*1,41) + (7*1,90) 9+7 = (12,69 + 13,3) / 16 = 25,99 /16 = 1,624 = 1,27 El valor de la desviación típica combinada es de 1,27. Ahora reemplazamos en la fórmula 43: ES = (14,0 – 17,4) / 1,27 = -3,4 / 1,27 = -2,68 El tamaño del efecto de la diferencia de las dos medias independientes fue de 2,68 (no importa el signo negativo). Para Cohen (1988) estos efectos se pueden clasificar en: 0,20 = efecto pequeño 0,50 = efecto moderado 0,80 = efecto grande Por lo tanto, podemos asumir que la diferencia de medias de la fuerza prensil entre el grupo de varones de 15 años y el grupo de varones de 17 años posee una diferencia significativa y dicha diferencia es grande (ES=2,68).

171

FERNANDO MAUREIRA CID

172

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

V PRUEBA T DE STUDENT PARA MUESTRAS RELACIONADAS

Esta prueba se utiliza para comparar la media de dos muestras que están relacionadas entre sí (por ejemplo: dos mediciones a los mismos sujetos en diferentes momentos, como antes y después de un entrenamiento) y determinar si la diferencia entre ambos son estadísticamente significativas (no se debe al azar). NIVEL DE MEDICIÓN: INTERVALAR O DE RAZON SUPUESTOS: x LA VARIABLE DEPENDIENTE DEBE PRESENTAR UNA DISTRIBUCIÓN NORMAL. x LA VARIABLE DEPENDIENTE DEBE SER NUMÉRICA.

ƒ Ejemplo 1 Un investigador evaluó la motivación por la clase de educación física de 10 estudiantes de sexto básico de un colegio de Santiago en marzo y luego en julio. Las puntuaciones se observan en la tabla siguiente: 173

FERNANDO MAUREIRA CID

Sujetos 1 2 3 4 5 6 7 8 9 10 Ш= S=

Medición 1 4 5 6 4 3 4 5 2 6 7 4,6 1,51

Medición 2 6 7 8 6 7 6 7 8 5 7 6,7 0,95

Ahora se desea establecer los intervalos de confianza de la diferencia de medias y saber si existen diferencias entre las medias de ambas evaluaciones. Datos: Ш1 = 4,6 S1 = 1,51 n1 = 10

Ш2 = 6,7 S2 = 0,95 n2 = 10

H 0 = Ш1 = Ш2 H 1 = Ш1 Ш2

1. ERROR ESTÁNDAR DE LA DIFERENCIA DE MEDIAS RELACIONADAS ¾ Paso 1 Calcular la diferencia de medias de cada valor (Ш1 – Ш2) y elevarlas al cuadrado (Ш1 – Ш2)2.

174

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

™= Ш= S=

x1 4 5 6 4 3 4 5 2 6 7

x2 6 7 8 6 7 6 7 8 5 7

46 4,6 1,51

67 6,7 0,95

x1 – x2 -2 -2 -2 -2 -4 -2 -2 -6 1 0 -21 -2,1 1,64

(x1 – x2)2 4 4 4 4 16 4 4 36 1 0 77 7,7 10,83

La diferencia de medias fue de -2,1.

¾ Paso 2 Calcular la suma de cuadrados de la diferencia (™G2) que se obtiene con la siguiente fórmula: ™G2 = ™'2 – (™')2 n

(fórmula 45)

™' 2 = suma de los valores de las diferencias al cuadrado (™')2 = suma de los valores de la diferencia elevada al cuadrado n = número de sujetos Para el ejemplo 1 reemplazamos en la fórmula 45: ™G2 = 77 – (-212 / 10) = 77 – (441 / 10) = 77 – 44,1 = 32,9 175

FERNANDO MAUREIRA CID

¾ Paso 3 Calcular la desviación estándar de diferencia de medias relacionadas (SD) que se obtiene con la siguiente fórmula: SD = ™G2 n

(fórmula 46)

™G2 = suma de cuadrados de la diferencia n = número de sujetos. Para el ejemplo 1 reemplazamos en la fórmula 46: SD = 32,9 / 10 = 3,29 = 1,813

¾ Paso 4 Calcular el error estándar de diferencia de medias relacionadas (e.e.D) que se obtiene con la siguiente fórmula: e.eD =

SD n–1

(fórmula 47)

SD = desviación estándar de diferencia de medias n = número de sujetos Para el ejemplo 1 reemplazamos en la fórmula 47: e.e.D = 1,813 / 10 – 1 = 1,813 / 9 = 1,813 / 3 = 0,604 El error estándar de diferencia de medias del ejemplo 1 es de 0,604. 176

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

2. INTERVALOS DE CONFIANZA PARA

DIFERENCIA DE MEDIAS RELACIONADAS Los intervalos de confianza de diferencia de medias relacionadas se obtienen con la siguiente fórmula: IC = D + (t * e.e.D)

(fórmula 48)

D = diferencia de medias relacionadas t = valor t de la tabla de valores críticos (se calcula con el nivel de significancia y los grados de libertad: n – 1) e.e.D = error estándar de la diferencia de medias relacionadas Para el ejemplo 1 tenemos 9 JO\XQĮ 5 por lo cual el valor t es 2,26. Ahora reemplazamos en la fórmula 48: ICs = -2,1 + (2,26*0,604) = -2,1 + 1,365 = -0,735 ICi = -2,1 – (2,26*0,604) = -2,1 – 1,365 = -3,465 Por lo tanto: -3,465 ”ȝD • -0,735 Esto significa que la media poblacional de la diferencia de medias de la motivación por la clase de educación física de estudiantes de sexto básico se encuentre entre -3,465 y -0,735 con una confianza del 95%.

3. VALOR T PARA MUESTRAS RELACIONADAS Para saber si la diferencia de medias es significativa debemos calcular el valor t de muestras relacionadas que se obtiene con la siguiente fórmula: t= D e.e.D (fórmula 49) D = diferencia de medias relacionadas e.e.D = error estándar de diferencia de medias relacionadas 177

FERNANDO MAUREIRA CID

Para el ejemplo 1 reemplazamos en la fórmula 49: t = -2,1 / 0,604 = -3,477 El valor t de muestras relacionadas fue de -3,477. Con un Į \HOYDORUWHVGH $QH[R). Ahora seguimos la regla de decisión: x Si el valor t calculado es menor al valor t de la tabla se debe aceptar la H 0. x Si el valor t calculado es igual o mayor al valor t de la tabla se debe rechazar la H0. 3,477 > 2,26 por lo tanto se debe rechazar H0 y podemos decir que existen diferencias entre las medias de los grupos. Por lo anterior, es que el investigador puede concluir que los estudiantes de sexto básico aumentaron su motivación por la clase de educación física entre marzo y julio.

4. TAMAÑO DEL EFECTO DE LA PRUEBA T PARA MUESTRAS RELACIONADAS El tamaño del efecto (ES) en dos muestras relacionadas se calcula con la siguiente fórmula: ES = Шpost – Шpre ıpost

(fórmula 50)

Шpost = media post intervención Шpre = media pre intervención ıpost = desviación típica post intervención Para el ejemplo 1 reemplazamos en la fórmula 50: 178

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

ES = (6,7 – 4,6) / 0,95 = 2,1 / 0,95 = 2,21 El tamaño del efecto de la diferencia de las dos medias relacionadas fue de 2,21. Por lo tanto, podemos asumir que la diferencia de medias de la motivación por la clase de educación física presenta diferencias entre marzo y julio y dicha diferencia es grande ya que las puntuaciones han variado en más de 1 desviación estándar (ES=2,21).

179

FERNANDO MAUREIRA CID

180

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

CAPÍTULO 6 ESTADISTICA PARAMETRICA PARA TRES O MAS POBLACIONES

I.

Análisis de varianza de un factor

II. Análisis de varianza de un factor de medidas repetidas

181

FERNANDO MAUREIRA CID

182

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

I ANALISIS DE VARIANZA DE UN FACTOR

Cuando necesitamos comparar la media de tres o más grupos no resulta eficiente agruparlos en dúos y realizar comparaciones de diferencia de medias ya que al aumentar los análisis también aumenta la posibilidad de cometer el error tipo I. Por lo tanto, en estas situaciones es necesario realizar un análisis de varianza (ANOVA). El análisis de varianza de un factor estima la relación de una o más variables independientes categóricas sobre una variable dependiente numérica.

NIVEL DE MEDICIÓN: INTERVALAR O DE RAZON SUPUESTOS: x LA VARIABLE DEPENDIENTE DEBE PRESENTAR UNA DISTRIBUCIÓN NORMAL. x LA VARIABLE DEPENDIENTE DEBE SER NUMÉRICA. x DEBE CUMPLIRSE LA HOMOCEDASTICIDAD HOMOGENEIDAD DE VARIANZA ENTRE LOS GRUPOS.

U

x INDEPENDENCIA DE LAS MEDICIONES DE LOS GRUPOS.

183

FERNANDO MAUREIRA CID

ƒ Ejemplo 1 Un investigador evalúa los hábitos de estudio de los alumnos de 3 carreras universitarias: grupo 1 educación física, grupo 2 kinesiología y grupo 3 nutrición de una universidad de Santiago. Los puntajes obtenidos se observan en la tabla siguiente:

Grupo 1 Puntaje 1 4 2 3 3 5 4 4 5 6 6 5 7 7 8 5 9 4 4,78 Ш= S= 1,20

Grupo 2 Puntaje 1 5 2 6 3 8 4 7 5 6 6 7 7 5 8 6 9 7 6,33 Ш= S= 1,00

Grupo 3 1 2 3 4 5 6 7 8

Puntaje 6 8 9 7 8 8 7 7

Ш= S=

7,50 0,93

Ahora se desea saber si existe diferencia entre la media de los tres grupos. Datos: Ш1 = 4,78 S1 = 1,20 n1 = 9

Ш2 = 6,33 S2 = 1,00 n2 = 9

Ш3 = 7,50 S3 = 0,93 n3 = 8

H 0 = Ш1 = Ш2 = Ш3 H 1 = Ш1 Ш2 Ш3 ¾ Paso 1 Los valores obtenidos en cada observación de los grupos deben ser elevados al cuadrado y calcular la suma de valores cuadrados de cada grupo. 184

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

™ Ш S n

x1 4 3 5 4 6 5 7 5 4 43 4,78 1,20 9

x2 5 6 8 7 6 7 5 6 7 57 6,33 1,00 9

x3 6 8 9 7 8 8 7 7 60 7,50 0,93 8

(x1)2 16 9 25 16 36 25

(x2)2 25 36 64 49 36 49

(x3)2 36 64 81 49 64 64

49 25 16 217 24,1 12,19

25 36 49 369 41,0 12,79

49 49 456 57,0 13,92

Ahora sumamos el valor de la suma de los valores al cuadrado de cada grupo: ™[2 = 217 + 369 + 456 = 1042 Y la suma de todos los valores de cada grupo: (™[)2 = 43 + 57 + 60 = 160

¾ Paso 2 Calcular la suma de cuadrados totales (SC T) con la siguiente fórmula: (fórmula 51) SCT = ™[2 – (™[)2 N ™[2 = suma de los cuadrados de todos los grupos (™[)2 = suma de los valores de las observaciones de todos los grupos N = número de toda la muestra 185

FERNANDO MAUREIRA CID

Con los datos del ejemplo 1 reemplazamos en la fórmula 51: SCT = 1042 – (1602 / 26) = 1042 – (25600 / 26) = 1042 – 984,62 = 57,38

¾ Paso 3 Calcular la suma de cuadrados inter-grupos (SC inter) con la siguiente fórmula: SCinter = ™ (™[2) – (™[2) n N

(fórmula 52)

(™[)2 = suma de las observaciones de cada grupo elevada al cuadrado n = número de sujetos del grupo (™[)2 = suma de todas las observaciones de cada grupo al cuadrado N = número total de la muestra

Con los datos del ejemplo 1 reemplazamos en la fórmula 52: SC inter = (432 / 9) + (572 / 9) + (602 / 8) – (1602 / 26) = (1849 / 9) + (3249 / 9) + (3600 / 8) – (25600 / 26) = (205,44 + 361 + 450) – 984,62 = 1016,44 – 984,62 = 31,82

¾ Paso 4 Calcular la suma de cuadrados intra-grupos (SCintra) con la siguiente fórmula: 186

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

SCintra = SCT - SC inter

(fórmula 53)

SC T = suma de los cuadrados totales SC inter = suma de los cuadrados inter-grupos Con los datos del ejemplo 1 reemplazamos en la fórmula 53: SC intra = 57,38 – 31,82 = 25,56 ¾ Paso 5 Calcular los cuadrados medios inter-grupos (CMinter) con la siguiente fórmula: CMinter = SC inter glinter

(fórmula 54)

SC inter = suma de los cuadrados inter-grupos glinter = grados de libertad inter-grupos que corresponde al número de grupos menos 1 Con los datos del ejemplo 1 reemplazamos en la fórmula 54: CMinter = 31,82 / (3-1) = 31,82 / 2 = 15,91 ¾ Paso 6 Calcular los cuadrados medios intra-grupos (CMintra) con la siguiente fórmula: CMintra = SC intra (fórmula 55) glintra SC intra = suma de cuadrados intra-grupos glintra = grados de libertad intra-grupos que corresponde a la suma de casos de cada grupo menos 1 187

FERNANDO MAUREIRA CID

Con los datos del ejemplo 1 reemplazamos en la fórmula 55: CMintra = 25,56 / (9 – 1) + (9 – 1) + (8 – 1) = 25,56 / 23 = 1,111

¾ Paso 7 Calcular el valor F de análisis de varianza con la siguiente fórmula: F = CMinter (fórmula 56) CMintra CMinter = cuadrado medio inter-grupos CMintra = cuadrado medio intra-grupo

Con los datos del ejemplo 1 reemplazamos en la fórmula 56: F = 15,91 / 1,111 = 14,320 Los datos calculados en el análisis de varianza deben ser presentados en una tabla como la siguiente:

Fuente de variación Inter-grupos Intra-grupos Total

gl 2 23 25

Suma de cuadrados 31,82 25,56 57,38

Cuadrados medios 15,91 1,111

F 14,320

El valor F del análisis de varianza fue de 14,320 ahora se debe encontrar el valor crítico de F (Anexo 3), donde debemos ubicar los gl de los cuadrados medios inter e intra-grupos, buscando 188

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

los gl menor entre ellos en la primera fila (horizontal) y los gl mayores en la primera columna (vertical). Con los datos del ejemplo 1 los 2 gl inter-grupos se buscan en primera fila y los 23 gl intra-grupos en la primera columna. La intersección de ambos fue un valor F de 3,42. A continuación se sigue la regla de decisión: x Si el valor F calculado es menor al valor F de la tabla se debe aceptar la H0. x Si el valor F calculado es igual o mayor al valor F de la tabla se debe rechazar la H0. 14,320 > 3,42 por lo tanto se debe rechazar H0 y podemos decir que existen diferencias entre las medias de los grupos. Por lo anterior, es que el investigador puede concluir que los hábitos de estudio de los alumnos de educación física, kinesiología y nutrición son diferentes.

1. COMPARACIONES POSTERIORES A F El análisis de varianza nos dice si existe o no diferencia entre la media de tres o más grupos, pero en el caso de haberla no dice nada sobre los grupos entre los cuales se presentan esta diferencias. Para ello es necesario realizar análisis posteriores comúnmente llamados comparaciones múltiples. Los métodos principales para estas comparaciones son la diferencia mínima significativa (LSD), prueba de rangos múltiples de Duncan, prueba de Scheffé, procedimiento de Tukey, etc. A continuación se explicará el procedimiento de Tukey modificado por Snedecor. ¾ Paso 1: Se ubican las medias de los grupos de mayor a menor y la diferencia entre ellas. 189

FERNANDO MAUREIRA CID

Grupo Nutrición Kinesiología E. Física

Medias 7,50 6,33 4,78

Diferencia de medias Nutrición Kinesiología E. Física 1,17 2,72

1,55

¾ Paso 2 Obtener un cuadrado medio intra-grupo promedio (CMintraX) con la siguiente fórmula: CMintra X = 1 CMintra + CMintra +… CMintra k n1 n2 nk

(fórmula 57)

k = número de grupos n = número de sujetos de cada grupo

Con los datos del ejemplo 1 reemplazamos en la fórmula 57: CMintra X = (1/3) * ((1,111 / 9) + (1,111 / 9) + (1,111 / 8)) = 0,333 * (0,123 + 0,123 + 0,139) = 0,333 * 0,385 = 0,128

¾ Paso 3: Calcular el error estándar de una media (Sx) con la siguiente fórmula: Sx = CMintra X (fórmula 58)

Con los datos del ejemplo 1 reemplazamos en la fórmula 58: Sx = 0,128 = 0,358 190

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

¾ Paso 4: Determinar el valor Q (Anexo 6) con el número de grupos y los grados de libertad dentro de los grupos.

¾ Paso 5: Se calcula D con la siguiente fórmula: D = Q * Sx

(fórmula 59)

Con los datos del ejemplo 1 tenemos: Valor Q con 3 grupos y 23 gl = 3,58 D = 3,58 * 0,358 = 1,282

¾ Paso 6: Se compara el valor D con las diferencias de los pares de medias de los grupos. Valores mayores que D significa diferencia entre los grupos. Con los datos del ejemplo 1 tenemos: Nutrición – Kinesiología = 1,17 < 1,282 Nutrición – E. Física = 2,72 > 1,282 Kinesiología – E. Física = 1,55 > 1,282 Por lo tanto, es posible concluir que las puntuaciones de los hábitos de estudio entre estudiantes de nutrición y kinesiología son estadísticamente iguales. En cambio, educación física posee una media menor que las otra dos carreras.

191

FERNANDO MAUREIRA CID

192

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

II ANALISIS DE VARIANZA DE UN FACTOR DE MEDIDAS REPETIDAS

Cuando tenemos un grupo y le hemos realizado dos mediciones a través del tiempo (antes y después de una intervención o en un momento inicial y otro posterior) es posible determinar si existen diferencias entre ambas mediciones a través de una prueba t para muestras relacionadas. Pero cuando las mediciones al mismo grupo se realizan tres o más veces la prueba t no resulta adecuada, entonces debemos utilizar un ANOVA de medidas repetidas.

NIVEL DE MEDICIÓN: INTERVALAR O DE RAZON SUPUESTOS: x LA VARIABLE DEPENDIENTE DEBE PRESENTAR UNA DISTRIBUCIÓN NORMAL. x LA VARIABLE DEPENDIENTE DEBE SER NUMÉRICA. x DEBE CUMPLIRSE LA HOMOCEDASTICIDAD HOMOGENEIDAD DE VARIANZA ENTRE LOS GRUPOS.

U

193

FERNANDO MAUREIRA CID

ƒ Ejemplo 2 Un entrenador aplicó un entrenamiento de mejora de la flexibilidad a un grupo de 11 gimnastas de 8 y 9 años durante 3 meses. Una de las pruebas que compone la batería de medición es el sit and reach que fue evaluado antes del entrenamiento, luego de 6 semanas y a las 12 semanas entregando los resultados de la tabla siguiente: Sujeto Medición 1 1 0 2 1 3 2 4 0 5 2 6 -2 7 0 8 1 9 3 10 2 11 2 1,0 Ш= S= 1,41

Medición 2 2 3 3 2 4 0 1 3 6 4 5 3,0 1,73

Medición 3 5 7 8 5 8 3 4 5 7 7 8 6,1 1,76

Ahora el entrenador quiere saber si existen diferencias entre las 3 mediciones, es decir, si el programa de entrenamiento provocó mejoras en las puntuaciones de esta evaluación. Datos: Ш1 = 1,0 S1 = 1,41 n1 = 11 H 0 = Ш1 = Ш2 = Ш3 H 1 = Ш1 Ш2 Ш3 194

Ш2 = 3,0 S2 = 1,73 n2 = 11

Ш3 = 6,1 S3 = 1,76 n3 = 11

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

¾ Paso 1 Calcular la suma de cuadrados de cada grupo.

1 2 3 4 5 6 7 8 9 10 11 ™ Ш= S= S2 =

X1 0 1 2 0 2 -2 0 1 3 2 2 11 1,0 1,41 1,98

X2 2 3 3 2 4 0 1 3 6 4 5 33 3,0 1,73 2,99

X3 5 7 8 5 8 3 4 5 7 7 8 67 6,1 1,76 3,10

™ ™11 ™13 ™7 ™14 ™1 ™5 ™9 ™16 ™13 ™15 ™

X12 0 1 4 0 4 4 0 1 9 4 4 31 2,82

X12 X12 4 25 9 49 9 64 4 25 16 64 0 9 1 16 9 25 36 49 16 49 25 64 129 439 ™ 11,73 39,91

¾ Paso 2 Calcular la suma de cuadrados totales (SCT) con la siguiente fórmula: SCT = ™™ 0,666 por lo tanto se debe rechazar H0 y podemos decir que existe relación entre las variables. La correlación de Pearson puede tomar valores entre -1 y 1 midiendo la fuerza de asociación lineal de las variables. Un valor r de cero indica que no existe correlación de X e Y, valores positivos indica una correlación positiva y viceversa. Valores < 0,300 0,300 – 0,600 > 0,600

Correlación Baja Media Alta

Este coeficiente de correlación es muy influenciado por datos extremos (outlier) y solo se utiliza cuando existe relaciones lineales entre variables, por esta razón es necesario construir un gráfico de dispersión para determinar la linealidad de los datos antes de utilizar este análisis. Por lo anterior, es que el investigador de este estudio puede concluir que los estudiantes que practican más actividad física son 209

FERNANDO MAUREIRA CID

los mismos que poseen mejor rendimiento académico y que esta relación de variables es muy alta (r = 0,943). También es posible calcular el coeficiente de determinación (r2) que corresponde al porcentaje de relación de las variables. Este se obtiene con la siguiente fórmula: r2 = r * r

(fórmula 74)

r = correlación de Pearson. Así del ejemplo 1 tenemos: r2 = 0,943 * 0,943 = 0,89 Es decir, la relación entre las dos variables es de un 89%.

210

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

II REGRESION LINEAL SIMPLE

La representación de la relación de dos variables, puede permitir realizar predicciones sobre los valores que tomará una de las variables a partir de los valores de la otra. La regresión lineal simple es el estadístico más utilizado a la hora de predecir los valores de una variable cuantitativa en base a otra variable cuantitativa.

NIVEL DE MEDICIÓN: INTERVALAR O DE RAZON SUPUESTOS: x LAS VARIABLES DEBEN PRESENTAR UNA DISTRIBUCIÓN NORMAL. x LAS VARIABLES DEBEN SER NUMÉRICA. x LOS DATOS DE AMBAS VARIABLES SON INDEPENDIENTES. x HOMOCEDASTICIDAD VARIANZAS.

U

HOMOGENEIDAD

DE

LAS

x LINEALIDAD EN LOS PARAMETROS (esto indica que un cambio unitario de X tiene el mismo efecto en Y, independiente del valor inicial de X). 211

FERNANDO MAUREIRA CID

ƒ Ejemplo 2 Un investigador evaluó el tiempo de práctica de actividad física y los niveles de estrés de un grupo de 10 estudiantes universitarios. Ahora quiere saber si la práctica de actividad física puede predecir los niveles de estrés en estos estudiantes. Sujeto 1 2 3 4 5 6 7 8 9 10

Act. Física 8 5 7 4 6 2 4 7 3 8

Estrés 5 3 4 2 4 1 3 5 2 5

¾ Paso 1 Calcular el modelo de regresión lineal que consiste en ajustar los datos a una línea recta mediante la siguiente ecuación: Estadística descriptiva >Tabla de contingencia En el cuadro de la izquierda aparece la lista de nuestras variables. Tomamos las dos variables que deseamos relacionar y llevamos una al cuadro superior derecho y la otra al cuadro medio derecho (no importa cual vaya en cual cuadro).

Figura 79. Pantalla tabla de contingencia.

Luego presionamos estadísticos y en el cuadro nominal presionamos Phi y V de Cramer. Hecho esto presionamos continuar para volver a la pantalla de tabla de contingencia y presionamos OK. 324

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Figura 80. Pantalla correlación de Phi. La hoja de cálculos del programa nos entrega dos tablas como las siguientes: Act. Física padres * Act. Física hijos Tabla de contingencia Act. Física hijos No hace Act. Física padres

No hace Hace

Total

Hace

Total

4

2

6

2

12

14

10

6

14

En la primera tabla se observa la cantidad de padres que no practican actividad física cuyos hijos tampoco lo hacen, los padres que no practican actividad física cuyos hijos si lo hacen, los padres que practican actividad física cuyos hijos no lo hacen y los padres que practican actividad física cuyos hijos también lo hacen.

325

FERNANDO MAUREIRA CID

Medidas simétricas Valor Nominal por Nominal N de casos validos

Sig. Aprox.

Phi

,524

,019

V de Cramer

,524

,019

20

En la segunda tabla se observa el coeficiente de correlación de Phi, el coeficiente de correlación V de Cramer que corresponde a una pequeña modificación del coeficiente Phi y la Sig. o valor p. La correlación de Phi puede tomar valores entre 0 y 1 midiendo la fuerza de asociación de las variables. El coeficiente Phi se interpreta de igual forma que Pearson y Spearman. También debe contrastar el valor p calculado (p=0,019) siendo p

0,05 0,975 0,842 0,708 0,624 0,565 0,521 0,486 0,457 0,432 0,401 0,391 0,375 0,361 0,349 0,338 0,328 0,318 0,309 0,301 0,295 0,27 0,24 0,23 0,21 0,20 0,19 1,36 / n

0,01 0,995 0,929 0,828 0,733 0,669 0,618 0,577 0,543 0,514 0,49 0,468 0,45 0,433 0,418 0,404 0,392 0,382 0,371 0,363 0,356 0,32 0,29 0,27 0,25 0,24 0,23 1,63 / n

331

FERNANDO MAUREIRA CID

ANEXO 2 Tabla de valores críticos para la prueba t

gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

332

0,05 12,71 4,30 3,18 2,78 2,57 2,45 2,37 2,31 2,26 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,11 2,10 2,09 2,09 2,08

0,01 63,68 9,93 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17 3,11 3,06 3,01 2,98 2,95 2,92 2,90 2,88 2,86 2,85 2,83

gl 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 ’

0,05 2,07 2,07 2,06 2,06 2,06 2,05 2,05 2,05 2,04 2,04 2,04 2,03 2,03 2,03 2,03 2,03 2,02 2,02 2,02 1,65

0,01 2,82 2,81 2,80 2,79 2,78 2,77 2,76 2,76 2,75 2,74 2,74 2,73 2,73 2,72 2,72 2,72 2,71 2,71 2,70 2,33

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

ANEXO 3 Tabla de valores críticos para la prueba F (Į 

gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37

1 2 3 4 5 6 7 8 161,45 199,50 215,70 224,58 230,16 233,99 236,77 238,88 18,51 19,00 19,16 19,25 19,23 19,33 19,35 19,37 10,13 9,55 9,27 9,12 9,01 8,94 8,89 8,85 7,71 6,94 6,60 6,39 6,26 6,16 6,09 6,04 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 5,60 4,73 4,35 4,12 3,97 3,87 3,79 3,73 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 5,12 4,23 3,86 3,63 3,48 3,37 3,29 3,23 4,97 4,10 3,71 3,45 3,33 3,22 3,14 3,07 4,84 3,98 3,59 3,36 3,20 3,10 3,01 2,95 4,75 3,89 3,49 3,26 3,11 2,97 2,91 2,85 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 4,45 3,59 3,20 2,97 2,81 2,70 2,61 2,55 4,41 3,56 3,16 2,93 2,77 2,66 2,58 2,51 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 4,32 3,47 3,07 2,84 2,69 2,57 2,49 2,42 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,38 4,26 3,40 3,01 2,78 2,62 2,51 2,41 2,34 4,24 3,39 2,99 2,76 2,60 2,49 2,41 2,34 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 4,16 3,31 2,91 2,68 2,52 2,41 2,32 2,26 4,15 3,30 2,90 2,67 2,51 2,40 2,31 2,24 4,14 3,29 2,89 2,66 2,50 2,39 2,30 2,24 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 4,12 3,27 2,87 2,64 2,49 2,37 2,29 2,22 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 4,11 3,25 2,86 2,63 2,47 2,36 2,27 2,20 333

FERNANDO MAUREIRA CID gl 38 39 40 50 60 70 80 90 100 120 200 500

1 4,10 4,09 4,09 4,03 4,00 3,98 3,96 3,95 3,94 3,92 3,89 3,86

2 3,25 3,24 3,23 3,18 3,15 3,13 3,11 3,10 3,09 3,07 3,04 3,01

3 2,85 2,85 2,84 2,79 2,76 2,74 2,72 2,71 2,70 2,69 2,65 2,62

4 2,62 2,61 2,61 2,56 2,53 2,50 2,49 2,47 2,46 2,45 2,42 2,39

5 2,46 2,46 2,45 2,40 2,37 2,35 2,33 2,32 2,31 2,29 2,26 2,23

6 2,35 2,34 2,34 2,29 2,25 2,23 2,21 2,20 2,19 2,18 2,14 2,12

7 2,26 2,26 2,25 2,20 2,17 2,14 2,13 2,11 2,10 2,09 2,06 2,03

8 2,19 2,19 2,18 2,13 2,10 2,07 2,06 2,04 2,03 2,02 1,99 1,96

Prueba F (continuación)

gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 334

9 10 15 20 30 40 120 500 240,54 241,88 245,95 248,01 250,10 251,14 253,25 254,06 19,39 19,40 19,43 19,45 19,46 19,47 19,49 19,49 8,81 8,79 8,70 8,66 8,62 8,59 8,55 8,53 6,00 5,96 5,86 5,80 5,75 5,72 5,66 5,64 4,77 4,74 4,62 4,56 4,50 4,46 4,40 4,37 4,10 4,06 3,94 3,87 3,81 3,77 3,71 3,68 3,68 3,64 3,51 3,45 3,38 3,34 3,27 3,24 3,39 3,35 3,22 3,15 3,08 3,04 2,97 2,94 3,18 3,14 3,01 2,94 2,90 2,83 2,75 2,71 3,02 2,98 2,85 2,77 2,70 2,66 2,58 2,55 2,90 2,86 2,72 2,65 2,57 2,53 2,45 2,42 2,80 2,74 2,62 2,54 2,47 2,43 2,34 2,31 2,71 2,67 2,53 2,46 2,38 2,34 2,25 2,19 2,65 2,60 2,46 2,39 2,31 2,27 2,18 2,14 2,59 2,54 2,40 2,33 2,25 2,20 2,11 2,08 2,54 2,49 2,35 2,28 2,19 2,15 2,06 2,02 2,49 2,45 2,31 2,23 2,15 2,10 2,01 1,97 2,46 2,41 2,27 2,19 2,11 2,06 1,97 1,93 2,42 2,38 2,23 2,16 2,07 2,03 1,93 1,89 2,39 2,35 2,20 2,12 2,04 1,99 1,90 1,86 2,37 2,32 2,18 2,10 2,01 1,97 1,87 1,83

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA gl 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 50 60 70 80 90 100 120 200 500

9 2,34 2,32 2,30 2,28 2,27 2,25 2,24 2,22 2,21 2,20 2,19 2,18 2,17 2,16 2,15 2,15 2,14 2,13 2,12 2,07 2,04 2,02 2,00 1,99 1,98 1,96 1,93 1,90

10 2,30 2,28 2,26 2,24 2,22 2,20 2,19 2,18 2,17 2,15 2,14 2,13 2,12 2,11 2,11 2,10 2,09 2,08 2,07 2,03 1,99 1,97 1,95 1,94 1,93 1,91 1,88 1,85

15 2,15 2,13 2,11 2,09 2,07 2,06 2,04 2,03 2,02 2,00 1,99 1,98 1,97 1,96 1,95 1,95 1,94 1,93 1,92 1,87 1,84 1,81 1,79 1,78 1,77 1,75 1,72 1,69

20 2,07 2,05 2,03 2,01 1,99 1,97 1,96 1,95 1,93 1,92 1,91 1,90 1,89 1,88 1,87 1,86 1,85 1,85 1,84 1,78 1,75 1,72 1,70 1,69 1,68 1,66 1,62 1,59

30 1,98 1,96 1,94 1,92 1,90 1,88 1,87 1,85 1,84 1,83 1,82 1,81 1,80 1,79 1,78 1,77 1,76 1,75 1,74 1,69 1,65 1,62 1,60 1,59 1,57 1,55 1,52 1,48

40 1,94 1,91 1,89 1,87 1,85 1,84 1,82 1,81 1,79 1,78 1,77 1,76 1,75 1,74 1,73 1,72 1,71 1,70 1,69 1,63 1,59 1,57 1,55 1,53 1,52 1,50 1,46 1,42

120 1,84 1,81 1,79 1,77 1,75 1,73 1,71 1,70 1,68 1,67 1,66 1,65 1,63 1,62 1,61 1,60 1,59 1,59 1,58 1,51 1,47 1,44 1,41 1,39 1,38 1,35 1,30 1,26

500 1,80 1,77 1,75 1,73 1,71 1,69 1,67 1,65 1,64 1,62 1,61 1,60 1,59 1,57 1,56 1,55 1,54 1,54 1,53 1,46 1,41 1,37 1,35 1,33 1,31 1,28 1,22 1,16

335

FERNANDO MAUREIRA CID

ANEXO 4 Tabla de valores críticos para la prueba de homogeneidad de YDULDQ]DGH&RFKUDQ Į 

N° de grupos gl 1 2 3 4 5 6 7 8 9 16 36 144

2 0,9985 0,9750 0,9392 0,9057 0,8772 0,8534 0,8332 0,8159 0,8010 0,7341 0,6602 0,5813

3 0,9969 0,8709 0,7977 0,7457 0,7071 0,6771 0,6530 0,6333 0,6167 0,5466 0,4748 0,4031

4 0,9065 0,7679 0,6841 0,6287 0,4447 0,5598 0,5365 0,5175 0,5017 0,4366 0,3720 0,3093

5 0,8412 0,6838 0,5981 0,5441 0,5895 0,4783 0,4564 0,4387 0,4241 0,3645 0,3066 0,2513

6 0,7808 0,6161 0,5321 0,4803 0,5065 0,4184 0,3980 0,3817 0,3682 0,3135 0,2612 0,2119

7 0,7271 0,5612 0,4800 0,4307 0,3974 0,3726 0,3535 0,3384 0,3259 0,2756 0,2278 0,1833

N° de grupos gl 1 2 3 4 5 6 7 8 9 16 36 144

336

8 0,6798 0,5157 0,4377 0,3910 0,3595 0,3362 0,3185 0,3043 0,2926 0,2462 0,2022 0,1616

9 0,6385 0,4775 0,4027 0,3584 0,3286 0,3067 0,2901 0,2768 0,2659 0,2226 0,1820 0,1446

10 0,6020 0,4450 0,3733 0,3311 0,3029 0,2823 0,2666 0,2541 0,2439 0,2032 0,1655 0,1308

15 0,4709 0,3346 0,2758 0,2419 0,2195 0,2034 0,1911 0,1815 0,1736 0,1429 0,1144 0,0889

20 0,3894 0,2705 0,2205 0,1921 0,1735 0,1602 0,1501 0,1422 0,1357 0,1108 0,0879 0,0675

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

ANEXO 5 Tabla de valores críticos para la prueba X2

gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

0,05 3,841 5,991 7,815 9,488 11,070 12,591 14,067 15,507 16,919 18,307 19,675 21,026 22,362 23,684 24,995 26,296 27,587 28,869 30,143 31,410 32,670

0,01 6,635 9,210 11,345 13,277 15,086 16,811 18,475 20,090 21,666 23,209 24,725 26,217 27,688 29,141 30,577 31,999 33,408 34,805 36,190 37,566 38,932

gl 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 50 100

0,05 0,01 33,924 40,289 35,172 41,638 36,415 42,979 37,652 44,314 38,885 45,641 40,113 46,962 41,337 48,278 42,557 49,587 43,773 50,892 44,985 52,191 46,194 53,485 47,399 54,775 48,602 56,060 49,801 57,342 50,998 58,619 52,192 59,892 53,383 61,162 54,572 62,428 55,758 63,690 67,504 76,153 124,342 135,806

337

FERNANDO MAUREIRA CID

ANEXO 6 Tabla de valores críticos para la prueba Q (Tukey-Snedecor)

N° de grupos gl 2 3 4 5 6 7 8 9 1 17,97 26,98 32,82 37,08 40,41 43.12 45,40 47,36 2 6,08 8,28 9,80 10,89 11,73 12,43 13,03 13,54 3 4,50 5,91 6,83 7,51 8,04 8,47 8,85 9,18 4 3,93 5,04 5,76 6,29 6,70 7,06 7,35 7,60 5 3,64 4,60 5,22 5,67 5,93 6,38 6,58 6,80 6 3,46 4,34 4,90 5,31 5,63 5,89 6,12 6,32 7 3,34 4,16 4,68 5,06 5,35 5,59 5,82 5,99 8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 9 3,20 3,95 4,42 4,76 5,02 5,24 5,43 5,60 10 3,15 3,88 4,33 4,66 4,91 5,12 5,30 5,46 11 3,11 3,82 4,26 4,58 4,82 5,03 5,20 5,35 12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 13 3,06 3,73 4,15 4,46 4,69 4,88 5,05 5,19 14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 15 3,01 3,67 4,08 4,37 4,59 4,78 4,94 5,08 16 3,00 3,65 4,05 4,34 4,56 4,74 4,90 5,03 17 2,98 3,62 4,02 4,31 4,52 4,70 4,86 4,99 18 2,97 3,61 4,00 4,28 4,49 4,67 4,83 4,96 19 2,96 2,59 3,98 4,26 4,47 4,64 4,79 4,92 20 2,95 3,58 3,96 4,24 4,45 4,62 4,77 4,90 30 2,89 3,48 3,84 4,11 4,30 4,46 4,60 4,72 40 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63 60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 120 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,47 ’ 2,77 3,32 3,63 3,86 4,03 4,17 4,29 4,39

338

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

ANEXO 7 Valores críticos del coeficiente de correlación de Pearson Nivel de significancia de 0,05

n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

0,05 0,997 0,950 0,878 0,811 0,755 0,707 0,666 0,632 0,602 0,576 0,553 0,532 0,514 0,497 0,482 0,468 0,456 0,444 0,433 0,423 0,413

N 24 25 26 27 28 29 30 32 34 36 38 40 42 44 46 48 50 60 70 80 90 100

0,05 0,404 0,396 0,388 0,381 0,374 0,367 0,361 0,349 0,339 0,329 0,320 0,312 0,304 0,297 0,291 0,285 0,279 0,254 0,235 0,220 0,207 0,197

339

FERNANDO MAUREIRA CID

ANEXO 8 Valores críticos de la prueba U de Mann Whitney Nivel de significancia de 0,05

n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

340

1 -

2 0 0 0 0 0 0 0 0 0 0 0 0

3 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7

4 0 1 2 3 4 4 5 6 7 8 9 10 11 11 12 13

5 0 1 2 3 5 6 7 8 9 11 12 13 14 15 17 18 19

6 1 2 3 5 6 8 10 11 13 14 16 17 19 21 22 24 25

7 1 3 5 6 8 10 12 14 16 18 20 22 24 26 28 30 32

8 0 2 4 6 8 10 13 14 17 19 22 24 26 29 31 34 36 38

9 0 2 4 7 10 12 15 16 20 23 26 28 31 34 37 39 42 45

10 0 3 5 8 11 14 17 18 23 26 29 33 36 39 42 45 48 52

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

Prueba U de Mann Whitney (continuación)

n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

11 0 3 6 9 13 16 19 23 26 30 33 37 40 44 47 51 55 58

12 0 4 7 11 14 18 22 26 29 33 37 41 45 49 53 57 61 65

13 0 4 8 12 16 20 24 28 33 37 41 45 50 54 59 63 67 72

14 0 5 9 13 17 22 26 31 36 40 45 50 55 59 64 67 74 78

15 0 5 10 14 19 24 29 34 39 44 49 54 59 64 70 75 80 85

16 0 6 11 15 21 26 31 37 42 47 53 59 64 70 75 81 86 92

17 0 6 11 17 22 28 34 39 45 51 57 63 67 75 81 87 93 99

18 0 7 12 18 24 30 36 42 48 55 61 67 74 80 86 93 99 106

19 0 7 13 19 25 32 38 45 52 58 65 72 78 85 92 99 106 113

341

FERNANDO MAUREIRA CID

ANEXO 9 Valores críticos de la prueba de rangos de Wilcoxon

n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

342

0,01 0 2 3 5 7 10 13 16 19 23 28 32 37 43 49 55 61 68

0,05 1 2 4 6 8 11 14 17 21 25 30 35 40 46 52 59 66 73 81 90

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

ANEXO 10 Valores críticos de la prueba de varianza unifactorial de rangos de Kruskal-Wallis Nivel de significancia de 0,05

n1 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5

n2 1 2 2 1 2 2 3 3 3 1 2 2 3 3 3 4 4 4 4 1 2 2 3 3 3 4 4 4 4

n3 1 1 2 1 1 2 1 2 3 1 1 2 1 2 3 1 2 3 4 1 1 2 1 2 3 1 2 3 4

0,05 4,71 5,14 5,36 5,60 5,33 5,21 5,44 5,73 4,96 5,45 5,59 5,69 5,00 5,16 4,96 5,25 5,65 4,99 5,27 5,63 5,62

n1 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 8

n2 5 5 5 5 5 1 2 2 3 3 3 4 4 4 4 5 5 5 5 5 6 6 6 6 6 6 7 8

n3 1 2 3 4 5 1 1 2 1 2 3 1 2 3 4 1 2 3 4 5 1 2 3 4 5 6 7 8

0,05 5,13 5,34 5,71 5,64 5,78 4,82 5,35 4,86 5,35 5,62 4,95 5,34 5,61 5,69 4,99 5,34 5,60 5,66 5,73 4,95 5,41 5,63 5,72 5,77 5,80 5,82 5,82

343

FERNANDO MAUREIRA CID

Continuación Kruskal-Wallis

n1 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

344

n2 1 2 2 2 1 2 2 2 3 3 3 3 3 3 1 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4

n3 1 1 2 2 1 1 2 2 1 2 2 3 3 3 1 1 2 2 1 2 2 3 3 3 1 2 2 3 3 3 4 4 4 4

n4 1 1 1 2 1 1 1 2 1 1 2 1 2 3 1 1 1 2 1 1 2 1 2 3 1 1 2 1 2 3 1 2 3 4

0,05 5,68 6,17 5,83 5,33 6,33 6,24 6,53 6,60 6,73 7,00 5,83 6,13 6,55 6,18 6,31 6,62 6,55 6,80 6,98 5,95 6,39 6,73 6,64 6,87 7,04 6,73 6,96 7,14 7,24

n1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3

n2 1 2 2 2 2 1 2 2 2 2 3 3 3 3 3 3 3 3 3 3

n3 1 1 2 2 2 1 1 2 2 2 1 2 2 2 3 3 3 3 3 3

n4 1 1 1 2 2 1 1 1 2 2 1 1 2 2 1 2 2 3 3 3

n5 1 1 1 1 2 1 1 1 1 2 1 1 1 2 1 1 2 1 2 3

0,05 6,75 7,13 7,42 6,58 6,80 7,31 7,68 7,11 7,20 7,59 7,91 7,58 7,76 8,04 8,00 8,20 8,33

ESTADÍSTICA BÁSICA PARA EDUCACIÓN FÍSICA

ANEXO 11 Valores críticos de la prueba de varianza de rangos de Friedman Nivel de significancia de 0,05

k 3 3 3 3 3 3 3 3 3 3 3 3 3 3

n 1 2 3 4 5 6 7 8 9 10 11 12 13 ’

0,05 6,00 6,50 6,40 7,00 7,14 6,25 6,22 6,20 6,54 6,17 6,00 5,99

0,01 8,00 8,40 9,00 8,86 9,00 8,67 9,60 8,91 8,67 9,39

k 4 4 4 4

n 1 2 3 4

0,05 6,00 8,20 9,30

0,01 9,00 9,90

345

FERNANDO MAUREIRA CID

ANEXO 12 Valores críticos del coeficiente de correlación de Spearman Nivel de significancia de 0,05

n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

346

0,05 1,000 0,886 0,786 0,738 0,700 0,648 0,618 0,587 0,560 0,538 0,521 0,503 0,485 0,472 0,460 0,447 0,435 0,425 0,415 0,406 0,398 0,390 0,382 0,375

N 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 60 70 80 90 100

0,05 0,368 0,362 0,356 0,350 0,345 0,340 0,335 0,330 0,325 0,321 0,317 0,313 0,309 0,305 0,301 0,298 0,294 0,291 0,288 0,285 0,282 0,279 0,255 0,235 0,220 0,207 0,197

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.