Capítulo 5 - Confort Térmico en Bioclima Semi-Frío: Estimación a partir de los Enfoques de Estudio Adaptativo y Predictivo

Share Embed


Descripción

DIVISIÓN DE CIENCIAS Y ARTES PARA EL DISEÑO Especialización, Maestría y Doctorado en Diseño

CONFORT TÉRMICO EN BIOCLIMA SEMI-FRÍO: ESTIMACIÓN A PARTIR DE LOS ENFOQUES DE ESTUDIO ADAPTATIVO Y PREDICTIVO (Caso de estudio: Centro de Estudios de Educación Superior en Pachuca, Hidalgo)

Julio César Rincón Martínez Tesis para optar por el grado de Doctor en Diseño Línea de Investigación: Arquitectura Bioclimática Miembros del Jurado: Dr. Víctor Armando Fuentes Freixanet Director de tesis

Dr. Gonzalo Bojórquez Morales Codirector de tesis

Dr. Luis Gabriel Gómez Azpeitia Dr. Aníbal Figueroa Castrejón Dr. Juan José Ambriz García Dr. Juan Raymundo Mayorga Cervantes México D.F. Junio 2015 Tesis_Julio_Rincon_Junio_de_2015

CAPÍTULO

5

.

PROCESAMIENTO DE DATOS

PROCESAMIENTO DE DATOS

5.

Procesamiento de datos

La planificación de esta investigación se realizó de forma estricta con el fin de recabar, a partir del formato con el que se diseñó y estructuró cada uno de los cuestionarios (de sitio y de laboratorio) aplicados en los estudios descritos en es te documento (ver Cuestionario para estudios de sitio, pág. 156; y, Cuestionario para estudios de laboratorio, pág. 161), una cantidad importante de información de la muestra blanco evaluada. En términos generales, la información obtenida podría clasificarse en al guno de l os siguientes ámbitos: a) Información personal (básica), b) Información del espacio de ev aluación y c) Percepción higrotérmica y eólica del ambiente inmediato; esto, durante el momento de l a evaluación en s itio (levantamiento de encuestas) y en laboratorio (pruebas experimentales). Con ello, aun cuando se recolectó una cantidad significativa de información durante los estudios, no fueron analizadas todas las variables registradas en los cuestionarios aplicados. Con el fin de atender los objetivos y los alcances planteados en esta investigación (ver Objetivos, pág. 14; y, Alcances, pág. 16), el análisis de datos se centró únicamente en l a correlación existente, por periodo de estudio, entre la sensación térmica (ST) percibida por los sujetos y las variables físicas registradas simultáneamente al interior del espacio de evaluación (de acuerdo con ANSI/ASHRAE 55, 2010): TGN, TBS, HR y VV para el caso de los estudios de sitio, y, TBS y HR para el caso de los estudios de l aboratorio. De esta manera, los votos de confort recaudados respecto a la sensación hígrica y eólica, así como a la preferencia térmica, hígrica y eólica, y, la aceptación general del ambiente, de momento, han quedado registrados como información recabada durante el desarrollo de los estudios en sitio y en laboratorio; sin embargo, ésta podría vislumbrarse como una bas e sólida de i nformación a p artir de l a cual podría darse inicio a n uevas investigaciones o, incluso, continuidad a esta misma (bajo un enfoque de objetivos y alcances aún más ambiciosos a los aquí planteados). Con lo anterior, el análisis desarrollado en este capítulo no hizo diferencia de edad, de sexo, de nivel de ar ropamiento o de ni vel de ac tividad en l os sujetos analizados (no así, las características propias de cada periodo de análisis y enfoque de estudio, fueron determinantes), con el fin de estimar modelos genéricos de fá cil aplicación para la toma de dec isiones en e l diseño arquitectónico. Lo anterior, ya que durante los estudios de sitio se observó que el patrón de vestimenta entre los sujetos (sin importar la carrera) era homogéneo, según el periodo de estudio (0,7 clo en verano y 1,0 clo en invierno, de acuerdo con la ponderación de resistencia térmica sugerida por ANSI/ASHARAE 55, 2010 e Innova, 2002), y que l as actividades

304

desarrolladas en las instalaciones del ITP básicamente eran el estudio (escribir, platicar, dibujar, estar sentado relajado, actividades de salón de clases, etc.; equivalentes a 70,0 W/m2, según la ISO 8996, 2004: 16; la ANSI/ASHRAE 55, 2010: 18; y la ISO 7730, 2005: 17), la recreación y la convivencia (actividades sedentarias o ligeras de oficinas, escuelas o laboratorios, equivalentes a 70,0 W/m2, según ISO 8996, 2004:18), es decir, la actividad metabólica predominante en ese instituto era de 70,0 W/m2, de acuerdo con las referencias señaladas. En tanto, en los estudios de laboratorio estos aspectos (nivel de ar ropamiento y nivel de ac tividad) fueron controlados como parte de la validación interna del experimento a 0,7 clo de arropamiento (vestimenta en verano y de actividades diurnas en invierno) y 70,0 W/m2 de actividad sedentaria (1,2 met), con el fin de atender las bases en las que se consolida el enfoque predictivo. Asimismo, los datos recabados durante las evaluaciones fueron procesados individualmente a partir de cuatro métodos de correlación: tres estadísticos (univariables) y uno contenido en la ANSI/ASHRAE 55 (2010: 11-12); no obstante, fue posible identificar que con el análisis univariable de datos llevado a cabo con el método de Medias por Intervalos de Sensación Térmica (pág. 333), propuesto por Gómez-Azpeitia et al. (2007c), se obtenían resultados con mayor consistencia respecto a la sensación térmica, el comportamiento personal y las condiciones climáticas de las que eran objeto los sujetos al momento de la evaluación (ver Anexo XIII, pág. 695). Para ello, fue necesario preparar las bases de datos anticipadamente con el fin de om itir los datos atípicos que pudieran afectar negativamente los resultados buscados y de brindar un tratamiento a l os votos de confort —dados bajo una m agnitud única de variable física— que coincidieran en una misma categoría de sensación térmica a lo largo de todo el periodo de estudio. Al final, se compararon los resultados obtenidos individualmente a partir de la base de datos generada por cada enfoque de estudio y se aplicó un ajuste (media ponderada) con el fin de obtener un dato único en el valor de neutralidad y rangos de confort, por periodo y variable física de estudio, a partir de todos los datos recabados en la investigación. 5.1. Preparación de la base de datos Con base en los datos recabados a partir de los cuestionarios aplicados durante el desarrollo de los estudios de confort térmico descritos en este documento, fue posible generar dos bases de datos: una por grupo de ev aluación y otra por periodo de es tudio, tal cual fue des crito en el subcapítulo Formatos de captura (pág. 669). Este procedimiento fue similar tanto para la

305

digitalización de los datos obtenidos en los estudios de sitio (enfoque adaptativo) como para los datos recabados con los estudios de laboratorio (enfoque predictivo). La finalidad principal de las bases de datos conformadas por grupo fue identificar los posibles errores en la respuesta (por parte de los sujetos) o la captura (por parte del coordinador de la encuesta) de los datos recabados con los cuestionarios y corregirlos conforme a la consistencia de los datos grupales. En tanto, el objetivo de las bases de datos generadas por periodo y por enfoque de estudio fue encontrar el grado de correlación existente entre la sensación térmica percibida por los sujetos y la magnitud de c ada una d e las variables físicas registradas simultáneamente durante la evaluación (TGN, TBS, HR y VV para los estudios de sitio; y, TBS y HR para los estudios de laboratorio), con el propósito de estimar el valor neutral y los rangos de confort para cada una de ellas. Con lo anterior, el contenido de e ste subcapítulo se refiere exclusivamente a las bases de datos originadas por periodo y por enfoque de estudio. Antes de comenzar a trabajar una base de datos es recomendable realizar un proceso previo de planificación y organización de los datos recabados en los estudios. Primeramente, es importante conocer y tener claridad de la finalidad y los alcances del proyecto de investigación, ya que estos aspectos serán determinantes para estructurar adecuadamente la base de datos. Posteriormente se deberá definir la posición de las variables y de los registros según se facilite la manipulación y la digitalización de los datos recabados; para ello, se debe determinar si las columnas corresponderán a l as variables y las filas a los registros, o viceversa, con el fin de construir una estructura idónea que, al cruce de una c olumna con una fila, genere los campos (casillas) pertinentes que permitirán recibir los datos obtenidos (CCPE, 2011). Como ya se ha descrito en el subcapítulo Proceso de captura de respuestas (pág. 171), la base de datos fue conformada por una tabl a —elaborada en M icrosoft Excel®— en la que la organización de los datos se estructuró por filas (cada fila representa los datos recabados en una encuesta) y por columnas (cada columna representa los datos de una variable analizada en los cuestionarios); es decir, en las filas se concentraron los datos de cada registro (cuestionario), y, en l as columnas, los datos de cada variable analizada, tal como es posible visualizar en la Figura 30 (pág. 172). Para ello, fue necesario denominar cada columna con el nombre correspondiente a cada variable analizada y se evitó dejar columnas vacías; asimismo, cada fila fue nombrada por el número consecutivo y el folio que correspondió a cada registro recabado en las evaluaciones del periodo de análisis.

306

El procedimiento empleado en la preparación de la base de datos —utilizada para la obtención de los resultados de esta investigación— fue diseño propio y se planteó a partir de métodos o modelos estadísticos ya establecidos y utilizados continuamente en di ferentes campos del conocimiento. Sin duda alguna, existen numerosos procedimientos y métodos para preparar bases de datos previamente al tratamiento, el procesamiento y la obtención de resultados —según el proyecto de i nvestigación en desarrollo—, sin embargo, el procedimiento desarrollado en es te apartado fue el que s e adaptó c on mayor flexibilidad a l a línea de investigación, los objetivos y los alcances aquí perseguidos. Según Bisbé (2011), los datos irregulares de una base de datos pueden ser tratados de tr es formas: a) sustitución (reemplazo por valor específico o pr omedio), b) omisión (conservar los datos pero no uti lizarlos para el procesamiento), y, c) eliminación (borrar el valor de l os datos con el fin de que l os registros sean nulificados). Cada uno de es tos tratamientos deberá ser utilizado cautelosamente de acuerdo con la finalidad del análisis de datos. En términos generales, el procedimiento que di o lugar a l a preparación de l a base de datos utilizada en este análisis consistió en l a omisión de ciertos valores que pudieran afectar significativamente los resultados esperados. Para ello, los siguientes pasos fueron los que conformaron este procedimiento: 1. Omisión de datos atípicos (conjunto de datos inconsistentes con la homogeneidad de los datos grupales). 2. Omisión de categorías de sensación térmica no r epresentativas (inferiores al 5,0 % del total de observaciones recabadas). 3. Omisión de categorías de sensación térmica con mismo valor en variable física (o, misma magnitud, que evitara estimar la desviación estándar). La preparación de la base de datos es una etapa preliminar de suma importancia a la manipulación de los datos recabados y al modelado de los resultados esperados, ya que si se omite este procedimiento, se arriesga la consistencia de los resultados obtenidos por el posible manejo y la falta de tr atamiento de datos erróneos (sesgo). No obstante, de ac uerdo con el CCPE (2011), algunas de las ventajas adicionales que ofrece este procedimiento son: • Conocer la base de d atos en cuanto a s u estructura. Es posible realizar consultas y crear diversas tablas para conocer si hay segmentos, clústeres, estratificaciones, etc. en los datos.

307

• Obtener una base de datos consistente. Permite identificar y proporcionar un tratamiento a los tipos de datos irregulares con el fin de obtener (preparar) una base de datos sin errores. El propósito de este procedimiento es la revisión, la validación y la verificación de la consistencia de la información obtenida en campo, con el fin de lograr datos válidos que permitan realizar un análisis preciso de la realidad de una población determinada. La limpieza de datos no es un proceso aislado, comienza desde el trabajo de campo y continúa durante todo el proceso de recolección, captura y preparación de l os archivos finales para el análisis. Por ello, las consideraciones generales a atender durante este procedimiento se describen en la Tabla 33.

Tabla 33. Consideraciones generales para la preparación de una base de datos (Tabla basada en CCPE, 2011).

308

Sin embargo, pese a ejecutar una serie de controles de datos y dar por declarada una base de datos final, aún es posible encontrar errores que r eproduzcan resultados inconsistentes. Bajo este supuesto, lo importante es identificar y corregir estos errores y documentar los ajustes que se hayan hecho, con el fin de obtener una base de datos consistente válida para el análisis y un archivo histórico de los datos. Por ello, es importante examinar la información desde un enfoque crítico e identificar si las distribuciones tienen sentido, de lo contrario, será necesario ejecutar una vez más la limpieza de datos e identificar si aún persiste algún error. Al respecto, López (2011) menciona que en toda investigación, antes de extraer conclusiones acerca de los objetivos e hipótesis planteados, es necesario llevar a cabo un análisis previo y exploratorio de l os datos con el fin de detec tar errores en la codificación de l as variables, eliminar inconsistencias, evaluar la magnitud y tipo de d atos perdidos (ausentes), conocer características básicas de la distribución de las variables (normalidad, igualdad de varianzas, presencia de valores atípicos, linealidad, etc.) y avanzar acerca de las relaciones entre ellas. En definitiva, el investigador debe adquirir un conocimiento básico de los datos de su investigación y de l as relaciones existentes entre las variables analizadas antes de proceder a aplicar los procedimientos inferenciales. La limpieza de datos

puede ser realizada mediante la especificación de una l ógica de

programación que ay ude a es tablecer los parámetros aceptables para cada variable y debe permitir la validación entre variables. El programa informático que se utilice para crear una sintaxis con la lógica de búsqueda de posibles errores es definido por la persona que trabajara en este proceso 34. 5.1.1. Métodos estadísticos para identificación de datos atípicos Los datos atípicos, también conocidos como outliers, son observaciones que se desvían tanto de otras observaciones, que de spierta la sospecha de que se generaron por un mecanismo diferente (Hawkins-Douglas, 1980), son aquellos valores extremos de alguna variable que difieren del comportamiento del resto de la muestra (Rodríguez et al., 2011); es decir, un valor atípico es una observación numéricamente distante del resto de los datos, aunque, es posible 34

Una opción es usar SPSS que es un paquete que además de hacer el análisis permite crear una lógica de consistencia de información. Si bien la identificación y la corrección de errores puede ser clara a través del lenguaje de comandos de SPSS, los principios son los mismos que si se utilizara los cuadros de diálogo, no obstante, la sintaxis permite guardar la evidencia de los errores encontrados y las soluciones o aj ustes que s e hicieron; esto, para mantener una referencia y una documentación de todo el proceso de limpieza de datos (CCPE, 2011).

309

que este valor sea un indicativo de que el dato pertenece a una población diferente a la de la muestra establecida, de cualquier manera, se le consideraría atípico por que no forma parte de la regularidad u homogeneidad del valor de la mayoría de los datos de la muestra. López (2011) plantea que l os datos atípicos son aquellas observaciones que s e encuentran alejadas del resto de las observaciones en una variable (atípico univariable) o en la distribución conjunta de dos o m ás variables (atípico multivariable). Los valores atípicos resultan de combinaciones de valores inusuales. Las consecuencias de una sola observación atípica pueden ser graves pues pueden distorsionar las medias y desviaciones típicas de las variables y destruir o construir relaciones entre ellas. Utilizar una base de d atos sin suministrar el debido tratamiento a l os datos irregulares del universo conformado deriva en ciertas consecuencias significativas para el procesamiento de datos y los resultados que éste concluya. Entre las consecuencias más comunes se encuentra la distorsión de los resultados (inconsistencia en la precisión) y la afectación a la normalidad de la base de datos (correlación / dispersión de los datos). No obstante, es importante señalar que el origen de este tipo de datos es diverso, sin embargo, las causas comúnmente identificadas son: errores en los datos (levantamiento y digitación / captura), errores intencionados por parte del encuestado, y, errores de m uestreo (individuo en l a muestra que no per tenece a la población) (Hawkins-Douglas, 1980). Pese a lo anterior, existe la posibilidad de que l a conformación de la base de datos sea expuesta a los llamados outliers verdaderos: casos que pertenecen a la población objeto de estudio y que realmente difieren del resto por la variabilidad inherente (López, 2011). Existen diversos métodos y procedimientos para dar tratamiento a l os datos atípicos de una base de datos; no obstante, en este apartado se describen los utilizados continuamente en las distintas áreas del conocimiento: Z-Score y Cuartil; adicionalmente, se presenta un m étodo estadístico exploratorio propuesto en esta investigación: Jerarquía Ponderada. Por lo anterior, las bases de datos por periodo obtenidas en c ada enfoque de es tudio fueron sometidas a distintos tratamientos estadísticos que permitieran identificar los valores atípicos que resultaban inconsistentes con relación a l os demás obtenidos en cada evaluación. Cada base de datos fue cuidadosamente analizada a partir de los métodos estadísticos mencionados en el párrafo anterior; no obstante, el que r espondió a l os requerimientos buscados para un análisis consistente de acuerdo al fenómeno estudiado (votos subjetivos de confort térmico) fue 310

el de Jerarquía Ponderada. Para efectos de esta investigación y con el objeto de no perder dato alguno, los datos atípicos se omitieron durante el procesamiento, pese a que es posible reemplazarlos o eliminarlos, según Bisbé (2011). Lo anterior fue resultado de realizar distintos análisis comparativos de las bases de datos (tanto por grupo como por periodo y enfoque de estudio) a partir de los métodos estadísticos mencionados, ya que, de acuerdo con el Z-Score y el Cuartil, los datos atípicos de un universo de datos conformado son determinados a partir de la lejanía que su valor representa respecto a la distribución normal del resto de los registros. No obstante, con base en las escalas subjetivas —de sensación térmica (ST)— en las que se apoya el fenómeno estudiado en esta investigación (confort térmico), fueron dos los criterios establecidos para identificar la presencia o ausencia de datos atípicos en las bases de datos conformadas: • El primer criterio se centra, básicamente, en el significado (perceptivo) que r epresenta cada uno de l os valores utilizados en l a escala subjetiva de S T para evaluar las condiciones de aceptación del entorno circundante (ver Tabla 20 y Tabla 21, págs. 160 y 166, respectivamente) —y, no as í, en el valor numérico mismo de c ada posibilidad de respuesta (del 1 al 7), tal como es interpretado por los métodos estadísticos ya mencionados—. • El segundo criterio hace referencia a la frecuencia con la que cada categoría de ST fue elegida bajo una misma (o similar) magnitud de variable física (evaluación por grupo) y la proporción que cada una de ellas representa respecto al total de opiniones recabadas en una evaluación grupal. En otras palabras, el método de Jerarquía Ponderada (como fue llamado en esta investigación) basa su criterio de i dentificación atípica en e l significado, la frecuencia y la representación proporcional de cada categoría de ST —como dato par de la magnitud de variable física registrada que conforman el diagrama de di spersión—, y no en el

valor numérico que

representa cada una de esas alternativas. Con el fin de c ontar con un c onocimiento básico de l os métodos estadísticos examinados en esta investigación para la identificación y el tratamiento de los datos atípicos obtenidos en las bases de datos por periodo y enfoque de es tudio, a continuación se describen brevemente las características del Z-Score, Cuartil y Jerarquía Ponderada.

311

5.1.1.1. Z-Score De acuerdo con Hernández et al. (2006), el método Z-Score, también conocido como puntuación Z, es la medida que indica la dirección y el grado en que un valor individual se aleja de la media —en una escala de unidades de desviación estándar (DS)—. Nie et al. (1975) mencionan que las puntuaciones z son el método comúnmente utilizado para estandarizar la escala de una variable medida en un nivel por intervalos. Su fórmula es: .

z=

(17)

………….

X-X s

Donde: X = Puntuación o valor a transformar. …….....…

X = Media de la distribución a la que pertenece el valor a transformar. s = Desviación estándar de la distribución a la que pertenece el valor a transformar. z = Valor transformado en unidades de desviación estándar.

En este tenor, para que es ta medida pueda s er empleada como método de i dentificación de datos atípicos es necesario que cada uno de los valores transformados —que conforman la distribución— no exceda el intervalo de -3,0 DS a +3,0 DS (López, 2011). Para lograr una mejor Y

comprensión de l o expuesto anteriormente, a modo

de ejemplo, en l a Tabla 34 se concentran los datos de ST recabados en una evaluación de sitio. La columna Muestra contiene las categorías de ST elegidas por los sujetos durante la evaluación, la columna Z-Score muestra la transformación a DS de cada uno de l os valores concentrados en la columna anterior, y, la columna ¿Es atípico? define si cada valor contenido en la primer columna es o no atípi co respecto a la distribución total de datos que la contiene; esto, a partir de su valor Z-Score respecto a un intervalo de -3,0 DS a +3,0 DS. Según este método, ninguno de l os registros recabados en esta evaluación de sitio (con valores de ST de 1 a 5) se clasificaría como atípico.

312

Tabla 34. Identificación de datos atípicos a partir del método Z-Score (Elaboración propia).

5.1.1.2. Cuartil De acuerdo con Sánchez (2007), los cuartiles son medidas estadísticas de posición que tienen la propiedad de dividir la serie estadística en cuatro grupos de números iguales de términos; es decir, son los tres valores que dividen al conjunto de datos ordenados en cuatro porciones iguales, el equivalente a los percentiles 25, 50 y 75: • El primer cuartil Q 1 es el valor de l a variable que dej a a la izquierda el 25,0 % de l a distribución. • El segundo cuartil Q 2 , es el valor de la variable que deja a la izquierda el 50,0 % de la distribución; es el valor equivalente a la mediana del conjunto de datos. • El tercer cuartil Q 3 es el valor de la variable que deja a la izquierda el 75,0 % de la distribución. La fórmula general de los cuartiles para datos agrupados es: .

.

kn 4

Qk = Li +

(18)

.

- Ma w mc

Donde: L i = Límite inferior que contiene el cuartil-k. n = Número de observaciones. k = Cuartil. Ma = Frecuencia acumulada hasta antes de la clase del cuartil-k. mc = Frecuencia de la clase que contiene el cuartil-k. w = Amplitud del cuartil-k.

Bajo este contexto, NIST/SEMATECH (2012) menciona que para que esta medida de posición pueda ser empleada como método de i dentificación de datos

atípicos es necesario,

primeramente, calcular el rango intercuartil (IQ) —a partir de la diferencia entre el cuartil superior Q 3 (definido por el percentil 75) y el cuartil inferior Q 1 (definido por el percentil 25), es decir, Q 3 - Q 1 = IQ—, después, continuar con cada una de las siguientes premisas para calcular el intervalo que definirán a un valor como: • Muy atípico. Cuando el valor del dato anal izado es mayor a la suma del cuartil superior más 3,0 v eces el IQ (dato analizado > Q 3 + 3,0 IQ ), o m enor a l a diferencia del cuartil inferior menos 3,0 veces el IQ (dato analizado < Q 1 - 3,0 IQ). 313

• Algo atípico. Cuando el valor del dato analizado es mayor a la suma del cuartil superior más 1,5 v eces el IQ (dato analizado > Q 3 + 1,5 IQ ), o m enor a l a diferencia del cuartil inferior menos 1,5 veces el IQ (dato analizado < Q 1 - 1,5 IQ). • No atípico. Cuando el valor del dato analizado está comprendido entre la suma del cuartil superior más 1,5 v eces el IQ, y la diferencia del cuartil inferior menos 1,5 v eces el IQ (Q 1 - 1,5 IQ < dato analizado < Q 3 + 1,5 IQ). En otras palabras, un dato muy atípico es aquel con valor mayor a Q 3 + 3,0 IQ (MaL s ) o valor menor a Q 1 - 3,0 IQ (MaL i ); un dato algo atípico es aquel con valor mayor a Q 3 + 1,5 IQ (AaL s ) o valor menor a Q 1 - 1,5 IQ (AaL i ); y, un dato no atípico es aquel comprendido entre AaL i y AaL s . Con el fin de impulsar una mejor comprensión de l o antes expuesto, es conveniente citar el ejemplo trabajado en el subcapítulo anterior. De acuerdo con la Tabla 35, la columna Muestra contiene las categorías de ST elegidas por los sujetos durante la evaluación, la columna Muy atípico muestra los valores límite —calculados a par tir de la distribución de d atos ordenados contenidos en la columna anterior— que permiten clasificar a un dato como tal dependiendo si su valor es menor a MaL i o mayor a MaL s , la columna Algo atípico muestra los valores límite —calcu lados a partir de l a distribución de dato s ordenados contenidos en la primer columna— que permiten clasificar a un dato como tal dependiendo si su valor es menor a AaL i o mayor a AaL s , y, la columna ¿Es atípico? define si cada valor contenido en la primer columna es o no atípi co (muy atípico o al go atípico) respecto a la distribución total de datos que la contiene; esto, a par tir de su valor respecto a los limites definidos en las dos columnas anteriores. Como se puede observar, según este método, sólo los registros en los que se eligió la categoría de ST igual a 1 son algo atípicos, ya que su valor numérico es inferior a 1,5, mientras que el resto de datos son clasificados como atípicos.

314

Tabla 35. Identificación de datos atípicos a par tir del método Cuartil (Elaboración propia).

5.1.1.3. Jerarquía ponderada Este método de identificación de datos atípicos fue el que se eligió para determinar cuáles de los registros recabados en los estudios descritos en este documento eran irregulares respecto al resto de las observaciones obtenidas durante las encuestas de sitio y las pruebas experimentales. Como ya se ha mencionado, es un método de identificación de diseño propio propuesto en esta investigación de acuerdo con las características, los objetivos y los alcances aquí planteados. A diferencia de los dos métodos anteriores, éste, en particular, centra su atención en el significado propio que el fenómeno analizado en estos estudios (confort térmico) le otorga a cada una de las posibles respuestas (categorías subjetivas de ST) utilizadas para llevar a c abo el análisis correlacional, así como en la frecuencia con la que éstas se repiten en una misma evaluación —con igual o similar magnitud de variable física: TGN, TBS, HR y VV— y la proporción grupal que cada valor representa respecto al total de observaciones recabadas en esa evaluación. Con lo anterior, este método básicamente se basó en la medida estadística de la proporción, también conocida como frecuencia relativa, la cual, según Ruiz (2004), es una medida de resumen que consiste en el número de veces que se presenta un valor o característica respecto al total de l a muestra de la variable en es tudio; una pr oporción informa del tamaño que ti ene una parte de la muestra con relación a la totalidad de ella misma. Esta medida estadística cuenta con la ventaja de apl icarse en variables cualitativas. El dato c on mayor proporción se conoce como moda. Su fórmula general es:

(19) .

Pi =

xi n

Donde: x i = número observaciones de interés (número de veces que se repite un mismo valor en la muestra). n = Tamaño de la muestra (número total de observaciones). P i = Proporción ponderada que representa el valor respecto al total de observaciones.

En este sentido, para que l a proporción, como medida estadística, pudiera aplicarse como método de i dentificación de datos atípicos, fue necesario realizar algunos ajustes y aclarar ciertos términos de aplicación. Para ello, es importante mencionar que: • Los valores únicos de los que se conformó el universo de datos de cada muestra evaluada fueron del 1 al 7, ya que cada uno de ellos representó una categoría subjetiva de ST en el cuestionario correspondiente (ver Tabla 20 y Tabla 21, págs. 160 y 166, respectivamente).

315

• Consecuencia del punto anterior, el criterio que se adaptó para determinar qué datos debían ser considerados atípicos fue que e l resultado obtenido con la fórmula de proporción —aplicada a cada una de las observaciones que conformaban la muestra— debía ser inferior a 1/7 (o, lo que es lo mismo, a 0,1429) . Lo anter ior se determinó suponiendo un caso hipotético en el que, en el mejor de los casos, la muestra evaluada eligiera proporcionalmente cada una de l as posibles respuestas (de la 1 a l a 7), es decir, una evaluación en la que 1/7 del total de los sujetos eligieran la respuesta 1; otro 1/7, la respuesta 2; otro 1/7, la respuesta 3; y así, sucesivamente, hasta concluir con el total de las siete posibilidades de r espuesta. Esto permite vislumbrar que, en c ondiciones hipotéticamente homogéneas, el total de sujetos que podría elegir cualquiera de las siete alternativas de respuesta sería 1/7 del total de la población; lo que, en términos prácticos, podría traducirse como que el

segmento mínimo de l a muestra que podr ía elegir

cualquiera de las siete posibilidades de r espuesta —de ST contenidas en l os cuestionarios correspondientes— en condiciones reales de evaluación sería 1/7 de l os sujetos que conforman la muestra. • La identificación de dat os atípicos (primer paso de l a preparación de la base datos) se llevó a c abo por grupo (de sitio y de l aboratorio) ya que c ada uno de e llos contaba con una misma (o similar) magnitud de variable física, lo que permitió utilizarla como ventaja para identificar de forma rápida, eficiente y precisa, las observaciones atípicas respecto a las del resto del grupo. Con lo anterior y con el fin de permear una mejor comprensión del planteamiento y los criterios aplicados con este método de identificación, se cita nuevamente el ejemplo que se ha descrito en los dos subcapítulos anteriores, en el cual se detallan las respuestas obtenidas en una evaluación de sitio, con 21 observaciones y una gama de respuestas de ST comprendidas entre las categorías 1 y 5 (Tabla 36). En este sentido, la columna Muestra, al igual que en los casos anteriores, contiene las categorías de S T elegidas por los sujetos durante la evaluación y la frecuencia con la que cada una de ellas fue elegida; la columna Proporción aloja la proporción que cada una de l as categorías de ST elegidas representa respecto al total de observaciones recabadas en esa evaluación —a partir de la aplicación de la fórmula para calcular la proporción, descrita en la página anterior—; y, la columna ¿Es atípico? define si cada valor contenido en la primer columna es o no atípico respecto a la distribución total de datos que la contiene; esto, a partir de verificar si la proporción (P i ) de la categoría de ST a la que pertenece

316

s E

es inferior a 1/7 respecto al total de observaciones

obtenidas en esa evaluación. Como se puede observar, con este método fue posible obtener una consistencia más estricta de lo que podría considerarse un valor atípico, es decir, con este método se determinó que las observaciones que eligieron la categoría 5 (una observación), la categoría 2 (dos observaciones) y la categoría 1 ( dos observaciones) como respuesta, fueron clasificadas como atípicas respecto al total de observaciones comprendidas por la muestra, lo que per mitió realizar el procesamiento y análisis de datos sólo con las observaciones que eligieron la categoría 4 (ocho observaciones) y la categoría 3 (ocho observaciones) como respuesta en la Tabla 36. Identificación de datos atípicos a partir del método Jerarquía Ponderada (Elaboración propia).

evaluación, según las condiciones de temperatura, humedad relativa y velocidad de viento a las que se expusieron los sujetos de estudio.

Una vez identificados los datos atípicos, este mismo método permitió omitirlos (y no eliminarlos o sustituirlos) de la base de datos antes de procesarlos —con el fin de conservarlos como registro; no así, para incluirlos en el procesamiento—, a partir de la personalización de ciertas ecuaciones en Microsoft Excel®, programa base en el que se capturaron (digitaron), limpiaron (filtraron, proporcionó tratamiento), procesaron, graficaron y analizaron los datos recabados en los estudios de confort térmico practicados en sitio y en laboratorio. 5.1.2. Omisión de categorías de Sensación Térmica no representativas El segundo paso que caracterizó a la etapa Preparación de la base de datos (pág. 305), previo al procesamiento y al modelado de r esultados, fue l a omisión de categorías de ST no representativas, es decir, la no consideración de aquellos registros de una misma categoría de ST que, en conjunto, no representaban, por lo menos, el 5,0 % respecto al total de observaciones recabadas en un m ismo periodo de ev aluación. Lo anterior indica que, a diferencia de la omisión de datos atípicos que se llevó a cabo por grupo de evaluación, la omisión de categorías de ST no representativas se aplicó por periodo de estudio.

317

El umbral del 5,0 % como límite determinante para identificar las categorías de ST no representativas derivó, en cierta forma, del parámetro utilizado como intervalo de confianza (margen de error) durante el diseño de la muestra poblacional (ver Tamaño de la muestra, pág. 140), es decir, este porcentaje de población pudo c onsiderarse como el intervalo de amortiguamiento que per mitió definir el nivel de confianza (certeza) con el que s e presumiría que las respuestas dadas por la muestra evaluada estarían íntegramente en f unción de l a magnitud registrada de las variables analizadas. Con ello, fue posible asumir que la omisión de esas categorías de ST no figuraba como representativa en el total de la muestra considerada para el desarrollo del procesamiento de datos. No obstante, es importante dejar en claro que, en el caso particular de esta investigación donde la correlación de datos se llevó a cabo, como mero referente, a partir de diferentes métodos estadísticos (ver Métodos estadísticos univariables de correlación de datos, pág. 320), este filtro de limpieza de datos no siempre representó un beneficio en los resultados esperados, ya que, en tanto que con la aplicación del método de Medias por Intervalos de Sensación Térmica (pág. 333) este filtro, por lo general, permitía incrementar el coeficiente de determinación (r2), con el ejercicio de los métodos Regresión lineal simple (pág. 322) y Regresión lineal simple a partir de medias por categoría de Sensación Térmica (pág. 330), por lo general, el coeficiente de determinación mermaba y, por ende, la correlación entre los pares datos analizados figuraba más débil. Por lo anterior, en su momento se tornó incierta la decisión de aplicar o no este filtro durante la preparación de la base de datos para su procesamiento y modelado de resultados. De esta manera, anticipando que el método estadístico definitivo que se utilizó para el procesamiento de dato s en e sta investigación fue el de Medias por Intervalos de Sensación Térmica (pág. 333), este filtro se aplicó sólo en aquellos casos (análisis de datos por variable física analizada, periodo de evaluación y/o enfoque de estudio) en el que el coeficiente de determinación representaba mayor consistencia a partir de un valor próximo a la unidad. 5.1.3. Omisión de categorías de Sensación Térmica con mismo valor en variable física Como ya se ha anticipado, el procesamiento de datos y modelado de resultados de esta investigación se llevó a cabo a partir del método estadístico de Medias por Intervalos de Sensación Térmica (pág. 333), el cual, en términos generales, después de estimar el valor neutral de la variable física analizada (TBS, TGN, HR o VV) respecto a la ST percibida por la muestra blanco, se apoya de la desviación estándar (DS) para estimar los rangos de confort. 318

De acuerdo con Ruiz (2004), la desviación estándar, también conocida como desviación típica, es la medida del grado de di spersión de u n conjunto de datos 35 (variables cuantitativas, cantidades racionales o variables de intervalo) respecto a su valor promedio —medida en las mismas unidades que la variable analizada—; en otr as palabras, es la variación esperada respecto a la media aritmética. Se define como la raíz cuadrada de la varianza de la variable y puede ser influida significativamente por los valores atípicos. Ahora bien, para que un conjunto de datos pueda ser considerado como tal, se requieren de dos o más valores que conformen la base de datos a analizar, por lo que para poder calcular la DS es necesario contar con un conjunto de datos de, por lo menos, dos valores. Con ello, durante el análisis de datos de esta investigación se observó que, en casos aislados, parte de las respuestas de ST dadas por un único grupo a lo largo de todo el periodo de evaluación en sitio (cualquiera que éste fuera), eran referidas a una categoría extrema (por lo general: 1, 2, 6 ó 7) que no volvía a figurar más como parte de las respuestas de algún otro grupo en todo ese periodo de análisis, lo que implicaba que esa categoría de ST sólo contara, como dato par, con un único valor registrado de variable física para su análisis; en otras palabras, durante la conformación de la base de d atos fue posible identificar que ciertas categorías extremas de S T —elegidas aisladamente como respuesta a la percepción térmica de los sujetos durante la evaluación— contaban con un sólo valor de variable física en todo el periodo de estudio. De acuerdo con el procedimiento señalado por el método estadístico utilizado para el procesamiento de dat os (ver Medias por Intervalos de Sensación Térmica, pág. 333), el escenario anterior implicaba la posibilidad de obtener, sin problema alguno, el valor neutral de la variable física analizada respecto a la ST percibida por la muestra estudiada —ya que éste es resultado de la regresión lineal derivada del promedio (media aritmética) de las diferentes magnitudes registradas por variable física respecto a cada categoría de ST implicada en e se periodo de estudio—, no así, implicaba la posibilidad de estimar los rangos de confort (reducido y extenso), ya que, al contar con un único valor de variable física en una de las categorías de ST involucradas en el análisis de datos de ese periodo, no era posible calcular la DS de dicha variable en esa categoría —con el propósito de sustraerla y/o adicionarla a la media aritmética obtenida (una vez para obtener las regresiones lineales del rango de c onfort reducido y dos 35

Un conjunto de datos, también conocido como dataset, es una colección de datos normalmente tabulada que corresponde con el contenido de una matriz estadística (base de datos), donde cada columna representa una variable y cada fila un registro del conjunto de datos en cuestión (Sánchez, 2007).

319

veces para obtener las del rango de confort extenso)—, por lo que, Microsoft Excel® (programa en el que se llevó a cabo el procesamiento y el análisis de datos) interpretaba que los valores correspondientes a - 2 DS, - 1 DS, media, + 1 DS y + 2 D S (respecto a la media aritmética) de la variable física en esa categoría de ST eran idénticos, lo que originaba que, si bien la regresión lineal derivada de las medias fuera consistente, las regresiones lineales de - 2 DS y + 2 DS (límites del rango de confort extenso), y, - 1 DS y + 1 DS (límites del rango de confort reducido) fueran afectadas significativamente por los valores idénticos de esa categoría de ST, lo que se reflejaba en la merma del coeficiente de determinación para estos últimos casos. Lo anterior demando que estos casos aislados fueran, de igual forma, omitidos en la base de datos —previamente al procesamiento y análisis de datos por periodo—, con el fin de evitar inconsistencias o pos ibles errores de interpretación durante el modelado de r esultados: valor neutro y rangos de confort de la variable física analizada respecto a la ST percibida por la muestra en estudio. Es importante mencionar que durante el procesamiento de datos fue posible identificar que este filtro ofreció viabilidad de aplicación únicamente en el método estadístico de correlación univariable de Medias por Intervalos de Sensación Térmica (pág. 333) —al permitir mayor consistencia en el modelado de r esultados e incrementar el valor de l os coeficientes de determinación en cada una de las regresiones lineales trazadas durante el procesamiento y análisis de datos (- 2 DS, - 1 DS, media, + 1 DS y + 2 DS)—, ya que se observó que en los casos de los métodos estadísticos de Regresión lineal simple (pág. 322) y de Regresión lineal simple a partir de medias por categoría de Sensación Térmica (pág. 330), por lo general, la aplicación de este filtro afectaba negativamente al valor de los coeficientes de determinación y, por ende, ofrecía menor consistencia en los resultados obtenidos. 5.2. Métodos estadísticos univariables de correlación de datos Como se ha mencionado en los últimos subcapítulos, por cada periodo y enfoque de estudio fue posible generar una bas e de datos con la cantidad de obs ervaciones descrita en l a Tabla 19 (pág. 146), esto permitió recabar un total de 1 556 observaciones con los estudios de sitio y 968 con los estudios de laboratorio. Asimismo, como se ha d escrito al inicio de este capítulo, el procesamiento de datos se centró únicamente en la correlación de la ST y las variables físicas medidas durante la evaluación.

320

Para llevar a cabo la correlación y el análisis de datos se examinaron tres métodos estadísticos de correlación univariable —utilizados con mayor frecuencia en los estudios de confort térmico— y uno contenido en la normativa ANSI/ASHRAE 55 (2010: 11-12): • Correlación lineal simple. • Correlación lineal simple a partir de medias por categoría de sensación térmica. • Medias por intervalo de sensación térmica. • Método de la ANSI/ASHRAE 55 (método opcional para determinar las condiciones térmicas aceptables en espacios acondicionados naturalmente). Después de realizar el análisis de datos con cada uno de estos métodos fue posible identificar que el que ofrecía mayor consistencia en resultados, así como en el valor del coeficiente de determinación (y, por ende, en el del coeficiente de correlación), era el de Medias por Intervalos de Sensación Térmica (pág. 333) (ver Anexo XIII, pág. 695), ya que, además de ofrecer el valor de neutralidad de l a variable física analizada respecto a l a ST percibida por los sujetos estudiados, era posible obtener los rangos de c onfort (extenso y reducido) que, no necesariamente, eran concebidos equidistantes al valor de neutralidad (Bojórquez, 2010). En tanto, los métodos estadísticos de Regresión lineal simple (pág. 322) y Regresión lineal simple a partir de medias por categoría de Sensación Térmica (pág. 330), si bien, ofrecen el valor de neutralidad de la variable analizada y ciertos rangos de confort, estos últimos quedan a criterio del analista y por lo general se modelan equidistantes al valor de neutr alidad, ya que resultan del valor originado (en el eje de las abscisas) por la intersección de la regresión lineal y los niveles de ST 4,5 (para el límite superior del rango de confort) y 3,5 (para el límite inferior del rango de c onfort), según los trabajos de G onzález y Bravo (2003), o por la intersección de l a regresión lineal y los niveles de S T 5,0 y 3,0 ( para los límites superior e inferior del rango de confort, respectivamente), de acuerdo con Fanger (1972) 36 (ver Anexo XIII, pág. 695). Por otro lado, los posibles resultados ofrecidos con el Método de ANSI/ASHRAE 55 (pág. 331) se acotan a las zonas de confort térmico trazadas en e l diagrama detallado en la Figura 88 (pág. 332), el cual, de igual manera, considera rangos de confort equidistantes al valor térmico 36

Fanger consideró al confort térmico como el conjunto de condiciones bajo las que las personas eligen las tres categorías centrales de la escala y no sólo la neutral, es decir que pueden estar entre lo ligeramente fresco (- 1,0 en su escala de ST) y lo ligeramente caluroso (+ 1,0 en su escala de ST), con lo que trata de absorber así los posibles desajustes entre la realidad objetiva y la opinión subjetiva de las personas (Fanger, 1972).

321

neutral. Con este método sólo es posible estimar el valor neutral y los rangos de confort exclusivamente de la temperatura operativa para espacios ventilados naturalmente, a partir de la intersección de l a temperatura operativa interior y la temperatura promedio mensual del exterior (ver Anexo XIII, pág. 695). Este modelo, entre otras acotaciones, cuenta con la limitante de que sus resultados son producto de evaluaciones en las que la actividad desarrollada por los sujetos en estudio es meramente sedentaria, no obstante, los sujetos pueden hacer libre uso de la adaptación a par tir del ajuste de s u nivel de arropamiento que les permita solventar las diferencias térmicas en ambientes interiores y exteriores. Adicionalmente, fue po sible identificar que c on el método de Medias por Intervalos de Sensación Térmica (pág. 333) los resultados obtenidos eran consistentes independientemente de la sensación (térmica, hígrica o eólica) y la variable física (TBS, TGN, HR y VV) que s e correlacionaran, cuando con los otros métodos únicamente era posible obtener resultados aceptables en cuanto a lo térmico —es decir, la correlación de la ST (específicamente) respecto a las variables físicas analizadas—. Otra de las ventajas representativas del método estadístico seleccionado es que los límites de confort, además de no ser equidistante al valor de neutralidad, se ajustan periódicamente con base en l a aclimatación que l os individuos van adoptando a lo largo del año (ver Anexo XIII, pág. 695). A continuación se describe, en términos generales, cada uno delos métodos de correlación explorados para el análisis de datos, con principal atención en el método de Medias por Intervalos de Sensación Térmica (pág. 333). 5.2.1. Regresión lineal simple El análisis de regresión 37 lineal es una téc nica estadística utilizada para estudiar la relación entre variables. Se adapta a una variedad amplia de situaciones; en la investigación social, el análisis de regresión se utiliza para predecir un extenso rango de fenómenos, desde medidas económicas hasta diferentes aspectos del comportamiento humano. De acuerdo con Cardona et al. (2013), la utilización del modelo de regresión lineal en l os procesos relacionados con el análisis de datos 37

demanda el conocimiento objetivo e

El término regresión fue utilizado por primera vez como un concepto estadístico en 1877 por Sir Francis Galton, quien llevó a cabo un estudio que mostró que la estatura de los niños nacidos de padres altos tiende a retroceder o regresar a la estatura media de la población. Por lo tanto, la palabra regresión fue designada como el nombre del proceso general de predecir una variable a partir de otra (Cardona et al., 2013).

322

instrumentación de la relación funcional de variables, los coeficientes de determinación y de correlación y la prueba de hipótesis como pilares fundamentales para verificar e interpretar su significado estadístico en el intervalo de confianza determinado. El análisis de regresión lineal simple puede utilizarse para explorar y cuantificar la relación entre una variable dependiente (Y, endógena o criterio) y una v ariable independiente (X, exógena o predictora), así como para desarrollar una ecuación lineal con fines predictivos. Además, el análisis de r egresión lleva asociada una s erie de procedimientos de di agnóstico (análisis de l os residuos, puntos de i nfluencia) que informan sobre la estabilidad e i doneidad del análisis y que proporcionan pistas sobre cómo perfeccionarlo. Al respecto, Martínez (2005) menciona que en el caso de la regresión lineal simple, el análisis de la covariación entre una variable dependiente y una independiente supone la obtención de una ecuación lineal que expresa la relación entre ambas, ecuación que considera la ordenada en el origen y la pendiente de la recta que mejor se aproxime a los puntos. Se trata de encontrar la línea media que resuma o sintetice la dependencia entre la variable Y y la X, con la doble finalidad práctica de explicación o descripción causal de la variable dependiente y previsión de los valores futuros de Y para valores dados en X. Diagrama de Dispersión Con el trazado de un diagrama de di spersión (nube de pu ntos) es posible vislumbrar una i dea aproximada sobre el tipo de r elación existente entre dos variables (Figura 86); no obstante, éste también puede ser utilizado como una forma de cuantificar el grado de relación lineal existente entre esas variables (basta con observar el grado en el que la nube de puntos se ajusta a una línea recta).

Figura 86. Diagramas de dispersión resultantes de un análisis de regresión lineal simple (Elaboración propia con base en Cardona et al., 2013).

323

Estos diagramas indican que a m ayor dispersión existe menor grado o fuerza de asociación entre las variables; por tanto, cuando la relación es poco consistente o nula entre las dos variables, conocer el pasado referente a una de ellas no permite pronosticar las ocurrencias futuras de la otra. Ecuación de la Recta Para calcular matemáticamente la línea de regresión, Cardona et al. (2013) sugieren hacer uso de la ecuación de l a recta donde l a variable dependiente Y está determinada por la variable independiente X:

( 20) y = a + bx

Donde: a = ordenada en el origen (valor de Y donde la línea de regresión cruza el eje vertical). b = pendiente de la recta (representa qué tanto cambia la variable dependiente Y por cada unidad de incremento de la variable independiente X).

Asimismo, la ecuación para calcular la pendiente de la recta, también conocida como razón de cambio, es:

(21) .

b=

∆y ∆x

Tanto a como b son consideradas constantes numéricas porque para cualquier línea recta dada sus valores no cambian. En la Figura 87 es posible apreciar la representación gráfica de cada uno de los factores que intervienen en la ecuación de la recta, así como la obtención de los valores a los que aluden cada uno de ellos.

Figura 87. Representación gráfica de los factores a y b de la ecuación de la recta (Elaboración propia).

324

Modelo de Regresión Lineal Simple De acuerdo con Kelmansky (2010), el análisis de r egresión lineal simple permite obtener una función lineal de una variable independiente X a partir de la cual explicar o predecir el valor de una variable dependiente Y, es decir, permite la construcción de un m odelo matemático lineal que explica o r epresenta la dependencia entre una v ariable respuesta o dependi ente (Y) y la variable explicativa o i ndependiente (X). La estructura de la ecuación general del modelo de regresión lineal que describe la relación entre las dos variables es la siguiente:

(22)

y = α + βx + ϵ Donde: y = variable a predecir. α + βx = parámetros desconocidos a estimar. ϵ = error en la predicción de los parámetros.

En este modelo, los valores de la variable dependiente Y se encuentran relacionados linealmente con la variable independiente X más un e rror. El término de er ror explica la variabilidad en Y que no se puede explicar con la relación lineal. Según el autor mencionado, la variable respuesta (Y) siempre se grafica en el eje vertical, o eje Y, y la variable predictora (X) en el eje horizontal, o ej e X; el asunto consiste en ajustar una recta que represente al conjunto de datos de la mejor manera, para obtener la predicción de Y a partir de cualquier valor de X. Al respecto Cardona et al. (2013) mencionan que el análisis de regresión lineal simple tiene por finalidad predecir o estimar los valores de la variable dependiente (Y) a partir de la obtención de la función lineal de la variable independiente (X); y, para ello, existen medidas que permiten determinar el grado o fuerza de asociación con la que ambas variables se relacionan: coeficiente de determinación y coeficiente de correlación. Coeficientes de Determinación y de Correlación Una medida de ajuste que ha recibido gran aceptación en el contexto del análisis de regresión es el coeficiente de determinación (r2): el cuadrado del coeficiente de correlación (r). Se trata de una medida estandarizada que toma valores entre 0 y 1 (0 cuando las variables son totalmente independientes y 1 cuando entre ellas existe relación perfecta) y se encarga de medir la bondad de ajuste para una ec uación de r egresión (Kelmansky, 2010). Si se expresara al valor de r2 como porcentaje, se podría interpretar al coeficiente de determinación como el porcentaje de la 325

variación de los valores de l a variable dependiente que s e puede ex plicar con la ecuación de regresión (Levin y Rubin, 2004). El coeficiente de determinación es la principal forma en que se puede medir el grado o fuerza de asociación existente entre dos variables: X y Y. Martínez (2005) menciona al respecto que el coeficiente de determinación en una regresión lineal es la medida que r ecoge cómo la recta de r egresión ajustada resume o des cribe los datos; indica cuanto de la variación total en Y se debe a la variación de X. Con base en Kelmansky (2010), la ecuación general de la r2 puede expresarse como: (23)

Donde: 2 r = coeficiente de determinación.

Numerador = variación explicada. Denominador = variación total.

En tanto, Cardona et al. (2013) mencionan que el coeficiente de correlación es la segunda medida que se usa para describir qué tan bien explica una variable a la otra. El coeficiente de correlación de la muestra se denota por r y es la raíz cuadrada del coeficiente de determinación:

(24)

r = (signo de b) √r2 Donde: r = coeficiente de correlación. (signo de b) = relación directa (+) o inversa (-). 2 r = coeficiente de determinación.

En el caso de una relación lineal entre dos variables, el coeficiente de determinación y el de correlación permiten tener medidas de la intensidad de la relación. El coeficiente de determinación da una medida entre 0 y 1, mientras que el coeficiente de correlación da una medida entre -1 (fuerte asociación lineal negativa: a medida que aumentan los valores de una variable disminuyen los de la otra) y 1 (fuerte asociación lineal positiva: a medida que aumenten los valores de una variable aumentarán los de l a otra) 38. Para lograr mayor certidumbre de que el valor de estos 38

Cuando los valores de este estadístico se aproximen a 0 indica que entre las dos variables no existe asociación lineal y, en c onsecuencia, carece de s entido determinar el modelo y/o ecuación de regresión lineal (Kelmansky, 2010).

326

coeficientes es preciso, antes de calcular r2 y r se deben graficar los pares de datos con el fin de verificar que haya motivo por el cual deducir que la relación entre la variable independiente (X) y la dependiente (Y) es lineal y que el cálculo de los coeficientes es producto de la distribución ordenada del diagrama de di spersión. Los valores de r2 cercanos a 1 i mplican que la línea de regresión da un aj uste mejor con los datos, esto es, que las observaciones están mayormente agrupadas respecto a la recta; no obstante, si sólo se utiliza el coeficiente de determinación, no es posible concluir con precisión si la relación es estadísticamente significativa, esto se debe basar en consideraciones donde intervengan el tamaño de la muestra y las propiedades de la distribución muestral adecuada (Cardona et al., 2013). Un error que s e comete frecuentemente en l a interpretación de r2 es el de no reparar en e l tamaño de la muestra. El coeficiente de determinación lineal y el número de datos suelen variar de forma inversa, de tal manera que basta con considerar un número pequeño de observaciones para que r2 alcance un v alor próximo a l a unidad, sin que el lo evidencie la existencia de una marcada relación lineal entre dos variables (Martínez, 2005). La consideración únicamente de r2 para medir el grado de ajuste cuando se trabaja con muestras pequeñas conduce a errores graves al aceptar la dependencia lineal entre las variables X y Y, cuando posiblemente pudieran mantener una relación diferente. De acuerdo con Kelmansky (2010), las propiedades del coeficiente de correlación son: • La correlación, a diferencia de la pendiente b, trata a los valores X y Y en forma simétrica. • El valor del coeficiente de correlación muestral r, no depende de las unidades en que s e miden las variables y su valor está siempre entre -1 y 1. • A mayor valor absoluto de r, mayor el grado de asociación lineal. • r tiene el mismo signo que b. • Cuando r= 0 también b= 0, no hay una tendencia lineal creciente o decreciente en la relación entre los valores X y Y. • Los valores extremos, r= 1 y r= -1, ocurren únicamente cuando los puntos en un diagrama de dispersión caen exactamente sobre una recta. Esto corresponde a asociaciones positivas o negativas perfectas. • Valores de r cercanos a 1 o -1 indican que los puntos yacen cerca de una recta. • Valores de r positivos indican que hay una asociación positiva entre las variables. • Valores de r negativos indican que hay una asociación negativa entre las variables. 327

Aplicación del modelo Con base en l o anteriormente planteado y a partir del trazado del diagrama de di spersión generado por los pares de datos ordenados recabados en las encuestas (ST vs magnitud de variable física registrada: TBS, TGN, HR y VV) fue posible identificar que la relación existente entre las variables (dependiente e i ndependiente, respectivamente) era de ti po lineal directa (para el caso de la correlación de la ST con la TBS, TGN y VV) y lineal indirecta (para el caso de la correlación entre la ST y la HR). Como ya se ha descrito, en esta investigación las variables independientes (no manipulables) fueron, en general, las variables físicas del entorno de evaluación (TBS, TGN, HR y VV, para el caso de los estudios de confort térmico basados en el enfoque adaptativo; y, TBS y HR para el caso de los estudios de confort térmico desarrollados con base en el enfoque pr edictivo), mientras que las variables dependientes fueron los votos de c onfort dados por los sujetos de es tudio con base en l a escala de S T contenida en los cuestionarios aplicados. De esta manera, en atención a l o señalado por Kelmansky (2010) respecto a qu e la variable respuesta (Y, o variable dependiente) siempre se grafica en el eje vertical (eje Y u ordenadas), y la variable predictora (X, o v ariable independiente) en el eje horizontal (eje X o abscisas), es que, durante la correlación de datos a partir del modelo de regresión lineal simple, el diagrama de dispersión se generó a partir del trazado de los votos de confort de ST sobre el eje Y y las magnitudes de variable física sobre el eje X. Dado que el producto final de este tipo de estudios (confort térmico humano) no es conocer la respuesta de ST de l os sujetos a par tir de s u exposición a deter minada magnitud de v ariable física, si no estimar las condiciones óptimas y los rangos de tol erancia térmica a partir de la magnitud de cada una de las variables físicas que intervienen en la percepción térmica, es que fue necesario, por un lado, despejar a X de la función lineal obtenida por la recta de regresión y, por otro, dar a Y un valor igual a 4 (categoría de ST equivalente a confort térmico: ni calor ni frío) con el fin de obt ener, primeramente, el valor neutral de l a variable física analizada y, posteriormente, los rangos de c onfort con base en l a estimación de l os límites a par tir de valores de Y (ST) iguales a 3,5 y 4,5, según González y Bravo (2003), o, 3,0 y 5,0, según Fanger (1972). Con ello, fue posible identificar que el factor determinante que permitió analizar la consistencia de cada resultado y, por ende, el grado de relación entre ambas variables, fueron los coeficientes de 328

determinación (r2) y de correlación (r). De esta manera, Bojórquez (2010) menciona que la r2 sirve para identificar el grado de di spersión de l as respuestas dadas respecto a l as variables físicas registradas simultáneamente, por lo que con base en l os estudios de Bedford (1936, citado por Humpreys et al., 2007), Humpreys (1976), Auliciems (1981), Nicol et al. (1993), de Dear et al. (1997b), Bravo y González (2003), Nikolopoulou (2004), Ruiz (2007) y Gomez-Azpeitia et al. (2009), establece los siguientes rangos respecto al valor del coeficiente de determinación: • Si la r2 ≥ 0,9 la correlación es muy alta, por lo que hay certeza en la concentración de respuestas, la muestra no es dispersa. • Si 0,7 ≤ r2 < 0,9 se puede decir que la correlación es alta, la muestra es poco dispersa. • Si 0,5 ≤ r2 < 0,7 la correlación es media, la muestra tiene una concentración moderada. • Si la r2 < 0,5 la correlación es baja, con alto grado de dispersión en la muestra, por lo que no hay claridad en l a percepción de la ST de la muestra. En caso de que un valor de b (pendiente de la recta) presente una correlación baja, se considerara más apropiado el próximo inmediato con un valor de r2 de al menos una correlación media (0,5 ≤ r2 < 0,7). Con base en la aplicación de es te modelo durante el análisis de dato s, fue po sible identificar que una de las ventajas de este procesamiento es que es posible estimar el valor neutral y los rangos de confort de cualquier variable física analizada respecto a la ST percibida por los sujetos de estudio; es decir, los valores resultantes de neutralidad y de rangos de confort de la TBS, TGN, HR y VV (variables independientes) se observan consistentes respecto a s u correlación con la ST (variable dependiente) únicamente, no as í, respecto a su correlación respecto al resto de votos de c onfort recabados en los cuestionarios (sensación hígrica, preferencia térmica, preferencia hígrica, sensación eólica, preferencia eólica y aceptación personal) y analizados superficialmente como mero ejercicio (actividad ajena a los objetivos planteados en esta investigación que permitió llegar a la conclusión descrita). Adicionalmente, fue pos ible identificar dos desventajas significativas con la utilización de es te modelo de correlación en el análisis de datos: • El valor del coeficiente de determinación resulta por debajo de 0,5, lo que, en términos del confort térmico responde a una correlación baja y a un alto grado de dispersión en la muestra. • La estimación de los rangos de confort quedan a c riterio del analista y por lo general se modelan equidistantes al valor de neutralidad.

329

5.2.2. Regresión lineal simple a partir de medias por categoría de Sensación Térmica Conceptualmente, este método, utilizado también como referente para el análisis de datos en esta investigación, se basó en una mezcla de las características particulares del modelo de Regresión lineal simple (pág. 322) ya descrito y el concepto de m edias por categoría de S T propuestas en el método de correlación de Medias por Intervalos de Sensación Térmica (pág. 333). Por ende, este es un método estadístico de diseño propio —basado en métodos estadísticos de correlación lineal ya establecidos— propuesto como referente exploratorio en el análisis de datos de esta investigación. Este método fue aplicado tal como se utiliza el modelo de regresión lineal simple, con la única adecuación de que antes de graficar la totalidad de pares de datos recabados con la muestra de análisis (por periodo), éstos debían promediarse por grupo de estudio, de tal forma que sólo resultara un par de datos por grupo evaluado —independientemente de la cantidad de sujetos que éste haya alojado durante la evaluación—. Para ello, se obtenía la media aritmética de las categorías de ST percibidas por grupo de estudio y, posteriormente, se empataba con el valor de cada variable física registrada simultáneamente durante la evaluación, de tal forma que e l tamaño de la muestra analizada quedaba sujeta a la cantidad de grupos evaluados por periodo de estudio —ya que el promedio (media aritmética) de cada uno de ellos representaba la totalidad de datos obtenidos en ellos mismos—. El análisis de datos a partir de e ste método permitió identificar que, además de l ograr las mismas ventajas obtenidas con el empleo del modelo de regresión lineal simple, se conseguían algunas otras mejorías respecto a la consistencia de los resultados y el valor del coeficiente de determinación. En el caso particular de es te último, su valor se incrementaba a par tir de d os situaciones en particular: • Al ser producto de la media aritmética de las categorías ST y de la magnitud de variable física registrada simultáneamente durante la evaluación (por grupo), y no así, de l a totalidad y la diversidad de pares de datos obtenidos por grupo de evaluación. • El tamaño de la muestra final analizada y graficada quedó limitada a la cantidad de grupos evaluados en c ada periodo de es tudio, por lo que al analizar una muestra de menor tamaño la r2 incrementa su valor (error que se comete frecuentemente en la interpretación de r2, según Martínez (2005), ya que el coeficiente de determinación lineal y el número de datos suelen variar de forma inversa). 330

5.2.3. Método de ANSI/ASHRAE 55 La normativa ANSI/ASHRAE 55 (2010) cuenta con un método opcional para determinar las condiciones térmicas aceptables en espacios acondicionados (ventilados) naturalmente 39. Según esta norma, diferentes experiencias de campo han dem ostrado que l as respuestas térmicas de l os ocupantes en di chos espacios dependen, en par te, de l as condiciones climáticas exteriores, por lo que podrían diferir de las respuestas térmicas obtenidas en edificios donde el acondicionamiento se da a partir de sistemas de aire acondicionado y/o calefacción principalmente, ya que el nivel de arropamiento, la disponibilidad de controles y la variación en las expectativas de los ocupantes son distintos en cada uno de los casos. Es por ello que este método también fue utilizado como referente para el análisis de datos de esta investigación. Según ANSI/ASHRAE 55 (2010), para estar en condiciones de aplicar este método, el espacio debe estar equipado con ventanas operables que abran al exterior y puedan ser de operación fácil (apertura y ajuste) por los ocupantes del espacio. No debe haber algún sistema mecánico de enfriamiento en el espacio (por ejemplo aire acondicionado, enfriamiento radiante o enfriamiento desecante). Es posible utilizar ventilación mecánica sin aire acondicionado, sin embargo, la apertura y el cierre de ventanas debe ser el medio para regular las condiciones térmicas del espacio; adicionalmente, es posible proveer al espacio con un s istema de c alefacción, no obstante, este método no aplica en tanto éste se encuentre en funcionamiento. Sólo aplica en espacios en donde los ocupantes están dedicados actividades físicas cercanas a la sedentaria (con tasas metabólicas en el rango de 1,0 met a 1,3 met) y cuentan con libertad para adaptar su nivel de arropamiento que les permita solventar las condiciones térmicas de interiores y/o exteriores. Con el diagrama siguiente (Figura 88) es posible determinar la temperatura operativa interior permisible en los espacios que cubren con las características anteriormente señaladas. Este diagrama presenta dos zonas de confort térmico: una que marca las condiciones aceptables para el 80,0 % de sujetos y otra que marca las del 90,0 % de ellos. Los umbrales que limitan a la zona de confort térmico con condiciones aceptables para el 80,0 % de sujetos son para aplicaciones cotidianas y debe ser utilizado cuando no haya disponibilidad de información adicional; en tanto, es posible utilizar los límites de la zona de confort térmico con condiciones aceptables para el 90,0 % de sujetos cuando se desea una mayor precisión de confort térmico. 39

Para efectos de esta norma, este tipo de e spacios son aquellos en dond e las condiciones térmicas son reguladas (controladas) principalmente por los ocupantes a través de la apertura o el cierre de ventanas (ANSI/ASHRAE 55, 2010).

331

Figura 88. Rangos aceptables de temperatura operativa para espacios acondicionados naturalmente (ANSI/ASHRAE 55, 2010).

Este diagrama está basado en un m odelo adaptativo de confort térmico derivado de una bas e de datos de 21 000 o bservaciones recabadas, principalmente, en edi ficios de oficinas. Los rangos de tem peratura aceptable (zona de c onfort) alrededor del valor óptimo para edificios acondicionados naturalmente se especifican como de ± 3,5 °C para el 80,0 % de aceptación y de ± 2,5 °C para una aceptación del 90,0 %. Los límites de la temperatura operativa permisible no deben ser extrapolados a áreas (arriba, abajo o a los lados) fuera de los límites marcados; por ejemplo, si la temperatura promedio mensual en exteriores es inferior a 10,0 °C o superior a 33,5 °C, este diagrama no debe ser usado. El diagrama considera los efectos de la falta de confort térmico local en edificios típicos, por lo que no es necesario incluir estos factores cuando es utilizada esta opción; asimismo, considera la adaptación de l a ropa de l as personas en l os espacios acondicionados naturalmente para relacionar el rango de confort térmico interior con el clima exterior, por lo que no e s necesario estimar los valores de la ropa usada en el espacio. De igual forma, los límites de la humedad relativa y la velocidad del viento no son necesarios con el empleo de este método.

332

5.2.4. Medias por Intervalos de Sensación Térmica El método estadístico de correlación de Medias por Intervalos de S ensación Térmica (MIST), planteado por Gómez-Azpeitia et al. (2007c), fue desarrollado con base en la propuesta de Nicol (1993) para climas asimétricos 40, la cual, en t érminos generales, consiste en utilizar la estadística descriptiva en la estimación de un valor neutral de temperatura (considerado de confort). Con ello, con el MIST se pretende estimar, por un lado, el valor neutral de la variable física analizada a partir de la ST percibida por los sujetos de estudio —apoyado en la regresión lineal simple derivada de las medias aritméticas obtenidas de las diferentes magnitudes de variable física registradas en c ada categoría de ST, por periodo de e studio—, y, por otro, los rangos de confort —con base en las regresiones lineales derivadas de la suma y la sustracción, a la media aritmética, de una y dos veces la desviación estándar (DS) de los datos analizados por categoría de S T— que, por lo general, resultan no e quidistantes (asimétricos) al valor de neutralidad de la variable física analizada. En la Figura 89 se puede apreciar un di agrama general del análisis de datos con el método estadístico de correlación univariable en mención y su adaptación en esta investigación.

Figura 89. Diagrama general del procesamiento de datos a partir del método estadístico del MIST y su adaptación a esta investigación (Elaboración propia con base en Bojórquez, 2010). 40

De acuerdo con este autor, los climas asimétricos hacen referencia a aquellos en donde los límites de c onfort térmico no son equidistantes a la temperatura óptima de confort; es decir, son aquellos climas en donde los rangos de confort térmico son asimétricos (desproporcionales) entre sí a partir de la temperatura neutra.

333

Como ya se mencionó en subcapítulos anteriores, este método de c orrelación es el que se seleccionó para llevar a c abo el análisis de datos en esta investigación, por lo que a continuación se describirá a deta lle (paso a paso) cuál es el procedimiento que adopta para lograr el valor neutral y los rangos de confort a partir de la ST percibida por los sujetos de estudio. De acuerdo con el diagrama anterior (Figura 89), el procedimiento de correlación estadística que s e siguió para el análisis de los datos recabados en los estudios (sitio y laboratorio) de esta investigación fue el siguiente: 1. Generación de una base de datos por periodo a partir de la captura o la digitación de los datos recabados en l os cuestionarios en c ada una de l as evaluaciones llevadas a c abo, tanto en s itio como en l aboratorio. Para ello, se siguió cautelosamente lo descrito en el subcapítulo Proceso de captura de respuestas (pág. 171) relativo a l a posición de cada variable (columna) respecto a la de cada observación recabada (fila). No obstante, como se mencionó al inicio de este capítulo, con el fin de atender los objetivos y los alcances planteados en esta investigación, sólo fueron procesados los datos de S T percibida respecto a la magnitud de TBS, TGN, HR y VV registrada simultáneamente durante la evaluación, por lo que a c ada una de l as observaciones recabadas (voto de c onfort y variables físicas registradas) se le denomino Respuesta de Sensación Térmica Percibida (RSTP). 2. Agrupación de las RSTP a partir de la categoría de ST registrada en el formato del cuestionario. Lo anterior debía realizarse por periodo de estudio, de tal forma que al cabo de éste, se obtuvieran, al menos, un total de 120 observaciones 41 consistentes, aunque lo recomendado era un muestreo mayor con el fin de contar con las RSTP suficientes después de llevar a cabo la limpieza de datos. Cada una de la RSTP fue agrupada o estratificada con base en las categorías de ST definidas en la Tabla 20 (pág. 160) y la Tabla 21 (pág. 166) adaptadas y utilizadas en los formatos de cuestionarios aplicados en las evaluaciones. 3. Preparación de la base de datos a partir de los tres filtros especificados en el subcapítulo Preparación de la base de datos (pág. 305): a) tratamiento de datos atípicos, b) omisión 41

De acuerdo con la experiencia adquirida por diversas investigaciones de campo a nivel local (Gómez- Azpeitia et al., 2009; Bojórquez, 2010; Ruiz, 2011), en donde se ha utilizado el método de MIST como modelo de correlación para llevar a cabo el análisis de datos recabados en los estudios de confort térmico, se ha determinado que el método requiere, por lo menos, de 120 observaciones (en total, y no por categoría de ST) para que sus resultados puedan ofrecer valores consistentes y puedan ser considerados como válidos (Información obtenida con base en conversaciones privadas con el Dr. Bojórquez).

334

de categorías de ST inferiores al 5,0 % de representatividad, y, c) omisión de categorías de ST con mismo valor en variable física; éste último, sólo cuando se desarrollan estudios de confort térmico de forma grupal y el registro simultáneo de la variable física es única para todo el grupo evaluado. Este procedimiento se realizó con el fin de limpiar la base de datos de cualquier dato atípico o conjunto de datos irregulares que pudieran afectar significativamente, de forma negativa, tanto el procesamiento de datos, como el modelado de los resultados esperados para el valor de neutralidad y los rangos de confort. 4. Cálculo de la media aritmética y de la DS por categoría de ST, tal como a continuación se describe: a) Se calculó la media aritmética (llamada promedio en Microsoft Excel®), por estrato, de los datos pares a cada categoría de ST, es decir, de las diversas magnitudes de variable física (TBS, TGN, HR y VV) contempladas en cada categoría de S T involucrada en el análisis de datos del periodo en estudio. Con esto, fue posible obtener los datos medios de l a variable física analizada que, apar eados con la categoría de ST correspondiente, permitirían generar los puntos de di spersión necesarios para lograr la regresión lineal buscada (y sus respectivos parámetros: pendiente de la recta y ordenada en el origen) que per mitiría estimar el valor de neutralidad de la variable física analizada. b) Se calculó la DS de forma individual por categoría de ST, a partir de los datos pares (magnitudes de variable física) contemplados en cada grupo estratificado. c) Se adicionó y sustrajo una y dos veces, respectivamente, la DS de l a media aritmética obtenidas por categoría de ST. Lo anterior permitió calcular los datos pares (de variable física) para obtener los puntos de di spersión requeridos en el trazado de las regresiones lineales necesarias para estimar los valores límite (inferior y superior) de los rangos de confort buscados (reducido y extenso). 5. Con base en los datos pares calculados en el paso anterior respecto a cada categoría de ST, se procedió a trazar las siguientes regresiones lineales simples (RLS): a) Regresión lineal simple a partir de los datos resultantes al adicionar dos veces la DS a la media aritmética (RLS + 2 DS) para obtener el valor del límite superior del rango de confort extenso.

335

b) Regresión lineal simple a partir de los datos resultantes al adicionar 1 vez la DS a la media aritmética (RLS + 1 DS) para obtener el valor del límite superior del rango de confort reducido. c) Regresión lineal simple a partir de medias aritméticas (RLS media) para obtener el valor de neutralidad de la variable física analizada. d) Regresión lineal simple a partir de los datos resultantes al sustraer 1 vez la DS a la media aritmética (RLS - 1 DS) para obtener el valor del límite inferior del rango de confort reducido. e) Regresión lineal simple a partir de los datos resultantes al sustraer 2 veces la DS a la media aritmética (RLS - 2 DS) para obtener el valor del límite inferior del rango de confort extenso. 6. Estimación de los valores correspondientes a la neutralidad y a los límites de los rangos de confort (reducido y extenso) de l a variable física analizada, a par tir de l a abscisa resultante (valor de X) por el cruce de l a regresión lineal respectiva y la ordenada 4 (categoría de ST equivalente a c onfort térmico: ni calor ni frío) en el diagrama de dispersión. La obtención de c ada uno de es tos valores se llevó a c abo de l a siguiente manera: a) El valor de neutr alidad se logró de la abscisa resultante por el cruce de la RLS media —derivada de los puntos obtenidos entre las medias de variable física y las categorías de ST implicadas en ese análisis— con el nivel 4 de ST. b) Los rangos de confort se establecieron mediante la adición y sustracción de una y dos veces la DS de la muestra, tal como a continuación se describe: • Rango de confort extenso. 1) El límite inferior del rango de confort extenso se obtuvo de la abscisa resultante por el cruce de la RLS - 2 DS —derivada de los puntos resultantes entre los valores generados por la sustracción de dos DS a las medias de variable física analizada y las categorías de ST implicadas en el análisis— con el nivel 4 de ST. 2) El límite superior del rango de confort extenso se obtuvo de la abscisa resultante por el cruce de l a RLS + 2 DS —derivada de los puntos resultantes entre los valores generados por la adición de dos DS a las medias de v ariable física analizada y las categorías de ST implicadas en el análisis— con el nivel 4 de ST.

336

• Rango de confort reducido. 1) El límite inferior del rango de confort reducido se obtuvo de la abscisa resultante por el cruce de l a RLS - 1 DS —derivada de los puntos resultantes entre los valores generados por la sustracción de una DS a las medias de variable física analizada y las categorías de ST implicadas en el análisis— con el nivel 4 de ST. 2) El límite superior del rango de confort reducido se obtuvo de la abscisa resultante por el cruce de l a RLS + 1 DS —derivada de los puntos resultantes entre los valores generados por la adición de una D S a las medias de v ariable física analizada y las categorías de ST implicadas en el análisis— con el nivel 4 de ST. Con lo anterior, es posible interpretar que el rango de confort extenso es el resultado del cruce de las regresiones lineales ± 2 DS con el nivel 4 de ST en el diagrama de dispersión; en tanto, el rango de confort reducido queda comprendido por el cruce de las regresiones lineales ± 1 DS con el nivel 4 de ST. 7. Obtención de los coeficientes de determinación (r2) y las ecuaciones lineales (y = a + b x) resultantes por cada regresión lineal simple trazadas. De acuerdo con Bojórquez (2010), con el fin de validar el modelo, es posible considerar como determinante el valor de la r2 de la RLS media, según la clasificación mencionada por el mismo autor y descrita en el apartado Aplicación del modelo (pág. 328). 8. Análisis fenomenológico (o circunstancial) de cada valor resultante obtenido con el apoyo de las gráficas y las tablas generadas a partir de las bases de este método de correlación. Adicionalmente, se realizó un análisis de cada una de las líneas de regresión simple con el fin de visualizar la adaptación subjetiva de la muestra estudiada. Este procedimiento se realizó por variable física analizada (TBS, TGN, HR y VV), por periodo de evaluación (frío, seco, caluros y húmedo; enero, marzo, mayo y septiembre, respectivamente) y por enfoque de estudio (adaptativo y predictivo) atendidos en esta investigación. El desarrollo del método de M IST se cimenta en l as bases que consolidan al enfoque d e adaptación, mismo que implica la interacción de v ariables físicas y biológicas (clima, metabolismo, aislamiento térmico) a l a vez que ps icológicas (adaptación, experiencia, expectativa, tolerancia, deseo). Por ello, según Brager y de Dear (2003), la sensación de confort varía de individuo a individuo, de localidad a localidad, e incluso de estrato sociocultural a otro. En este sentido, la variabilidad regional y estacional de la magnitud del rango de confort es más 337

congruente con el enfoque adaptativo que la hipótesis convencional de aplicar una amplitud fija a una temperatura neutra, aunque ésta sea variable. De acuerdo con el enfoque de adaptación ambos parámetros debían ser variables (Bojórquez, 2010). La diferencia principal del método de MIST respecto al método convencional (ver Regresión lineal simple, pág. 322) es que antes de obtener la línea de regresión que caracteriza a la muestra estudiada, las observaciones que coinciden en categoría de ST se agrupan por estratos con el fin de calcular la media aritmética y la desviación estándar de s us datos pares —los cuales corresponden con las magnitudes de variable física registradas simultáneamente al voto de confort durante las evaluaciones—. Así, la regresión lineal no se hace a partir de todos los pares de datos de la muestra, sino sólo con los valores medios (y la adición y sustracción de una y dos veces la DS a ésta) de cada categoría de ST involucrada en el análisis. El objetivo de este procedimiento es determinar el valor medio de la variable física analizada (TBS, TGN, HR y VV) de todas las respuestas comprendidas en cada categoría de ST; de esta manera, se calcula el valor promedio de las diversas magnitudes de variable física registradas (durante el periodo de estudio) cuando los sujetos manifestaron sentirse en confort, así como de quienes expresaron sentir calor o frío en cada una de las categorías previamente establecidas. En el caso de distribuciones asimétricas —es decir, donde la media se carga significativamente a uno de los extremos del grupo de datos y no refleja el punto medio de la muestra—, se recomienda utilizar la mediana y por lo tanto la DS a la mediana (Bojórquez, 2010). La desviación estándar se emplea como una medida de la dispersión de las respuestas y, por lo tanto, sirve para determinar los estratos en que se pueden ordenar éstas. Según Reynaga (2011), se estima que par a datos normalmente distribuidos, el rango de ± 1 D S incluye al 68,26 % de las respuestas dadas por los sujetos de estudio, el rango de ± 2 DS incluye al 95,45 % de ellas, y, el rango de ± 3 D S incluye al 99,74 % (Figura 90). Para datos no distribuidos normalmente este porcentaje puede v ariar, por lo que s e recomienda obtener el mayor número de respuestas en los estudios de campo para lograr una distribución normal. De esa forma se obtuvieron gráficas por variable física analizada, por periodo de evaluación y por enfoque de estudio. La intersección de cada una de las líneas de regresión con la ordenada cuatro determinaron el valor de neutralidad y de los rangos de confort según el método MIST. Para llevar a cabo el procedimiento anteriormente descrito, se desarrolló una hoja de cálculo en Microsoft Excel®. 338

Figura 90. Rangos de la desviación estándar para datos normalmente distribuidos (Elaboración propia con base en Reynaga, 2011).

Las ventajas observadas con la aplicación de este método estadístico de correlación, las cuales, paralelamente, permitieron determinar que éste sería el método a emplear para el desarrollo del análisis de datos recabados en los estudios contemplados en esta investigación, fueron: • Ofrece mayor consistencia en resultados y mayor valor en el coeficiente de determinación (y, por ende, en el coeficiente de correlación). • Además de estimar el valor de neutralidad (respecto a la ST percibida por los sujetos en estudio), es posible conocer los valores límite de dos rangos de confort: a) Reducido. Considera al 68,26 % de las RSTP obtenidas en los estudios. b) Extenso. Involucra al 95,45 % de los sujetos evaluados. • Por lo general (no siempre), la estimación de am bos rangos de confort (reducido y extenso) resulta no equidistante al valor de neutralidad. Se observó que este aspecto adquiere importancia cuando el total de las categorías de ST, percibidas en un periodo de estudio, no figuran como simétricas a ambos lados de la número cuatro —después de la preparación de l a base de datos — 42. Por ejemplo, cuando las categorías de ST resultantes de un periodo de estudios son 3, 4, 5 y 6, se observa que el total de ellas son cuatro, una ubicada por debajo del nivel de ST 4 y dos por encima de éste, lo que implica 42

Cuando las categorías finales de ST, obtenidas en un periodo de estudio, resultan con una distribución uniforme a ambos extremos del nivel cuatro —es decir, del nivel dos al nivel seis en la escala de ST, por ejemplo—, los valores de los rangos de confort (reducido y extenso) resultan equidistantes al valor de neutralidad; no obstante, cuando no hay una distribución uniforme de éstas respecto al nivel cuatro, los rangos de confort no resultan equidistantes.

339

que los rangos de confort en este caso no serían equidistante al valor de neutralidad; caso contrario sería si las categorías de ST resultantes de ese mismo periodo de estudio fueran 2, 3, 4, 5 y 6, donde dos de ellas se ubican por debajo del nivel de ST 4 y dos por encima de éste, lo que implicaría rangos de confort equidistantes al valor de neutralidad. • De acuerdo con Bojórquez (2010), el valor de la r2 de la RLS media es el factor determinante que permite validar la consistencia de los resultados y del método propiamente —según la clasificación mencionada por el mismo autor y descrita en el apartado Aplicación del modelo (pág. 328)—. De esta manera, si se observa que la RLS media es producto de los valores medios obtenidos con los datos pares de las categorías de ST involucradas en el análisis, el valor de la r2 de ésta siempre se aproximará a la unidad y será superior a las r2 de las RLS - 2 DS, - 1 DS, + 1 DS y + 2 DS. • Una situación observada específicamente en esta investigación respecto al método de MIST, es que es posible una interpretación fenomenológica más precisa con éste; por ejemplo, cuando la r2 es mayor en los límites inferiores de los rangos de confort (es decir, las r2 de la RLS - 1 DS y de la RLS - 2 DS) se puede interpretar que hay mayor adaptación por parte de l os sujetos a baj as temperaturas (inferiores a la Tn) que a l as superiores, lo que justificaría los requerimientos de calentamiento en el periodo estudiado. Adicionalmente, esto se puede comprobar gráficamente (a partir de una interpretación fenomenológica) al observar, en un c aso como estos, la concentración de par te de l a nube de pu ntos en l as categorías de ST que t ienden a l o caluroso (de la 5 a la 7) y la dispersión del resto de ella en las categorías de ST que tienden a lo frío (de la 1 a la 3); lo que indica que, en tér minos fenomenológicos, a m ayor concentración, menor rango de adaptación, y, a mayor dispersión, mayor rango de adaptación. No obstante, al igual que el resto de m étodos analizados, fue pos ible identificar que es te método estadístico también cuenta con ciertas desventajas respecto a la forma de correlación de datos y modelado de resultados. En términos generales, las desventajas observadas fueron: • Las RLS (media, + 2D, + 1 DS, - 1 DS, - 2 DS) son producto de una muestra reducida (máximo siete pares de datos, el equivalente a las siete categorías de ST), lo que implica, según Martínez (2005), un error en la interpretación de la r2 resultante, en virtud de que el coeficiente de determinación lineal y el número de datos suelen variar de forma inversa, de tal manera que basta con considerar un número pequeño de observaciones para que r2

340

alcance un valor próximo a la unidad, sin que ello evidencie necesariamente la existencia de una marcada relación lineal entre las dos variables; por lo que, en términos estadísticos, se recomienda que las RLS sean producto de una muestra significativa 43. • El valor de l a r2 resulta elevado en c ada una de las RLS (media, + 2D, + 1 D S, - 1 DS, - 2 DS) porque éstas son producto de valores medios y la sustracción y adición de DS, respectivamente, lo que implica que el valor de la r2 no sería el mismo si las RLS fueran producto del total de pares de datos considerados en la nube de puntos. • El modelo de regresión lineal simple no s iempre aplica adecuadamente en l os puntos obtenidos para el trazo de las RLS ± 1 DS y/o ± 2 DS en los diagramas de dispersión, ya que, en ocasiones, se puede observar una clara tendencia curva —cóncava a los puntos que originan la RLS media— (y no recta) entre los puntos graficados, lo que i ndica que posiblemente debería trazarse algún otro tipo de l ínea de tendenc ia que per mita una regresión más adecuada a la dispersión de los puntos (en cada caso). • Cuando en una categoría de ST los valores pares —correspondientes a las diferentes magnitudes de variable física analizada (o variable independiente)— son próximos entre sí o se ubican en un mismo punto (por lo general, en las categorías de ST extremas), las líneas de regresión suelen distorsionarse —respecto al resto de valores pares de cada categoría de ST involucrada en esa regresión— y alterar significativamente los resultados esperados. 5.3. Métodos estadísticos para ajustar los resultados de distintas bases de datos Como ya se mencionó, entre los Objetivos específicos (pág. 15) de esta investigación estuvo la estimación del confort térmico a partir de cada uno de l os enfoques de estudio con los que se llevaron a cabo las evaluaciones en sitio y las pruebas de laboratorio. Esta estimación se realizó a partir del método estadístico de MIST de forma individual; no obstante, otro de los objetivos específicos plateados para esta investigación fue: “Comparar los valores de neutralidad y los rangos de confort obtenidos (...) a partir de la aplicación metodológica del enfoque adaptativo a la luz de los resultados estimados con la aplicación del enfoque predictivo (...)”, lo que demandó la confrontación y el análisis de cada par de resultados obtenidos por variable física analizada y periodo de evaluación.

43

La consideración únicamente de la r2 para medir el grado de ajuste cuando se trabaja con muestras pequeñas conduce a errores graves al aceptar la dependencia lineal entre las variables X y Y, cuando posiblemente pudieran mantener una relación diferente (Martínez, 2005).

341

Adicionalmente, el siguiente objetivo específico refirió a “(...) ajustar a un valor único de neutralidad y de rangos de confort los resultados de temperatura de bulbo seco y humedad relativa obtenidos, de forma individual y por periodo de evaluación, por cada enfoque de estudio abordado (...)”, por lo que fue necesario explorar diferentes modelos estadísticos que permitieran, por un l ado, empatar las bases de datos obtenidas desde enfoques metodológicos distintos, y, por otro, obtener un ajuste de resultados consistente con la jerarquía de la muestra analizada, en cada caso, por cada uno de los enfoques de estudio. Para ello, se analizaron detalladamente los procedimientos estadísticos y los alcances de dos métodos específicamente: metaanálisis y media ponderada. Asimismo, se exploró una tercera alternativa (propuesta en esta investigación) cuyo análisis de datos se centraba, básicamente, en anal izar como un todo el total de datos obtenidos por ambos enfoques de estudio —en cada periodo de evaluación—, es decir, unificar ambas bases de datos en una m atriz única y aplicar el mismo procesamiento estadístico propuesto por el método de MIST. Si bien, el valor de neutralidad y los rangos de c onfort obtenidos para cada variable física y por periodo de ev aluación resultaban próximos a l os obtenidos de for ma individual por cada enfoque de es tudio, los resultados mostraban ciertas inconsistencias al adquirir un valor, en ocasiones, fuera del rango generado entre el resultado obtenido por el enfoque adaptativo y el obtenido por el enfoque predictivo. 5.3.1. Metaanálisis Según Marín, Sánchez y López (2009), las alternativas que per miten el desarrollo adecuado de una revisión de la investigación (conocimiento) 44 son numerosas, por lo que los resultados y las conclusiones de ésta pueden verse influenciadas según la metodología con la que se conduzca. En este sentido, el metaanálisis aporta una metodología sistemática, objetiva y científica para la revisión cuantitativa de un conjunto de investigaciones primarias sobre una temática común. 44

Las alternativas comúnmente practicadas son dos (Marín, Sánchez y López, 2009):

342

a)

Tradicional. Cuando durante la revisión de los estudios no son detalladas las decisiones adoptadas en las distintas fases del proceso (definición del problema de investigación, búsqueda de información, selección de la literatura o los trabajos de apoyo, codificación de la información recabada, etc.), por lo que el trabajo del investigador se desarrolla con base en su criterio, sin detallar la metodología aplicada. La principal limitación de esta alternativa es que el resultado se sesga por la experiencia y la perspicacia del investigador, sus opiniones personales, preferencias, creencias previas y el estilo personal con el que aborda la revisión.

b)

Sistemática. Cuando durante la revisión de los estudios se aclara detalladamente cada una de las decisiones y los procedimientos aplicados en las distintas fases del proceso (criterios de i nclusión y exclusión de estudios, estrategias de bús queda de la literatura, procedimientos para la codificación de l a información y tipo de análisis aplicado). De esta forma se garantiza la transparencia de la revisión y la posibilidad de que sea replicada por otros investigadores.

Los metaanálisis 45 son revisiones sistemáticas en las que se aplican técnicas estadísticas para el análisis cuantitativo de l os resultados de un c onjunto de es tudios dirigidos a un tem a común 46. La principal aportación de este método es el análisis estadístico (por el tamaño del efecto, generalmente) de los resultados cuantitativos derivados de los estudios, al considerar que constituyen la parte más objetiva de las investigaciones (Giménez, 2012). Al respecto, Clark (1988) menciona que el metaanálisis constituye una estrategia estructurada de revisión de la literatura científica que, en su producto final, contiene elementos cualitativos y cuantitativos; es decir, por un lado, la revisión evalúa los aspectos de la calidad metodológica de los estudios considerados y, por otro, a través de diferentes técnicas matemáticas, permite combinar los resultados numéricos de múltiples trabajos. Además, es particularmente útil cuando los resultados en los diferentes estudios sobre el mismo tema son controversiales en cuanto al establecimiento de l a magnitud de al gún problema o l a dirección del efecto de u na solución donde el tamaño de la muestra es pequeño y no suficiente para demostrar la hipótesis de trabajo, o bien, cuando la realización de ciertas investigaciones no es factible porque se requieren muestras grandes de sujetos, costos altos o tiempo de duración largo. De acuerdo con Marín et al. (2007), los metaanálisis se desarrollan a través de una s erie de etapas claramente establecidas, lo que l es permite adoptar el carácter de sistemáticas, objetivas y científicas. En términos generales, esas etapas son las siguientes: 1. Formulación del problema. Delimitación del problema (objeto de la revisión) y definición de las variables y de l os conceptos implicados. El problema de i nvestigación determina los objetivos del metaanálisis y las características de s elección de los estudios que se incluirán en la revisión 47. 2. Búsqueda de la literatura. Definición de l os criterios de s elección que permitan elegir imparcialmente los estudios empíricos de l os cuales se obtendrán las bases de datos a utilizar en el desarrollo del metaanálisis (entre otros, temporalidad de realización, diseño 45

El metaanálisis tiene sus orígenes en la psicología y las ciencias sociales; Glass introdujo el término en 1976 y lo definió como "el análisis de los análisis" o "el análisis de una colección amplia de análisis de resultados de estudios individuales, con el objetivo de integrar los hallazgos" (Clark, 1988).

46

Esto implica que aunque todos los metaanálisis son revisiones sistemáticas, no todas las revisiones sistemáticas incluyen necesariamente un metaanálisis (Giménez, 2012).

47

Es fundamental que el metaanalista tome en consideración la forma en que se ha investigado previamente el fenómeno de interés, la validez de las conclusiones, las hipótesis y las cuestiones para las que todavía no haya una respuesta clara y consistente a lo largo de los estudios (Marín et al., 2007).

343

de la investigación y lenguaje de publicación). Adicionalmente, se deberá combinar la consulta de bases de datos especializadas con diferentes estrategias de búsqueda (referencias bibliográficas de trabajos relevantes, tesis doctorales, comunicaciones presentadas en c ongresos, informes técnicos internos de centros de investigación, contacto con autores o grupos de investigación especialistas en el tema, etc.). 3. Codificación de las características y los resultados de los estudios. Los estudios integrados en un metaanálisis no suelen presentar resultados idénticos —aun cuando se evalúa el mismo fenómeno—, éstos suelen variar por múltiples factores aleatorios y por determinadas características diferenciales en l os estudios que s e pueden identificar y codificar. Adicionalmente, con el metaanálisis es posible unificar la forma de medición y registro de los resultados de los estudios (tamaño del efecto, diferencia media, diferencia de riesgos, razón de r iesgos o c oeficiente de c orrelación), lo que per mite transformar a una misma métrica los resultados procedentes de diferentes escalas de medida. 4. Análisis estadístico e interpretación. Las técnicas de análisis aplicadas deben responder a tres estrategias generales: 1) promediar los resultados o tamaños del efecto a través de los estudios, 2) evaluar la heterogeneidad de los resultados, y, 3) explicar la heterogeneidad de los resultados en función de las características diferenciales de los estudios integrados. 5. Publicación del metaanálisis. Redacción formal del estudio metaanalítico para su posterior publicación a partir de la siguiente estructura: introducción, método, resultados y discusión. En cada una de es tas fases, el investigador debe detal lar con claridad todas las decisiones adoptadas y los procedimientos aplicados, con el fin de facilitar la posibilidad de replicar el metaanálisis en ocasiones futuras. Con lo anterior, es posible identificar algunas ventajas que deja entrever este método estadístico (Marín, Sánchez y López, 2009): • Las técnicas del metaanálisis permiten el manejo eficiente de gr andes cantidades de información, se manejan grandes tamaños muestrales producto de la acumulación de las distintas muestras de los estudios revisados, lo que permite incrementar la confianza en los resultados y la potencia estadística de las pruebas de significación. • La metodología del metaanálisis cumple con todas las características del método científico, especialmente por la posibilidad de dupl icidad —donde otros investigadores puedan repetirlo bajo las mismas condiciones— con el fin de verificar si se obtienen o no los mismos resultados.

344

• Las principales conclusiones de los metaanálisis son derivadas del análisis estadístico de los resultados cuantitativos de l os estudios que constituyen una bas e sólida, precisa, objetiva y contrastable de información. • Las técnicas estadísticas aplicadas permiten analizar las fuentes de heterogeneidad en los resultados de los estudios y detectar aquellas características diferenciales de los estudios que pudieran explicar parte de esa heterogeneidad. En este sentido, también es posible mencionar algunas de las desventajas de las que es objeto el metaanálisis (Marín, Sánchez y López, 2009; Giménez, 2012): • La presencia de un sesgo de publicación (tendencia a publ icar sólo los estudios que presentan resultados estadísticamente significativos), dificulta el acceso a la totalidad de estudios desarrollados sobre el tema objeto de revisión. • Las limitaciones y deficiencias metodológicas propias de los estudios que i ntegran el metaanálisis restan validez a las conclusiones del mismo, por lo que se deberá evaluar la calidad metodológica de éstos e identificar la relación entre dicha calidad y la magnitud de los resultados. • La calidad de un m etaanálisis depende básicamente de d os factores: el nivel científico con el que se lleve a cabo éste, y, la calidad de datos (calidad de los estudios) con los que se desarrolle la revisión. • La heterogeneidad en l a metodología, el diseño, la operatividad de l as variables y la conceptualización de los diferentes estudios integrados en el metaanálisis puede dificultar significativamente su combinación, es por ello que s e deberán tomar y aclarar múltiples decisiones que permitan homogeneizar la codificación de las características y resultados de los estudios con el fin de tr ansformarlos a una

métrica común que l os haga

directamente comparables. No obstante, dado el nivel de d ominio, de especialización —de estadística descriptiva e inferencial— y de ti empo que r equiere el desarrollo y la aplicación de un metaanálisis, se determinó utilizar, de momento 48, un modelo estadístico sencillo (no complejo) que no excediera 48

No se descarta la posibilidad de q ue en algún otro momento se lleve a c abo la comparación y el ajuste de resultados —obtenidos de forma individual por cada enfoque de estudio— a través del meta-análisis, con el fin de identificar las posibles bondades y desventajas que este método podría ofrecer respecto al procesamiento de datos y el modelado de resultados en investigaciones relacionadas con el confort térmico desde un enfoque de análisis estadístico.

345

el tiempo designado para llevar a cabo la confrontación y el ajuste de resultados obtenidos de forma individual por cada uno de los enfoques de estudio utilizados para llevar a c abo los estudios de confort térmico de esta investigación. Para ello, se investigó, analizó y practicó el modelo de media ponderada para realizar el análisis de datos correspondiente que permitiera cumplir con los objetivos y los alcances planteados en esta investigación. 5.3.2. Media ponderada De acuerdo con Paz (2007), la media ponderada es una medida de tendencia central utilizada comúnmente cuando cada observación o dato de la muestra analizada posee una importancia relativa (o peso) respecto a los demás datos. Al respecto, Alegre y Cladera (2002) mencionan que esta medida de tendencia central se emplea cuando se pretende conocer la media aritmética de una serie estadística en la que no todos los datos tienen la misma importancia relativa, por lo que es necesario asumir este factor como determinante al momento del cálculo 49. Para obtener la media ponderada es necesario multiplicar cada observación por el peso que le corresponde50 dentro de la muestra analizada, posteriormente cada producto es sumado —lo que se conoce como suma ponderada— y el total se divide entre la suma de los pesos (Paz, 2007). Es decir, si se tienen k valores distintos de la variable x i y a cada uno de ellos se le proporciona un peso w i , la media ponderada se define como (Alegre y Cladera, 2002):

(25)

Donde: ________

X = media ponderada. x i = observaciones totales de la distribución. w i = peso o ponderación de los valores que conforman la serie estadística.

49

El proceso de valorar la importancia de los datos se llama ponderación y consiste en asignar a cada valor de la muestra un coeficiente de importancia o de peso (Alegre y Cladera, 2002). Cada observación es ponderada por un peso determinado que puede hacer alusión, por ejemplo, al número de observaciones que representa frente a la muestra que la contiene o cualquier otro criterio aleatorio (Paz, 2007).

50

En ocasiones, la ponderación tiene que ver con el peso en la población de las distintas observaciones (Alegre y Cladera, 2002), es decir, la cantidad de veces con la que el valor de una misma observación se repite dentro de la muestra analizada. En este sentido, la media aritmética es equivalente a la media ponderada ya que el peso designado a cada valor corresponde con la cantidad de veces en que éste se repite en la muestra estadística.

346

De esta manera, para llevar a cabo el ajuste correspondiente entre los resultados obtenidos por el enfoque adaptativo y los obtenidos con el enfoque predictivo, se tomó como factor determinante de ponde ración el tamaño de l a muestra efectiva (total de obs ervaciones por periodo después de l levar a c abo el procedimiento de l impieza de da tos, de a cuerdo con los filtros descritos en el subcapítulo Preparación de la base de datos, pág. 305) con la cual se llevó a cabo, de forma individual, el procesamiento de datos y el modelado de r esultados en c ada caso (por enfoque de estudio); es decir, para realizar el ajuste correspondiente al valor de neutralidad y los rangos de c onfort de c ada una de l as variables físicas analizadas desde ambos enfoques de estudio (TBS y HR, únicamente) en c ada uno de l os periodos de evaluación, se calculó la media ponderada para cada par de r esultados equivalentes de acuerdo con la jerarquía ponderada adoptada por cada caso según el tamaño de la muestra con la que se llevó a cabo cada análisis de datos de forma individual 51. El procedimiento anterior, se detalla, paso por paso, a continuación, con el fin de precisar la manera con la que fue posible determinar el ajuste de resultados pares en un valor único: 1. Identificar los resultados pares obtenidos de forma individual por cada enfoque de estudio para una v ariable física y periodo de ev aluación determinados. Uno de es tos resultados correspondía a l os estudios de s itio y el otro a los estudios realizados bajo condiciones controladas de laboratorio. 2. Determinar el tamaño de la muestra con la que se estimó cada uno de los dos resultados pares (anteriormente identificados) a los que se aplicaría el ajuste correspondiente. 3. Multiplicar, para cada caso, el resultado (obtenido por enfoque de es tudio) por el tamaño de la muestra con la que fue estimado. 4. Sumar los productos generados anteriormente (suma ponderada, según Paz, 2007). 5. Dividir el total entre la sumatoria de las muestras consideradas por ambos enfoques de estudio. Con ello se obtiene el ajuste de resultados pares a partir de la media ponderada. 6. Repetir este procedimiento para cada valor de neutralidad y cada valor límite (superior e inferior) que permitieron estimar los rangos de confort (reducido y extenso) de cada variable física analizada. 51

Para ello, se tomó el total de observaciones recabadas y filtradas de cada periodo de evaluación por enfoque de estudio y, con base en el tamaño de la muestra que cada uno representaba, se llevó a cabo este procedimiento que permitió ajustar los resultados obtenidos de forma individual por cada enfoque de estudio en un valor único —estimado entre el rango resultante por los dos valores individuales—.

347

El procedimiento descrito anteriormente se llevó a cabo para cada periodo en el que se llevaron a cabo los estudios de confort tanto en sitio como en laboratorio, sólo para las variables físicas en las que se registró simultáneamente el valor de la variable durante la evaluación, es decir, para la TBS y la HR (ya que en las pruebas experimentales de laboratorio las variables independientes que era posible manipular, monitorear y registrar, eran únicamente las ya mencionadas). En la Tabla 37 es posible apreciar gráficamente un ejemplo del procedimiento que se llevó a cabo para calcular el ajuste correspondiente a los valores de neutralidad y de los límites de los rangos de confort para el periodo de septiembre (periodo húmedo) en la correlación de la TBS respecto a la ST percibida durante las evaluaciones de sitio y de l aboratorio. En este ejemplo se puede observar que la Tn resultante a partir de los estudios de sitio fue de 22,2 °C (con una muestra de 381 opiniones), en tanto que la Tn obtenida con los estudios de laboratorio (LAC) fue de 21,9 °C (con una muestra de 182 observaciones), por lo que al realizar el cálculo de la media ponderada, ambos resultados se ajustan (ponderadamente) a un valor de 22,1 °C, lo que significa que el valor final se inclina mayormente por el resultado individual obtenido con los estudios de sitio, ya que en éstos se analizó una muestra dos veces mayor a la analizada en los estudios de laboratorio.

Tabla 37. Ajuste de resultados pares a partir de la media ponderada para la TBS respecto a la ST percibida durante el periodo de evaluación de septiembre (Elaboración propia).

Adicionalmente, es posible observar con la tabla anterior que el ajuste para este periodo (septiembre) y esta variable física (TBS) en específico, resulta, en todos

sus valores

(neutralidad, límites superior e inferior de los rangos de confort extenso y reducido), con mayor vocación (tendencia) al resultado individual de los estudios en sitio que al resultado de los estudios de laboratorio. Asimismo, el intervalo (rango) de confort extenso resultante se ajusta proporcionalmente a esta media ponderada al pasar de 4,7 K (con los estudios de sitio) y 3,6 K (con los estudios de laboratorio) a 4,3 K.

348

5.3.3. Otra alternativa (combinación de bases de datos) Como se mencionó al inicio de e ste subcapítulo, además de ex plorar al metaanálisis y a l a media ponderada como alternativas para llevar a cabo el ajuste de resultados pares obtenidos individualmente por cada enfoque de estudio, se llevó a c abo un ej ercicio de di seño propio, propuesto en esta investigación, que, en tér minos generales, consistió en s uperponer (juntar) todos los datos recabados por ambos enfoques en una úni ca base de datos y, posteriormente, darles el mismo tratamiento que se aplicó con los datos de forma individual. Sin embargo, fue posible observar que, además de que l as bases metodológicas (enfoques de estudio) a partir de las cuales se recabaron de forma individual los datos, no eran compatibles en sí mismas (aunque posiblemente si complementarias), el ajuste resultante no par ecía consistente con los resultados pares que se trabajaban, es decir, el valor obtenido como ajuste de los resultados individuales —obtenidos por el procesamiento de datos de c ada enfoque—, no era consistente en sí mismo, pues se esperaba que el ajuste reflejara un valor medio (tal vez no equidistante) entre los valores obtenidos con el enfoque predictivo (subestimación del confort térmico) y con el enfoque adaptativo (sobrestimación del confort térmico), sin embargo, no fue así, en muchas de las ocasiones el aparente ajuste quedaba por encima o por debajo de los límites marcados por los resultados individuales de ambos enfoques (Tabla 38). Por ejemplo, si se hace referencia nuevamente al caso de septiembre descrito en el subcapítulo anterior (ver Media ponderada, pág. 346), en la Tabla 38 se puede observar que el valor de neutralidad para la temperatura con los estudios de sitio es de 22,2 °C y para los estudios de laboratorio de 21,9 °C, en tanto que el aparente ajuste entre estos valores se ubica en 21,9 °C a partir del procesamiento de una única base de datos conformada por las observaciones recabadas por ambos enfoques de estudio.

Tabla 38. Ajuste de resultados pares a partir de la combinación de datos de ambos enfoques de estudio para la TBS respecto a la ST percibida durante el periodo de evaluación de septiembre (Elaboración propia).

349

Lo anterior deja entrever que el aparente ajuste, en este caso particular, no resulta comprendido en el rango generado por los resultados individuales de cada enfoque de estudio, sino que se determina con el mismo valor con el que resultó el valor de neutr alidad a par tir del enfoque predictivo. Asimismo, los valores de los límites inferiores de l os rangos de c onfort (- 2 DS y - 1 DS) se ubican por debajo de los resultados obtenidos individualmente, mientras que los de los limites superiores (+ 2 DS y + 1 DS) se ubican a la par que los resultados obtenidos con el enfoque predictivo. Es decir, todos los valores resultantes del ajuste (neutralidad, límites superior e inferior de los rangos de confort extenso y reducido) se ubican a la par o por debajo de los valores obtenidos con el enfoque predictivo, modelo de es tudio que se caracteriza por subestimar el confort térmico humano, lo que, evidentemente, demandó explorar alguna otra alternativa que permitiera ofrecer un ajuste más consistente entre los pares de resultados obtenidos por la aplicación metodológica de ambos enfoques de estudio. El ejercicio y los resultados anteriormente planteados para el periodo húmedo (septiembre), fueron producto de la combinación de las observaciones recabadas con los enfoques adaptativo (381 opiniones) y predictivo (182 observaciones), lo que p ermitió generar una ba se de datos única y efectiva de 563 opiniones procesadas con el método de MIST.

350

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.