Adaptación y validación del Health Utilities Index Mark 3 al castellano y baremos de corrección en la población española

Share Embed


Descripción

ORIGINALES Adaptación y validación del Health Utilities Index Mark 3 al castellano y baremos de corrección en la población española

47.980

Miguel Ruiza, Javier Rejasb, Javier Sotoc, Antonio Pardoa e Irene Rebolloa a

Departamento de Metodología. Facultad de Psicología. Universidad Autónoma de Madrid. Madrid. Unidad de Investigación de Resultados en Salud. División Médica. Pfizer S.A. Madrid. Unidad de Farmacoeconomía e Investigación de Resultados en Salud. Departamento de Medicina. Pharmacia S.A. Madrid. España.

b c

FUNDAMENTO Y OBJETIVO: El Health Utilities Index Mark 3 (HUI-3) es un instrumento que permite atribuir utilidades a los estados de salud. Se presenta la adaptación y validación al castellano, así como la estimación de las utilidades en la población española comparándola con la canadiense. PACIENTES Y MÉTODO: El proceso de adaptación se ha realizado siguiendo el protocolo de Furlong. Se seleccionó un panel de expertos para garantizar el proceso, la traducción del cuestionario y el entrenamiento de los entrevistadores. Se han utilizado dos muestras: una de modelado destinada a desarrollar la función de utilidad multiatributo (MAUF) y una de medición directa para validar la MAUF. Ambas muestras son representativas de la población española. Para estimar las utilidades asociadas a cada estado de salud se han utilizado: la Escala Visual Analógica y la Apuesta Normalizada o Juego Estándar. La dimensionalidad del instrumento se ha analizado mediante análisis factorial y la validez convergente se ha comprobado con el EuroQoL. RESULTADOS: La versión española del HUI-3 es factible (< 2% de valores perdidos con tiempo de ejecución de 7,34 [1,27] min) y fiable (α-Cronbach de 0,792 en la muestra de modelado; 0,707 en la de medición directa y 0,760 en la muestra total), presentando una buena correlación test–retest (0,909; p < 0,001). Posee buena validez convergente (las correlaciones con EuroQoL oscilaron entre 0,788 y 0,793). La solución factorial obtenida presenta 5 factores: habla y destreza; deambulación y dolor; visión, emoción y cognición, y audición. La función de utilidad española difirió significativamente de la calculada para la población canadiense (0,07 puntos, p < 0,001). CONCLUSIONES: El cuestionario puede aplicarse de forma individual o colectiva y de forma autoadministrada o mediante entrevista. Los índices psicométricos obtenidos son buenos. Las diferencias encontradas entre las funciones de utilidad española y canadiense hacen necesario utilizar como referente las funciones específicas de cada población. Palabras clave: Utilidades. Calidad de vida relacionada con la salud. HUI Mark 3. Preferencias por estados de salud. Adaptación cultural.

Adaptation and validation of the Health Utilities Index Mark 3 into Spanish and correction norms for Spanish population BACKGROUND AND OBJECTIVE: The Health Utilities Index Mark III (HUI-3) is a psychometric instrument developed to assign utilities to patients’ health states. We present its Spanish adaptation and validation. Moreover, we estimate its utility in the Spanish population and compare it to Canadian patients. PATIENTS AND METHOD: The Adaptation process has been carried out following the original protocol by Furlong. A panel of experts was selected in order to warrant the process, the questionnaire translation and the training of interviewers. Two different samples were used: a modelling sample to develop the Multi Attribute Utility function (MAUF) and a directed measure sample to validate the MAUF. Both samples are representative of the Spanish population according to gender and age quota. In order to estimate the utilities associated with each health state, Visual Analogue Scale (VAS) and Standard Gamble (SG) procedures were used. The instrument’s dimensionality was assessed by means of Factor Analysis, and the convergent validity was checked against EuroQoL. RESULTS: The HUI-3 Spanish version is feasible (< 2% missing values and 7.34 ± 1.27 minutes completion time) and reliable (Cronbach’s (= 0.792 in modelling sample, 0.707 in direct measure sample, and 0.760 as a whole), showing a good test-retest correlation (0.909, p < 0.001). Convergent validity is good (correlation with EuroQoL: within 0.788 and 0.793). Factor solution met 5 factors: Speech & Dexterity, Ambulation & Pain, Vision, Emotion & Cognition, and Hearing. The Spanish and Canadian utility function differed significantly; 0.07 pts, p < 0.001). CONCLUSIONS: This questionnaire can be applied to individuals or collectively, either self-administered or through an interview. Psychometric indexes are good. Differences between Spanish and Canadian utility functions suggest the need of using the specific function for each population. Key words: Utilities. Health-related-quality-of-life. HUI Mark 3. Health-state-preferences. Cultural adaptation. Este estudio ha sido financiado por Pfizer S.A. y Pharmacia S.A. Correspondencia: Dr. J. Rejas Gutiérrez. Unidad de Investigación de Resultados en Salud. División Médica. Pfizer S.A. Madrid. Parque Empresarial de la Moraleja. Avda. de Europa, 20-B. 28108 Alcobendas. Madrid. España. Correo electrónico: [email protected] Recibido el 29-4-2002; aceptado para su publicación el 22-10-2002.

En la actualidad, a la hora de evaluar la eficacia de las nuevas intervenciones terapéuticas es necesario valorar cómo van a afectar al estado de salud de los pacientes y cómo éstos van a percibir la calidad de vida asociada a este estado de salud. Por otra parte, en cualquier estudio de la calidad de vida relacionada con la salud se abordan dos aspectos muy diferentes: la calidad de vida atribuida a un estado de salud y la preferencia o utilidad asignada a ese estado. Los instrumentos tradicionales de medida de la calidad de vida evalúan distintos atributos o dimensiones relacionadas con la salud (dolor, movilidad, visión, audición, etc.) para averiguar qué estado de salud percibida tienen las personas y cómo se sienten con ese estado de salud percibido. Por el contrario, los instrumentos de medida de las utilidades evalúan las preferencias individuales por cada estado de salud para determinar la utilidad que asigna la población a cada estado1. Los instrumentos que miden la calidad de vida tienen el inconveniente de trabajar con puntuaciones multidimensionales que dificultan tanto la comparación entre distintas personas como el estudio de la evolución de un mismo paciente. Por el contrario, los instrumentos que miden utilidades reflejan las preferencias de los pacientes por cada estado de salud con una puntuación única que resume, en escala 0-1, el estado de salud del sujeto y la preferencia poblacional por ese estado, reflejando la calidad de vida percibida por los pacientes en relación con un determinado estado de salud. Al final esta puntuación, que va a representar la preferencia por el estado de salud, se puede combinar con la cantidad de vida obtenida por las opciones terapéuticas evaluadas para calcular los años de vida corregidos por calidad (AVAC), índice que se utiliza en el análisis de coste-utilidad para valorar su eficiencia2,3. Dado que la percepción de las personas está sesgada hacia tratamientos más compasivos y hacia una sobrevaloración de la evitación de la enfermedad2, para poder tomar decisiones desde una perspectiva social es necesario obtener valores de Med Clin (Barc) 2003;120(3):89-96

89

RUIZ M, ET AL. ADAPTACIÓN Y VALIDACIÓN DEL HEALTH UTILITIES INDEX MARK 3 AL CASTELLANO Y BAREMOS DE CORRECCIÓN EN LA POBLACIÓN ESPAÑOLA

preferencia social a través de una muestra representativa de la población general, con el fin de conocer la valoración relativa que hace una muestra representativa de la población de los distintos estados de salud3,4. Uno de los cuestionarios más utilizados para valorar la utilidad de distintos estados de salud es el Índice de Utilidades de Salud Mark 3 (Health Utilities Index Mark III, [HUI-3]), desarrollado en Canadá por Feeny et al5. El HUI-3 se concibió como un instrumento genérico, capaz de ser empleado tanto en investigación clínica como a la hora de evaluar resultados de salud en la práctica médica asistencial, pertinente para todo tipo de pacientes (incluso niños) y enfermedades, y para todo tipo de opciones terapéuticas empleadas3,4. El objetivo de este trabajo es presentar la adaptación del HUI-3 al castellano6. Como resultado, se detallan las propiedades métricas (fiabilidad y validez) de la versión adaptada, se presenta la función de utilidad para la población española y se exponen el método de corrección y los baremos para la población española.

Para conocer la utilidad asociada a cada estado de salud se realizan comparaciones binarias entre todas las combinaciones posibles de estados de salud. Analizando el resultado de esas comparaciones se obtiene una estimación de la utilidad asociada a cada estado de salud. Ahora bien, puesto que el número de comparaciones binarias que es necesario hacer con los 972.000 estados de salud es demasiado alto, se utilizan diseños ortogonales que permiten reducir considerablemente el número de comparaciones sin perder información. La estimación descompuesta, por ejemplo, se obtiene mediante la aplicación de un diseño factorial incompleto. Este tipo de diseño, además de reducir el número de juicios subjetivos (comparaciones binarias) necesarios para asignar valoraciones a todos los estados de salud, permite separar el efecto individual de cada atributo sobre la valoración subjetiva (es decir, proporciona información acerca de cómo las personas combinan los atributos para llegar a un juicio global sobre un estado de salud). Tras la aplicación del método descompuesto se obtiene una fórmula matemática que permite estimar la utilidad de cada uno de los 972.000 estados de salud del HUI-3. Esta fórmula recibe el nombre de función de utilidad multiatributo (multiatribute utility function [MAUF]). Un índice de utilidad (como la MAUF) es un número entre 0 y 1 que refleja el impacto general de un estado de salud sobre el estilo de vida de las personas, es decir, que refleja el grado en que un estado de salud afecta al funcionamiento emocional y físico de las personas. En definitiva, un índice de utilidad resume la calidad de vida asociada a un determinado estado de salud. Cuanto más se aproxima a 1, mayor es la calidad de vida asociada a un estado de salud (se asume que las personas prefieren los estados de salud que llevan asociada una mejor calidad de vida; por lo que a los mejores estados de salud les corresponde una mayor utilidad).

Pacientes y métodos Descripción del instrumento

Procedimiento de adaptación

El HUI-3 es un instrumento de medida que ofrece información sobre el estado de salud de las personas y que permite asignar una utilidad a cada uno de los estados de salud. Se trata de un instrumento genérico (no referido a una enfermedad concreta) para la medición de la calidad de vida relacionada con la salud en población general5. Como sistema de clasificación el HUI-3 está formado por un conjunto de preguntas categóricas que describen el estado de salud funcional de los individuos en un total de 8 atributos: Visión, Audición, Habla, Deambulación, Destreza, Emoción, Cognición y Dolor (apéndice). En cada atributo se incluyen 5 o 6 niveles que varían desde la normalidad hasta el deterioro serio. Un estado de salud del HUI-3 es definido por un vector que identifica el nivel de cada atributo que corresponde a ese estado. Por ejemplo, el estado de salud perfecta, denominado «Salud total» (ST), es definido por el vector: ST [V1 A1 H1 M1 D1 E1 C1 Do1]; y el peor estado de salud (denominado Sima), por el vector: Sima [V6 A6 H5 M6 D6 E5 C6 Do5]. Las letras indican el nombre del atributo (V: Visión; A: Audición; H: Habla; M: Deambulación; D: Destreza; E: Estado Emocional; C: Cognición, y Do: Dolor); los números indican el nivel del atributo elegido por el entrevistado. La combinación de todos los niveles incluidos en el HUI-3 permite describir 972.000 estados de salud distintos. El vector que representa el estado de salud de un sujeto puede compararse con los baremos de la población de referencia, tanto de manera global (sumando las puntuaciones de todos los atributos) como individual (cada atributo por separado). Como sistema de clasificación, el HUI-3 permite valorar la situación de un paciente en cada uno de los 8 atributos, conocer la puntuación normativa que corresponde a su estado de salud y, en el caso de aplicarse en situaciones sucesivas, valorar el cambio producido en cada atributo. Como sistema de utilidades, las preferencias se refieren al grado de aceptación o rechazo que genera un objeto (estado, idea, conducta, etc.) en las personas. Este concepto está tomado de la teoría económica del consumidor, donde se utiliza para valorar productos y servicios. En el ámbito sanitario el HUI-3 permite calcular el grado de preferencia, denominado «utilidad», que la población general manifiesta hacia cada uno de los estados de salud.

El proceso de adaptación del HUI-3 a la población española se ha llevado a cabo siguiendo el protocolo propuesto por Furlong et al para el desarrollo de la versión original canadiense7,8. En la fase de preparación se realizaron las tareas de selección del panel de expertos, traducción del cuestionario original, definición de las muestras, elaboración de los materiales y entrenamiento de los entrevistadores. El panel de expertos quedó formado por una psicóloga clínica, dos profesores de universidad especialistas en medición (metodólogos), un farmacólogo clínico y un farmacoepidemiólogo. Estos expertos fueron los encargados de revisar el proceso de traducción y supervisar el proceso de adaptación. Dado que la versión original del cuestionario estaba bien definida y estructurada, el panel de expertos no juzgó necesarias la redefinición de las dimensiones ni la reformulación de las preguntas originales. La traducción del cuestionario se encargó a dos traductores oficiales independientes (filólogos) para disponer de dos traducciones distintas. El panel de expertos fue el responsable de la fusión de ambas traducciones en una única versión. La versión definitiva en castellano se encuentra en el apéndice. Esta versión final fue retraducida al inglés por otros dos traductores oficiales (distintos de los dos primeros) y remitida a los autores originales a la McMaster University para su ratificación. La validez de contenido está asegurada por los presupuestos teóricos y la formulación del cuestionario original, y ha sido heredada de los estudios originales; en la versión adaptada al castellano la validez de contenido se ha perseguido utilizando un panel de 5 expertos y 4 traductores diferentes.

90

Med Clin (Barc) 2003;120(3):89-96

Definición de las muestras de sujetos Se han utilizado dos muestras distintas: una muestra de modelado destinada a desarrollar la MAUF, con 243 sujetos, y una muestra de medición directa destinada a obtener una estimación directa de las utilidades con las que comparar la MAUF, formada por 260 sujetos. Ambas muestras se han diseñado para ser representativas de la población general española respecto a las cuotas de sexo y edad; sin embargo, la recogida de datos se ha realizado sólo en la Comunidad Autónoma de Madrid. Puesto que el proceso de adaptación no fue circunscrito a ningún estudio clíni-

co particular, no fue necesario establecer un tamaño muestral mínimo para asegurar un determinado tamaño del efecto. Sin embargo, se ha procurado que las muestras fueran lo bastante grandes para permitir crear los baremos de corrección y se han seguido las directrices del estudio original. Así, se ha estimado que la muestra total debía estar formada por al menos 500 personas con una edad mínima de 15 años. Se seleccionó además una submuestra aleatoria de 5 sujetos por entrevistador (en total 46 sujetos) para realizar un retest del cuestionario HUI-3. Instrumentos de medida de las preferencias Para estimar las utilidades asociadas a cada estado de salud se han utilizado dos métodos de recogida de información por escalamiento unidimensional: la Escala Visual Analógica (EVA)9 y el Juego Estándar o Apuesta Normalizada (AN)10,11. Ambos métodos permiten obtener las valoraciones (preferencias) de los sujetos en una escala de intervalo6. Estados de salud valorados Los estados de salud utilizados en las tareas de estimación de las utilidades se han seleccionado siguiendo el esquema de aleatorización incompleta propuesto por los autores originales. Se distinguen 4 tipos de estados de salud: 1. Estados de referencia: son tres estados de salud extremos (Salud total, Muerte y Sima) que se utilizan como punto de referencia de las valoraciones del método EVA. Se han medido en las dos submuestras. 2. Marcadores metodológicos: estados de salud utilizados para calcular las funciones de utilidad. Los marcadores metodológicos son tres estados de salud intermedios y frecuentes. Se han medido en las dos submuestras. 3. Estados asociados a un atributo: para obtener la MAUF es necesario evaluar previamente las utilidades asociadas a cada atributo por separado. Estas utilidades se obtienen fijando en 1 (mejor estado de salud) los valores de 7 de los 8 atributos y presentando todas las variaciones posibles del octavo atributo. De esta forma se obtienen 37 estados de salud. Estos 37 estados de salud se dividen en dos grupos mediante un diseño de bloques. En una tarea EVA, cada uno de los entrevistados evalúa los estados correspondientes a dos atributos, uno de cada grupo. Puesto que estos estados se utilizan para obtener las funciones de utilidad, sólo se miden en la submuestra de modelado. 4. Estados más prevalentes en la población: a partir de los datos recogidos en la submuestra de modelado se han seleccionado los 72 estados de salud más prevalentes en la población (es la mejor estimación poblacional de la que se dispone). Éstos se dividen en: estados z (los 5 estados más prevalentes en la muestra) y otros estados prevalentes (los restantes 67 estados más prevalentes). Entre estos 67 estados se ha incluido el peor nivel posible del atributo Audición, puesto que se considera que la sordera es un estado frecuente en la población pero imposible de registrar dadas las características de la entrevista. Además, a estos 67 estados se han añadido los 5 estados del atributo Cognición porque en la primera fase se encontraron resultados anómalos (inversión de los niveles 2 y 3 en los tres entrevistadores). Los 72 estados se dividen en 12 bloques de 6. Cada entrevistado evalúa uno de esos 12 bloques. En primer lugar se evalúan los estados z y un bloque de estados más prevalentes con el método EVA. A continuación se evalúan los estados z o un bloque de estados más prevalentes con el método AN (según un diseño factorial de bloques). Estos estados se recogen únicamente en la submuestra de medición directa. Combinando las dos muestras (la de modelado y la de medición directa) se ha obtenido una valoración de tres estados de referencia, tres marcadores metodológicos, 37 estados de atributo y 72 estados prevalentes. Es decir, un total de 115 estados de salud. Recogida de datos La recogida de datos se ha realizado mediante entrevista directa de todos los sujetos incluidos en la evaluación. De las entrevistas se han encargado 12 entrevistadores cualificados. Todos ellos recibieron

RUIZ M, ET AL. ADAPTACIÓN Y VALIDACIÓN DEL HEALTH UTILITIES INDEX MARK 3 AL CASTELLANO Y BAREMOS DE CORRECCIÓN EN LA POBLACIÓN ESPAÑOLA

1,0

1,0

0,9

0,8 Medias marginales estimadas

Medias marginales estimadas

0,8 0,7 0,6 0,5 0,4 0,3 MAUF

0,2

Española Canadiense

0,1

0,6 0,4 0,2 0,0 –0,2

MAUF Española Canadiense

–0,4

0,0

–0,6 0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

–0,3 –0,2 –0,1 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

Décimas (Sima-Salud total) Fig. 1. Comparación de las funciones de utilidad multiatributo (MAUF) española y canadiense (escala Sima-Salud total).

información específica sobre el proceso de adaptación del cuestionario y sobre las características de los instrumentos de medida de las preferencias. Sin embargo, para evitar posibles sesgos en la aplicación no tuvieron en ningún momento información sobre los objetivos de la investigación. Cada entrevistador ha recogido datos de 40-42 personas. La recogida de datos se ha desarrollado en dos fases: en la primera se recabaron los datos relativos a la muestra de modelado; en la segunda, los relativos a la muestra de medición directa. Las dos muestras se han seleccionado de manera independiente mediante un método de rutas aleatorias estratificado por las cuotas de sexo y edad establecidas en el diseño muestral. Análisis de datos Las dos submuestras de sujetos se han comparado en las principales variables sociodemográficas, con objeto de evaluar la homogeneidad de las mismas, mediante la prueba de la t de Student para muestras independientes en el caso de las variables continuas, y la prueba de la χ2 en el de las variables categóricas. Para valorar la adaptación del HUI-3 se ha realizado un estudio psicométrico que ha incluido su fiabilidad, valorada mediante el coeficiente alfa de Cronbach (para la consistencia interna) y el coeficiente de correlación de Pearson entre el test y el retest, y el coeficiente de correlación intraclase (para la estabilidad temporal)12-14, así como su validez: a) la validez convergente mediante la correlación con la versión española del EuroQoL (termómetro, puntuaciones tarifa por equivalencia temporal y suma de puntos)15 y una pregunta de salud general; b) la validez de constructo mediante la validez factorial del cuestionario, utilizando el método de extracción alfa16 con rotación promax17 y como reglas para la determinación de número de factores la regla K118, la prueba de sedimentación19 y la proporción de la variancia explicada por cada factor20; c) el ajuste intramuestra comparando y correlacionando los valores de la MAUF con la valoración por AN de los tres estados marcadores, y d) el ajuste intermuestra comparando y correlacionando los valores de la MAUF con las valoraciones AN de 80 estados de salud. La factibilidad se ha valorado mediante la comprobación de la legibilidad del cuestionario, el tiempo de ejecución promedio y los problemas surgidos durante su administración. También se han comparado las funciones de utilidad multiatributo de las poblaciones española y canadiense, y se han construido los bare-

Décimas (Muerte-Salud total) Fig. 2. Comparación de las utilidades asignadas por las funciones de utilidad multiatributo (MAUF) española y canadiense (escala Muerte-Salud total).

mos correspondientes a la población española Para la obtención de la MAUF se siguen los siguientes pasos: a) se divide la muestra en dos grupos en función del estado de salud más bajo (Sima o Muerte); b) se calcula la media recortada de las valoraciones y utilidades por estado de atributo simple en cada grupo; c) se corrigen las valoraciones de los estados medidos simultáneamente con el EVA por el sesgo del extremo de la escala; d) mediante una ecuación de regresión se transforman las valoraciones en utilidades; e) se reescalan las utilidades de un grupo para poner ambos en la misma escala (SimaSalud total); f) se funden las utilidades de los dos grupos con el cálculo de una media ponderada; g) se convierten las utilidades en desutilidades para la obtención de las constantes de la MAUF; h) al mismo tiempo se reescalan las utilidades de los estados de atributo simple a escala estándar 0-1; i) las utilidades reescaladas se transforman también en desutilidades. Con estas desutilidades y las constantes estimadas, aplicando la fórmula del cálculo de utilidades se puede estimar la desutilidad de un estado de salud. Restándolo de 1 se obtiene la utilidad7,8. Para comparar las MAUF española y canadiense se han obtenido las puntuaciones de utilidad que asigna a cada sujeto la función obtenida con la muestra española y la función obtenida con la muestra canadiense, tanto en la métrica Sima-Salud total como en la métrica Muerte-Salud total. En la métrica Sima-Salud total se han redondeado a la décima las puntuaciones obtenidas con la función española para formar 10 grupos de sujetos: los que puntúan de 0 a 0,10; los que puntúan de 0,11 a 0,20, etc. En cada grupo se han calculando los promedios tanto en las puntuaciones obtenidas con la función española como en las obtenidas con la función canadiense. Si las dos funciones de utilidad fueran equivalentes, los promedios de ambas funciones deberían ser similares en cada uno de los 10 grupos definidos. Las MAUF española y canadiense se han comparado mediante un análisis de la varianza de dos factores, el primer factor intersujetos (con 10 niveles: los resultantes de redondear a la décima las puntuaciones de utilidad obtenidas con la muestra española) y el segundo factor intrasujetos o de medidas repetidas (con dos niveles: puntuaciones de la MAUF española y puntuaciones de la MAUF canadiense). En la métrica Muerte-Salud total se ha seguido el mismo procedimiento anterior pero, al existir utilidades negativas, el número de grupos decimales redondeados es 14 (–0,3 = –0,25 a –0,345; –0,2 = –0,15 a –0,244; –0,1 = –0,05 a

–0,144; 0 = 0,45 a –0,05, etc.). La comparación gráfica se presenta en las figuras 1 y 2. Por último, los baremos se han elaborado calculando los centiles correspondientes a las puntuaciones de utilidad obtenidas mediante la MAUF de la muestra española.

Resultados Descripción de las muestras En la tabla 1 se recogen los resultados obtenidos al comparar ambas muestras en las variables sociodemográficas. Puesto que en ningún caso se observan diferencias significativas, podemos asumir que ambas muestras son sociodemográficamente equivalentes. Las muestras sólo difieren significativamente en el atributo Cognición: la distribución de frecuencias en la muestra presenta valores más altos (χ2 = 17,9; gl = 5; p = 0,003). En el resto de atributos podemos asumir que el nivel de salud de las muestras es comparable. Estudio psicométrico La administración del cuestionario no presentó problemas de comprensión ni censura en las respuestas. No ha sido necesario invalidar ningún cuestionario completo. La tasa de no respuestas más alta fue para el atributo Dolor (1%) y despreciable en el resto de los casos. No se ha considerado necesario aplicar ninguna estrategia de sustitución de valores perdidos. Debido a la lentitud en la incorporación de sujetos (si bien la calidad de la información recogida era adecuada), uno de los entrevistadores fue sustituido después de realizar tres entrevistas. El Med Clin (Barc) 2003;120(3):89-96

91

RUIZ M, ET AL. ADAPTACIÓN Y VALIDACIÓN DEL HEALTH UTILITIES INDEX MARK 3 AL CASTELLANO Y BAREMOS DE CORRECCIÓN EN LA POBLACIÓN ESPAÑOLA

tiempo de ejecución del cuestionario ha oscilado entre 4 y 15 min, con una media (desviación típica) de 7,34 (1,27) min. El tiempo promedio de la entrevista completa de modelado fue de 47,41 (19,58) y la de medición directa de 59,65 (24,49). A las personas mayores de 70 años (14 en la muestra de modelado y 13 en la de medición directa) se les ayudó a cumplimentar el cuestionario, lo que ha incrementado el tiempo de ejecución de esas personas. En el atributo Visión, a 4 entrevistados (6,6% de los que han evaluado ese atributo) les ha parecido imposible la combinación descrita en el nivel 3, y a

tres entrevistados (5% de los que han evaluado ese atributo) les ha parecido imposible la combinación descrita en el nivel 4. En el atributo Emoción, 9 entrevistados (31,6% de los que han evaluado ese atributo) han echado en falta una categoría intermedia entre los niveles 2 y 3 (Bastante feliz-Bastante infeliz). La correlación entre el test y el retest ha sido de 0,909 (p < 0,001) y el coeficiente de correlación intraclase arrojó un valor de 0,899 (intervalo de confianza [IC] del 95%, 0,813-0,945). Por otra parte, la correlación entre utilidades en el test y el retest (estimadas en la métrica Sima-Sa-

TABLA 1 Características sociodemográficas de las muestras de sujetos incluidas en el estudio de adaptación al español del instrumento HUI-3 Característica

Muestra de modelado

Muestra de medición directa

p

43,54 (19,17) 52,9 39,23 (20,0) 3,48 (1,47)

46,38 (19,15) 51,7 38,96 (20,03) 3,33 (1,5)

0,4 0,4 0,9 0,2 0,8

35,7 44,5 6,7 9,2 3,8

37,6 43,7 6,5 10,3 1,9

38,9 11,3 2,1 0,8 14,6 18,0 10,0 4,2

41,6 12,2 1,1 0,8 15,3 16,8 11,5 v0,8

3,0 13,8 11,2 20,3 51,7

3,9 11,2 18,5 20,8 45,6

2,7 6,3 11,2 21,0 32,1 26,8

0,4 4,9 9,0 21,7 31,1 32,8

10,9 37,4 34,9 13,0 3,8 76,6

12,9 41,8 30,8 12,9 1,5 73,8

Edad (años) Sexo (mujeres; %) Expectativa de vida (años) Miembros en la familia (n) Estado civil (%) Soltero Casado Separado o divorciado Viudo Otro Situación laboral (%) Empleado a tiempo completo Empleado a tiempo parcial Desempleado No trabaja por motivos de salud Retirado Estudiante Ama de casa Otra situación laboral Nivel educativo (%) Sin estudios Primarios Secundarios o FP-I Medios o FP-II Superiores Nivel de ingresos (%) < 5.000 e 5.001 a 7.200 e 7.201 a 10.200 e 10.201 a 15.000 e 15.001 a 30.000 e > 30.000 e Salud actual (%) Excelente Muy buena Buena Regular Pobre ¿Conoces alguna persona discapacitada? (Sí; %)

0,3

0,3

0,3

0,4

0,5

Los valores se expresan como media (desviación típica). FP: Formación profesional.

lud total) ha sido de 0,935 (p < 0,001). En la tabla 2 se ofrecen los resultados obtenidos al comparar el test y el retest en cada atributo con la prueba de la t de Student para muestras relacionadas. Puede observarse que sólo existen diferencias significativas en el atributo Cognición. En el atributo Dolor, la significación se encuentra al borde del límite (los resultados obtenidos con la prueba de Wilcoxon son similares). Las puntuaciones correspondientes al atributo Cognición han aumentado sin mediar tratamiento alguno. Las puntuaciones totales del HUI-3 fluctúan entre –1 y 4 puntos, con una diferencia media entre el test y el retest de 0,43 puntos (p = 0,015). Respecto a las utilidades test-retest estimadas por la MAUF, la diferencia observada ha sido de –0,0024 (0,07) (p = 0,021), por lo que los investigadores deben tener presente que es posible encontrar diferencias como ésta y que deben ser atribuidas al azar o a la variación espontánea de los sujetos (no al tratamiento). La consistencia interna, medida con el coeficiente alfa de Cronbach, ha arrojado unos valores aceptables aunque moderados: 0,7915 en la muestra de modelado, 0,7073 en la muestra de medidas directas y 0,7597 en la muestra total. En cuanto a la validez convergente, en la tabla 3 se recogen las correlaciones obtenidas entre las utilidades del HUI-3 con otras medidas. Aunque el HUI-3 no se diseñó originalmente para medir puntuaciones globales del estado de salud, cabe señalar que la correlación entre la suma de las puntuaciones del HUI-3 y la suma de puntos del EuroQoL es de 0,821 (p < 0,001). Por atributos, el atributo Deambulación del HUI-3 y la dimensión Movilidad del EuroQoL (conceptualmente similares) correlacionan 0,837 (p < 0,001) y el atributo Dolor del HUI-3 y la dimensión Dolor del EuroQol correlacionan 0,821 (p < 0,001). Sin embargo, la correlación entre el atributo Emoción del HUI-3 y la dimensión Ansiedad-Depresión del EuroQoL correlacionan 0,488 (p < 0,001), lo que indica una menor convergencia entre esas dimensiones. Los resultados indican que todas las medidas captan aspectos de la salud actual de los sujetos.

TABLA 2 Diferencias y correlación momento de Pearson test-retest en cada atributo de la versión española del HUI-3 Atributos

Visión Audición Habla Deambulación Destreza Emoción Cognición Dolor Suma HUI–3

Media

0,00 0,02 0,00 0,00 0,00 0,00 0,28 0,15 0,43

Diferencia mínima

–1 0 0 –1 0 –1 0 –1 –1

Diferencia máxima

1 1 0 1 0 1 2 2 4

DT

0,21 0,14 0,00 0,21 0,00 0,46 0,68 0,50 1,17

ETM

0,030 0,021 0,000 0,030 0,000 0,067 0,099 0,073 0,172

*No calculable. DT: desviación típica; ETM: error típico de la media; IC: intervalo de confianza.

92

Med Clin (Barc) 2003;120(3):89-96

IC del 95% Inferior

Superior

–0,06 –0,02 * –0,06 * –0,13 0,08 0,00 0,09

0,06 0,06 * 0,06 * 0,13 0,48 0,29 0,78

t

Significación (bilateral)

0,00 1,00 * 0,00 * 0,00 2,78 2,00 2,53

1,000 0,322 * 1,000 * 1,000 0,008 0,051 0,015

Correlación de Pearson r

Significación

0,942 0,910 1,000 0,885 1,000 0,722 0,748 0,834 –

< 0,001 < 0,001 < 0,001 < 0,001 < 0,001 < 0,001 < 0,001 < 0,001 –

RUIZ M, ET AL. ADAPTACIÓN Y VALIDACIÓN DEL HEALTH UTILITIES INDEX MARK 3 AL CASTELLANO Y BAREMOS DE CORRECCIÓN EN LA POBLACIÓN ESPAÑOLA

TABLA 3 Validez convergente de la versión española del HUI-3. Correlaciones entre el termómetro, la suma y la puntuación tarifa del EuroQoL; la suma de puntos y la puntuación de utilidad del HUI-3, y una medida de valoración global del estado de salud actual Termómetro EQ-5D

Suma EQ-5D

Puntuación tarifa EQ-5D

Suma HUI-3

Utilidad HUI-3

Salud actual

– –0,643 –0,611 –0,625 0,642 –0,662

–0,643 – –0,929 0,827 –0,807 0,646

–0,611 –0,929 – –0,796 0,793 –0,587

–0,625 0,827 –0,796 – –0,923 0,661

0,642 –0,807 –0,793 –0,923 – –0,648

–0,662 0,646 –0,587 0,661 –0,648 –

Termómetro EQ-5D Suma EQ-5D Puntuación tarifa EQ-5D Suma HUI-3 Utilidad HUI-3 Salud actual

Todas las correlaciones son significativas (p < 0,01).

El 10% de los sujetos a los que se aplicó el HUI-3 se encuentra en el estado de Salud total y el 30% se encuentra en el mejor estado posible en 7 de los 8 atributos, no pasando del nivel 2 en el octavo atributo. Como consecuencia, la matriz de correlaciones entre los atributos no puede calcularse de manera realista (ya que un alto porcentaje de puntuaciones es constante). Por este motivo, la matriz de correlaciones entre atributos se ha estimado utilizando únicamente a los sujetos con mayor variabilidad en sus respuestas: el 20% de la muestra (los 105 sujetos con peor estado de salud). La solución factorial obtenida presenta 5 factores: en el primer factor saturan Habla y Destreza; en el segundo, Deambulación y

Dolor; en el tercero, Visión; en el cuarto, Emoción y Cognición, y en el quinto, Audición (tabla 4). La solución basada en el 50% de sujetos con peor estado de salud no difiere sustancialmente de la obtenida con los 105 sujetos, y excluyendo únicamente al 10% de sujetos más sanos también se obtienen los mismos 5 factores. La prueba de Bartlett (χ2 = 171, gl = 28, p < 0,001) permite concluir que existen correlaciones significativas entre los atributos. La medida de adecuación muestral de Kaiser-Meyer-Olkin es de 0,67. Los resultados indican que el deterioro de la salud de los sujetos no se experimenta de manera unidimensional (en el sentido medido por el instrumento). Por el contrario, existen agrupaciones de atri-

TABLA 4 Matriz de configuración (rotación oblicua) y matriz de correlaciones entre los factores Factor Atributo

1

2

3

4

5

Visión Audición Habla Deambulación Destreza Emoción Cognición Dolor Autovalores*

–0,470 0,147 0,863 0,113 0,664 –0,082 0,247 –0,035 2,638

–0,019 0,025 –0,007 0,713 0,085 0,220 –0,153 0,763 1,454

0,719 0,294 –0,265 0,044 0,277 0,071 0,093 –0,030 1,147

0,114 –0,079 0,080 –0,202 –0,016 0,550 0,511 0,279 0,780

0,230 0,629 0,228 0,030 –0,140 –0,010 –0,100 –0,007 0,654

1

2

3

4

5

– 0,412 0,506 –0,068 –0,010

0,412 – 0,631 –0,023 0,258

0,506 0,631 – –0,294 –0,074

–0,068 –0,023 –0,294 – –0,223

–0,010 0,258 –0,074 –0,223 –

Función de utilidad multiatributo en la población española. Diferencias con la población canadiense En la tabla 5 se detalla la información necesaria para resolver la MAUF en la métrica Sima-Salud total (también existen tablas para la métrica Muerte-Salud total) y la fórmula para el cálculo de la utilidad (u). El valor de u es la utilidad que corresponde a un estado de salud crónico en la escala Sima-Salud total. En esa escala, el peor estado de salud posible (Sima) tiene una utilidad de 0; la Muerte, una utilidad de 0,289, y la Salud total, una utilidad de 1 (los estados de salud crónicos y el esta-

Matriz de correlaciones entre los factores

1 2 3 4 5

butos que empeoran de manera simultánea. Por otra parte, es interesante señalar que los atributos referentes al funcionamiento psicológico (Emoción, Cognición y, en menor medida, Dolor) aparecen asociados en una única dimensión. El Dolor aparece relacionado fundamentalmente con el empeoramiento de la Deambulación (movilidad); en tanto que Habla y Destreza aparecen asociados en una dimensión. Y la dimensión en la que se encuentra el atributo de Visión comparte, aunque en menor medida, carencias en Deambulación y Destreza. El ajuste intramuestra de la MAUF, en la muestra de modelado, arrojó una diferencia media de 0,147 (0,039) (p < 0,001). Parece que la MAUF sobrestima las utilidades en la muestra de modelado. La correlación intraclase es alta (0,934), lo que indica que el 93% de la varianza en las puntuaciones estimadas se debe a las diferencias en los estados de salud y solamente el 7% restante, al error de estimación. El ajuste intermuestra de la MAUF, en la muestra de modelado, y las utilidades obtenidas directamente por AN en la muestra de estimación directa, para los estados de salud prevalentes en la población, fueron buenos. La diferencia media intermuestra es negativa: –0,132 (0,042) (p < 0,001), lo que significa que la MAUF tiende a infraestimar las utilidades obtenidas de forma directa. El coeficiente de correlación intraclase disminuye algo con respecto a la muestra de modelado (0,898): el 90% de la variabilidad en las utilidades estimadas se debe a las diferencias en los estados de salud.

*Autovalores iniciales de la matriz de correlaciones.

TABLA 5 Valores para el cálculo de la función de utilidad multiatributo. Formato simplificado en escala Sima-Salud total Visión

Audición

Habla

Deambulación

Destreza

Emoción

Cognición

Dolor

A1

B1

A2

b2

A3

b3

A4

b4

A5

b5

A6

b6

A7

b7

A8

b8

1 2 3 4 5 6

1,00 0,99 0,92 0,85 0,74 0,62

1 2 3 4 5 6

1,00 0,95 0,87 0,80 0,72 0,59

1 2 3 4 5

1,00 0,96 0,89 0,78 0,62

1 2 3 4 5 6

1,00 0,94 0,86 0,73 0,62 0,52

1 2 3 4 5 6

1,00 0,95 0,86 0,74 0,62 0,49

1 2 3 4 5

1,00 0,99 0,74 0,56 0,35

1 2 3 4 5 6

1,00 0,91 0,95 0,80 0,69 0,62

1 2 3 4 5

1,00 0,95 0,89 0,77 0,64

Función de utilidad: u = (1,0078 × b1 × b2 × b3 × b4 × b5 × b6 × b7 × b8) – 0,0078.

Med Clin (Barc) 2003;120(3):89-96

93

RUIZ M, ET AL. ADAPTACIÓN Y VALIDACIÓN DEL HEALTH UTILITIES INDEX MARK 3 AL CASTELLANO Y BAREMOS DE CORRECCIÓN EN LA POBLACIÓN ESPAÑOLA

TABLA 6

meramente descriptiva, pues la suma de las puntuaciones no parece que tenga un significado claro). En la tabla 7 se presenta el baremo para el sistema de utilidades (MAUF), los percentiles obtenidos al analizar las utilidades asignadas por la muestra normativa. Cada percentil indica el porcentaje de casos que obtiene una utilidad igual o menor que la correspondiente a ese percentil.

Baremo para el sistema de clasificación. Percentiles asociados a los niveles de cada atributo del HUI-3 Nivel del atributo Atributo

Visión Audición Habla Deambulación Destreza Emoción Cognición Dolor

1

2

3

4

5

6

34,7 87,3 92,4 84,9 93,0 45,3 68,7 55,4

90,6 97,2 98,4 93,8 99,6 92,6 76,3 88,8

97,4 99,6 99,4 99,0 99,6 98,8 98,0 97,0

99,4 100,0 100,0 99,4 99,6 99,4 99,6 99,6

100,0 100,0 100,0 99,8 99,6 100,0 99,8 100,0

100,0 100,0 * 100,0 100,0 * 100,0 *

Discusión

*Estado imposible.

do de Salud total se asume que se mantienen de por vida; el estado Muerte se asume como algo inmediato). Al comparar, mediante análisis de la varianza, las utilidades medias de las funciones española y canadiense (fig. 1), todas las diferencias han resultado significativas (p < 0,001), excepto las de los grupos con puntuaciones redondeadas a 0,1 y 0,6. La mayor diferencia entre utilidades promedio se ha obtenido en el grupo 0,2: 0,092 puntos, y la diferencia entre los promedios de los grupos que difieren significativamente ha sido de 0,04 puntos. Por otra parte, existe interacción significativa entre el tipo de función utilizada y el grupo de puntuación de utilidad: la función canadiense, comparada con la española, ofrece puntuaciones más bajas en los 7 primeros grupos (de 0,1 a 0,7) y puntuaciones más altas en los tres últimos (de 0,8 a 1,0). Los resultados obtenidos en la métrica Muerte-Salud total son similares (fig. 2), si bien la diferencia entre estimaciones es todavía mayor. La diferencia más grande entre

En la actualidad cada vez se emplean más los análisis de coste-utilidad para la asignación de los recursos sanitarios, donde la medida de los resultados clínicos se lleva a cabo combinando cantidad y calidad de vida a través de la medida de los AVAC ganados. Para poder calcular la utilidad, es necesario determinar las preferencias de las personas por los diferentes estados de salud de interés. Una forma de efectuar su cálculo es a través de cuestionarios donde los estados de salud son descritos a partir de un sistema de clasificación consistente en una serie de dimensiones, con múltiples niveles por dimensión3,4,11,21,22. Uno de los instrumentos más empleados es el HUI-3, que ha sido ampliamente utilizado en Canadá, EE.UU. y en algunos países de Europa para evaluar preferencias de los pacientes en diferentes enfermedades23,24. Teniendo en cuenta las diferencias culturales e idiomáticas de unos países a otros, es fundamental la utilización de funciones de utilidad propias de la población en la que se desea aplicar el HUI-3, por lo que la disponibilidad a partir de ahora de una versión española de este

utilidades promedio es de 0,14 puntos, y la diferencia media entre los grupos que difieren significativamente ha sido de 0,07 puntos. La única diferencia no significativa corresponde al grupo con puntuación redondeada –0,2. De nuevo existe interacción significativa entre la función utilizada y el grupo de puntuación de utilidad. Es interesante apreciar que el estado Muerte (grupo de puntuación 0) recibe una menor utilidad con la función española, lo que hace sospechar de la existencia de una mayor aversión hacia este estado en la población española. Baremos para la población española En la tabla 6 se ofrecen los percentiles correspondientes a los distintos niveles de cada atributo. Un percentil más alto indica mayor gravedad. Adicionalmente, la puntuación total (la suma de las puntuaciones en cada atributo) puede utilizarse como una descripción unidimensional del nivel de gravedad del estado de salud de una persona (aunque esta información es

TABLA 7 Baremo para el sistema de utilidades. Percentiles asociados a cada utilidad en la escala Sima-Salud total Utilidades 0,00-0,520

94

Utilidades 0,528-0,724

Utilidades 0,726-0,804

Utilidades 0,805-0,881

Utilidades 0,882-1,000

Utilidad

Centil

Utilidad

Centil

Utilidad

Centil

Utilidad

Centil

Utilidad

Centil

0,052 0,122 0,148 0,236 0,251 0,262 0,275 0,301 0,325 0,341 0,345 0,346 0,365 0,390 0,391 0,428 0,430 0,433 0,442 0,446 0,456 0,464 0,478 0,488 0,520

0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,2 2,8 3,0 3,2 3,4 3,6 3,8 4,0 4,2 4,4 4,8 5,0 5,2

0,528 0,545 0,558 0,561 0,579 0,589 0,609 0,618 0,633 0,639 0,649 0,653 0,657 0,663 0,665 0,675 0,685 0,686 0,687 0,690 0,694 0,698 0,703 0,707 0,724

5,4 5,6 5,8 6,0 6,2 6,5 6,7 6,9 7,1 7,3 7,5 7,7 8,1 8,3 8,5 8,7 8,9 9,3 9,5 9,9 10,1 10,3 10,5 10,7 11,1

0,726 0,728 0,734 0,740 0,744 0,746 0,750 0,754 0,760 0,762 0,769 0,771 0,772 0,773 0,774 0,776 0,780 0,781 0,782 0,787 0,789 0,790 0,794 0,799 0,804

11,7 12,3 12,7 12,9 13,3 13,5 13,7 13,9 14,3 14,5 14,7 15,1 15,3 15,5 15,7 15,9 16,7 17,5 17,7 17,9 18,1 18,3 18,5 18,7 19,0

0,805 0,812 0,814 0,820 0,821 0,824 0,826 0,827 0,829 0,831 0,834 0,835 0,839 0,840 0,843 0,846 0,852 0,855 0,867 0,871 0,872 0,876 0,878 0,880 0,881

19,6 19,8 20,0 20,4 20,8 21,0 21,2 21,4 21,6 21,8 22,2 22,4 22,6 22,8 23,8 24,0 25,2 25,4 25,8 26,2 26,4 26,8 27,0 30,0 31,3

0,882 0,883 0,886 0,887 0,888 0,890 0,892 0,893 0,896 0,896 0,900 0,906 0,925 0,926 0,927 0,930 0,936 0,941 0,944 0,946 0,951 0,955 0,978 0,989 1,000

31,9 32,3 32,9 33,3 33,5 35,5 36,1 36,3 37,1 37,1 37,3 37,7 39,1 39,3 39,9 44,8 47,8 55,4 56,3 59,7 61,1 61,7 71,2 87,9 100,0

Med Clin (Barc) 2003;120(3):89-96

RUIZ M, ET AL. ADAPTACIÓN Y VALIDACIÓN DEL HEALTH UTILITIES INDEX MARK 3 AL CASTELLANO Y BAREMOS DE CORRECCIÓN EN LA POBLACIÓN ESPAÑOLA

instrumento va a permitir calcular utilidades en nuestro país. Los resultados de este trabajo de validación y adaptación del HUI al castellano indican que el cuestionario puede aplicarse de forma individual o colectiva, y de forma autoadministrada o mediante entrevista (esto último es recomendable en personas mayores y cuando el estado de salud es grave). Puede afirmarse que, valorados en conjunto, los índices psicométricos obtenidos son buenos. Tanto los índices de fiabilidad (consistencia interna y estabilidad temporal) como los de validez (convergente, de constructo y ajuste) alcanzan valores que permiten confiar en la calidad de la versión adaptada del HUI-3, y esto tanto si el cuestionario se utiliza como un sistema de clasificación como si se emplea como un sistema de utilidades. Si se desea utilizar el cuestionario como un inventario de estados de salud (como un sistema de clasificación), debería hacerse valorando cada atributo por separado y no todos conjuntamente de manera unidimensional. La razón para hacer esta recomendación es que la suma total de las puntuaciones se comporta de manera ordinal y no refleja de manera fidedigna el nivel de gravedad del estado de salud del sujeto. Como instrumento de utilidades, los resultados del HUI-3 se correlacionan fuertemente con los obtenidos por el EuroQoL, el termómetro de salud y la escala de valoración global de salud. Sin embargo, debe tenerse en cuenta que las utilidades atribuidas por la muestra española difieren significativamente de las atribuidas por la muestra canadiense. De hecho, al aplicar la función canadiense a la población española se sobrestiman las utilidades de los estados de salud más graves. Hay que tener en cuenta que los autores de la escala original consideran que los niveles descritos dentro de cada atributo son nominales (no ordinales). Esto es debido a que se asume que la ordenación de los niveles no necesariamente se corresponde con las preferencias reales de la población (p. ej., es posible que en una determinada población el nivel 3 sea preferible al 2). En este sentido, llama la atención la preferencia atribuida a los niveles 2 y 3 del atributo Cognición (el nivel 3 se ha preferido al 2). Este fenómeno ya fue detectado por los autores originales, quienes pensaron que no constituía ningún problema precisamente por considerar que los niveles del HUI-3 representan estados de salud nominales. No obstante, existen dos hallazgos que hacen dudar de esta afirmación. En primer lugar, existe un mayor número de personas en el nivel 3 que en el 2: dado que en la población suele encontrarse mayor número de personas en los estados de salud más benignos (mayor preva-

lencia de los mejores estados de salud; cfr. Encuesta Nacional de Salud), este resultado indica que esos dos niveles podrían no estar bien definidos. En segundo lugar, las personas entrevistadas han manifestado explícitamente su tendencia a no leer todos y cada uno de los estados de salud; como tendencia general, han ido leyendo los distintos niveles de cada atributo hasta encontrar un nivel peor que en el que creían estar y han marcado el inmediatamente anterior; esto indica que los sujetos utilizan los atributos de manera ordinal, no de manera nominal. Este resultado es ilustrativo desde el punto de vista de la diferencia mínima relevante25: si se utiliza el HUI-3 en un estudio clínico para valorar la evolución de los pacientes, se debe tener en cuenta que en las mediciones correspondientes al atributo Cognición pueden aparecer diferencias significativas espontáneas entre el test y el retest (es decir, diferencias significativas no atribuibles a ningún tratamiento). Cabe pensar que existe un cierto sesgo en las muestras utilizadas respecto al nivel de estudios, ya que hay una sobrerrepresentación de los titulados superiores. Aunque no se han encontrado diferencias significativas entre los grupos de estudios respecto a las utilidades asignadas en las tareas EVA y AN, se aprecia una tendencia (no significativa) a atribuir menor utilidad a los estados de salud cuando el nivel de estudios del encuestado es bajo. Por lo hallado en este trabajo, podemos concluir que el cuestionario HUI-3, diseñado originalmente para medir 8 atributos de salud independientes8, en la práctica tiende a recoger niveles de deterioro que se encuentran relacionados entre sí. Si bien es cierto que el propósito original del instrumento es la medición ordinal del deterioro en cada dimensión (nivel de medida ordinal), el análisis factorial asume un nivel de medida continuo (que no coincide con el propósito original del diseño del instrumento). Sin embargo, los resultados del análisis factorial mediante escalamiento multidimensional (que asume mediciones ordinales) no difieren sustancialmente de los obtenidos. Es necesario reseñar algunas limitaciones de nuestro estudio, tales como: a) la muestra empleada se ha escogido de la población de la Comunidad Autónoma de Madrid, no de la población general española, aunque pensamos que la población de la Comunidad de Madrid no difiere sustancialmente de la del resto del país y que, por tanto, nuestros resultados se pueden aplicar a toda la geografía española, y b) el HUI es, fundamentalmente, una medida del impacto físico y es bastante insensible a los cambios en el bienestar psicológico relacionado con variables como la autoestima o el estrés (lo que aconseja integrar el HUI con otras

medidas complementarias de salud psicológica cuando se vaya a explorar los estados de salud en la población general). Por otra parte, varios autores han hallado al evaluar el HUI que los atributos Destreza y Habla presentan una fiabilidad modesta (coeficientes kappa de 0,347 y 0,137, respectivamente), y que al evaluar estados de salud buenos (experimentados por la mayoría de la población) este instrumento no parece discriminar entre muchos niveles diferentes, ya que es bastante insensible a las variaciones de los indicadores de bienestar social26,27. El uso habitual del HUI-3 presenta varias aplicaciones potenciales en nuestro país; por ejemplo, puede ser usado como un perfil que describa el estado de salud de un paciente o de un grupo de pacientes, o bien como un índice que pueda representar el estado de salud de una persona o grupo de personas. Además, será posible obtener el valor de utilidades sociales de un determinado paciente aplicando una tarifa social de valores, que ha sido obtenida de la valoración por parte de una muestra representativa de la sociedad, de los estados de salud más importantes descritos por este cuestionario. De esta forma se podrá calcular los AVAC de cada opción terapéutica existente en el mercado, lo que ayudará a la asignación de recursos en atención sanitaria. Sin embargo, y en aras de incrementar la credibilidad y relevancia de los estudios efectuados con el HUI, dado que se han encontrado diferencias significativas entre la función de utilidad obtenida con la muestra española y la función de utilidad original canadiense, si se desea utilizar el HUI-3 con sujetos españoles es recomendable utilizar la función de utilidad obtenida con la muestra española, ya que si no se estará cometiendo el error de comparar a un sujeto con un grupo normativo con valores de referencia que no le corresponden. Como continuación del presente estudio, se está recabando información adicional con el HUI-3 sobre grupos de pacientes con enfermedades específicas (de próstata, depresión, demencia, etc.), con el ánimo de comprobar la posible variación de las utilidades sociales en estos grupos. Además, se desea comprobar la posibilidad de estimación de las utilidades mediante técnicas de escalamiento multidimensional. REFERENCIAS BIBLIOGRÁFICAS 1. Fayers PM, Machin D. Quality of life. Assessment, analysis and interpretation. 1st ed. West Sussex: John Wiley & Sons Ltd; 2000. 2. Nord E. Measuring population health: an organisation for economic cooperation and development survey of multi-attribute utility instruments. In: Pinto JL, López-Casanovas, Ortún V, editors. Economic evaluation: from theory to practice. Barcelona: Spinger-Verlag Ibérica, 2001. Med Clin (Barc) 2003;120(3):89-96

95

RUIZ M, ET AL. ADAPTACIÓN Y VALIDACIÓN DEL HEALTH UTILITIES INDEX MARK 3 AL CASTELLANO Y BAREMOS DE CORRECCIÓN EN LA POBLACIÓN ESPAÑOLA

3. Torrance GW. Toward a utility theory foundation for health status index models. Health Serv Res 1976;11:349-69 4. Drummond MF, O’Brien B, Stoddart GL, Torrance GW. Cost-utility analysis. In: Drummond MF, O’Brien D, Stoddart GL, Torrance GW, editors. Methods for the economic evaluation of health care programmes. 2nd. ed. Oxford: Oxford University Press, 1997. 5. Feeny D, Furlong W, Boyle M, Torrance GW. Multi-attribute health status classification systems. Health Utilities Index. Pharmacoeconomics 1995;7:490-502. 6. Casas A, Repullo JR, Pereira J. Medidas de calidad de vida relacionada con la salud. Conceptos básicos, construcción y adaptación. Med Clin (Barc) 2001;116:789-96. 7. Furlong W, Feeny D, Torrance GW, Goldsmith CH, DePauw S, Zhu Z, et al. Multiplicative multiattribute utility function for the Health Utilities Index Mark III System: a technical report. Hamilton, Ontario. Canadá. McMaster University Centre for Health Economics and Policy Analysis Working Paper, 1998. 8. Feeny D, Furlong W, Torrance G, Goldsmith, C, Zhu Z, Depauw S, et al. Multi-attribute and single-attribute utility functions for the Health Utilities Index Mark 3 System. Med Care 2002;4: 113-28. 9. Torrance GW, Feeny D, Furlong W. Visual analog scales: do they have a role in the measurement

10. 11. 12. 13.

14. 15.

16. 17. 18. 19.

of preferences for health states? Med Decis Making 2001;21:329-34. Von Neuman U, Morgenstern O. Theory of games and economic behavior. Princeton NJ: Princeton University Press, 1944. Torrance GW. The measurement of health states utilities for economic appraisal. J Health Econ 1986;5:1-30. Cronbach LJ. Coefficient alpha and the internal structure of tests. Psychometrika 1951;16:297-334. Nunnally JC, Bernstein IJ. La evaluación de la confiabilidad. En: Nunnally JC, Bernstein IJ, editores. Teoría psicométrica. 3.a ed. México: McGraw Hill, 1995. McGraw KO, Wong SP. Forming inferences about some intraclass correlation coefficients. Psychol Bull 1996;1:30-46. Badía X, Roset M, Montserrat S, Herdman M, Segura A. La versión española del EuroQol: descripción y aplicaciones. Med Clin (Barc) 1999; 112(Supl 1):79-86. Kaiser HF, J Caffrey. Alfa factor analysis. Psychometrika 1965;30:1-14. Hendrickson AE, White PO. Promax: a quick method for rotation to oblique simple structure. Brit J Stat Psychol 1964;17:65-70. Kaiser HF. The application of electronic computers to factor analysis. Educ Psychol Meas 1960;20:141-51. Cattell RB. The scree test for the number of factors. Multivar Behav Res 1966;1:245-76.

20. Nunnally JC, Bernstein IJ. Análisis factorial. En: Nunnally JC, Bernstein IJ, editores. Teoría psicométrica. 3.a ed. México: McGraw Hill, 1995. 21. Siegel J, Torrance W, Russell L, Luce B, Weinstein M, Gold M, et al. Guidelines for pharmacoeconomic studies. Recommendations from the Panel on Cost Effectiveness in Health and Medicine. Pharmacoeconomics 1997;11:159-68. 22. Raisch D. Understanding quality-adjusted life years and their application to pharmacoeconomic research. Ann Pharmacother 2000;34:906-14. 23. Kopec JA, Schultz SE, Goel V, Williams JI. Can the Health Utilities Index measure change? Med Care 2001;39:562-74. 24. Bosch JL, Hunink MGM. Comparison of the Health Utilities Index Mark 3 (HUI-3) and the EuroQol ED-5D in patients treated for intermittent claudication. Qual Life Res 2000;9:591-601. 25. Hays RD, Wooley JM. The concept of clinically meaningful difference in health related qualityof-life research: how meaningful is it? Pharmacoeconomics 2000;18:419-23. 26. Boyle MH, Furlong W, Feeny D, Torrance GW, Hatcher J. Reliability of the Health Utilities Index-Mark III used in the 1991 cycle 6 Canadian General Social Survey Health Questionnaire. Qual Life Res 1995;4:249-57. 27. Richardson CG, Zumbo BD. A statistical examination of the health utility index-Mark III as a summary measure of heath status for a general population health survey. Soc Indic Res 2000; 51:171-91

APÉNDICE Sistema de clasificación del estado de salud por atributos. Health Utilities Index Mark 3 Atributo

Visión

Audición

Descripción de los niveles

1 2 3 4 5 6 1 2 3 4 5

Habla

Deambulación

Destreza

Estado emocional

Cognición

Dolor

96

6 1 2 3 4 5 1 2 3 4 5 6 1 2 3 1 2 3 4 5 1 2 3 4 5 6 1 2 3 4 5

Capaz de ver lo suficiente para leer el periódico y reconocer a un amigo al otro lado de la calle, sin gafas ni lentes de contacto Capaz de ver lo suficiente para leer el periódico y reconocer a un amigo al otro lado de la calle, usando gafas Capaz de leer el periódico con gafas o sin ellas, pero incapaz de reconocer a un amigo al otro lado de la calle, ni usando gafas Capaz de reconocer a un amigo al otro lado de la calle con gafas o sin ellas pero incapaz de leer el periódico, ni usando gafas Incapaz de leer el periódico ni de reconocer a un amigo al otro lado de la calle, ni usando gafas Incapaz de ver nada Capaz de oír una conversación en grupo en la que participen al menos otras tres personas, sin ayuda auditiva Capaz de oír una conversación con otra persona en una habitación silenciosa sin ayuda auditiva, pero necesitado de esta ayuda auditiva para oír una conversación en grupo en la que participen al menos otras tres personas Capaz de oír una conversación con otra persona en una habitación silenciosa con ayuda auditiva y capaz de oír una conversación en grupo en la que participen al menos otras tres personas, con ayuda auditiva Capaz de oír una conversación con otra persona en una habitación silenciosa sin ayuda auditiva pero incapaz de oír una conversación en grupo en la que participen al menos otras tres personas, incluso con ayuda auditiva Capaz de oír una conversación con otra persona en una habitación silenciosa con ayuda auditiva pero incapaz de oír una conversación en grupo en la que participen al menos otras tres personas, incluso con ayuda auditiva Incapaz de oír nada Capaz de hacerse entender completamente cuando habla con extraños o con amigos Capaz de hacerse entender parcialmente cuando habla con extraños pero capaz de hacerse entender completamente por personas que le conocen bien Capaz de hacerse entender parcialmente cuando habla con extraños o con personas que le conocen bien Incapaz de hacerse entender cuando habla con extraños pero capaz de hacerse entender parcialmente por personas que le conocen bien Incapaz de hacerse entender cuando habla con cualquiera (o incapaz de hablar en absoluto) Capaz de caminar por el barrio sin dificultad y sin ayudas para la deambulación Capaz de caminar por el barrio con dificultad, pero sin necesitar ayudas para la deambulación ni la ayuda de otra persona Capaz de caminar por el barrio con ayudas para la deambulación pero sin la ayuda de otra persona Capaz de caminar sólo distancias cortas con ayudas para la deambulación y necesitado de una silla de ruedas para desplazarse por el barrio Incapaz de caminar solo, ni con ayudas para la deambulación. Capaz de caminar distancias cortas con la ayuda de otra persona y necesitado de una silla de ruedas para desplazarse por el barrio Incapaz de caminar en absoluto Utiliza completamente las dos manos y los diez dedos Limitaciones en el empleo de las manos o de los dedos pero sin necesitar instrumentos especiales ni la ayuda de otra persona Limitaciones en el empleo de las manos o de los dedos, es independiente gracias a ayuda de otra persona para realizar cualquier tarea (no es independiente ni empleando instrumentos especiales) Feliz y con interés por la vida Bastante feliz Bastante infeliz Muy infeliz Tan infeliz que la vida no vale la pena Capaz de recordar la mayoría de las cosas, piensa con claridad y resuelve los problemas cotidianos Capaz de recordar la mayoría de las cosas, pero tiene cierta dificultad cuando intenta pensar y resolver los problemas cotidianos Bastante olvidadizo, pero capaz de pensar con claridad y de resolver los problemas cotidianos Bastante olvidadizo y tiene cierta dificultad cuando intenta pensar o resolver los problemas del día a día Muy olvidadizo y tiene una gran dificultad cuando intenta pensar o resolver los problemas cotidianos Incapaz de recordar nada ni de pensar o resolver los problemas cotidianos Sin dolor ni molestias Dolor leve a moderado que no impide realizar actividades Dolor moderado que impide realizar ciertas actividades Dolor moderado a intenso que impide realizar algunas actividades Dolor muy intenso que impide realizar la mayoría de las actividades

Med Clin (Barc) 2003;120(3):89-96

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.