Correlación Canónica

June 30, 2017 | Autor: Charliie Ibanez | Categoría: Statistics, Multivariate Statistics, Multivariate Analysis, R Studio, R
Share Embed


Descripción

Canonical Correlation Luis Carlos Ibáñez León September 2015

Análisis de Correlación Canónica El análisis de correlación canónica es un método de análisis multivariante desarrollado por Harold Hotelling. Su objetivo es buscar las relaciones que pueda haber entre dos grupos de variables y la validez de las mismas. Se diferencia del análisis de correlación múltiple en que este solo predice una variable dependiente a partir de múltiples independientes, mientras que la correlación canónica predice múltiples variables dependientes a partir de múltiples independientes. Las correlaciones canónicas constituyen una generalización de las correlaciones simples y múltiples. Las correlaciones simples estiman la relación existente entre dos variables, la variable independiente X y la dependiente Y. Las correlaciones múltiples estiman la relación entre un conjunto de variables independientes Xi y una sola variable dependiente Y. Las correlaciones canónicas estiman la correlación existente entre un conjunto de variables independientes Xi y otro conjunto de variables dependientes Yi .

Keywords Correlación La correlación trata de establecer la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas. Canónico Ésta palabra indica algo que es natural e independiente de elecciones arbitrarias, que es absoluto y no relativo a un observador, que es intrínseco y no depende de un sistema de referencia o de un sistema de coordenadas, que pertenece a la estructura propia de lo que estudiamos.

Cómo funciona Algunas estructuras de datos multivariados complejos se comprenden mejor mediante el estudio de las proyecciones de baja dimensionalidad. Para un estudio conjunto de dos conjuntos de datos, podemos preguntar qué tipo de proyección de pocas dimensiones ayuda en el hallazgo posibles estructuras comunes para las dos muestras. El análisis de correlación canónica es una herramien ta estándar de análisis estadístico multivariado para el descubrimiento y cuantificación de las asociaciones entre dos conjuntos de variables. La técnica básica se basa en proyecciones. Uno de fine un índice (variable multivariante proyectada) que se correlaciona con el índice máximo de la otra variable para cada muestra por separado. El objetivo del análisis de correlación canónica es maximizar la asociación (medida por la correlación) entre los salientes de baja dimensionalidad de los dos conjuntos de datos. Los vectores de correlación canónica se encuentran por un análisis de covarianza conjunta de las dos variables. Supongamos que tenemos dos variables aleatorias Xq e Yp . La idea es encontrar un índice que describe una (posible) relación entre X e Y. El análisis de correlación canónica (CCA) se basa en los índices lineales, i.e. , combinaciones lineales aT X y bT Y de las variables aleatorias. El CCA busca vectores a y b tales que la relación entre los dos indices aT y bT es cuantificada de manera interpretable.

1

Aplicaciones del Análisis e Correlación Canónica El análisis de correlación canónica puede ser un instrumento adecuado para tratar los supuestos en los que se dispone de información de un conjunto numeroso de variables que pueden agruparse en dos grupos, el primero formado por las variables explicativas y el segundo por las explicadas y, además, dentro de cada grupo se observa un elevado grado de correlación entre las variables. Su uso se extiende dentro de las ciencias sociales como la politica y educación hasta las ciencias de la tierra como la biología y la química. Es el modelo mas generalizado de la familia de técnicas de análisis multivariado ya que permite analizar relaciones multidimensionales entre mltiples variables independientes y otras dependientes.

Correlación Canónica en R R ofrece a través de el paquete CCA un conjunto de funciones que extienden la funcion ‘cancor’, y permite lidear con conuntos de datos en los que el número de variables sea mayor que el número de observaciones. Para realizar un análisis de Correlación Canónica es necesario instalar el paquete de R que nos permite llevar a cabo éste análisis y cargar la librería corresponiente. install.packages("CCA") library("CCA") install.packages("MBESS") library("MBESS") install.packages("yhat") library("yhat") Para comenzar a trabajar con las funciones que podemo utilizar en R para desarrollar un CCA trataremos varios ejemplos.En el primero se trata de encontrar las posibles correlaciones ente las variables que describen dos conjuntos de datos sobre una población (ambas tablas se muestran en la sección de anexos). La primera matriz nos muestra 29 observaciones de individos a los cuales se les extrajo la siguiente información: Edad Genero Nivel socioeconómico Escolaridad Ocupacion Estado Civil La segunda tabla nos muestra los puntajes obtenidos por los 29 individuos(rows) despues de haberles aplicado el test Cleaver(tipo y estilo de comportamiento), las variables que en esta tabla se muestran (cols) son: D Dominio o empuje: La capacidad de liderazgo, de lograr resultados, de aceptar retos, de superar problemas y tener iniciativa I Influencia: Habilidad para relacionarse con la gente y motivarla para que realice actividades específicas. S Constancia: Capacidad para realizar trabajos de manera continua y rutinaria, que no requiera cambios. C Apego: Habilidad para desarrollar trabajos respetando normas y procedimientos establecidos.

2

Análisis CCA Cuando el numero de observaciones (n) es mucho mas grande que el numero de variables (p,q),(como en este caso), procedemos a hacer un análisis de correlación canónica con la siguiente serie de comandos: Los resutados de esta instrucción se muestran en la seccion de Anexos require(CCA) res
Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.