Estatística Multivariada
Prof. José Francisco
[email protected]
Vetor aleatório
Vetor aleatório Vetor aleatório é um vetor cujas componentes são variáveis aleatórias
x1 Vetor X = M aleatório x p
xi é uma variável aleatória ∀i=1,2,...,p
Exemplo: Notas finais obtidas por um aluno nas disciplinas no 6º período Vetor aleatório
x1 x2 X = x3 x4 x5
Variáveis aleatórias:
x1 = nota em processos estocásticos II x2 = nota em planejamento de experimentos x3 = nota em tecnologia da amostragem II x4 = nota de econometria x5 = nota de estatística multivariada
Vetor de médias
x1 Seja X um vetor aleatório: X = M x p E ( x1 ) µ1 Vetor de médias: E ( X ) = M ⇒ µ X = M E (x ) µ p P Vetor com as médias das variáveis do vetor aleatório X
Matriz de covariâncias x1 Seja X um vetor aleatório: X = M x p
Matriz de covariâncias: Matriz com as variâncias e covariâncias das variáveis do vetor aleatório X
Cov(x1, x2 ) K Cov (x1, x p ) Var (x1 ) Cov (x2 , x p ) Cov (x2 , x1 ) Var (x2 ) ΣX = M O M Cov (x , x ) Cov (x , x ) L Var (x ) p 1 p 2 p σ11 σ12 K σ p1 σ p2 σ 21 σ 22 ΣX = M O M σ L σ σ p 1 p 2 pp Matriz pxp simétrica, σij =
σji
Matriz positiva definida, ou seja,
a1Txp Σ pxp a px1 > 0 ∀ vetor de constantes a px1
Matriz de covariâncias
Matriz de covariâncias σ11 σ12 K σ p1 σ p2 σ 21 σ 22 ΣX = M O M σ p1 σ p 2 L σ pp
Variância generalizada (determinante)
ΣX
Variância total (traço) traço(Σ X ) = σ11 + σ 22 + K + σ pp
Matriz de correlação x1 Seja X um vetor aleatório: X = M x p
Matriz de correlação: Matriz com as correlações entre as variáveis do vetor aleatório X
1 ρ12 K ρ1 p ρ2 p ρ21 1 PX = M O M ρ p1 ρ p 2 L 1 ρij =
cov (xi , x j )
Var (xi ) ⋅ Var (x j )
Coeficiente de correlação entre as variáveis xi e xj
− 1 ≤ ρij ≤ 1
Matriz pxp simétrica, ρij
= ρ ji
Combinações lineares x1 Seja X um vetor aleatório: X = M x p Seja a um vetor de constantes:
a T = (a1 K a p )
y = a1x1 + a2 x2 + K + a p x p
Em notação vetorial:
y = (a1
y é uma variável aleatória
x1 K a p ) M = a1Txp X px1 x P
Combinações lineares
y = (a1
x1 T K a p ) M = a1 xp X px1 x P
T T ( ) ( ) E y = a E X ⇒ µy = a µX
Var ( y ) = a T Σ X a
Combinações lineares Exemplo:
x1 X = x2
vetor aleatório com vetor média µX e matriz de covariâncias ΣX
1 µ X = 2
Considere
8 − 2 Σ X = − 2 5
1 1 z = x1 + x2 2 2
Qual a média e a variância da variável aleatória z ?
1 µ Z = (0,5 0,5)µ X = (0,5 0,5) = 1,5 2 0,5 8 − 2 0,5 2 = 2,25 σ z = (0,5 0,5)Σ X = (0,5 0,5) 0,5 − 2 5 0,5
Combinações lineares Exemplo:
x1 X = x2
vetor aleatório com vetor média µX e matriz de covariâncias ΣX
µ1 µ X = µ2
Considere
σ 11 σ 12 Σ X = σ 12 σ 22
z = a1 x1 + a2 x2
µ Z = (0,5 0,5)µ X = (a1 σ = (a1 2 z
a1 a2 )Σ X = (a1 a2
Qual a média e a variância da variável aleatória z ?
µ1 a2 ) = a1µ1 + a2 µ 2 µ2 σ 11 σ 12 a1 = a12σ 11 + a22σ 22 + 2a1a2σ 12 a2 ) σ 12 σ 22 a2
Combinações lineares
y1 = a11x1 + a12 x2 + K + a1 p x p y2 = a21x1 + a22 x2 + K + a2 p x p M yq = aq1x1 + aq 2 x2 + K + aqp x p
q combinações lineares de p variáveis do vetor aleatório X
y1 a11 K a1 p x1 Y = M = M O M M = Aqxp X px1 y a x K a qp P q q1 Vetor aleatório qx1 µY = A ⋅ µ X
vetor de médias qx1
ΣY = AΣ X AT
matriz de covariâncias qxq
Combinações lineares Exemplo:
x1 X = x2
vetor aleatório com vetor média µX e matriz de covariâncias ΣX
1 µ X = 2 Considere
8 − 2 Σ X = − 2 5 1 1 1 3 z = x1 + x2 w = x1 + x2 2 2 4 4
z 0,5 0,5 x1 = w 0,25 0,75 x2 Qual as médias e variâncias das variáveis aleatórias z e w ? Qual a covariância entre elas ?
Combinações lineares Exemplo: Vetor de médias
Matriz de covariâncias
µ z 0,5 0,5 0,5 0,5 1 1,5 = µ x = = 0,25 0,75 2 1,75 µ w 0,25 0,75
Σ z ,w Σ z ,w Σ z ,w
0,5 0,5 0,5 0,25 Σ x = 0,25 0,75 0,5 0,75 0,5 0,5 8 − 2 0,5 0,25 = 0,25 0,75 − 2 5 0,5 0,75 2 σ z = 2, 25 2,25 1,875 = 2 σ w = 2,5625 1 , 875 2 , 5625
cov( z , w) = 1,875
Estimadores do vetor média e da matriz de covariâncias Sejam X1, X2, ..., Xn observações multivariadas de uma amostra aleatória de tamanho n. x11 X1 = M x 1p
x21 X2 = M x 2p
...
xn1 Xn = M x np
O vetor média populacional µ é estimado pelo vetor média amostral:
x1 µˆ = X = M x p
n
1 x i = ∑ xk , i n k =1
i=1,p
Estimadores do vetor média e da matriz de covariâncias A matriz de covariâncias populacional Σ é estimada pela matriz de covariãncias amostral:
s11 K s1 p Σˆ = S = M O M s K s p 1 pp
(
)
(
)(
1 n sii = xk , i − x i ∑ n − 1 k =1
2
i=1,p
1 n sij = xk , i − x i x k , j − x j ∑ n − 1 k =1
)
i≠j i,j=1,p
Estimadores do vetor média e da matriz de covariâncias Exemplo: Amostra aleatória com quatro observações (n=4) de uma população trivariada (p=3) 1 3 X1 = 2 X 2 = 1 6 9
2 X3 = 3 5
1+ 3 + 2 +1 4 1,75 2 +1+ 3 + 5 = 2,75 X= 4 9 + 6 + 5 + 1 5,25 4 mu=apply(X,2,mean) > mu [1] 1.75 2.75 5.25
1 X 4 = 5 1
x1