Em outras palavras, é possível, por exemplo, que as variações de três ou quatro variáveis observadas possam ser explicadas por somente um fator. Dessa forma a análise fatorial é útil em descrever um conjunto de dados utilizando para isso apenas alguns fatores. Em marketing, esses fatores podem estar associados à características do produto, clientes e até mesmo da organização.
Cuidados.
Como todo método estatístico a análise fatorial clássica exige que alguns pressupostos sejam satisfeitos, quais sejam:
- Normalidade dos dados. Apesar desse pressuposto não ser crítico quando a estimação é realizada por mínimos quadrados ordinários, a exigência de normalidade auxilia na análise, evitando possíveis assimetrias e a presença de outliers.
- Variáveis quantitativas medidas em escala Intervalar ou de Razão. Esse pressuposto é crítico, pois a análise deve ser realizada com variáveis quantitativas e, frequentemente, alguns estudos são realizados utilizando variáveis ordinais (as quais são qualitativas) na análise fatorial clássica (o que é errado de muitas maneiras). Para maiores detalhes consulte Jöreskog e Moustaki (2001) e Castilho (2011) - Estudo do perfil dos visitantes do zoológico de Brasília com análise fatorial: uma aplicação em marketing.
Outros pressupostos ainda podem ser exigidos dependendo do tipo de análise a ser realizada.
Cada software possui sua peculiaridade no processo de estimação dos fatores. No caso do R a análise fatorial é realizada por meio da função factanal.
Exemplo.
Como exemplo considere o seguinte banco de dados: USArrests. Este conjunto de dados contém informações sobre as prisões ocorridas nos EUA em 1973 para cada 100.000 habitantes. A proporção da população, quantidade de assaltos, assassinatos e estupros em cada um dos 50 estados dos EUA são registrados.
1 2 3 4 5 | #Habilita o banco de dados USArrests data (USArrests) #Lista as variáveis presentes no banco names (USArrests) |
Nesse caso, temos quatro variáveis: "Murder", "Assault", "UrbanPop" e "Rape". A análise fatorial pode ser utilizada para reduzir esse conjunto de dados para uma dimensão menor ou igual a quantidade de variáveis disponíveis.
O primeiro passo é determinar quantos fatores devem ser utilizados. Uma abordagem bastante prática é a análise do ScreePlot. Nessa abordagem a escolha do número de fatores se dá no "cotovelo" do Screeplot (Catell, R.B. (1966)).
Essa metodologia foi criticada por Kaiser, H.F.(1970) devido a sua natureza subjetiva (ou seja, não há uma definição clara do objetivo que constitui uma queda substancial, nesse caso, descrita pelo "cotovelo" do Screeplot).
Apesar de polêmica, utilizaremos a abordagem do Screeplot nesse exemplo. Outros métodos de escolha do números de fatores podem ser obtidos nos textos Horn (1965), Humphreys e Ilgen (1969), Humphreys, Montanelli e Jr. (1975) e Ledesma e Valero-Mora (2007).
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | # Obtêm os autovalores observados #da matriz de correlações amostrais. autovalores<- eigen ( cor (USArrests))$values #Obtêm o número de observações da base de dados. nobservacoes <- nrow (USArrests) #Computa o número de variáveis. variaveis<- length (autovalores) #Define o número de repetições para a estimação do número #de fatores por meio da análise paralela Horn (1965). rep <- 100 #Valor do centil para a análise fatorial. cent <- 0.95 |
1 2 3 4 5 6 | #Análise paralela de Horn (1965) #para determinação do número de fatores. ap <- parallel (subject=nobservacoes,var=variaveis,rep=rep,cent=cent) #Número de fatores segundo diferentes regras apAutovet <- ap$eigen |
1 2 3 4 5 6 | #Guarda os resultados results <- nScree (eig = autovalores,aparallel=apAutovet$qevpea) results #Imprimi o Screeplot plotnScree (results) |
1 2 3 4 5 | #Realiza a análise fatorial para dois fatores. fit <- factanal (USArrests, 2, rotation= "varimax" ) #Imprimi os resultados print (fit, digits=2, cutoff=.3, sort= TRUE ) |
1 2 3 4 5 | #Mapa fatorial library (FactoMineR) #Gera os gráficos automaticamente result <- PCA (USArrests) |
Nenhum comentário:
Postar um comentário