Em outras palavras, é possível, por exemplo, que as variações de três ou quatro variáveis observadas possam ser explicadas por somente um fator. Dessa forma a análise fatorial é útil em descrever um conjunto de dados utilizando para isso apenas alguns fatores. Em marketing, esses fatores podem estar associados à características do produto, clientes e até mesmo da organização.
Cuidados.
Como todo método estatístico a análise fatorial clássica exige que alguns pressupostos sejam satisfeitos, quais sejam:
- Normalidade dos dados. Apesar desse pressuposto não ser crítico quando a estimação é realizada por mínimos quadrados ordinários, a exigência de normalidade auxilia na análise, evitando possíveis assimetrias e a presença de outliers.
- Variáveis quantitativas medidas em escala Intervalar ou de Razão. Esse pressuposto é crítico, pois a análise deve ser realizada com variáveis quantitativas e, frequentemente, alguns estudos são realizados utilizando variáveis ordinais (as quais são qualitativas) na análise fatorial clássica (o que é errado de muitas maneiras). Para maiores detalhes consulte Jöreskog e Moustaki (2001) e Castilho (2011) - Estudo do perfil dos visitantes do zoológico de Brasília com análise fatorial: uma aplicação em marketing.
Outros pressupostos ainda podem ser exigidos dependendo do tipo de análise a ser realizada.
Cada software possui sua peculiaridade no processo de estimação dos fatores. No caso do R a análise fatorial é realizada por meio da função factanal.
Exemplo.
Como exemplo considere o seguinte banco de dados: USArrests. Este conjunto de dados contém informações sobre as prisões ocorridas nos EUA em 1973 para cada 100.000 habitantes. A proporção da população, quantidade de assaltos, assassinatos e estupros em cada um dos 50 estados dos EUA são registrados.
#Habilita o banco de dados USArrests data(USArrests) #Lista as variáveis presentes no banco names(USArrests)
Nesse caso, temos quatro variáveis: "Murder", "Assault", "UrbanPop" e "Rape". A análise fatorial pode ser utilizada para reduzir esse conjunto de dados para uma dimensão menor ou igual a quantidade de variáveis disponíveis.
O primeiro passo é determinar quantos fatores devem ser utilizados. Uma abordagem bastante prática é a análise do ScreePlot. Nessa abordagem a escolha do número de fatores se dá no "cotovelo" do Screeplot (Catell, R.B. (1966)).
Essa metodologia foi criticada por Kaiser, H.F.(1970) devido a sua natureza subjetiva (ou seja, não há uma definição clara do objetivo que constitui uma queda substancial, nesse caso, descrita pelo "cotovelo" do Screeplot).
Apesar de polêmica, utilizaremos a abordagem do Screeplot nesse exemplo. Outros métodos de escolha do números de fatores podem ser obtidos nos textos Horn (1965), Humphreys e Ilgen (1969), Humphreys, Montanelli e Jr. (1975) e Ledesma e Valero-Mora (2007).
# Obtêm os autovalores observados #da matriz de correlações amostrais. autovalores<- eigen(cor(USArrests))$values #Obtêm o número de observações da base de dados. nobservacoes <- nrow(USArrests) #Computa o número de variáveis. variaveis<- length(autovalores) #Define o número de repetições para a estimação do número #de fatores por meio da análise paralela Horn (1965). rep <- 100 #Valor do centil para a análise fatorial. cent <- 0.95A definição dos métodos para estimar o número de fatores é dado por:
#Análise paralela de Horn (1965) #para determinação do número de fatores. ap <- parallel(subject=nobservacoes,var=variaveis,rep=rep,cent=cent) #Número de fatores segundo diferentes regras apAutovet <- ap$eigenOs resultados são gerados e armazendados no objeto results:
#Guarda os resultados results <- nScree(eig = autovalores,aparallel=apAutovet$qevpea) results #Imprimi o Screeplot plotnScree(results)O método de análise gráfica do Screeplot indica a presença de um fator. Para proceder com a análise, utilizamos a função factanal. Como a estimação dos fatores pela função factanal é realizada por meio de máxima verossimilhança, o pressuposto de normalidade multivariada é exigido. Apesar dos métodos indicarem a presença de um fator, estimaremos dois fatores para apresentar como a análise gráfica pode ser utilizada nesses casos.
#Realiza a análise fatorial para dois fatores. fit <- factanal(USArrests, 2, rotation="varimax") #Imprimi os resultados print(fit, digits=2, cutoff=.3, sort=TRUE)Existem outros métodos de rotação possíveis para a análise fatorial, quais sejam: none", "varimax", "quatimax", "promax", "oblimin", "simplimax", ou "cluster". Detalhes sobre os tipos de rotações podem ser obtidos em Everitt e Hothorn (2011). Outra maneira de visualizar graficamente a análise fatorial é por meio do pacote FactoMineR:
#Mapa fatorial library(FactoMineR) #Gera os gráficos automaticamente result <- PCA(USArrests)A função PCA do pacote FactoMineR forenece os gráficos para o mapa de fatores para as variáveis e para as observações. O pacote FactoMineR oferece um grande número de funções adicionais para a análise fatorial exploratória. Isto inclui a utilização de variáveis quantitativas e qualitativas, bem como a inclusão de variáveis suplementares e observações. Além da análise fatorial exploratória (apresentada brevemente aqui) ainda existe a possibilidade da análise fatorial confirmatória cujo principal objetivo é testar se as medidas de um constructo são consistentes com a compreensão do investigador sobre a natureza do constructo (ou fator). A análise fatorial confirmatória é então utilizada para testar se os dados se encaixam no modelo de mensuração definido.
Nenhum comentário:
Postar um comentário