Hoje uma grande queixa em relação ao uso do R é a dificuldade de lidar com grandes bases de dados (Big Data), nesse sentido, o software Revolution R tem apresentado bons resultados, pois além de lidar com grandes bases de dados utiliza a sintaxe do R para a execução de comandos.
Revolution Analytics é uma empresa de software estatístico focada no desenvolvimento de versões "open-core" do software livre e open source para R. Revolution Analytics foi fundada em 2007 oferecendo apoio e serviços para o software R em um modelo semelhante a abordagem da Red Hat com Linux na década de 1990.
Um bom ponto de partida para entender o Revolution R é pesquisando nos fóruns: http://forums.revolutionanalytics.com/forums/forum.php.
Em 2009, a empresa recebeu nove milhões em capital da Intel, juntamente com uma empresa nomeando Norman H. Nie como seu novo CEO. Em 2010, a empresa anunciou a mudança de nome, bem como uma mudança de foco. Seu principal produto, Revolution R, seria oferecido gratuitamente aos usuários acadêmicos e seu software comercial iria incidir sobre grandes volumes de dados, utilizando multiprocessamento em larga escala e funcionalidade multi-core.
Formato XDF é o formato padrão no Revolution R.
Esse tipo de formato tem como principais características:
- Armazena dados em blocos para a leitura eficiente de colunas arbitrárias e linhas contíguas.
- Contém metadados associados, tais como nomes de variáveis, descrições e tipos de armazenamento de dados.
- Suporta um conjunto mais rico de tipos de armazenamento de dados do que R (oito tipos de inteiros, dois tipos de números de ponto flutuante.
- Escreve blocos de dados de linhas para que o processamento de dados possa ser otimizado.
- Processa os dados em blocos (grupos de blocos).
- Otimiza o tamanho dos blocos dependendo da largura de banda do computador individual para I/O.
Uma vez instalado o Revolution R o primeiro passo é criar um projeto:
O interessante é que no Revolution R podemos criar Soluções, Projetos e Scripts. Uma SOLUÇÃO pode conter mais de um PROJETO, e os projetos podem conter um ou mais SCRIPTS. A principal tela do Revolution R é a seguinte:
Suponha que desejamos importar o arquivo Pobreza.csv. Para importar os dados no ambiente Revolution R, basta inserirmos os Snippets. Clique com o botão direito do mouse na tela de Script e escolha:
Em seguida vá na Opção Data Sets:
Escolha a opção Import Data:
Automaticamente, o Revolution R cria a sintaxe básica para importação de dados. Para navegar entre os argumentos da função basta usar a tecla Tab:
Para executar o comando, basta fazer:
Observação: É importante indicar o endereço exato do arquivo Pobreza.csv, como por exemplo:
#Importação dos dados pobreza.df<-read.table("C:/Pasta/Pobreza.csv",sep=",")