SAUDAÇÕES!

Seja bem vindo à página do professor Pedro Albuquerque. Para saber mais sobre meu currículo, disciplinas ministradas e interesses de pesquisa, navegue no menu disponível no topo da página.

quarta-feira, 29 de agosto de 2012

Value at Risk (VaR) usando o R.

Em matemática financeira e gestão de risco financeiro, a medida Value at Risk (VaR) é uma medida de risco utilizada para mensurar o risco de perda de uma determinada carteira de ativos financeiros.

O VaR é definido como um valor limite tal que a probabilidade de perda daquele valor para a carteira ao longo do horizonte de tempo for superior a este valor de risco o qual é o nível de probabilidade determinado.

Por exemplo, se uma carteira de ações tem um VaR de um dia de 5% igual a 1 milhão de reais, há uma probabilidade de 0,05 de que a carteira caia a um valor superior 1 milhão de reais em um período de um dia.

O VaR tem quatro principais usos em finanças: gestão de riscos, controle financeiro e relatórios financeiros. VaR é por vezes utilizado em aplicações não-financeiras também.

Segundo Alexander (2009) os principais métodos de estimação do VaR são:

  • NFHS: Normal Filtered Historical Simulation.
  • STFHS: Student´s T Filtered Historical Simulation.
  • NEVT: Normal Extreme Value.
  • STEVT: Student´s T Extreme Value.

Considere o ativo PETR4 da Petrobrás para o ano de 2011 (01/01/2011 até 31/12/2011):

#Habilita o pacote quantmod
library(quantmod)

#Cria um novo ambiente para armazenar os dados
stockData <- new.env() 
#Especifica as datas de interesse
startDate = as.Date("2011-01-01") 
endDate = as.Date("2011-12-31")
#Obtêm os dados do ativo PETR4 e PETR3
getSymbols("PETR4.SA", src="yahoo",from=startDate,to=endDate)
#Calcula o log-retorno
retorno<-na.omit(diff(log(Cl(PETR4.SA))))
Para o método NFHS com $\lambda=0.05$ tem-se:
#Estima o VaR pelo método NFHS (lambda=0.05)
library(fGarch)
lambda<-0.05
#Passo1: Encotrando os resíduos padronizados
fit<-arima(retorno,order=c(1,0,0))
fit.res<-resid(fit)
modelo.N.FHS <- garchFit( ~garch(1, 1), fit.res , cond.dist = "norm")
sresi<-(modelo.N.FHS@residuals/modelo.N.FHS@sigma.t) 
#Passo2: Obtem-se sigma_t+1 e mu_t+1
mu.t1<- predict(fit, n.ahead=1)$pred[1]
sigma.t1<-predict(modelo.N.FHS , n.ahead=1)[1,1]
#Passo3: Para o período t+1 gera-se um conjunto de Retornos
uniforme<-ceiling(runif(1000)*length(sresi))
Retornos<-(sresi[uniforme]*sigma.t1)+mu.t1
#Passo4: Calcular o VaR
VaR.t1<- -quantile(Retornos, lambda) 
VaR.t1
O valor do $VaR_{0.05}=0.0006525116$ o que significa que com base nos dados da PETR4 entre 01/01/2011 até 31/12/2011 a probabilidade de se obter um retorno menor do que 0.06% é de 5%. Usando o método STFHS:
#Estima o VaR pelo método STFHS (lambda=0.05)
library(fGarch)
lambda<-0.05
#Passo1: Encotrando os resíduos padronizados
fit<-arima(retorno,order=c(1,0,0))
fit.res <- resid(fit)
modelo.N.FHS <- garchFit( ~garch(1, 1), fit.res , cond.dist = "sstd")
sresi<-(modelo.N.FHS@residuals/modelo.N.FHS@sigma.t) 
#Passo2: Obtem-se sigma_t+1 e mu_t+1
mu.t1<- predict(fit, n.ahead=1)$pred[1]
sigma.t1<-predict(modelo.N.FHS , n.ahead=1)[1,1]
#Passo3: Para o período t+1 gera-se um conjunto de Retornos
uniforme<-ceiling(runif(1000)*length(sresi))
Retornos<-(sresi[uniforme]*sigma.t1)+mu.t1
#Passo4: Calcular o VaR
VaR.t1<- -quantile(Retornos, lambda)
VaR.t1
O valor do VaR obtido aqui aproximadamente igual ao obtido pelo método NFHS $VaR_{0.05}=0.0006524376$ o que significa que com base nos dados da PETR4 entre 01/01/2011 até 31/12/2011 a probabilidade de se obter um retorno menor do que 0.06% é de 5%. Utilizando a abordagem paramétrica de valores extremos, temos para o método NEVT:
#Estima o VaR pelo método NEVT (lambda=0.05)
library(fGarch)
lambda<-0.05

#Passo1: Encotrando os resíduos padronizados
fit<-arima(retorno,order=c(1,0,0))
fit.res <- resid(fit)
modelo.N.EVT <- garchFit( ~garch(1, 1), fit.res , cond.dist = "norm")
sresi<-(modelo.N.EVT@residuals/modelo.N.EVT@sigma.t) 
#Passo2: Obtem-se sigma_t+1 e mu_t+1
mu.t1<- predict(fit, n.ahead=1)$pred[1]
sigma.t1<-predict(modelo.N.EVT , n.ahead=1)[1,1]
#Passo3: Estima o quantil com base na distribuição GEV
library(fExtremes)
sresi.menos<- -sresi
MLE<- gevFit(sresi.menos,type="pwm")
xi<- MLE@fit$par.ests[1]
mu<- MLE@fit$par.ests[2]
sigma<- MLE@fit$par.ests[3]

#Passo4: Calcular o VaR
quantil<- qgev(lambda, xi = xi, mu = mu, beta = sigma, lower.tail = TRUE)
VaR.t1<- -(mu.t1+quantil[1]*sigma.t1)
VaR.t1
O VaR obtido para o método NEVT foi de $0.0006521597$ e a interpretação é análoga aos exemplos anteriores. Por fim, o cálculo do VaR usando o método STEVT:
#Estima o VaR pelo método STEVT (lambda=0.05)
library(fGarch)
lambda<-0.05

#Passo1: Encotrando os resíduos padronizados
fit<-arima(retorno,order=c(1,0,0))
fit.res <- resid(fit)
modelo.N.ST.EVT <- garchFit( ~garch(1, 1), fit.res , cond.dist = "sstd")
sresi<-(modelo.N.ST.EVT@residuals/modelo.N.ST.EVT@sigma.t) 
#Passo2: Obtem-se sigma_t+1 e mu_t+1
mu.t1<- predict(fit, n.ahead=1)$pred[1]
sigma.t1<-predict(modelo.N.ST.EVT , n.ahead=1)[1,1]
#Passo3: Estima o quantil com base na distribuição GEV
library(fExtremes)
sresi.menos<- -sresi
MLE<- gevFit(sresi.menos,type="pwm")
xi<- MLE@fit$par.ests[1]
mu<-MLE@fit$par.ests[2]
sigma<-MLE@fit$par.ests[3]

#Passo4: Calcular o VaR
quantil<-qgev(lambda, xi = xi, mu = mu, beta = sigma, lower.tail = TRUE)
VaR.t1<- -(mu.t1+quantil[1]*sigma.t1)
VaR.t1
O VaR obtido para o método STEVT foi de $0.0006521516$. Graficamente, temos:
O código para a criação do gráfico de barras é:
VaR<-c(0.0006525116,0.0006524376,0.0006521597,0.0006521516)*100

mybarcol <- "gray20"
barplot(VaR, beside = TRUE,
 + col = c("lightblue", "mistyrose",
 +         "lightcyan", "lavender"),
 + legend = c("NFHS","STFHS","NEVT","STEVT"), 
 + main = "Value at Risk (VaR)", font.main = 4,
 + sub = "Petr4", col.sub = mybarcol, ylab="% VaR",
 + ylim= c(min(VaR),max(VaR)))

quinta-feira, 23 de agosto de 2012

Pacote quantmod - Análise quantitativa de séries financeiras.


O pacote quantmod é um pacote projetado para ajudar na análise quantitativa, desenvolvimento de testes e implantação de modelos de negócios com base estatística.

Após instalar o pacote, podemos fazer o download dos dados dos ativos PETR4.SA e PETR3.SA por meio do seguinte código:

#Habilita o pacote quantmod
library(quantmod)

#Cria um novo ambiente para armazenar os dados
stockData <- new.env() 

#Especifica as datas de interesse
startDate = as.Date("2010-01-01") 
endDate = as.Date("2011-12-31")
#Obtêm os dados do ativo PETR4 e PETR3
ativos<-c("PETR4.SA","PETR3.SA")
getSymbols(ativos, src="yahoo",from=startDate,to=endDate)
No comando acima, os dados dos ativos PETR4.SA e PETR3.SA são obtidos para as datas 01/01/2010 até 31/12/2011. A fonte desses dados é o Yahoo Finance. É possível, utilizar outras fontes como o Google Finance nesse caso basta trocar a opção src="yahoo" pela opção src="google".
#Usa o comando head para mostrar as seis primeiras observações
head(PETR4.SA)

#Plota a série temporal dos preços de fechamento
plot.xts(PETR4.SA$PETR4.SA.Close,major.format="%b/%d/%Y",
+main="PETR4.SA.",ylab="Close price.",xlab="Time")
O comando acima produz o seguinte gráfico:
Usualmente, trabalha-se com a série diferenciada, ou seja, utiliza-se o log-retorno na forma: $\begin{array}{ll} r_{t}=&log\left(\frac{P_{t}}{P_{t-1}}\right)\end{array}$ onde $P_{t}$ é o preço do ativo no tempo $t$ e $log(.)$ é o logarítimo natural. O comado em R é escrito da seguinte forma:
#Calcula o log-retorno.
diffPETR4.SA<-diff(log(PETR4.SA))

#Plota a série temporal dos preços de fechamento
plot.xts(diffPETR4.SA$PETR4.SA.Close,major.format="%b/%d/%Y",
+main="PETR4.SA.",ylab="Log-return Close price.",xlab="Time")
Resultando no seguinte gráfico:
Pode-se trabalhar inclusive com um subconjunto de dados para uma determinada janela:
#Examinando apenas um mês de dados.
petrSubset<-  window(diffPETR4.SA, 
+start = as.Date("2011-05-01"), end = as.Date("2011-05-31"))
#Imprime os dados
petrSubset 

sexta-feira, 17 de agosto de 2012

Pacote Rmetrics para finanças computacionais.


O pacote Rmetrics é um pacote livre, aberto e para o desenvolvimento e o ensino de finanças computacionais.

Rmetrics baseia-se principalmente na linguagem de programação estatística R, mas contém contribuições de outras linguagens de programação como Fortran, C e C++. O projeto foi iniciado em 2001 por Diethelm Wuertz, no Instituto Suíço de Tecnologia, em Zurique.

Os objetivos gerais do projeto RMetrics são:
  • Proporcionar o acesso generalizado a uma ampla gama de poderosos métodos estatísticos e gráficos para a análise dos dados de finanças de mercado e gestão de risco.
  • Fornecer uma plataforma comum de software que permita o rápido desenvolvimento e implantação de software extensível, escalável e interoperável.
  • Fortalecer o conhecimento científico através da produção de documentação de alta qualidade e por meio de pesquisa reprodutível.
  • Formar pesquisadores em métodos computacionais e estatísticos para a análise de dados financeiros e de gestão de risco financeiro.

Existem diversos livros sobre os métodos implementados no RMetrics , entre eles:


Outrs livros estão disponíveis!! Have fun!!

segunda-feira, 13 de agosto de 2012

O futuro da ciência.


Achei esse post bem interessante... O original foi postado no site http://techcrunch.com.

Quase todas as inovações tecnológicas do mundo têm suas raízes em um artigo científico. Dessa forma, estudar como os textos e artigos científicos são produzidos é importante para o desenvolvimento acadêmico. Segundo Richard Price - CEO do academic.edu - o progresso da ciência está emperrado devido a dois problemas principais:

  1. O problema do lapso temporal: há um intervalo de tempo de, em média, 12 meses entre o término de um artigo e sua publicação.
  2. O problema do modo único de publicação: pesquisadores em geral compartilham suas ideias apenas através de um único formato, qual seja: o artigo científico. E não utilizam todo o potencial fornecido pela internet.

Caso essas ineficiências sejam removidas, a ciência poderá acelerar tremendamente. Uma Ciência mais rápida levaria a inovações mais rápidas na medicina, tecnologia e outras áreas. O câncer, por exemplo, poderia ser curado em 2 a 3 anos mais cedo do que se os mecanismos de publicações continuassem os mesmos, salvando assim milhões de vidas.

O problema do lapso temporal.

A primeira e mais crítica ineficiência é o problema do lapso temporal para distribuição de ideias científicas. Depois de ter escrito um artigo científico, a publicação do artigo demora em média 12 meses. Durante esse tempo o texto passa pelo processo de revisão por pares, o que também demanda um tempo extremamente longo.

Caso você leia um artigo e queira comentá-lo, do período em que você escreve a resposta até a publicação definitiva demora mais 12 meses até que essa seja vista pela comunidade científica mundial.

A ciência é fundamentalmente uma conversa entre cientistas de todo o mundo. Atualmente, o intervalo entre essas conversas é de 12 meses.

Imagine como seria a internet se cada post de blog, cada tweet, e cada foto, fosse disponibilizada apenas 12 meses após a realização do evento. Imagine ainda se todas as histórias em seu feed de notícias do Facebook tiverem 12 meses de idade. As pessoas exigiriam sérias mudanças.

O lapso de tempo na distribuição de ideias científicas está retendo significativamente a ciência. É fundamental para o progresso científico que possamos remover essa ineficiência.

O problema do modo único de publicação.

Historicamente, se um cientista quer fazer uma contribuição para o corpo do conhecimento científico, essa contribuição tem de estar na forma de um artigo científico.

O Blogging não decolou na ciência, isso porque os pesquisadores não recebem crédito por escrever posts. É comum ouvirmos um pesquisador dizer "eu não vou colocar essas idéias em um blog, porque elas são boas o suficiente para que eu mesmo produza um artigo, que pretendo publicar daqui a alguns anos". Todos perdemos devido a esses "alguns anos".

A maioria das pessoas que compartilham informações por meio da web se aproveita dos meios de comunicação ricos que a web oferece. As pessoas compartilham informações de todos os tipos de formas: vídeos, atualizações de status, blogs, comentários em blogs, conjuntos de dados, gráficos interativos, e outras...

Em contrapartida, se um cientista quer compartilhar algumas informações sobre uma proteína na qual ele está trabalhando, eles têm que escrever um documento com um conjunto de duas imagens bidimensionais em preto e branco da proteína. As normas das revistas científicas não incentivam a partilha de informações de maneira interativa com full-color e com modelos tridimensionais da proteína, mesmo que essa seja a forma mais adequada para compartilhar o que está sendo estudado.

O futuro da ciência: distribuição instantânea.

Tim Berners-Lee inventou a web, a fim de tornar mais fácil para ele e seus colegas o compartilhamento de seus trabalhos de pesquisa. A web tem impactado a ciência mas, ao longo dos próximos anos, a web vai totalmente re-inventar a maneira que os cientistas interagem.

Daqui a 5 a 10 anos o modo como os cientistas irão se comunicar será irreconhecível da maneira que essas comunicações se realizaram nos últimos 400 anos, quando a primeira revista acadêmica foi fundada.

A primeira mudança será a distribuição imediata de todas as idéias científicas. Alguns sites como arXiv, Academia.edu, Mendeley, e ResearchGate trouxeram recentemente a distribuição instantânea a certos sub-campos da ciência e essa tendência irá continuar para todos os outros campos da ciência.

Em poucos anos, os cientistas irão olhar para trás e vão se questionar como costumava existir um mundo onde um artigo científico levava 12 meses para ser conhecido mundialmente.

Distribuição instantânea significa trazer o lapso de tempo para a distribuição de um artigo científico em todo o mundo para menos de um dia. Este aumento na velocidade irá ter um efeito transformador sobre a taxa de progresso científico no mundo. Descobertas serão feitas muito mais rapidamente.

Uma das razões para que o progresso tecnológico no século 20 fosse muito maior do que o desenvolvimento nos séculos anteriores, é que havia muitas tecnologias de comunicação poderosas inventadas no século 20 que ligavam as pessoas ao redor do globo como: o telefone, a TV e a internet.

Ao trazer a distribuição instantânea para a ciência, isso acarretará em um efeito semelhante transformando assim o progresso científico.

O futuro da ciência: hiperlink
Historicamente os cientistas escrevem seus artigos em documentos no formato PDF, e posteriormente carregam esses arquivos para a web.

Ao longo dos próximos anos o conteúdo científico será cada vez mais um conteúdo da web nativa, e será escrito diretamente para a web. O conteúdo científico será criado com plena interatividade, e riqueza que a web permite. A maioria dos trabalhos hoje são baixados da web e impresso pelos cientistas para a leitura. O conteúdo foi escrito de tal maneira que ele é totalmente legível quando impresso.

Entretanto, o conteúdo criado na web é inerentemente rico. Não será somente possível imprimi-lo, mas também compartilhá-lo em seu Twitter e Facebook. A idéia de imprimir o conteúdo não faz sentido para boa parte dos conteúdos da web, como vídeos do YouTube, fotos no Facebook, mapas interativos, gráficos e interativos, como aqueles que você encontra na Quantcast, ou Yahoo Finance.

O hiperlink é uma parte da interatividade construída no conteúdo web. Um dos motivos para você não imprimir um artigo da Wikipedia para lê-lo é que a página está cheia de links úteis, e você quer manter essa interatividade na leitura do artigo de modo a aproveitar o poder completo do artigo.

Historicamente, os trabalhos científicos têm citado outros artigos, mas essas citações não são "linkadas".

Para os cidadãos da web, a idéia de se referir a alguma outra página sem ligar a essa parece ser uma maneira incrivelmente antiquada de compartilhamento de conteúdo.

Imagine se a leitura de um blog, ou um feed de notícias do Facebook, não possuísse links, apenas texto puro. Houvesse, ao final da página, um conjunto de referências e essas referências dissecem que era para encontrar determinadas outras páginas na web, mas as referências não eram elas mesmas hiperlinks. Uma citação de um vídeo seria algo como "YouTube.com, seção Comédia, página 10, garrafa de Coca explosão, vídeo id = 34883". Você teria então de ir ao YouTube e navegar até a seção certa para obter o vídeo com esse título.

Esta experiência seria realmente um pesadelo. A diferença entre esta estrutura e como a web é atualmente, é a diferença entre onde a comunicação científica está agora, e onde estará em poucos anos, quando os cientistas adotarem os meios de comunicação ricos da web.

Os cientistas irão compartilhar o conteúdo em qualquer formato para auxiliar na divulgação de suas ideias. Eles irão compartilhar idéias na forma de conjuntos de dados, vídeos, modelos 3-D, programas de software, gráficos, blogs, atualizações de status e comentários sobre todas estas ricas mídias.

As formas que estes formatos de conteúdo irão se conectar uns com os outros será através do hiperlink, e não através de citações. A citação será semelhante a um conceito antigo em poucos anos.

A Ciência está passando por uma das mudanças mais emocionantes de sua história. É um período de transição entre uma forma pré-web de comunicação para uma forma nativa e dinâmica de comunicação. A adoção plena da web por cientistas irá transformar a ciência. Os cientistas vão começar a interagir e comunicar-se em novas maravilhosas formas as quais terão um enorme efeito sobre o progresso científico.

O futuro da ciência: o crédito acadêmico.

Historicamente os cientistas ganharam crédito por meio da publicação em revistas de prestígio. Contratação de comitês e comissões de subvenção, historicamente, olham para os tipos de revistas que um cientista conseguiu publicar como uma medida da qualidade do seu trabalho. Nos últimos anos, as comissões também começaram a olhar para contagens de citações também.

Como o conteúdo científico move-se para tornar um conteúdo web, o conteúdo científico será cada vez mais avaliados de acordo com os tipos de métricas que refletem o sucesso de uma parte do conteúdo na web.

Métricas da Web variam, e evoluem. Alguns medidas para a internet são métricas: como número de visitantes, page views, tempo no site, etc.. Outros são específicos para determinados setores, ou locais, tais como contagem de seguidores do Twitter, pontuação no StackOverflow, gostos do Facebook e visualizações de vídeos YouTube.

Essas métricas poderão ser modificadas para o conteúdo científico, atribuindo assim o crédito adequado aos pesquisadores.

Há ainda muitas barreiras para que esse formato tome as nossas universidades, mas a ideia e proposta não são ruins...