Existem várias abordagens para modelar séries temporais. Apresentamos algumas das abordagens mais comuns abaixo. Trend, Seasonal, Decomposições Residuais Uma abordagem é decompor as séries temporais em um componente de tendência, sazonal e residual. O abrandamento exponencial triplo é um exemplo desta abordagem. Outro exemplo, denominado loess sazonal, é baseado em mínimos quadrados localmente ponderados e é discutido por Cleveland (1993). Não discutimos o loess sazonal neste manual. Métodos baseados em frequência Outra abordagem, comumente usada em aplicações científicas e de engenharia, é analisar a série no domínio da freqüência. Um exemplo dessa abordagem na modelagem de um conjunto de dados de tipo sinusoidal é mostrado no estudo de caso de deflexão do feixe. O gráfico espectral é a ferramenta principal para a análise de freqüência de séries temporais. Modelos Autoregressivos (AR) Uma abordagem comum para modelar séries temporais univariadas é o modelo autorregressivo (AR): Xt delta phi1 X phi2 X cdots phip X At, onde (Xt) é a série temporal, (At) é ruído branco e delta Esquerda (1 - sum p phii right) mu. Com (mu) denotando o processo significa. Um modelo autorregressivo é simplesmente uma regressão linear do valor atual da série contra um ou mais valores anteriores da série. O valor de (p) é chamado de ordem do modelo AR. Os modelos AR podem ser analisados com um dos vários métodos, incluindo técnicas de mínimos quadrados padrão padrão. Eles também têm uma interpretação direta. Modelos de média móvel (MA) Outra abordagem comum para a modelagem de modelos de séries temporais univariáveis é o modelo de média móvel (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, onde (Xt) é a série temporal, (mu ) É a média da série, (A) são termos de ruído branco e (theta1, ldots,, thetaq) são os parâmetros do modelo. O valor de (q) é chamado de ordem do modelo MA. Ou seja, um modelo de média móvel é conceitualmente uma regressão linear do valor atual da série contra o ruído branco ou choques aleatórios de um ou mais valores anteriores da série. Os choques aleatórios em cada ponto são assumidos como provenientes da mesma distribuição, tipicamente uma distribuição normal, com localização em zero e escala constante. A distinção neste modelo é que esses choques aleatórios são propogados para valores futuros das séries temporais. Ajustar as estimativas de MA é mais complicado do que com os modelos AR porque os termos de erro não são observáveis. Isto significa que os procedimentos iterativos de encadernação não linear precisam ser usados em lugar de mínimos quadrados lineares. Os modelos MA também têm uma interpretação menos óbvia do que os modelos AR. Às vezes, o ACF eo PACF sugerem que um modelo de MA seria uma escolha de modelo melhor e, por vezes, ambos os termos de AR e MA devem ser usados no mesmo modelo (ver Seção 6.4.4.5). Note, no entanto, que os termos de erro após o ajuste do modelo devem ser independentes e seguir os pressupostos padrão para um processo univariado. Box e Jenkins popularizaram uma abordagem que combina a média móvel e as abordagens autorregressivas no livro Time Series Analysis: Forecasting and Control (Box, Jenkins e Reinsel, 1994). Embora as abordagens médias autorregressivas e móveis já tenham sido conhecidas (e foram originalmente investigadas por Yule), a contribuição de Box e Jenkins foi no desenvolvimento de uma metodologia sistemática para identificar e estimar modelos que poderiam incorporar ambas as abordagens. Isso faz modelos da Box-Jenkins uma classe de modelos poderosa. As próximas várias seções discutirão estes modelos em detalhes. Modelos ARMA (p, q) modestos de Análise Estratégica Automotiva - Parte 2 Na Parte 1 consideramos o modelo Autoregressivo da ordem p, também conhecido como o modelo AR (p). Nós o apresentamos como uma extensão do modelo de caminhada aleatória em uma tentativa de explicar correlação serial adicional em séries temporais financeiras. Em última análise, percebemos que não era suficientemente flexível para realmente capturar toda a autocorrelação nos preços de fechamento da Amazon Inc. (AMZN) e do SampP500 US Equity Index. O principal motivo para isso é que ambos esses ativos são condicionalmente heterossegativos. O que significa que eles não são estacionários e têm períodos de variação variável ou aglomeração de volatilidade, que não é levado em consideração pelo modelo AR (p). Em futuros artigos, acabaremos por construir os modelos da Média Mover Integrada Autoregressiva (ARIMA), bem como os modelos condicionalmente heterossejidos das famílias ARCH e GARCH. Esses modelos nos fornecerão nossas primeiras tentativas realistas de previsão dos preços dos ativos. Neste artigo, no entanto, iremos apresentar o modelo da Mente Mover da ordem q, conhecido como MA (q). Este é um componente do modelo ARMA mais geral e, como tal, precisamos compreendê-lo antes de avançar. Eu recomendo que você leia os artigos anteriores na coleção Time Series Analysis, se você não tiver feito isso. Todos podem ser encontrados aqui. Modelos de média móvel (MA) q Um modelo de média móvel é semelhante a um modelo autoregressivo, exceto que, em vez de ser uma combinação linear de valores da série temporária passada, é uma combinação linear dos termos de ruído branco passados. Intuitivamente, isso significa que o modelo MA vê tais choques de ruído branco aleatórios diretamente em cada valor atual do modelo. Isso contrasta com um modelo de AR (p), onde os choques de ruído brancos só são vistos indiretamente. Através de regressão em termos anteriores da série. Uma diferença fundamental é que o modelo MA só verá os últimos choques q para qualquer modelo particular de MA (q), enquanto que o modelo AR (p) tomará em consideração todos os choques anteriores, embora de forma decrescente. Definição Matemática, o MA (q) é um modelo de regressão linear e está estruturado de forma semelhante a AR (p): modelo médio em movimento da ordem q Um modelo de série temporal, é um modelo médio móvel de ordem q. MA (q), se: begin xt wt beta1 w ldots betaq w end Onde é o ruído branco com E (wt) 0 e variância sigma2. Se considerarmos o operador de deslocamento para trás. (Veja um artigo anterior), então podemos reescrever o acima como uma função phi de: begin xt (1 beta1 beta2 2 ldots betaq q) wt phiq () wt end Utilizaremos a função phi em artigos posteriores. Propriedades de segunda ordem Tal como acontece com AR (p), a média de um processo MA (q) é zero. Isso é fácil de ver como a média é simplesmente uma soma de termos de ruído branco, que são todos eles próprios zero. Começar texto enspace mux E (xt) soma E (wi) 0 fim começar texto enspace sigma2w (1 beta21 ldots beta2q) texto final enspace rhok esquerda 1 texto enspace k 0 sum betai beta sumq beta2i texto enspace k 1, ldots, q 0 texto O espaçador k gt q acaba direito. Onde beta0 1. Agora, vamos gerar alguns dados simulados e usá-lo para criar correlogramas. Isso tornará a fórmula acima para rhok um pouco mais concreta. Simulações e Correlogramas Comece com um processo MA (1). Se configuramos beta1 0.6, obtemos o seguinte modelo: Tal como acontece com os modelos AR (p) no artigo anterior, podemos usar R para simular uma série e depois traçar o correlograma. Uma vez que tínhamos muita prática na série anterior de série de séries de séries de séries de execução, vou escrever o código R na íntegra, em vez de dividi-lo: a saída é a seguinte: como vimos acima na fórmula para rhok , Para k gt q, todas as autocorrelações devem ser zero. Desde q 1, devemos ver um pico significativo em k1 e, em seguida, picos insignificantes subseqüentes a isso. No entanto, devido ao viés de amostragem, devemos esperar ver 5 (marginalmente) picos significativos em um gráfico de autocorrelação de amostra. Este é precisamente o que o correlograma nos mostra neste caso. Temos um pico significativo em k1 e depois picos insignificantes para k gt 1, exceto em k4 onde temos um pico marginalmente significativo. Na verdade, esta é uma maneira útil de ver se um modelo MA (q) é apropriado. Ao dar uma olhada no correlograma de uma série específica, podemos ver quantos atrasos sequenciais não-zero existem. Se houver tais atrasos, então podemos tentar legítimamente ajustar um modelo de MA (q) a uma determinada série. Uma vez que temos evidências de nossos dados simulados de um processo MA (1), agora tentaríamos ajustar um modelo MA (1) aos nossos dados simulados. Infelizmente, não há um comando ma equivalente para o comando autor modelo modelo ar em R. Em vez disso, devemos usar o comando arima mais geral e configurar os componentes autoregressivos e integrados em zero. Fazemos isso criando um vetor 3 e configurando os dois primeiros componentes (os parâmetros autogressivos e integrados, respectivamente) para zero: recebemos algum resultado útil do comando arima. Em primeiro lugar, podemos ver que o parâmetro foi estimado como o chapéu 0.602, que é muito próximo do valor verdadeiro de beta1 0.6. Em segundo lugar, os erros padrão já foram calculados para nós, tornando-o direto calcular os intervalos de confiança. Em terceiro lugar, recebemos uma variância estimada, probabilidade de logaritmo e Critério de Informação Akaike (necessário para comparação de modelo). A principal diferença entre arima e ar é que arima estima um termo de intercepção porque não subtrai o valor médio da série. Portanto, precisamos ter cuidado ao realizar previsões usando o comando arima. Bem, volte para esse ponto mais tarde. Como uma verificação rápida calcularam os intervalos de confiança para o chapéu: podemos ver que o intervalo de confiança 95 contém o verdadeiro valor do parâmetro de beta1 0,6 e, portanto, podemos julgar o modelo em um bom ajuste. Obviamente, isso deve ser esperado, já que simulamos os dados em primeiro lugar. Como as coisas mudam se modificarmos o sinal de beta1 para -0.6. Realizamos a mesma análise: A saída é a seguinte: podemos ver que na k1 nós temos um significado Pico no correlograma, exceto que mostra correlação negativa, conforme esperado de um modelo de MA (1) com primeiro coeficiente negativo. Mais uma vez, todos os picos além de k1 são insignificantes. Permite um modelo MA (1) e estimar o parâmetro: hat -0.730, que é uma pequena subestimação de beta1 -0.6. Finalmente, vamos calcular o intervalo de confiança: podemos ver que o verdadeiro valor do parâmetro de beta1-0.6 está contido dentro do intervalo de confiança 95, fornecendo-nos evidência de um bom ajuste do modelo. Vamos executar o mesmo procedimento para um processo MA (3). Desta vez, devemos esperar picos significativos em k e picos insignificantes para k gt 3. Vamos usar os seguintes coeficientes: beta1 0,6, beta2 0,4 e beta3 0,2. Permite simular um processo MA (3) deste modelo. Ive aumentou o número de amostras aleatórias para 1000 nesta simulação, o que torna mais fácil ver a verdadeira estrutura de autocorrelação, à custa de tornar a série original mais difícil de interpretar: a saída é a seguinte: como esperado, os primeiros três picos são significativos . No entanto, também é o quarto. Mas podemos sugerir legitimamente que isso pode ser devido ao viés de amostragem, pois esperamos que 5 dos picos sejam significativos além do kq. Vamos agora ajustar um modelo MA (3) aos dados para tentar e estimar parâmetros: as estimativas hat 0.544, hat 0.345 e hat 0.298 são próximas dos valores reais de beta10.6, beta20.4 e beta30.3, respectivamente. Também podemos produzir intervalos de confiança usando os respectivos erros padrão: em cada caso, os 95 intervalos de confiança contêm o verdadeiro valor do parâmetro e podemos concluir que temos um bom ajuste com nosso modelo MA (3), como seria de esperar. Dados Financeiros Na Parte 1 consideramos a Amazon Inc. (AMZN) e o SampP500 US Equity Index. Nós montamos o modelo AR (p) para ambos e descobrimos que o modelo não conseguiu efetivamente capturar a complexidade da correlação serial, especialmente no elenco do SampP500, onde os efeitos de memória longa parecem estar presentes. Eu não vou traçar os gráficos novamente para os preços e autocorrelação, em vez disso eu vou encaminhá-lo para a publicação anterior. Amazon Inc. (AMZN) Comece tentando encaixar uma seleção de modelos de MA (q) para AMZN, ou seja, com q in. Como na Parte 1, use o quantmod para baixar os preços diários do AMZN e, em seguida, convertê-los em um fluxo de retorno de log de preços de fechamento: Agora que temos o fluxo de retorno do registro, podemos usar o comando arima para ajustar MA (1), MA (2) e MA (3) e, em seguida, estimar os parâmetros de cada um. Para MA (1), temos: podemos traçar os resíduos dos retornos diários do log e do modelo ajustado: observe que temos alguns picos significativos nos atrasos k2, k11, k16 e k18, indicando que o modelo MA (1) é Improvável que seja um bom ajuste para o comportamento do retorno AMZN, uma vez que isso não parece uma realização de ruído branco. Vamos tentar um modelo MA (2): ambas as estimativas para os coeficientes beta são negativas. Permite traçar os resíduos mais uma vez: podemos ver que existe uma autocorrelação quase zero nos primeiros atrasos. No entanto, temos cinco picos marginalmente significativos nos laços k12, k16, k19, k25 e k27. Isso sugere que o modelo MA (2) esteja capturando uma grande parte da autocorrelação, mas não todos os efeitos de memória longa. Que tal um modelo de MA (3) Mais uma vez, podemos traçar os resíduos: o gráfico de residual de MA (3) parece quase idêntico ao do modelo MA (2). Isso não é surpreendente, assim como a adição de um novo parâmetro a um modelo que aparentemente explicou muitas correlações em atrasos mais curtos, mas isso não terá muito efeito nos atrasos de longo prazo. Toda essa evidência sugere o fato de que um modelo de MA (q) não é provável que seja útil para explicar toda a correlação em série isoladamente. Pelo menos para a AMZN. SampP500 Se você lembrar, na Parte 1, vimos que a estrutura de retorno do diário diferenciado da primeira ordem do SampP500 possuía muitos picos significativos em vários atrasos, tanto curtos quanto longos. Isso proporcionou evidências de heterocedasticidade condicional (ou seja, aglomeração de volatilidade) e efeitos de memória longa. Isso nos leva a concluir que o modelo AR (p) foi insuficiente para capturar toda a autocorrelação presente. Como já vimos acima, o modelo MA (q) foi insuficiente para capturar correlação serial adicional nos resíduos do modelo ajustado para a série de preços de registro diário diferenciada de primeira ordem. Agora tentaremos ajustar o modelo MA (q) ao SampP500. Pode-se perguntar por que estamos fazendo isso é se soubemos que é improvável que seja um bom ajuste. Essa é uma boa pergunta. A resposta é que precisamos ver exatamente como isso não é um bom ajuste, porque este é o processo final que seguiremos quando compararmos modelos muito mais sofisticados, que são potencialmente mais difíceis de interpretar. Comece por obter os dados e convertê-lo em uma série diferenciada de preços de fechamento diários logaritmicamente transformados como no artigo anterior: agora vamos ajustar um modelo MA (1), MA (2) e MA (3) para A série, como fizemos acima para a AMZN. Comece com MA (1): Vamos fazer um gráfico dos resíduos desse modelo ajustado: O primeiro pico significativo ocorre em k2, mas há muitos mais em k. Esta não é claramente uma percepção do ruído branco e, portanto, devemos rejeitar o modelo MA (1) como um potencial bom ajuste para o SampP500. A situação melhora com MA (2) Mais uma vez, vamos fazer um gráfico dos resíduos desse modelo MA (2) ajustado: Enquanto o pico em k2 desapareceu (como esperamos), ainda ficamos com os picos significativos em Muitos desfasamentos nos resíduos. Mais uma vez, achamos que o modelo MA (2) não é um bom ajuste. Devemos esperar, para o modelo MA (3), ver menos correlação serial em k3 do que para o MA (2), mas, mais uma vez, também não devemos esperar nenhuma redução em atrasos adicionais. Finalmente, vamos fazer uma parcela dos resíduos desse modelo MA (3) ajustado: é precisamente o que vemos no correlograma dos resíduos. Daí o MA (3), como com os outros modelos acima, não é um bom ajuste para o SampP500. Próximas etapas. Já examinamos dois modelos principais de séries temporais em detalhes, ou seja, o modelo autogressivo de ordem p, AR (p) e, em seguida, a média móvel da ordem q, MA (q). Nós vimos que eles são ambos capazes de explicar algumas das autocorrelação nos resíduos de preços de registro diários diferenciados de primeira ordem de ações e índices, mas a acumulação de volatilidade e os efeitos de memória longa persistem. Finalmente é hora de chamar nossa atenção para a combinação desses dois modelos, ou seja, a Média de Movimento Autoregressiva da ordem p, q, ARMA (p, q) para ver se isso melhorará a situação. No entanto, teremos que esperar até o próximo artigo para uma discussão completa Clique abaixo para aprender mais sobre. A informação contida neste site é a opinião dos autores individuais com base em sua observação pessoal, pesquisa e anos de experiência. A editora e seus autores não são conselheiros de investimento registrados, advogados, CPAs ou outros profissionais de serviços financeiros e não prestam assessoria jurídica, fiscal, contábil, de investimento ou outros serviços profissionais. A informação oferecida por este site é apenas de educação geral. Como cada situação factual de indivíduos é diferente, o leitor deve procurar seu próprio conselheiro pessoal. Nem o autor nem o editor assumem qualquer responsabilidade ou responsabilidade por quaisquer erros ou omissões e não devem ter responsabilidade nem responsabilidade para qualquer pessoa ou entidade em relação a danos causados ou alegadamente causados direta ou indiretamente pelas informações contidas neste site. Use por sua conta e risco. Além disso, este site pode receber compensações financeiras das empresas mencionadas através de publicidade, programas afiliados ou de outra forma. Taxas e ofertas de anunciantes exibidos neste site mudam com freqüência, às vezes sem aviso prévio. Enquanto nos esforçamos para manter informações precisas e oportunas, os detalhes da oferta podem estar desactualizados. Os visitantes devem assim verificar os termos de tais ofertas antes de participar delas. O autor e sua editora renunciam à responsabilidade por atualizar informações e negar a responsabilidade pelo conteúdo, produtos e serviços de terceiros, inclusive quando acessados através de hiperlinks ou propagandas neste site. Média de Mudança Automatizada Modelos ARMA (p, q) para Análise da Série de Tempo - Parte 3 Esta é a terceira e última publicação na mini-série em modelos de Redução Autoregressiva (ARMA) para análise de séries temporais. Introduzimos modelos autoregressivos e modelos de média móvel nos dois artigos anteriores. Agora é hora de combiná-los para produzir um modelo mais sofisticado. Em última análise, isso nos levará aos modelos ARIMA e GARCH que nos permitirão prever os retornos dos ativos e prever a volatilidade. Esses modelos constituirão a base para sinais comerciais e técnicas de gerenciamento de risco. Se você ler a Parte 1 e a Parte 2, você verá que tendemos a seguir um padrão para a análise de um modelo de séries temporais. Vou repeti-lo brevemente aqui: Justificação - Por que estamos interessados neste modelo particular Definição - Uma definição matemática para reduzir a ambigüidade. Correlograma - Traçando um correlograma de amostra para visualizar um comportamento de modelos. Simulação e montagem - Ajustando o modelo às simulações, para garantir que entendemos o modelo corretamente. Dados financeiros reais - Aplicar o modelo aos preços dos ativos históricos reais. Previsão - Preveja os valores subsequentes para construir sinais ou filtros comerciais. Para seguir este artigo, é aconselhável dar uma olhada nos artigos anteriores sobre análise de séries temporais. Todos podem ser encontrados aqui. Critério de Informação Bayesiano Na Parte 1 desta série de artigos, analisamos o Critério de Informação Akaike (AIC) como um meio de nos ajudar a escolher entre os melhores modelos de séries temporais. Uma ferramenta estreitamente relacionada é o Bayesian Information Criterion (BIC). Essencialmente, tem um comportamento semelhante ao AIC na medida em que penaliza os modelos por ter muitos parâmetros. Isso pode levar a uma superposição. A diferença entre o BIC e o AIC é que o BIC é mais rigoroso com a penalização de parâmetros adicionais. Critério de informação bayesiano Se tomarmos a função de verossimilhança para um modelo estatístico, que tem parâmetros k, e L maximiza a probabilidade. Então o critério de informação bayesiano é dado por: Onde n é o número de pontos de dados na série temporal. Usaremos o AIC e o BIC abaixo ao escolher os modelos apropriados de ARMA (p, q). Teste de Ljung-Box Na Parte 1 desta série de artigos, Rajan mencionou nos comentários da Disqus que o teste de Ljung-Box era mais apropriado do que usar o Critério de Informação Akaike do Critério de Informação Bayesiano ao decidir se um modelo ARMA era um bom ajuste para um tempo Series. O teste de Ljung-Box é um teste de hipótese clássico projetado para testar se um conjunto de autocorrelações de um modelo de séries temporais ajustadas diferem significativamente de zero. O teste não prova cada atraso individual por aleatoriedade, mas prova a aleatoriedade sobre um grupo de atrasos. Teste de Ljung-Box Definimos a hipótese nula como: Os dados da série temporal em cada intervalo são i. i.d .. ou seja, as correlações entre os valores da série da população são zero. Definimos a hipótese alternativa como: Os dados da série temporal não são i. i.d. E possuem correlação em série. Calculamos a seguinte estatística de teste. Q: Onde n é o comprimento da amostra da série temporal, hat k é a autocorrelação da amostra no intervalo k e h é o número de atrasos no teste. A decisão determina se rejeitar a hipótese nula é verificar se Q gt chi2, para uma distribuição de qui-quadrado com h graus de liberdade no percentil 100 (1-alfa). Embora os detalhes do teste possam parecer um pouco complexos, podemos usar R para calcular o teste para nós, simplificando um pouco o procedimento. Média de Movimento Autogressivo (ARMA) Modelos de ordem p, q Agora que discutimos o BIC e o teste de Ljung-Box, estávamos prontos para discutir o nosso primeiro modelo misto, a saber, a Média Mover Autoregressiva da ordem p, q ou ARMA (p, Q). Até o momento consideramos processos autoregressivos e processos de média móvel. O modelo anterior considera seu próprio comportamento passado como insumos para o modelo e, como tal, tenta capturar os efeitos dos participantes do mercado, como o impulso e a reversão média na negociação de ações. O último modelo é usado para caracterizar informações de choque em uma série, como um anúncio de ganhos surpresos ou um evento inesperado (como o derramamento de óleo da BP Deepwater Horizon). Portanto, um modelo ARMA tenta capturar esses dois aspectos ao modelar séries temporais financeiras. Note-se que um modelo ARMA não leva em consideração o agrupamento de volatilidade, um fenômeno empírico chave de muitas séries temporais financeiras. Não é um modelo condicionalmente heteroscedástico. Para isso, precisamos aguardar os modelos ARCH e GARCH. Definição O modelo ARMA (p, q) é uma combinação linear de dois modelos lineares e, portanto, é ele mesmo ainda linear: Modelo Médio Autoregressivo da ordem p, q Um modelo de séries temporais, é um modelo médio vertical autorregressivo de ordem p, q . ARMA (p, q), se: begin xt alpha1 x alpha2 x ldots wt beta1 w beta2 w ldots betaq w end Onde é ruído branco com E (wt) 0 e variância sigma2. Se considerarmos o operador de deslocamento para trás. (Veja um artigo anterior) então podemos reescrever o acima como uma função theta e phi de: Nós podemos ver diretamente que, ao definir p neq 0 e q0, recuperamos o modelo AR (p). Da mesma forma, se definimos p 0 e q neq 0, recuperamos o modelo MA (q). Uma das principais características do modelo ARMA é que é parcimonioso e redundante em seus parâmetros. Ou seja, um modelo ARMA muitas vezes exigirá menos parâmetros do que um modelo AR (p) ou MA (q) sozinho. Além disso, se reescrevemos a equação em termos do BSO, então os polinômios theta e phi às vezes podem compartilhar um fator comum, levando a um modelo mais simples. Simulações e correlações Tal como acontece com os modelos de média autorregressiva e móvel, simularemos várias séries ARMA e tentamos ajustar os modelos ARMA a essas realizações. Realizamos isso porque queremos garantir que entendamos o procedimento de montagem, incluindo como calcular intervalos de confiança para os modelos, bem como garantir que o procedimento realmente recupere estimativas razoáveis para os parâmetros ARMA originais. Na Parte 1 e na Parte 2, construímos manualmente a série AR e MA, desenhando N amostras de uma distribuição normal e, em seguida, elaborando o modelo de séries temporais específico usando atrasos dessas amostras. No entanto, há uma maneira mais direta de simular AR, MA, ARMA e até mesmo dados ARIMA, simplesmente usando o método arima. sim em R. Comece com o modelo ARMA não trivial mais simples possível, a saber, o ARMA (1,1 ) modelo. Ou seja, um modelo de ordem autorregressivo combinado com um modelo médio móvel da ordem um. Esse modelo tem apenas dois coeficientes, alfa e beta, que representam os primeiros atrasos da própria série de tempo e os termos de ruído branco de choque. Esse modelo é dado por: Precisamos especificar os coeficientes antes da simulação. Leve a alfa 0.5 e beta -0.5: A saída é a seguinte: Posicione também o correlograma: podemos ver que não há autocorrelação significativa, o que é de se esperar de um modelo ARMA (1,1). Finalmente, vamos tentar determinar os coeficientes e seus erros padrão usando a função arima: podemos calcular os intervalos de confiança para cada parâmetro usando os erros padrão: os intervalos de confiança contêm os valores dos parâmetros verdadeiros para ambos os casos, no entanto, devemos notar que o 95 intervalos de confiança são muito amplos (uma conseqüência dos erros padrão razoavelmente grandes). Vamos agora tentar um modelo ARMA (2,2). Ou seja, um modelo AR (2) combinado com um modelo MA (2). Precisamos especificar quatro parâmetros para este modelo: alpha1, alpha2, beta1 e beta2. Leve alpha1 0.5, alpha2-0.25 beta10.5 e beta2-0.3: A saída do nosso modelo ARMA (2,2) é a seguinte: E a autocorelação correspondente: agora podemos tentar ajustar um modelo ARMA (2,2) para Os dados: também podemos calcular os intervalos de confiança para cada parâmetro: Observe que os intervalos de confiança para os coeficientes para o componente da média móvel (beta1 e beta2) na verdade não contêm o valor do parâmetro original. Isso descreve o perigo de tentar ajustar os modelos aos dados, mesmo quando sabemos os valores dos parâmetros verdadeiros. No entanto, para fins comerciais, precisamos ter um poder preditivo que exceda as chances e produz lucro suficiente acima dos custos de transação, para ser rentável em A longo prazo. Agora que vimos alguns exemplos de modelos de ARMA simulados, precisamos de um mecanismo para escolher os valores de p e q ao ajustar os modelos aos dados financeiros reais. Escolhendo o melhor modelo ARMA (p, q) Para determinar qual ordem p, q do modelo ARMA é apropriado para uma série, precisamos usar o AIC (ou BIC) em um subconjunto de valores para p, q e Em seguida, aplique o teste Ljung-Box para determinar se um bom ajuste foi alcançado, para valores particulares de p, q. Para mostrar este método, vamos simular primeiro um processo particular de ARMA (p, q). Em seguida, rolaremos todos os valores de p em p e q e calcularemos o AIC. Selecionaremos o modelo com o AIC mais baixo e depois executaremos um teste de Ljung-Box nos resíduos para determinar se conseguimos um bom ajuste. Comece simulando uma série ARMA (3,2): agora criaremos um objeto final para armazenar o melhor ajuste do modelo e o menor valor AIC. Atravessamos as várias combinações p, q e usamos o objeto atual para armazenar o ajuste de um modelo ARMA (i, j), para as variáveis de loop i e j. Se o AIC atual for menor do que qualquer AIC previamente calculado, definimos o AIC final para esse valor atual e selecionamos essa ordem. Após o término do loop, temos a ordem do modelo ARMA armazenado em final. order e o ARIMA (p, d, q) se encaixa (com o componente d integrado configurado para 0) armazenado como final. arma: Permite a saída do AIC Coeficientes de ordem e ARIMA: podemos ver que a ordem original do modelo ARMA simulado foi recuperada, nomeadamente com p3 e q2. Podemos traçar o corelograma dos resíduos do modelo para ver se eles parecem uma realização de ruído branco discreto (DWN): O corelograma realmente parece uma realização de DWN. Finalmente, realizamos o teste Ljung-Box por 20 atrasos para confirmar isso: observe que o valor p é maior do que 0,05, o que indica que os resíduos são independentes no nível 95 e, portanto, um modelo ARMA (3,2) fornece um Bom ajuste do modelo. Claramente, este deve ser o caso, já que nós simulamos os dados. No entanto, este é precisamente o procedimento que usamos quando chegarmos para ajustar os modelos ARMA (p, q) ao índice SampP500 na seção a seguir. Dados financeiros Agora que descrevemos o procedimento para escolher o modelo da série temporal ideal para uma série simulada, é bastante direto aplicá-lo aos dados financeiros. Para este exemplo, vamos escolher mais uma vez o SampP500 US Equity Index. Permite baixar os preços de fechamento diários usando o quantmod e, em seguida, crie o fluxo de retorno de log: Realize o mesmo procedimento de montagem que para a série ARMA (3,2) simulada acima na série de retorna de registro do SampP500 usando o AIC: o modelo de melhor ajuste Tem ordem ARMA (3,3): permite traçar os resíduos do modelo ajustado para o fluxo de retorno diário SampP500: observe que há alguns picos significativos, especialmente em atrasos maiores. Isso é indicativo de um ajuste ruim. Vamos realizar um teste de Ljung-Box para ver se temos evidências estatísticas para isso: como nós suspeitamos, o valor p é menor que 0,05 e, como tal, não podemos dizer que os resíduos são uma realização de ruído branco discreto. Portanto, há autocorrelação adicional nos resíduos que não é explicada pelo modelo ARMA (3,3). Próximas Etapas Como discutimos ao longo desta série de artigos, vimos evidências de heterocedasticidade condicional (aglomeração de volatilidade) na série SampP500, especialmente nos períodos de 2007-2008. Quando usamos um modelo GARCH mais tarde na série de artigos, veremos como eliminar essas autocorrelações. Na prática, os modelos ARMA nunca são geralmente bons ajustes para retornos de títulos de log. Precisamos levar em consideração a heterocedasticidade condicional e usar uma combinação de ARIMA e GARCH. O próximo artigo irá considerar ARIMA e mostrar como o componente integrado é diferente do modelo ARMA que consideramos neste artigo. Clique abaixo para aprender mais sobre. A informação contida neste site é a opinião dos autores individuais com base em sua observação pessoal, pesquisa e anos de experiência. A editora e seus autores não são conselheiros de investimento registrados, advogados, CPAs ou outros profissionais de serviços financeiros e não prestam assessoria jurídica, fiscal, contábil, de investimento ou outros serviços profissionais. A informação oferecida por este site é apenas de educação geral. Como cada situação factual de indivíduos é diferente, o leitor deve procurar seu próprio conselheiro pessoal. Nem o autor nem o editor assumem qualquer responsabilidade ou responsabilidade por quaisquer erros ou omissões e não devem ter responsabilidade nem responsabilidade para qualquer pessoa ou entidade em relação a danos causados ou alegadamente causados direta ou indiretamente pelas informações contidas neste site. Use por sua conta e risco. Além disso, este site pode receber compensações financeiras das empresas mencionadas através de publicidade, programas afiliados ou de outra forma. Taxas e ofertas de anunciantes exibidos neste site mudam com freqüência, às vezes sem aviso prévio. Enquanto nos esforçamos para manter informações precisas e oportunas, os detalhes da oferta podem estar desactualizados. Os visitantes devem assim verificar os termos de tais ofertas antes de participar delas. O autor e a editora não se responsabilizam por atualizar informações e negar a responsabilidade pelo conteúdo, produtos e serviços de terceiros, inclusive quando acessados através de hiperlinks ou propagandas neste site.
No comments:
Post a Comment