Saturday 11 November 2017

Diferença Entre Regressão Linear E Média Móvel


O que é relação e diferença entre séries temporais e regressão Para modelos e premissas. É correto que os modelos de regressão assumam a independência entre as variáveis ​​de saída para diferentes valores da variável de entrada, enquanto o modelo da série temporal não é o que são algumas outras diferenças Existem várias abordagens para a análise de séries temporais, mas as duas mais conhecidas são as Método de regressão e método Box-Jenkins (1976) ou ARIMA (AutoRegressive Integrated Moving Average). Este documento apresenta o método de regressão. Eu considero o método de regressão muito superior ao ARIMA por três razões principais, eu não entendo bem o método de regressão para séries temporais no site e como é diferente do método Box-Jenkins ou ARIMA. Agradeço se alguém pode dar algumas informações sobre essas questões. Obrigado e considero que realmente acho que esta é uma boa pergunta e merece uma resposta. O link fornecido é escrito por um psicólogo que afirma que algum método de elaboração de casa é uma maneira melhor de fazer análises de séries temporais do que Box-Jenkins. Espero que a minha tentativa de resposta incentive outros, que estão mais bem informados sobre as séries temporais, para contribuir. A partir de sua introdução, parece que Darlington está defendendo a abordagem de apenas ajustar um modelo de AR por mínimos quadrados. Ou seja, se você deseja encaixar o modelo zt alpha1 z cdots alphak z varepsilont para a série de tempo zt, você pode apenas regredir a série zt na série com o atraso 1, o atraso 2 e assim por diante até o atraso k, usando um Regressão múltipla comum. Isso é certamente permitido em R, é mesmo uma opção na função ar. Eu testei isso e tende a dar respostas semelhantes ao método padrão para montar um modelo AR em R. Ele também defende regredir zt em coisas como t ou poderes de t para encontrar tendências. Novamente, isso é absolutamente bom. Muitos livros da série de tempo discutem isso, por exemplo Shumway-Stoffer e Cowpertwait-Metcalfe. Normalmente, uma análise de séries de tempo pode prosseguir nas seguintes linhas: você encontra uma tendência, remova-a e então ajuste um modelo para os resíduos. Mas parece que ele também está defendendo o excesso de ajuste e, em seguida, usando a redução no erro de quadrado médio entre a série ajustada e os dados como evidência de que seu método é melhor. Por exemplo: sinto que os correlogramas agora são obsolescentes. O objetivo principal era permitir que os trabalhadores adivinissem quais modelos se encaixariam melhor nos dados, mas a velocidade dos computadores modernos (pelo menos em regressão se não em modelos temporais) permite que um trabalhador se encaixe apenas em vários modelos e veja exatamente como Cada um se ajusta conforme medido pelo erro quadrático médio. A questão da capitalização sobre o acaso não é relevante para essa escolha, uma vez que os dois métodos são igualmente suscetíveis a esse problema. Esta não é uma boa idéia porque o teste de um modelo é suposto ser o quão bem ele pode prever, não o quão bem ele se adapta aos dados existentes. Em seus três exemplos, ele usa erro de quadrado médio ajustado como seu critério para a qualidade do ajuste. Evidentemente, o modelo excessivo irá fazer uma estimativa na amostra do erro menor, então sua afirmação de que seus modelos são melhores porque eles têm RMSE menor está errado. Em poucas palavras, uma vez que ele está usando o critério errado para avaliar o quão bom é um modelo, ele alcança as conclusões erradas sobre a regressão versus ARIMA. Devo apostar que, se ele tivesse testado a habilidade preditiva dos modelos, o ARIMA teria saído no topo. Talvez alguém possa tentar se tiverem acesso aos livros que ele menciona aqui. Suplementar: para mais informações sobre a ideia de regressão, você pode querer verificar livros da série de tempo anteriores, que foram escritos antes de o ARIMA se tornar o mais popular. Por exemplo, Kendall, Time-Series. 1973, o Capítulo 11 possui um capítulo completo sobre esse método e comparações com o ARIMA. Tanto quanto posso dizer, o autor nunca descreveu seu método home-brew em uma publicação revisada por pares e as referências para e da literatura estatística parecem mínimas e suas principais publicações sobre temas metodológicos remontam aos anos 70. Estritamente falando, nada disso prova qualquer coisa, mas sem tempo suficiente ou experiência para avaliar as reivindicações, eu ficaria extremamente relutante em usar qualquer uma delas. Ndash Gala 18 de julho 13 às 11: 31mike, primeiro instale R (se você ainda não), execute R e instale o pacote TeachingDemos (exatamente como depende do seu sistema), carregue o pacote com a biblioteca (TeachingDemos) e digite loess. demo Para exibir a página de ajuda para ver como executá-lo, você pode rolar para a parte inferior onde o exemplo é e copiar e colar esse código na linha de comando R39s para ver os exemplos e, em seguida, executar com seus próprios dados para explorar ainda mais. Ndash Greg Snow 23 de março 12 às 17:15 Aqui está uma resposta simples, mas detalhada. Um modelo linear se encaixa em um relacionamento através de todos os pontos de dados. Este modelo pode ser de primeira ordem (outro significado de linear) ou polinômio para explicar a curvatura, ou com splines para explicar diferentes regiões com um modelo de governo diferente. Um ajuste LOESS é uma regressão ponderada localmente movida com base nos pontos de dados originais. O que significa que A LOESS se encaixa na entrada dos valores X e Y originais, além de um conjunto de valores de saída X para os quais calcular novos valores de Y (geralmente os mesmos valores de X são usados ​​para ambos, mas muitas vezes menos valores X são usados ​​para pares XY ajustados Devido ao aumento da computação necessária). Para cada valor de saída X, uma porção dos dados de entrada é usada para calcular um ajuste. A porção dos dados, geralmente de 25 a 100, mas tipicamente 33 ou 50, é local, o que significa que é a porção dos dados originais mais próximos de cada valor de saída X específico. É um ajuste em movimento, porque cada valor de saída X requer um subconjunto diferente dos dados originais, com pesos diferentes (veja o próximo parágrafo). Este subconjunto de pontos de dados de entrada é usado para executar uma regressão ponderada, com pontos mais próximos do valor de saída X, com maior peso. Essa regressão geralmente é de segunda ordem ou superior é possível, mas requer maior poder de computação. O valor Y desta regressão ponderada calculada na saída X é usado como o valor dos modelos Y para este valor X. A regressão é recalculada em cada valor de saída X para produzir um conjunto completo de valores de saída Y. Respondeu 21 de fevereiro às 21: 08 A função Diferença da média móvel (série de tempo) calcula a diferença entre um valor e a média móvel da série temporal. Parâmetros ------------------ Dados Os dados a analisar. Isso geralmente é um campo em uma série de dados ou um valor calculado. Período O número de barras de dados a incluir na média, incluindo o valor atual. Por exemplo, um período de 3 inclui o valor atual e os dois valores anteriores. Função Valor ------------------------ A média móvel da série temporal é calculada ajustando uma linha de regressão linear sobre os valores para o período determinado e depois determinando O valor atual dessa linha. Uma linha de regressão linear é uma linha direta que é o mais próximo possível de todos os valores dados. A média móvel da série temporal no início de uma série de dados não é definida até que haja valores suficientes para preencher o período especificado. Note-se que uma média móvel de séries temporais difere muito de outros tipos de médias móveis em que o valor atual segue a tendência recente dos dados, e não uma média real dos dados. Por isso, o valor desta função pode ser maior ou menor do que todos os valores que estão sendo usados ​​se a tendência dos dados geralmente estiver aumentando ou diminuindo. A diferença da média móvel é a média móvel subtraída do valor atual. Uso ----------- As médias móveis são úteis para suavizar os dados brutos ruidosos, como os preços diários. Os dados de preços podem variar muito do dia-a-dia, obscurecendo se o preço está subindo ou desce ao longo do tempo. Ao analisar a média móvel do preço, pode-se ver uma imagem mais geral das tendências subjacentes. Uma vez que as médias móveis podem ser usadas para ver tendências, elas também podem ser usadas para ver se os dados estão atrapalhando a tendência. Isso faz a diferença da média móvel útil para destacar onde os dados estão se afastando da tendência.

No comments:

Post a Comment