Um olhar mais atento no Algoritmo médio avançado de CODAS A média móvel versátil no algoritmo CODAS avançado filtra o ruído da forma de onda, extrai significa, e elimina a deriva da linha de base. A média móvel é uma técnica matemática simples usada principalmente para eliminar aberrações e revelar a tendência real em uma coleção de pontos de dados. Você pode estar familiarizado com isso com a média de dados ruidosos em um experimento de física de primeiro ano, ou de rastrear o valor de um investimento. Você pode não saber que a média móvel também é um protótipo do filtro de resposta ao impulso finito, o tipo de filtro mais comum usado na instrumentação baseada em computador. Nos casos em que uma determinada forma de onda está cheia de ruído, onde uma média precisa ser extraída de um sinal periódico, ou onde uma linha de base devagar deve ser eliminada de um sinal de freqüência mais alta, um filtro médio móvel pode ser aplicado para alcançar o desejado resultado. O algoritmo de média móvel de Advanced CODAS oferece esse tipo de desempenho de filtragem de formas de onda. O CODAS avançado é um pacote de software de análise que opera em arquivos de dados de forma de onda existentes criados pela WinDaq de primeira geração ou pacotes de aquisição de dados WinDaq de segunda geração. Além do algoritmo da média móvel, o CODAS Avançado também inclui um utilitário do gerador de relatórios e rotinas de software para a integração de formas de onda, a diferenciação, a captação de picos e do vale, a rectificação e as operações aritméticas. Teoria do Filtro Médio em Mudança O algoritmo de média móvel móvel da DATAQ Instruments permite uma grande flexibilidade nas aplicações de filtragem de formas de onda. Ele pode ser usado como um filtro passa-baixa para atenuar o ruído inerente em muitos tipos de formas de onda, ou como um filtro passa-alto para eliminar uma linha de base de derivação a partir de um sinal de freqüência mais alta. O procedimento usado pelo algoritmo para determinar a quantidade de filtragem envolve o uso de um fator de suavização. Este fator de suavização, controlado por você através do software, pode ser aumentado ou diminuído para especificar o número de pontos de dados de formas de onda reais ou amostras que a média móvel abrangerá. Qualquer forma de onda periódica pode ser pensada como uma string longa ou coleção de pontos de dados. O algoritmo realiza uma média móvel tirando dois ou mais desses pontos de dados da forma de onda adquirida, adicionando-os, dividindo sua soma pelo número total de pontos de dados adicionados, substituindo o primeiro ponto de dados da forma de onda pela média calculada, e Repetindo os passos com o segundo, terceiro e assim por diante os pontos de dados até o final do dado ser alcançado. O resultado é uma segunda forma de onda gerada que consiste na média de dados e com o mesmo número de pontos que a forma de onda original. Figura 1 8212 Qualquer forma de onda periódica pode ser pensada como uma string longa ou coleção de pontos de dados. Na ilustração acima, os pontos de dados de forma de onda consecutivos são representados por quotyot para ilustrar como a média móvel é calculada. Neste caso, foi aplicado um fator de suavização de três, o que significa que três pontos consecutivos de dados da forma de onda original são adicionados, a sua soma dividida por três, e esse quociente é traçado como o primeiro ponto de dados de uma forma de onda gerada. O processo se repete com o segundo, terceiro e assim por diante pontos de dados da forma de onda original até o final do dado ser alcançado. Uma técnica especial de quotfeatherchot significa os pontos de início e de data final da forma de onda original para garantir que a forma de onda gerada contenha o mesmo número de pontos de dados que o original. A Figura 1 ilustra como o algoritmo da média móvel é aplicado aos pontos de dados da forma de onda (que são representados por y). A ilustração possui um fator de suavização de 3, o que significa que o valor médio (representado por a) será calculado em 3 valores de dados de forma de onda consecutivos. Observe a sobreposição que existe nos cálculos da média móvel. É esta técnica de sobreposição, juntamente com um tratamento especial de início e final que gera o mesmo número de pontos de dados na forma de onda média que existe no original. A forma como o algoritmo calcula uma média móvel merece um olhar mais atento e pode ser ilustrada com um exemplo. Digamos que temos uma dieta há duas semanas e queremos calcular nosso peso médio nos últimos 7 dias. Nós sumaríamos nosso peso no dia 7 com nosso peso nos dias 8, 9, 10, 11, 12 e 13 e depois multiplicaremos por 17. Para formalizar o processo, isso pode ser expresso como: a (7) 17 (y ( 7) y (8) y (9). Y (13)) Esta equação pode ser generalizada adicionalmente. A média móvel de uma forma de onda pode ser calculada por: Onde: um valor médio n posição do ponto de dados s fator de suavização y valor do ponto de dados real Figura 2 8212 A forma de onda de saída da célula de carga mostrada original e não filtrada no canal superior e como um ponto de 11 pontos Forma de onda média movida no canal inferior. O ruído que aparece na forma de onda original foi devido às intensas vibrações criadas pela imprensa durante a operação de embalagem. A chave para essa flexibilidade de algoritmos é a sua ampla gama de fatores de suavização selecionáveis (de 2 a 1.000). O fator de suavização determina quantos pontos de dados reais ou amostras serão calculados de forma média. Especificar qualquer fator de suavização positivo simula um filtro passa-baixa enquanto especifica um fator de suavização negativo simula um filtro de passagem alta. Dado o valor absoluto do fator de suavização, os valores mais altos aplicam maiores restrições de suavização na forma de onda resultante e, inversamente, os valores mais baixos aplicam menos alisamento. Com a aplicação do fator de suavização apropriado, o algoritmo também pode ser usado para extrair o valor médio de uma dada forma de onda periódica. Um fator de suavização positivo mais alto é tipicamente aplicado para gerar valores de forma de onda média. Aplicando o algoritmo de média móvel Uma característica saliente do algoritmo de média móvel é que ele pode ser aplicado muitas vezes na mesma forma de onda, se necessário para obter o resultado de filtragem desejado. A filtragem de formas de onda é um exercício muito subjetivo. O que pode ser uma forma de onda devidamente filtrada para um usuário pode ser inaceitavelmente ruidoso para outro. Só você pode avaliar se o número de pontos médios selecionados foi muito alto, muito baixo ou simplesmente correto. A flexibilidade do algoritmo permite que você ajuste o fator de suavização e faça outro passar pelo algoritmo quando resultados satisfatórios não são alcançados com a tentativa inicial. A aplicação e as capacidades do algoritmo da média móvel podem ser ilustradas melhor pelos seguintes exemplos. Figura 3 8212 A forma de onda ECG mostrada original e não filtrada no canal superior e como uma forma de onda em média móvel de 97 pontos no canal inferior. Observe a ausência de deriva basal no canal inferior. Ambas as formas de onda são mostradas em uma condição comprimida para apresentação. Uma aplicação de redução de ruído Nos casos em que uma determinada forma de onda está cheia de ruído, o filtro médio móvel pode ser aplicado para suprimir o ruído e produzir uma imagem mais clara da forma de onda. Por exemplo, um cliente CODAS avançado estava usando uma imprensa e uma célula de carga em uma operação de empacotamento. Seu produto deveria ser comprimido para um nível predeterminado (monitorado pela célula de carga) para reduzir o tamanho da embalagem necessária para conter o produto. Por razões de controle de qualidade, eles decidiram monitorar a operação da imprensa com instrumentação. Ocorreu um problema inesperado quando começaram a ver a saída de células de carga em tempo real. Uma vez que a máquina de impressão vibrou consideravelmente enquanto estava em operação, a forma de onda de saída das células de carga era difícil de discernir porque continha uma grande quantidade de ruído devido à vibração, conforme mostrado no canal superior da Figura 2. Este ruído foi eliminado ao gerar um canal em média móvel de 11 pontos como mostrado no canal inferior da Figura 2. O resultado foi uma imagem muito mais clara da saída das células de carga. Uma aplicação na eliminação da deriva da linha de base Nos casos em que uma linha de base devagar deve ser removida de um sinal de freqüência mais alta, o filtro de média móvel pode ser aplicado para eliminar a linha de base da derivação. Por exemplo, uma forma de onda ECG tipicamente exibe algum grau de andar de linha base como pode ser visto no canal superior da Figura 3. Esta deriva de linha de base pode ser eliminada sem alterar ou perturbar as características da forma de onda como mostrado no canal inferior da Figura 3. Isto é conseguido aplicando um fator de alívio de valor negativo apropriado durante o cálculo da média móvel. O fator de suavização apropriado é determinado dividindo um período de forma de onda (em segundos) pelo intervalo de amostra de canais. O intervalo de amostra de canais é simplesmente o recíproco da taxa de amostragem dos canais e é convenientemente exibido no menu de utilidade média móvel. O período da forma de onda é facilmente determinado a partir da tela de exibição posicionando o cursor em um ponto conveniente na forma de onda, definindo um marcador de tempo e, em seguida, movendo o cursor um ciclo completo para longe do marcador de tempo exibido. A diferença horária entre cursor e marcador de tempo é um período de forma de onda e é exibida na parte inferior da tela em segundos. No nosso exemplo de ECG, a forma de onda possuía um intervalo de amostra de canal de 0,004 segundos (obtido a partir do menu de utilidade média móvel) e um período de forma de onda foi medido para span .388 segundos. Dividir o período da forma de onda pelo intervalo de amostra dos canais nos deu um fator de suavização de 97. Como é a deriva da linha de base que estamos interessados em eliminar, aplicamos um fator de suavização negativo (-97) ao algoritmo da média móvel. Isso, de fato, subtraiu o resultado médio móvel do sinal da forma de onda original, que eliminou a deriva da linha de base sem alterar a informação da forma de onda. Outros Problemas Médicos em Movimento de Formas de Onda Qualquer que seja a aplicação, a razão universal para aplicar um filtro de média móvel é superar quotly as aberrações altas e baixas e revelar um valor de forma de onda intermediária mais representativo. Ao fazer isso, o software não deve comprometer outros recursos da forma de onda original no processo de geração de uma forma de onda em média móvel. Por exemplo, o software deve ajustar automaticamente as informações de calibração associadas ao arquivo de dados original, de modo que a forma de onda em média móvel esteja nas unidades de engenharia apropriadas quando geradas. Todas as leituras nas figuras foram feitas usando o software WinDaq Data AcquisitionMoving proficientes Médias móveis Com conjuntos de dados convencionais, o valor médio é geralmente o primeiro e um dos estatísticos de resumo mais útil para calcular. Quando os dados estão na forma de uma série temporal, a série significa uma medida útil, mas não reflete a natureza dinâmica dos dados. Os valores médios calculados em períodos curtos, quer antes do período atual, quer centrados no período atual, são geralmente mais úteis. Uma vez que esses valores médios variam, ou se movem, à medida que o período atual se move do tempo t 2, t 3. etc., eles são conhecidos como médias móveis (Mas). Uma média móvel simples é (tipicamente) a média não ponderada de k valores anteriores. Uma média móvel ponderada exponencialmente é essencialmente a mesma que uma média móvel simples, mas com contribuições para a média ponderada pela proximidade com a hora atual. Como não há um, mas toda uma série de médias móveis para qualquer série, o conjunto de Mas pode ser plotado em gráficos, analisados como uma série e usados em modelagem e previsão. Uma série de modelos pode ser construída usando médias móveis, e estas são conhecidas como modelos MA. Se esses modelos forem combinados com modelos autorregressivos (AR), os modelos compostos resultantes são conhecidos como modelos ARMA ou ARIMA (o I é para integrado). Médias móveis simples Uma vez que uma série temporal pode ser considerada como um conjunto de valores, t 1,2,3,4, n a média desses valores pode ser calculada. Se assumirmos que n é bastante grande, e selecionamos um inteiro k, que é muito menor que n. Podemos calcular um conjunto de médias de bloco, ou médias móveis simples (da ordem k): cada medida representa a média dos valores de dados ao longo de um intervalo de observações k. Observe que o primeiro MA possível da ordem k gt0 é aquele para t k. Mais geralmente podemos soltar o subíndice extra nas expressões acima e escrever: Isto indica que a média estimada no tempo t é a média simples do valor observado no tempo t e as etapas de tempo precedentes de k-1. Se forem aplicados pesos que diminuam a contribuição das observações que estão mais longe no tempo, a média móvel é dita suavizada exponencialmente. As médias móveis são freqüentemente usadas como forma de previsão, pelo que o valor estimado para uma série no instante t 1, S t1. É tomado como MA durante o período até e inclusive o tempo t. por exemplo. A estimativa de hoje é baseada em uma média de valores registrados anteriores até e inclusive ontem (para dados diários). As médias móveis simples podem ser vistas como uma forma de suavização. No exemplo ilustrado abaixo, o conjunto de dados de poluição do ar mostrado na introdução deste tópico foi aumentado por uma linha de média móvel de 7 dias (MA), mostrada aqui em vermelho. Como pode ser visto, a linha MA suaviza os picos e as depressões nos dados e pode ser muito útil na identificação de tendências. A fórmula padrão de cálculo direto significa que os primeiros pontos de dados k -1 não possuem valor MA, mas, posteriormente, os cálculos se estendem ao ponto final de dados da série. PM10 valores médios diários, fonte de Greenwich: London Air Quality Network, londonair. org. uk Um dos motivos para o cálculo de médias móveis simples da maneira descrita é que permite que os valores sejam computados para todos os intervalos de tempo do tempo até o presente, e Como uma nova medida é obtida para o tempo t 1, o MA para o tempo t 1 pode ser adicionado ao conjunto já calculado. Isso fornece um procedimento simples para conjuntos de dados dinâmicos. No entanto, existem algumas questões com essa abordagem. É razoável argumentar que o valor médio nos últimos 3 períodos, por exemplo, deve estar localizado no tempo t -1, e não no tempo t. E para um MA em um número par de períodos, talvez ele deve estar localizado no meio do ponto entre dois intervalos de tempo. Uma solução para esta questão é usar cálculos de MA centrados, em que o MA no tempo t é a média de um conjunto simétrico de valores em torno de t. Apesar de seus méritos óbvios, essa abordagem não é geralmente usada porque requer que os dados estejam disponíveis para eventos futuros, o que pode não ser o caso. Nos casos em que a análise é inteiramente de uma série existente, o uso de Mas centrado pode ser preferível. As médias móveis simples podem ser consideradas como uma forma de suavização, eliminando alguns componentes de alta freqüência de uma série de tempo e destacando (mas não removendo) tendências de maneira similar à noção geral de filtragem digital. De fato, as médias móveis são uma forma de filtro linear. É possível aplicar uma computação média móvel a uma série que já foi suavizada, ou seja, suavizando ou filtrando uma série já suavizada. Por exemplo, com uma média móvel da ordem 2, podemos considerá-la como sendo calculada usando pesos, de modo que o MA em x 2 0,5 x 1 0,5 x 2. Do mesmo modo, o MA em x 3 0,5 x 2 0,5 x 3. Se nós Aplicar um segundo nível de suavização ou filtragem, temos 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3, isto é, a filtragem de 2 estágios O processo (ou convolução) produziu uma média móvel simétrica ponderada de forma variável, com pesos. Várias convoluções podem produzir médias móveis bastante ponderadas, algumas das quais foram encontradas de particular uso em campos especializados, como nos cálculos do seguro de vida. As médias móveis podem ser usadas para remover efeitos periódicos se computado com o comprimento da periodicidade como conhecido. Por exemplo, com os dados mensais, as variações sazonais podem ser muitas vezes removidas (se este for o objetivo) aplicando uma média móvel simétrica de 12 meses com todos os meses ponderados igualmente, exceto o primeiro e o último que são ponderados por 12. Isso ocorre porque haverá Tenha 13 meses no modelo simétrico (tempo atual, t. - 6 meses). O total é dividido por 12. Procedimentos semelhantes podem ser adotados para qualquer periodicidade bem definida. Médias móveis ponderadas exponencialmente (EWMA) Com a fórmula média móvel simples: todas as observações são igualmente ponderadas. Se chamássemos esses pesos iguais, alfa t. Cada um dos pesos k seria igual a 1 k. Então a soma dos pesos seria de 1, e a fórmula seria: já vimos que as múltiplas aplicações desse processo resultam na variação dos pesos. Com médias móveis exponencialmente ponderadas, a contribuição para o valor médio de observações mais removidas no tempo é deliberada reduzida, enfatizando eventos mais recentes (locais). Essencialmente, um parâmetro de suavização, 0lt alfa lt1, é introduzido e a fórmula revisada para: Uma versão simétrica desta fórmula seria da forma: se os pesos no modelo simétrico forem selecionados como os termos dos termos da expansão binomial, (1212) 2q. Eles somarão para 1, e como q se tornar grande, irá se aproximar da distribuição Normal. Esta é uma forma de ponderação do kernel, com o Binomial atuando como a função kernel. A convolução de dois estágios descrita na subseção anterior é precisamente esse arranjo, com q 1, produzindo os pesos. Em suavização exponencial, é necessário usar um conjunto de pesos que somem para 1 e que reduzem de tamanho geométricamente. Os pesos utilizados são tipicamente da forma: Para mostrar que esses pesos somam para 1, considere a expansão de 1 como uma série. Podemos escrever e expandir a expressão entre parênteses usando a fórmula binomial (1- x) p. Onde x (1-) e p -1, o que dá: Isto fornece uma forma de média móvel ponderada da forma: esta soma pode ser escrita como uma relação de recorrência: o que simplifica bastante a computação e evita o problema de que o regime de ponderação Deve ser estritamente infinito para os pesos somarem para 1 (para valores pequenos de alfa. Isso geralmente não é o caso). A notação utilizada por diferentes autores varia. Alguns usam a letra S para indicar que a fórmula é essencialmente uma variável suavizada e escreve: enquanto a literatura da teoria do controle geralmente usa Z em vez de S para os valores exponencialmente ponderados ou suavizados (veja, por exemplo, Lucas e Saccucci, 1990, LUC1 , E o site NIST para mais detalhes e exemplos trabalhados). As fórmulas citadas acima derivam do trabalho de Roberts (1959, ROB1), mas Hunter (1986, HUN1) usa uma expressão da forma: que pode ser mais apropriada para uso em alguns procedimentos de controle. Com o alfa 1, a estimativa média é simplesmente seu valor medido (ou o valor do item de dados anterior). Com 0,5, a estimativa é a média móvel simples das medições atuais e anteriores. Em modelos de previsão o valor, S t. É freqüentemente usado como estimativa ou valor de previsão para o próximo período de tempo, ou seja, como a estimativa para x no tempo t 1. Assim, temos: Isso mostra que o valor de previsão no tempo t 1 é uma combinação da média móvel ponderada exponencialmente anterior Mais um componente que representa o erro de previsão ponderado, epsilon. No tempo t. Assumindo que uma série de tempo é fornecida e uma previsão é necessária, é necessário um valor para alfa. Isso pode ser estimado a partir dos dados existentes, avaliando a soma dos erros de predição quadrados, obtendo com valores variáveis de alfa para cada t 2,3. Definindo a primeira estimativa para ser o primeiro valor de dados observado, x 1. Nas aplicações de controle, o valor de alfa é importante, isto é, é usado na determinação dos limites de controle superior e inferior e afeta o comprimento de execução médio (ARL) esperado Antes que esses limites de controle sejam quebrados (sob o pressuposto de que a série temporal representa um conjunto de variáveis independentes aleatoriamente, distribuídas de forma idêntica com variância comum). Nessas circunstâncias, a variância da estatística de controle: é (Lucas e Saccucci, 1990): os limites de controle geralmente são estabelecidos como múltiplos fixos dessa variância assintótica, p. - 3 vezes o desvio padrão. Se alfa 0.25, por exemplo, e os dados que estão sendo monitorados assumem ter uma distribuição Normal, N (0,1), quando no controle, os limites de controle serão - 1.134 e o processo atingirá um ou outro limite em 500 etapas na média. Lucas e Saccucci (1990 LUC1) derivam os ARLs para uma ampla gama de valores alfa e sob vários pressupostos usando os procedimentos da Cadeia de Markov. Eles tabulam os resultados, incluindo o fornecimento de ARL quando a média do processo de controle foi deslocada por algum múltiplo do desvio padrão. Por exemplo, com uma mudança de 0,5 com alfa 0.25, o ARL tem menos de 50 etapas de tempo. As abordagens descritas acima são conhecidas como suavização exponencial única. Uma vez que os procedimentos são aplicados uma vez às séries temporais e, em seguida, os processos de análise ou controle são realizados no conjunto de dados suavizado resultante. Se o conjunto de dados incluir uma tendência e / ou componentes sazonais, o alisamento exponencial de dois ou três estágios pode ser aplicado como meio de remoção (modelagem explícita) desses efeitos (veja ainda mais a seção sobre Previsão abaixo e o exemplo do NIST). CHA1 Chatfield C (1975) The Analysis of Times Series: Teoria e Prática. Chapman and Hall, London HUN1 Hunter J S (1986) A média móvel ponderada exponencialmente. J of Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Esquemas de Controle Médio Médio Ponderado Exponencialmente: Propriedades e Melhorias. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Testes de tabela de controle com base em médias móveis geométricas. Technometrics, 1, 239-2505.2 Smoothing Time Series Smoothing geralmente é feito para nos ajudar a melhorar padrões, tendências, por exemplo, em séries temporais. Geralmente suavizar a irregularidade irregular para ver um sinal mais claro. Para dados sazonais, podemos suavizar a sazonalidade para que possamos identificar a tendência. O Smoothing não nos fornece um modelo, mas pode ser um bom primeiro passo na descrição de vários componentes da série. O termo filtro às vezes é usado para descrever um procedimento de suavização. Por exemplo, se o valor suavizado para um determinado horário for calculado como uma combinação linear de observações para os tempos circundantes, pode-se dizer que aplicamos um filtro linear aos dados (não o mesmo que dizer que o resultado é uma linha reta, por o caminho). O uso tradicional do termo média móvel é que, em cada ponto do tempo, determinamos médias (possivelmente ponderadas) dos valores observados que circundam um determinado momento. Por exemplo, no tempo t. Uma média móvel centrada de comprimento 3 com pesos iguais seria a média de valores às vezes t -1. T. E t1. Para tirar a sazonalidade de uma série, para que possamos melhor ver a tendência, usaríamos uma média móvel com um período de duração sazonal. Assim, na série suavizada, cada valor suavizado foi calculado em média em todas as estações. Isso pode ser feito observando uma média móvel unilateral em que você mede todos os valores para os anos anteriores de dados ou uma média móvel centrada em que você usa valores antes e depois da hora atual. Para dados trimestrais, por exemplo, podemos definir um valor suavizado para o tempo t como (x t x t-1 x t-2 x t-3) 4, a média deste tempo e os 3 trimestres anteriores. No código R, este será um filtro unilateral. Uma média móvel centrada cria um pouco de dificuldade quando temos um número par de períodos de tempo no período sazonal (como costumamos fazer). Para suavizar a sazonalidade em dados trimestrais. Para identificar a tendência, a convenção usual é usar a média móvel alisada no tempo t é Suavizar a sazonalidade nos dados mensais. A fim de identificar a tendência, a convenção usual é usar a média móvel suavizada no tempo t é. Isto é, aplicamos o peso 124 aos valores nos tempos t6 e t6 e peso 112 a todos os valores em todos os momentos entre t5 e t5. No comando R filter, bem, especifique um filtro de frente e verso quando quisermos usar valores que venham antes e depois do tempo para o qual foram suavizados. Observe que na página 71 do nosso livro, os autores aplicam pesos iguais em uma média móvel sazonal centrada. Isso também está bem. Por exemplo, um suavizado trimestral pode ser alisado no tempo t é frac x frac x frac xt frac x frac x Um mensageiro mensal pode aplicar um peso de 113 a todos os valores desde os tempos t-6 até t6. O código que os autores usam na página 72 aproveita o comando rep que repete um valor um certo número de vezes. Eles não usam o parâmetro de filtro dentro do comando de filtro. Exemplo 1 Produção Trimestral de Cerveja na Austrália Tanto na Lição 1 quanto na Lição 4, analisamos uma série de produção trimestral de cerveja na Austrália. O código R que se segue cria uma série suavizada que nos permite ver o padrão de tendência e traça esse padrão de tendência no mesmo gráfico que as séries temporais. O segundo comando cria e armazena a série suavizada no objeto chamado trendpattern. Observe que, dentro do comando do filtro, o parâmetro chamado filtro fornece os coeficientes para o alisamento e os lados 2 fazem com que um cálculo centrado seja calculado. Beerprod scan (beerprod. dat) trendpattern filter (beerprod, filtro c (18, 14, 14, 14, 18), sides2) trama (beerprod, tipo b, principal tendência média móvel) linhas (trendpattern) Heres o resultado: Nós Pode subtrair o padrão de tendência dos valores dos dados para obter uma melhor visão da sazonalidade. Heres como isso seria feito: Seasonals beerprod - traço trendpattern (seasonals, tipo b, padrão sazonal principal para a produção de cerveja) O resultado segue: Outra possibilidade para a série de suavização ver tendência é o filtro one-sided filterpattern2 filter (beerprod, filtro c (14, 14, 14, 14), lados1) Com isso, o valor suavizado é a média do ano passado. Exemplo 2. Desemprego mensal dos EUA No trabalho de casa para a semana 4, você analisou uma série mensal de desemprego americano de 1948 a 1978. Heres um alisamento feito para olhar a tendência. (Time de tendência, mainTrend no desemprego dos EUA, 1948-1978, ano de xlab) Somente a tendência suavizada é plotada. (Figura 2.1). O segundo comando identifica as características do tempo do calendário da série. Isso faz com que o enredo tenha um eixo mais significativo. A trama segue. Para as séries não sazonais, você não deve suavizar qualquer extensão específica. Para alisar, você deve experimentar as médias móveis de diferentes intervalos. Esses períodos de tempo poderiam ser relativamente curtos. O objetivo é eliminar as bordas difíceis para ver qual tendência ou padrão podem estar lá. Outros métodos de suavização (Seção 2.4) A Seção 2.4 descreve várias alternativas sofisticadas e úteis para o alisamento médio móvel. Os detalhes podem parecer incompletos, mas isso é bom porque não queremos ficar atolados em muitos detalhes para esses métodos. Dos métodos alternativos descritos na Seção 2.4, lowess (regressão ponderada localmente) pode ser o mais utilizado. Exemplo 2 Continuação O traçado seguinte é linha de tendência suavizada para a série de desemprego dos EUA, encontrada usando um método mais suave, em que uma quantidade substancial (23) contribuiu para cada estimativa suavizada. Observe que isso suavizou a série de forma mais agressiva do que a média móvel. Os comandos utilizados foram desempregados (desemprego, começo c (1948,1), freq12) trama (lowess (desempregado, f 23), alavanca Lowess principal da tendência de desemprego dos EUA) Suavização exponencial simples A equação de previsão básica para o alisamento exponencial único é muitas vezes Dado como hat alpha xt (1-alpha) hat t text Previstamos o valor de x no tempo t1 para ser uma combinação ponderada do valor observado no tempo t e o valor previsto no tempo t. Embora o método seja chamado de método de suavização, é usado principalmente para previsões de curto prazo. O valor de é chamado de constante de suavização. Por qualquer motivo, 0.2 é uma escolha padrão popular de programas. Isso coloca um peso de .2 na observação mais recente e um peso de 1 .2 .8 na previsão mais recente. Com um valor relativamente pequeno, o alisamento será relativamente mais extenso. Com um valor relativamente grande, o alisamento é relativamente menos extenso à medida que mais peso será colocado no valor observado. Este é um método simples de previsão de um passo para a frente que, a primeira vista, parece não exigir um modelo para os dados. De fato, esse método é equivalente ao uso de um modelo ARIMA (0,1,1) sem constante. O procedimento ideal é ajustar um modelo ARIMA (0,1,1) ao conjunto de dados observado e usar os resultados para determinar o valor de. Isso é ideal no sentido de criar o melhor para os dados já observados. Embora o objetivo seja o alisamento e a previsão um passo a frente, a equivalência ao modelo ARIMA (0,1,1) traz um bom ponto. Não devemos aplicar cegamente alisamento exponencial porque o processo subjacente pode não ser bem modelado por um ARIMA (0,1,1). ARIMA (0,1,1) e Equivalência de Suavização Exponencial Considere um ARIMA (0,1,1) com média 0 para as primeiras diferenças, xt - x t-1: start hat amp amp xt theta1 wt amp amp xt theta1 (xt - hat t) amp amp (1 theta1) xt - theta1hat tende. Se deixarmos (1 1) e assim - (1) 1, vemos a equivalência com a equação (1) acima. Por que o Método é Chamado Suavização Exponencial Isso produz o seguinte: begin hat amp amp alpha phxt (1-alpha) alfa x (1-alfa) som amplificador amp alpha xt alfa (1-alfa) x (1-alfa) 2hat fim Continuar Desta forma, substituindo sucessivamente o valor previsto no lado direito da equação. Isso leva a: hat alpha alfa (1-alpha) x alfa (1-alfa) 2 x pontos alfa (1-alfa) jx pontos alfa (1-alfa) x1 texto A equação 2 mostra que o valor previsto é uma média ponderada De todos os valores passados da série, com pesos exponencialmente alternativos à medida que avançamos na série. Suavização exponencial otimizada em R Basicamente, apenas nos ajustamos a ARIMA (0,1,1) aos dados e determinamos o coeficiente. Podemos examinar o ajuste do liso, comparando os valores previstos com a série real. O suavizado exponencial tende a ser usado mais como uma ferramenta de previsão do que um verdadeiro mais suave, por isso estava olhando para ver se nós temos um bom ajuste. Exemplo 3. N 100 observações mensais do logaritmo de um índice de preços do petróleo nos Estados Unidos. A série de dados é: Um ajuste ARIMA (0,1,1) em R deu um coeficiente MA (1) 0,3877. Assim (1 1) 1.3877 e 1- -0.3877. A equação de previsão de suavização exponencial é hat 1.3877xt - 0.3877hat t No momento 100, o valor observado da série é x 100 0.86601. O valor previsto para a série naquele momento é Assim, a previsão para o tempo 101 é 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 A seguir, o quão bem é mais adequado para a série. É um bom ajuste. Isso é um bom sinal para a previsão, o objetivo principal para este mais suave. Aqui estão os comandos usados para gerar a saída para este exemplo: planilha oilindex scan (oildata. dat) (oilindex, tipo b, registro principal da série de índice de óleo) expsmoothfit arima (oilindex, order c (0,1,1)) expsmoothfit Para ver os resultados de arima previstos oilindex - linhas de gráficos preditos expsmoothfitresiduais (linhas de indexação de óleo (indexação de óleo, tipo, alinhamento exponencial principal de índice de óleo) 1.3877oilindex100-0.3877predicteds100 previsão para o tempo 101 Suavização exponencial dupla Suavização exponencial dupla pode ser usada quando há Tendência (tanto a longo prazo quanto a curto prazo), mas sem sazonalidade. Essencialmente, o método cria uma previsão combinando estimativas exponencialmente suavizadas da tendência (inclinação de uma linha reta) e do nível (basicamente, a interceptação de uma linha reta). Dois pesos diferentes, ou parâmetros de suavização, são usados para atualizar esses dois componentes em cada momento. O nível suavizado é mais ou menos equivalente a um simples alisamento exponencial dos valores de dados e a tendência suavizada é mais ou menos equivalente a um alisamento exponencial simples das primeiras diferenças. O procedimento é equivalente ao encaixe de um modelo ARIMA (0,2,2), sem constante pode ser realizada com um ajuste ARIMA (0,2,2). (1-B) 2 xt (1 theta1B theta2B2) wt. Navegação
Comments
Post a Comment