Sunday, 15 October 2017

Estacionalidad Centrada Media Móvil


Cuando se calcula una media móvil en ejecución, colocar el promedio en el período de tiempo medio tiene sentido En el ejemplo anterior se calculó el promedio de los primeros 3 períodos de tiempo y lo colocó al lado del período 3. Podríamos haber colocado el promedio en el medio de la Intervalo de tiempo de tres períodos, es decir, al lado del período 2. Esto funciona bien con períodos de tiempo impares, pero no tan bueno para incluso períodos de tiempo. Entonces, ¿dónde colocaríamos el primer promedio móvil cuando M 4 Técnicamente, el promedio móvil caería en t 2,5, 3,5. Para evitar este problema, suavizar las MA con M 2. Así, suavizar los valores suavizados Si la media de un número par de términos, tenemos que suavizar los valores suavizados La siguiente tabla muestra los resultados utilizando M 4.Señalización de la aplicación de ajuste estacional y Suavizado exponencial Es sencillo realizar ajustes estacionales y ajustar modelos de suavizado exponencial utilizando Excel. Las imágenes y gráficos de pantalla que se muestran a continuación se toman de una hoja de cálculo que se ha configurado para ilustrar el ajuste estacional multiplicativo y el suavizado lineal exponencial en los siguientes datos de ventas trimestrales de Outboard Marine: Para obtener una copia del archivo de la hoja de cálculo, haga clic aquí. La versión de suavizado exponencial lineal que se utilizará aquí para propósitos de demostración es la versión de Brown8217s, simplemente porque puede implementarse con una sola columna de fórmulas y sólo hay una constante de suavizado para optimizar. Por lo general, es mejor usar la versión de Holt8217s que tiene constantes de suavizado separadas para nivel y tendencia. El proceso de pronóstico se desarrolla de la siguiente manera: (i) en primer lugar los datos se ajustan estacionalmente (ii) luego se generan pronósticos para los datos desestacionalizados a través de la suavización exponencial lineal y (iii) finalmente los pronósticos desestacionalizados son quotorasonalizados para obtener pronósticos para la serie original . El proceso de ajuste estacional se lleva a cabo en las columnas D a G. El primer paso en el ajuste estacional es calcular una media móvil centrada (realizada aquí en la columna D). Esto puede hacerse tomando el promedio de dos promedios de un año que son compensados ​​por un período entre sí. (Se necesita una combinación de dos promedios de compensación en lugar de un solo promedio para fines de centrado cuando el número de estaciones es par.) El siguiente paso es calcular la relación con el promedio móvil - ie. Los datos originales divididos por la media móvil en cada período - que se realiza aquí en la columna E. (Esto también se llama el componente quottrend-cyclequot del patrón, en la medida en que los efectos de tendencia y de ciclo de negocio podrían considerarse como todo lo que Por supuesto, los cambios mensuales que no son debidos a la estacionalidad podrían ser determinados por muchos otros factores, pero el promedio de 12 meses suaviza sobre ellos en gran medida. El índice estacional estimado para cada estación se calcula primero haciendo un promedio de todas las razones para esa estación particular, que se hace en las células G3-G6 usando una fórmula de AVERAGEIF. Las relaciones medias se vuelven a escalar de modo que suman exactamente 100 veces el número de períodos en una estación, o 400 en este caso, lo que se hace en las células H3-H6. En la columna F, las fórmulas VLOOKUP se usan para insertar el valor de índice estacional apropiado en cada fila de la tabla de datos, de acuerdo con el trimestre del año que representa. La media móvil centrada y los datos desestacionalizados terminan pareciendo esto: Obsérvese que la media móvil típicamente se parece a una versión más suave de la serie con ajuste estacional, y es más corta en ambos extremos. Otra hoja de trabajo en el mismo archivo de Excel muestra la aplicación del modelo de suavizado exponencial lineal a los datos desestacionalizados, empezando en la columna G. Un valor para la constante de suavizado (alfa) se introduce por encima de la columna de pronóstico (aquí en la celda H9) y Por comodidad se le asigna el nombre de rango quotAlpha. quot (El nombre se asigna mediante el mandato quotInsert / Name / Createquot). El modelo LES se inicializa estableciendo los dos primeros pronósticos igual al primer valor real de la serie ajustada estacionalmente. La fórmula utilizada aquí para la previsión de LES es la forma recursiva de una sola ecuación del modelo Brown8217s: Esta fórmula se introduce en la celda correspondiente al tercer período (aquí, célula H15) y se copia desde allí. Obsérvese que la previsión de LES para el período actual se refiere a las dos observaciones precedentes ya los dos errores de pronóstico precedentes, así como al valor de alfa. Por lo tanto, la fórmula de pronóstico en la fila 15 se refiere sólo a los datos que estaban disponibles en la fila 14 y anteriores. (Por supuesto, si deseamos usar el suavizado exponencial lineal simple en vez de lineal, podríamos sustituir la fórmula SES aquí en lugar. También podríamos usar Holt8217s en lugar de Brown8217s modelo LES, lo que requeriría dos columnas más de fórmulas para calcular el nivel y la tendencia Que se utilizan en la previsión). Los errores se calculan en la siguiente columna (aquí, columna J) restando las previsiones de los valores reales. El error cuadrático medio raíz se calcula como la raíz cuadrada de la varianza de los errores más el cuadrado de la media. En el cálculo de la media y la varianza de los errores en esta fórmula, se excluyen los dos primeros períodos porque el modelo no comienza realmente a pronosticar hasta el momento en que se calcula la media y la varianza de los errores en esta fórmula. El tercer período (fila 15 en la hoja de cálculo). El valor óptimo de alpha se puede encontrar cambiando manualmente alfa hasta que se encuentre el RMSE mínimo, o bien puede usar el quotSolverquot para realizar una minimización exacta. El valor de alfa que encontró el Solver se muestra aquí (alpha0.471). Por lo general, es una buena idea trazar los errores del modelo (en unidades transformadas) y también calcular y trazar sus autocorrelaciones en retrasos de hasta una temporada. Las correlaciones de error se calculan usando la función CORREL () para calcular las correlaciones de los errores con ellos mismos rezagados por uno o más períodos - los detalles se muestran en el modelo de hoja de cálculo . Aquí hay una gráfica de las autocorrelaciones de los errores en los primeros cinco retrasos: Las autocorrelaciones en los retornos 1 a 3 son muy cercanas a cero, pero el pico con retraso 4 (cuyo valor es 0,35) es ligeramente problemático. El proceso de ajuste estacional no ha sido completamente exitoso. Sin embargo, en realidad sólo es marginalmente significativo. 95 para determinar si las autocorrelaciones son significativamente diferentes de cero son más o menos 2 / SQRT (n-k), donde n es el tamaño de la muestra yk es el retraso. Aquí n es 38 y k varía de 1 a 5, por lo que la raíz cuadrada de - n-menos-k es de alrededor de 6 para todos ellos, y por lo tanto los límites para probar la significación estadística de las desviaciones de cero son más o menos - O-menos 2/6, o 0,33. Si se modifica el valor de alfa manualmente en este modelo de Excel, se puede observar el efecto sobre la serie temporal y las gráficas de autocorrelación de los errores, así como sobre el error cuadrático medio de raíz, que se ilustrará a continuación. En la parte inferior de la hoja de cálculo, la fórmula de pronóstico se quotbootrapeado en el futuro mediante la simple sustitución de los pronósticos de los valores reales en el punto en que se agotan los datos reales, es decir, Donde comienza el futuro. (En otras palabras, en cada celda donde ocurrirá un valor de datos futuro, se inserta una referencia de celda que apunta a la previsión hecha para ese período). Todas las otras fórmulas son simplemente copiadas desde arriba: Obsérvese que los errores para las previsiones de El futuro se calcula que es cero. Esto no significa que los errores reales sean cero, sino que simplemente refleja el hecho de que para propósitos de predicción estamos asumiendo que los datos futuros serán iguales a los pronósticos en promedio. Las previsiones de LES para los datos desestacionalizados se ven así: Con este valor particular de alfa, que es óptimo para predicciones de un período de anticipación, la tendencia proyectada es levemente ascendente, reflejando la tendencia local que se observó en los últimos 2 años más o menos. Para otros valores de alfa, se podría obtener una proyección de tendencia muy diferente. Por lo general, es una buena idea ver qué sucede con la proyección de tendencia a largo plazo cuando el alfa es variado, porque el valor que es mejor para pronósticos a corto plazo no será necesariamente el mejor valor para predecir el futuro más lejano. Por ejemplo, aquí está el resultado que se obtiene si el valor de alpha se establece manualmente en 0.25: La tendencia a largo plazo proyectada es ahora negativa en lugar de positiva Con un valor menor de alfa, el modelo está poniendo más peso en datos antiguos en Su estimación del nivel y tendencia actual y sus pronósticos a largo plazo reflejan la tendencia a la baja observada en los últimos 5 años en lugar de la tendencia al alza más reciente. Este gráfico también ilustra claramente cómo el modelo con un valor menor de alpha es más lento para responder a los puntos de quotturning en los datos y por lo tanto tiende a hacer un error del mismo signo para muchos períodos en una fila. Sus errores de pronóstico de 1 paso son mayores en promedio que los obtenidos antes (RMSE de 34,4 en lugar de 27,4) y fuertemente positivamente autocorrelacionados. La autocorrelación lag-1 de 0,56 excede en gran medida el valor de 0,33 calculado anteriormente para una desviación estadísticamente significativa de cero. Como alternativa a la disminución del valor de alfa para introducir un mayor conservadurismo en los pronósticos a largo plazo, a veces se añade al modelo un factor quottrend de amortiguación para hacer que la tendencia proyectada se aplaste después de unos pocos períodos. El paso final en la construcción del modelo de predicción es el de la obtención de la razón de los pronósticos de LES, multiplicándolos por los índices estacionales apropiados. Por lo tanto, las previsiones reseasonalized en la columna I son simplemente el producto de los índices estacionales en la columna F y las previsiones desestacionalizadas de LES en la columna H. Es relativamente fácil calcular intervalos de confianza para los pronósticos de un paso adelante realizados por este modelo: primero Calcular el RMSE (error cuadrático-medio cuadrático, que es sólo la raíz cuadrada del MSE) y luego calcular un intervalo de confianza para el pronóstico ajustado estacionalmente sumando y restando dos veces el RMSE. (En general, un intervalo de confianza de 95 para un pronóstico de un período por delante es aproximadamente igual al punto de previsión más o menos dos veces la desviación estándar estimada de los errores de pronóstico, suponiendo que la distribución del error es aproximadamente normal y el tamaño de la muestra Es lo suficientemente grande, por ejemplo, 20 o más. En este caso, el RMSE en lugar de la desviación estándar de la muestra de los errores es la mejor estimación de la desviación estándar de futuros errores de pronóstico, ya que toma el sesgo, así como las variaciones aleatorias en cuenta. Para el pronóstico estacionalmente ajustado son entonces reseasonalized. Junto con el pronóstico, multiplicándolos por los índices estacionales apropiados. En este caso el RMSE es igual a 27,4 y la previsión desestacionalizada para el primer período futuro (Dic-93) es de 273,2. Por lo que el intervalo de confianza estacionalmente ajustado es de 273.2-227.4 218.4 a 273.2227.4 328.0. Multiplicando estos límites por Decembers índice estacional de 68,61. Obtenemos límites de confianza inferiores y superiores de 149,8 y 225,0 en torno al pronóstico del punto Dec-93 de 187,4. Los límites de confianza para los pronósticos más de un período por delante se ampliarán generalmente a medida que aumenta el horizonte de pronóstico, debido a la incertidumbre sobre el nivel y la tendencia, así como los factores estacionales, pero es difícil calcularlos en general por métodos analíticos. (La forma apropiada de calcular los límites de confianza para la previsión de LES es utilizando la teoría ARIMA, pero la incertidumbre en los índices estacionales es otra cuestión.) Si desea un intervalo de confianza realista para un pronóstico de más de un período, tomando todas las fuentes de Su mejor opción es utilizar métodos empíricos: por ejemplo, para obtener un intervalo de confianza para un pronóstico de dos pasos adelante, podría crear otra columna en la hoja de cálculo para calcular un pronóstico de 2 pasos adelante para cada período ( Iniciando el pronóstico de un paso adelante). Luego calcula el RMSE de los errores de pronóstico de 2 pasos adelante y usa esto como la base para un intervalo de confianza de 2 pasos adelante. Promedios de movimiento y promedios móviles centrados Un par de puntos acerca de la estacionalidad en una serie temporal repiten, incluso si Parecen obvias. Una es que el término 8220season8221 no se refiere necesariamente a las cuatro estaciones del año que resultan de la inclinación del eje Earth8217s. En la analítica predictiva, 8220season8221 a menudo significa precisamente eso, porque muchos de los fenómenos que estudiamos varían con la progresión de la primavera a través del invierno: ventas de engranajes de invierno o de verano, incidencia de ciertas enfermedades generalizadas, eventos meteorológicos causados ​​por la ubicación del Corriente de chorro y cambios en la temperatura del agua en el Océano Pacífico oriental, y así sucesivamente. Igualmente, los acontecimientos que ocurren regularmente pueden actuar como estaciones meteorológicas, a pesar de que sólo tienen una conexión tenue con los solsticios y los equinoccios. Los turnos de ocho horas en hospitales y fábricas a menudo se expresan en la incidencia de consumos y gastos de energía allí, una temporada es de ocho horas de duración y las estaciones ciclo todos los días, no todos los años. Las fechas de vencimiento de los impuestos señalan el inicio de una inundación de dólares en los tesoros municipales, estatales y federales, la temporada puede ser de un año (impuestos a la renta personal), seis meses (impuestos sobre la propiedad en muchos estados), trimestrales ), y así. Es un poco extraño que tengamos la palabra 8220season8221 para referirnos generalmente al período de tiempo que se repite regularmente, pero no hay término general para el período de tiempo durante el cual ocurre una vuelta completa de las estaciones. 8220Cycle8221 es posible, pero en analítica y pronóstico ese término se suele considerar un período de duración indeterminada, como un ciclo económico. En ausencia de un término mejor, se utilizó en este y en los siguientes capítulos. Esto no es sólo reflexión terminológica. Las formas en que identificamos las estaciones y el período de tiempo durante el cual las estaciones tienen repercusiones reales, aunque a menudo menores, en cómo medimos sus efectos. En las siguientes secciones se discute cómo algunos analistas varían la forma en que calculan los promedios móviles según si el número de estaciones es impar o incluso. Usando los promedios móviles en lugar de los promedios simples Suponga que una gran ciudad está considerando la reasignación de su policía de tránsito para abordar mejor la incidencia de la conducción mientras está deteriorada, lo que la ciudad cree que ha ido aumentando. Hace cuatro semanas, entró en vigor una nueva legislación que legalizaba la posesión y el uso recreativo de la marihuana. Desde entonces, el número diario de arrestos por tráfico de DWI parece estar subiendo. La complicación es el hecho de que el número de detenciones parece aumentar los viernes y los sábados. Para ayudar a planificar los requerimientos de mano de obra en el futuro, le gustaría prever cualquier tendencia subyacente que se establezca. A usted también le gustaría tiempo el despliegue de sus recursos para tener en cuenta cualquier temporada relacionada con el fin de semana que ocurra. La Figura 5.9 tiene los datos relevantes con los que tiene que trabajar. Figura 5.9 Con este conjunto de datos, cada día de la semana constituye una temporada. Incluso observando el gráfico de la figura 5.9. Usted puede decir que la tendencia del número de arrestos diarios es para arriba. You8217ll tiene que planificar para ampliar el número de oficiales de tráfico, y esperamos que la tendencia se estabilice pronto. Además, los datos corroboran la idea de que más arrestos ocurren rutinariamente los viernes y sábados, por lo que su asignación de recursos necesita abordar esos picos. Pero usted necesita cuantificar la tendencia subyacente, para determinar cuántos policías adicionales tienen que traer. También es necesario para cuantificar el tamaño esperado de los picos de fin de semana, para determinar cuántos policías adicionales que necesita para ver los conductores erráticos en esos días. El problema es que aún no sabes cuánto del aumento diario se debe a la tendencia y cuánto se debe a ese efecto de fin de semana. Usted puede comenzar por detrending la serie de tiempo. Anteriormente en este capítulo, en 8220Simple Seasonal Averages, 8221 usted vio un ejemplo de cómo detrend una serie de tiempo con el fin de aislar los efectos estacionales usando el método de promedios simples. En esta sección usted verá cómo hacerlo utilizando promedios móviles, probablemente, el enfoque de promedios móviles se usa más a menudo en el análisis predictivo que el enfoque de promedios simples. Hay varias razones para la mayor popularidad de las medias móviles, entre ellas, que el enfoque de las medias móviles no le pide que colapse sus datos en el proceso de cuantificación de una tendencia. Recordemos que el ejemplo anterior hizo necesario colapsar los promedios trimestrales con los promedios anuales, calcular una tendencia anual y luego distribuir una cuarta parte de la tendencia anual en cada trimestre del año. Este paso era necesario para eliminar la tendencia de los efectos estacionales. Por el contrario, el enfoque de las medias móviles le permite desviar la serie de tiempo sin recurrir a ese tipo de maquinación. La figura 5.10 muestra cómo funciona el enfoque de las medias móviles en el presente ejemplo. Figura 5.10 El promedio móvil en el segundo gráfico aclara la tendencia subyacente. La Figura 5.10 añade una columna de media móvil y una columna para estaciones específicas. Al conjunto de datos de la figura 5.9. Ambas adiciones requieren cierta discusión. Los picos en los arrestos que tienen lugar los fines de semana le da razón para creer que usted está trabajando con temporadas que se repiten una vez cada semana. Por lo tanto, comience por obtener el promedio para el período que abarca8212, es decir, las primeras siete temporadas, de lunes a domingo. La fórmula para el promedio en la celda D5, la primera media móvil disponible, es la siguiente: Esta fórmula se copia y se pega a través de la celda D29, por lo que tiene 25 promedios móviles basados ​​en 25 ciclos de siete días consecutivos. Observe que para mostrar las primeras y últimas observaciones de la serie temporal, he ocultado las filas 10 a 17. Puede mostrarlas, si lo desea, en el libro de este capítulo, disponible en el sitio web del editor. Haga una selección múltiple de filas visibles 9 y 18, haga clic con el botón secundario en uno de sus encabezados de fila y elija Mostrar en el menú contextual. Cuando ocultas las filas de una hoja de trabajo, como he hecho en la figura 5.10. Los datos cartografiados en las filas ocultas también se ocultan en el gráfico. Las etiquetas del eje x sólo identifican los puntos de datos que aparecen en el gráfico. Debido a que cada promedio móvil en la Figura 5.10 abarca siete días, ningún promedio móvil se empareja con las tres primeras o últimas tres observaciones reales. Copiar y pegar la fórmula en la celda D5 hasta un día a la celda D4 lo hace fuera de las observaciones8212 no hay ninguna observación registrada en la celda C1. Del mismo modo, no hay media móvil registrada por debajo de la celda D29. Copiar y pegar la fórmula en D29 en D30 requeriría una observación en la celda C33, y no hay observación disponible para el día que la célula representaría. Sería posible, por supuesto, acortar la longitud de la media móvil a, digamos, cinco en lugar de siete. Hacerlo significaría que las fórmulas de promedio móvil en la Figura 5.10 podrían comenzar en la celda D4 en lugar de D5. Sin embargo, en este tipo de análisis, desea que la duración de la media móvil sea igual al número de estaciones: siete días en una semana para eventos que se repiten semanalmente implica un promedio móvil de siete y cuatro trimestres en un año para eventos que Recur anualmente implica un promedio móvil de longitud cuatro. En líneas similares, generalmente cuantificamos los efectos estacionales de tal manera que se suman a cero dentro del período de tiempo abarcador. Como se vio en la primera sección de este capítulo, en los promedios simples, esto se hace calculando el promedio de (digamos) los cuatro trimestres de un año y luego restando el promedio del año de cada cifra trimestral. De este modo se asegura que el total de los efectos estacionales es cero. A su vez, ese 8217s útil porque pone los efectos estacionales en un pie de igualdad 8212a efecto de verano de 11 es tan lejos de la media como un efecto de invierno de 821111. Si desea promedio de cinco estaciones en lugar de siete para obtener su promedio móvil, you8217re mejor De encontrar un fenómeno que se repite cada cinco temporadas en lugar de cada siete. Sin embargo, cuando se toma el promedio de los efectos estacionales más tarde en el proceso, es improbable que estos promedios sumen a cero. Es necesario en ese punto recalibrar, o normalizar. Los promedios para que su suma sea cero. Cuando se hace esto, los promedios promedio estacionales expresan el efecto en un período de tiempo de pertenecer a una estación particular. Una vez normalizados, los promedios estacionales se denominan los índices estacionales que este capítulo ya ha mencionado varias veces. En la Figura 5.10 también se muestra lo que se conoce como estaciones estacionales específicas en la columna E. Estas son las que quedan después de restar el promedio móvil de la observación real. Para tener una idea de lo que representan los temporales específicos, considere el promedio móvil en la celda D5. Es la media de las observaciones en C2: C8. Las desviaciones de cada observación de la media móvil (por ejemplo, C2 8211 D5) se garantiza que suman a cero 8212 que es una característica de un promedio. Por lo tanto, cada desviación expresa el efecto de estar asociado con ese día en particular en esa semana en particular. Es una temporada específica, entonces específica porque la desviación se aplica a ese lunes o martes particular y así sucesivamente, y estacional, porque en este ejemplo se trata cada día como si fuera una estación en el período abarcador de una semana. Debido a que cada temporada específica mide el efecto de estar en esa temporada frente a la media móvil para ese grupo de (aquí) siete temporadas, puede posteriormente mediar las estaciones específicas de una temporada en particular (por ejemplo, todos los viernes en su Series temporales) para estimar ese efecto general, más que específico, de la temporada. Ese promedio no se confunde con una tendencia subyacente en la serie temporal, ya que cada estación específica expresa una desviación de su propio promedio móvil. Alinear los promedios móviles también es la cuestión de alinear las medias móviles con el conjunto de datos original. En la Figura 5.10. He alineado cada promedio móvil con el punto medio de la gama de observaciones que incluye. Así, por ejemplo, la fórmula en la celda D5 promedia las observaciones en C2: C8, y la he alineado con la cuarta observación, el punto medio del rango promedio, colocándolo en la fila 5. Esta disposición se denomina una media móvil centrada . Y muchos analistas prefieren alinear cada media móvil con el punto medio de las observaciones que promedia. Tenga en cuenta que en este contexto, 8220midpoint8221 se refiere a la mitad de un período de tiempo: El jueves es el punto medio de lunes a domingo. No se refiere a la mediana de los valores observados, aunque, por supuesto, podría funcionar de esa manera en la práctica. Otro enfoque es el promedio móvil de arrastre. En ese caso, cada media móvil se alinea con la observación final de que promedia 8212 y, por lo tanto, sigue detrás de sus argumentos. Esta es a menudo la disposición preferida si se desea utilizar un promedio móvil como pronóstico, como se hace con el suavizado exponencial, porque su promedio móvil final coincide con la observación disponible final. Centrado Medios móviles con números pares de las estaciones Normalmente adoptamos un procedimiento especial cuando el número de estaciones es incluso en lugar de impar. Ese es el estado típico de las cosas: tienden a haber incluso números de estaciones en el período abarcador para temporadas típicas, como meses, trimestres y períodos cuadrienales (para las elecciones). La dificultad con un número par de estaciones es que no hay punto medio. Dos no es el punto medio de un rango que comienza en 1 y termina en 4, y tampoco es 3 si se puede decir que tiene uno, su punto medio es 2,5. Seis no es el punto medio de 1 a 12, y tampoco es 7 su punto medio puramente teórico es 6,5. Para actuar como si existiera un punto medio, debe agregar una capa de promediación encima de los promedios móviles. Vea la Figura 5.11. Figura 5.11 Excel ofrece varias maneras de calcular una media móvil centrada. La idea detrás de este enfoque para conseguir un promedio móvil que se centró en un punto medio existente, cuando hay un número par de temporadas, es tirar de ese punto medio hacia adelante por la mitad de una temporada. Usted calcula un promedio móvil que sería centrado en, digamos, el tercer punto en el tiempo si cinco estaciones en lugar de cuatro constituyeran una vuelta completa del calendario. Esto se realiza tomando dos promedios móviles consecutivos y haciendo un promedio de ellos. Así en la Figura 5.11. Hay un promedio móvil en la celda E6 que promedia los valores en D3: D9. Debido a que hay cuatro valores estacionales en D3: D9, el promedio móvil en E6 se piensa centrado en la temporada imaginaria 2,5, medio punto por debajo de la primera temporada candidata disponible, 3. (Las estaciones 1 y 2 no están disponibles como puntos medios para Falta de datos al promedio antes de la Temporada 1.) Obsérvese, sin embargo, que el promedio móvil en la celda E8 promedia los valores en D5: D11, el segundo a través del quinto en la serie de tiempo. Ese promedio se centra en (imaginario) punto 3.5, un período completo por delante de la media centrada en 2,5. Mediante el promedio de los dos promedios móviles, por lo que el pensamiento va, puede tirar el punto central del primer promedio móvil hacia adelante por medio punto, de 2,5 a 3. That8217s lo que los promedios en la columna F de la figura 5.11 hacer. La celda F7 proporciona el promedio de las medias móviles en E6 y E8. Y el promedio en F7 está alineado con el tercer punto de datos en la serie de tiempo original, en la celda D7, para enfatizar que el promedio se centra en esa temporada. Si se expande la fórmula en la celda F7, así como las medias móviles en las celdas E6 y E8, verá que resulta ser un promedio ponderado de los primeros cinco valores de la serie temporal, con el primer y el quinto valor dados un peso De 1 y el segundo a cuarto valores dados un peso de 2. Eso nos lleva a una forma más rápida y sencilla de calcular una media móvil centrada con un número par de estaciones. Todavía en la Figura 5.11. Los pesos se almacenan en el rango H3: H11. Esta fórmula devuelve el primer promedio móvil centrado, en la celda I7: Esa fórmula devuelve 13.75. Que es idéntico al valor calculado por la fórmula de doble promedio en la celda F7. Haciendo la referencia a los pesos absolutos, por medio de los signos de dólar en H3: H11. Puede copiar la fórmula y pegarla en la medida de lo necesario para obtener el resto de las medias móviles centradas. Detrender la serie con los promedios móviles Cuando haya substraído las medias móviles de las observaciones originales para obtener las estaciones específicas, ha eliminado la tendencia subyacente de la serie. Lo que se deja en las estaciones estacionales es normalmente una serie horizontal y estacionaria con dos efectos que hacen que los estacionales específicos se aparten de una línea absolutamente recta: los efectos estacionales y el error aleatorio en las observaciones originales. La figura 5.12 muestra los resultados de este ejemplo. Figura 5.12 Los efectos estacionales específicos para el viernes y el sábado permanecen claros en la serie de tendencias. El gráfico superior de la figura 5.12 muestra las observaciones diarias originales. Tanto la tendencia general al alza como los picos estacionales del fin de semana son claros. El gráfico inferior muestra los datos estacionales específicos: el resultado de la detrensión de la serie original con un filtro de media móvil, como se describió anteriormente en 8220. Entendiendo las estaciones específicas.8221 Puede ver que la serie detrended es ahora prácticamente horizontal (una línea de tendencia lineal para los estacionales específicos Tiene una ligera desviación hacia abajo), pero los picos estacionales del viernes y del sábado todavía están en su lugar. El siguiente paso es pasar de los datos estacionales específicos a los índices estacionales. Vea la Figura 5.13. Figura 5.13 Los efectos estacionales específicos se promedian primero y luego se normalizan para alcanzar los índices estacionales. En la figura 5.13. Las series estacionales específicas en la columna E se reordenan en la forma tabular mostrada en el intervalo H4: N7. El propósito es simplemente hacer más fácil calcular los promedios estacionales. Estos promedios se muestran en H11: N11. Sin embargo, las cifras en H11: N11 son promedios, no desviaciones de un promedio, y por lo tanto podemos esperar que suman a cero. Todavía tenemos que ajustarlos para que expresen desviaciones de un gran medio. Esa gran media aparece en la celda N13, y es el promedio de los promedios estacionales. Podemos llegar a los índices estacionales restando la media grande en N13 de cada uno de los promedios estacionales. El resultado está en el rango H17: N17. Estos índices estacionales ya no son específicos de un promedio móvil determinado, como es el caso de las estaciones específicas en la columna E. Debido a que se basan en un promedio de cada instancia de una temporada dada, expresan el efecto promedio de una temporada dada a lo largo de la temporada Cuatro semanas en la serie de tiempo. Además, son medidas de una estación, un día en las detenciones de tráfico frente a la media durante un período de siete días. Ahora podemos usar esos índices estacionales para desestacionalizar la serie. Utilizaremos la serie desestacionalizada para obtener pronósticos a través de la regresión lineal o el método Holt8217s de suavizar las series de tendencias (discutidas en el Capítulo 4). Entonces simplemente agregamos los índices estacionales de nuevo en los pronósticos para reseasonalized ellos. Todo esto aparece en la figura 5.14. Figura 5.14 Después de tener los índices estacionales, los toques finales que se aplican aquí son los mismos que en el método de promedios simples. Los pasos ilustrados en la figura 5.14 son en gran parte los mismos que los de las figuras 5.6 y 5.7. En las siguientes secciones. Desestacionalización de las observaciones Reste los índices estacionales de las observaciones originales para desestacionalizar los datos. Puede hacerlo como se muestra en la Figura 5.14. En el que las observaciones originales y los índices estacionales se disponen como dos listas que comienzan en la misma fila, las columnas C y F. Esta disposición hace que sea un poco más fácil estructurar los cálculos. También puede hacer la sustracción como se muestra en la Figura 5.6. En el que se muestran en un formato tabular las observaciones trimestrales originales (C12: F16), los índices trimestrales (C8: F8) y los resultados desestacionalizados (C20: F24). Ese arreglo hace que sea un poco más fácil concentrarse en los índices estacionales y los trimestres desastrosos. Pronóstico de las observaciones desestacionalizadas En la Figura 5.14. Las observaciones desestacionalizadas están en la columna H y en la figura 5.7 se encuentran en la columna C. Independientemente de si se desea usar un enfoque de regresión o un enfoque de suavizado para el pronóstico, es mejor organizar las observaciones desestacionalizadas en una lista de una sola columna. En la Figura 5.14. Las previsiones están en la columna J. La siguiente fórmula de matriz se introduce en el rango J2: J32. Anteriormente en este capítulo, señalé que si omite el argumento x-values ​​de los argumentos de la función TREND () function8217s, Excel proporciona los valores predeterminados 1. 2. N. Donde n es el número de valores y. En la fórmula dada, H2: H32 contiene 31 valores y. Dado que falta el argumento que normalmente contiene los valores x, Excel proporciona los valores predeterminados 1. 2. 31. Estos son los valores que queremos utilizar de todos modos, en la columna B, por lo que la fórmula dada es equivalente a TREND (H2: H32, B2: B32). Y eso 8217s la estructura utilizada en D5: D24 de la Figura 5.7: Haciendo el pronóstico de un paso hacia adelante Hasta ahora se han arreglado para los pronósticos de las series temporales desestacionalizadas de t 1 a t 31 en la figura 5.14. Y de t 1 a t 20 en la figura 5.7. Estas previsiones constituyen información útil para diversos fines, incluida la evaluación de la exactitud de las previsiones mediante un análisis RMSE. Pero su propósito principal es pronosticar por lo menos el siguiente período de tiempo, aún no observado. Para conseguirlo, puede pronosticar primero desde la función TREND () o LINEST () si utiliza la regresión o desde la fórmula de suavizado exponencial si utiliza el método Holt8217s. A continuación, puede agregar el índice estacional asociado a la regresión o el pronóstico de suavizado, para obtener un pronóstico que incluya tanto la tendencia como el efecto estacional. En la Figura 5.14. Se obtiene el pronóstico de regresión en la celda J33 con esta fórmula: En esta fórmula, los valores y en H2: H32 son los mismos que en las otras fórmulas TREND () en la columna J. Así son los valores x (por defecto) de 1 A través de 32. Ahora, sin embargo, suministra un nuevo valor x como el tercer argumento de la función 8217, que le indica a TREND () que busque en la celda B33. It8217s 32. El siguiente valor de t. Y Excel devuelve el valor 156.3 en la celda J33. La función TREND () en la celda J33 indica a Excel, en efecto, 8220Cálculo de la ecuación de regresión para los valores en H2: H32 regresó a los valores t de 1 a 31. Aplique esa ecuación de regresión al nuevo valor de x de 32 y devuelva el resultado.8221 Usted encontrará el mismo enfoque tomado en la celda D25 de la Figura 5.7. Donde la fórmula para obtener el pronóstico de un paso adelante es la siguiente: Adición de los índices estacionales Volver En El paso final es reseasonalize los pronósticos mediante la adición de los índices estacionales a las previsiones de tendencia, invirtiendo lo que hizo cuatro pasos atrás cuando se resta el Índices de las observaciones originales. Esto se hace en la columna F en la figura 5.7 y la columna K en la figura 5.14. No olvide agregar el índice estacional apropiado para el pronóstico de un paso adelante, con los resultados mostrados en la celda F25 en la Figura 5.7 y en la celda K33 en la Figura 5.14. (I8217ve sombreó las celdas un paso adelante en la Figura 5.7 y la Figura 5.14 para resaltar las previsiones). Puede encontrar gráficos de tres representaciones de los datos de detención de tráfico en la Figura 5.15. La serie desestacionalizada, el pronóstico lineal a partir de los datos desestacionalizados y las previsiones reseasonalized. Tenga en cuenta que los pronósticos incorporan tanto la tendencia general de los datos originales como sus picos del viernes / sábado. Figura 5.15 Representación gráfica de las previsiones.

No comments:

Post a Comment