Tuesday 21 November 2017

Przenoszenie średnie szereg czasowy analiza danych


Podczas obliczania ruchomej średniej ruchomej, ustawienie średniej w środkowym okresie ma sens W poprzednim przykładzie obliczyliśmy średnią z pierwszych 3 okresów i umieściliśmy ją obok okresu 3. Mogliśmy umieścić średnią w środku przedział czasowy trzech okresów, to znaczy, obok okresu 2. Działa to dobrze z nieparzystymi przedziałami czasowymi, ale nie jest tak dobry dla nawet okresów czasu. Więc gdzie ustawilibyśmy pierwszą średnią ruchomą, gdy M 4 Technicznie, średnia ruchoma spadłaby o t 2,5, 3,5. Aby uniknąć tego problemu, wygładzamy MA za pomocą M 2. W ten sposób wygładzamy wygładzone wartości. Jeśli uśredniamy parzystą liczbę terminów, musimy wygładzić wygładzone wartości. Poniższa tabela pokazuje wyniki przy użyciu M 4. Średnie ruchome Średnie ruchome Z konwencjonalnym datasety wartość średnia jest często pierwszą i jedną z najbardziej użytecznych, sumarycznych statystyk do obliczenia. Gdy dane mają postać szeregu czasowego, średnia serii jest użyteczną miarą, ale nie odzwierciedla dynamicznej natury danych. Średnie wartości obliczane w okresach zwartych, poprzedzających bieżący okres lub wyśrodkowane w bieżącym okresie, są często bardziej użyteczne. Ponieważ takie średnie wartości będą się różnić lub przesuwać, ponieważ bieżący okres zmienia się z czasu t2, t3 itd. Są one znane jako średnie ruchome (Mas). Prosta średnia krocząca jest (zazwyczaj) nieważoną średnią z poprzednich wartości. Wyliczana wykładniczo średnia ruchoma jest zasadniczo taka sama jak zwykła średnia ruchoma, ale z wkładem do średniej ważonej przez ich bliskość do bieżącego czasu. Ponieważ nie ma jednej, ale całej serii ruchomych średnich dla dowolnej serii, zbiór Masów można sami nanosić na wykresy, analizować jako serię i stosować w modelowaniu i prognozowaniu. Szereg modeli można skonstruować za pomocą średnich kroczących i są one znane jako modele MA. Jeśli takie modele są połączone z modelami autoregresyjnymi (AR), uzyskane modele kompozytowe są znane jako modele ARMA lub ARIMA (I jest zintegrowane). Proste wartości ruchome Ponieważ szeregi czasowe można traktować jako zestaw wartości, t 1,2,3,4, n można obliczyć średnią tych wartości. Jeśli przyjmiemy, że n jest dość duże i wybieramy liczbę całkowitą k, która jest znacznie mniejsza niż n. możemy obliczyć zestaw średnich bloków lub prostych średnich ruchomych (rzędu k): Każda miara reprezentuje średnią wartości danych w przedziale k obserwacji. Zauważ, że pierwszym możliwym MA porządku k gt0 jest ten dla t k. Bardziej ogólnie możemy upuścić dodatkowy indeks dolny w wyrażeniach powyżej i napisać: Stwierdza on, że szacowana średnia w czasie t jest prostą średnią obserwowanej wartości w czasie t i poprzednich stopniach k-1. Jeśli stosuje się wagi, które zmniejszają udział obserwacji, które są dalej w czasie, średnia ruchowa ma być wykładniczo wygładzona. Średnie kroczące są często używane jako forma prognozowania, przy czym szacowana wartość dla serii w czasie t1, S t1. jest uznawany za IZ na okres do czasu t włącznie. na przykład Współczesne szacunki są oparte na średniej z uprzednio zarejestrowanych wartości, aż do wczorajszych dni (dla danych dziennych). Proste średnie ruchome mogą być postrzegane jako forma wygładzania. W przedstawionym poniżej przykładzie zbiór danych zanieczyszczenia powietrza przedstawiony we wstępie do tego tematu został powiększony o 7-dniową średnią ruchomą (MA), pokazaną tutaj na czerwono. Jak widać, linia MA wyrównuje wartości szczytowe i spadki w danych i może być bardzo pomocna w identyfikowaniu trendów. Standardowa formuła obliczania do przodu oznacza, że ​​pierwsze punkty danych k-1 nie mają wartości MA, ale następnie obliczenia rozciągają się do końcowego punktu danych w serii. Średnie wartości dzienne PM10, źródło Greenwich: London Air Quality Network, londonair. org. uk Jednym z powodów obliczania prostych średnich ruchomych w opisany sposób jest to, że umożliwia obliczenie wartości dla wszystkich przedziałów czasowych od czasu tk do chwili obecnej, oraz gdy nowy pomiar zostanie uzyskany dla czasu t 1, MA dla czasu t 1 można dodać do zestawu już obliczonego. Zapewnia to prostą procedurę dla dynamicznych zestawów danych. Istnieją jednak pewne problemy z tym podejściem. Uzasadnione jest twierdzenie, że średnia wartość z ostatnich 3 okresów powinna być zlokalizowana w czasie t -1, a nie w czasie t. a dla IZ przez parzystą liczbę okresów być może powinna być zlokalizowana w środkowym punkcie między dwoma przedziałami czasowymi. Rozwiązaniem tego problemu jest zastosowanie wyśrodkowanych obliczeń MA, w których MA w czasie t jest średnią z symetrycznego zbioru wartości wokół t. Pomimo oczywistych zalet, takie podejście nie jest powszechnie stosowane, ponieważ wymaga, aby dane były dostępne dla przyszłych zdarzeń, co może nie być prawdą. W przypadkach, w których analiza dotyczy wyłącznie istniejącej serii, preferowane może być użycie wyśrodkowanego Mas. Proste średnie ruchome można uznać za formę wygładzania, usuwając niektóre komponenty o wysokiej częstotliwości z szeregów czasowych i podkreślając (ale nie usuwając) trendy w sposób podobny do ogólnego pojęcia filtrowania cyfrowego. Rzeczywiście, średnie ruchome są formą filtra liniowego. Możliwe jest zastosowanie obliczenia średniej ruchomej do serii, która została już wygładzona, to jest wygładzanie lub filtrowanie już wygładzonej serii. Na przykład, przy średniej ruchomej rzędu 2, możemy uznać ją za obliczoną przy użyciu wag, więc MA na x 2 0,5 x 1 0,5 x 2. Podobnie, MA na x 3 0,5 x 2 0,5 x 3. zastosuj drugi poziom wygładzania lub filtrowania, mamy 0,5 x 2 0,5 x 3 0,5 (0,5 x 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 tj. 2-stopniowe filtrowanie proces (lub splot) wytworzył zmiennie ważoną symetryczną średnią ruchomą, z wagami. Wielokrotne zwoje mogą dawać dość złożone ważone średnie ruchome, niektóre z nich zostały znalezione o szczególnym zastosowaniu w wyspecjalizowanych dziedzinach, takich jak w obliczeniach ubezpieczeń na życie. Średnie kroczące mogą być stosowane do usuwania efektów okresowych, jeśli są obliczane na podstawie długości okresowości jako znanej. Na przykład z miesięcznymi danymi sezonowe odchylenia mogą być często usuwane (jeśli jest to cel) przez zastosowanie symetrycznej 12-miesięcznej średniej kroczącej z wszystkimi miesiącami ważonymi jednakowo, z wyjątkiem pierwszego i ostatniego, które są ważone przez 12. Wynika to z tego, że mieć 13 miesięcy w modelu symetrycznym (obecny czas, t. - 6 miesięcy). Suma jest podzielona przez 12. Podobne procedury można zastosować dla każdej dobrze określonej okresowości. Wykładniczo ważone średnie ruchome (EWMA) Za pomocą prostej średniej ruchomej: wszystkie obserwacje są jednakowo ważone. Gdybyśmy nazwali te równe wagi, alfa t. każdy z wag k wynosiłby 1 k. więc suma wag wynosiłaby 1, a formuła byłaby: Widzieliśmy już, że wiele aplikacji tego procesu powoduje, że waga jest różna. W przypadku średnich ważonych ruchami wykładniczymi, udział w wartości średniej z obserwacji, które są bardziej usuwane w czasie, jest zmniejszany, co uwydatnia nowsze (lokalne) zdarzenia. Zasadniczo wprowadzono parametr wygładzania, 0 lt alfa1, a wzór zmieniono na: Wersja symetryczna tego wzoru miałaby postać: Jeżeli wagi w modelu symetrycznym są wybrane jako warunki warunków dwumianowego rozszerzenia, (1212) 2q. będą sumowane do 1, a gdy q stanie się duża, przybliżą się do rozkładu normalnego. Jest to forma ważenia jądra, z dwumianem działającym jako funkcja jądra. Dwustopniowe splatanie opisane w poprzednim podrozdziale jest właśnie tym układem, z q 1, co daje wagi. W wygładzaniu wykładniczym konieczne jest użycie zbioru wag, które sumują się do 1 i które geometrycznie zmniejszają rozmiar. Użyte wagi mają zazwyczaj postać: Aby pokazać, że te wagi sumują się do 1, rozważ rozszerzenie 1 jako serię. Możemy napisać i rozwinąć wyrażenie w nawiasach za pomocą dwumianowej formuły (1- x) p. gdzie x (1-) i p -1, co daje: To zapewnia formę ważonej średniej ruchomej formy: To sumowanie można zapisać jako relację powtarzalności: co znacznie upraszcza obliczenia i unika problemu, że system ważenia powinno być bezwzględnie nieskończone, aby ciężary sumowały się do 1 (dla małych wartości alfa, zazwyczaj tak nie jest). Notacja stosowana przez różnych autorów jest różna. Niektórzy używają litery S, aby wskazać, że formuła jest zasadniczo zmienną wygładzoną i piszą: podczas gdy literatura z dziedziny teorii sterowania często używa Z zamiast S dla wykładniczo ważonych lub wygładzonych wartości (patrz, na przykład, Lucas i Saccucci, 1990, LUC1 oraz na stronie internetowej NIST po więcej szczegółów i opracowanych przykładów). Wymienione wyżej wzory wywodzą się z pracy Roberta (1959, ROB1), ale Hunter (1986, HUN1) używa wyrażenia formy: która może być bardziej odpowiednia do użycia w niektórych procedurach kontrolnych. W przypadku alfa 1 średnia wartość szacunkowa jest po prostu wartością zmierzoną (lub wartością poprzedniego elementu danych). Przy 0,5 oszacowanie to prosta średnia krocząca z bieżących i poprzednich pomiarów. W modelach prognostycznych wartość S t. jest często używana jako wartość szacunkowa lub prognoza dla następnego okresu czasu, tj. jako szacunek dla x w czasie t 1. Mamy więc: Pokazuje to, że wartość prognozy w czasie t 1 jest kombinacją poprzedniej ważonej ruchomą średnią z wykładnikiem plus składnik reprezentujący błąd ważonej prognozy, epsilon. w czasie t. Zakładając, że szereg czasowy jest podany, a prognoza jest wymagana, wymagana jest wartość alfa. Można to oszacować na podstawie istniejących danych, oceniając sumę kwadratów uzyskanych z predykcji z różnymi wartościami alfa dla każdego t 2,3. ustawienie pierwszego oszacowania jako pierwszej obserwowanej wartości danych, x 1. W aplikacjach kontrolnych wartość alfa jest ważna, ponieważ jest używana do określania górnej i dolnej granicy kontrolnej i wpływa na średnią oczekiwaną długość trasy (ARL) przed przekroczeniem tych granic kontrolnych (przy założeniu, że szeregi czasowe reprezentują zbiór losowych, identycznie rozłożonych zmiennych niezależnych ze wspólną wariancją). W tych okolicznościach wariancja statystyki kontrolnej to (Lucas i Saccucci, 1990): Granice kontrolne są zwykle ustalane jako stałe wielokrotności tej asymptotycznej wariancji, np. - 3 razy odchylenie standardowe. Jeśli na przykład alfa 0,25 i monitorowane dane mają rozkład normalny, N (0,1), gdy kontrolowane, limity kontroli będą - 1.134, a proces osiągnie jeden lub inny limit w 500 krokach średnio. Lucas i Saccucci (1990 LUC1) wyprowadzają poziomy ARL dla szerokiego zakresu wartości alfa i przy różnych założeniach, stosując procedury Markowa Chain. Tabele przedstawiają wyniki, w tym dostarczają ARL, gdy średnia z procesu kontroli została przesunięta o kilka wielokrotności odchylenia standardowego. Na przykład z przesunięciem 0,5 z parametrem alfa 0,25 wartość ARL jest mniejsza niż 50 kroków czasowych. Podejścia opisane powyżej są znane jako wygładzanie pojedynczego wykładniczego. ponieważ procedury są stosowane jednorazowo w szeregach czasowych, a następnie przeprowadza się analizy lub procesy kontrolne na wynikowym wygładzonym zbiorze danych. Jeśli zbiór danych zawiera trend i składniki sezonowe, można zastosować dwu - lub trójstopniowe wygładzanie wykładnicze jako środek do usuwania (jawnego modelowania) tych efektów (patrz dalej, sekcja na temat Prognozowania poniżej i przykład działania NIST). CHA1 Chatfield C (1975) Analiza szeregów czasowych: Teoria i praktyka. Chapman and Hall, Londyn HUN1 Hunter J S (1986) Wykładniczo ważona średnia ruchoma. J of Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Treść wykładnicza o średniej ważonej wykładniczej: Właściwości i ulepszenia. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Testy kart kontrolnych oparte na geometrycznych średnich ruchomych. Technometrics, 1, 239-250Moving Average W tym przykładzie dowiesz się, jak obliczyć średnią ruchomą szeregu czasowego w Excelu. Średnia ruchoma służy do łagodzenia nieprawidłowości (szczytów i dolin) w celu łatwego rozpoznawania trendów. 1. Najpierw przyjrzyjmy się naszej serii czasowej. 2. Na karcie Dane kliknij Analiza danych. Uwaga: nie można znaleźć przycisku Analiza danych Kliknij tutaj, aby załadować dodatek Analysis ToolPak. 3. Wybierz średnią ruchomą i kliknij OK. 4. Kliknij pole Input Range i wybierz zakres B2: M2. 5. Kliknij w polu Interwał i wpisz 6. 6. Kliknij pole Zakres wyjściowy i wybierz komórkę B3. 8. Narysuj wykres tych wartości. Objaśnienie: ponieważ ustawiliśmy przedział na 6, średnia ruchoma jest średnią z poprzednich 5 punktów danych i bieżącego punktu danych. W rezultacie szczyty i doliny są wygładzone. Wykres pokazuje rosnący trend. Program Excel nie może obliczyć średniej ruchomej dla pierwszych 5 punktów danych, ponieważ nie ma wystarczającej liczby poprzednich punktów danych. 9. Powtórz kroki od 2 do 8 dla przedziału 2 i odstępu 4. Wniosek: Im większy przedział, tym bardziej wygładzone są szczyty i doliny. Im mniejszy przedział czasu, tym bardziej zbliżone są średnie ruchome do rzeczywistych punktów danych.

No comments:

Post a Comment