Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Z tego bloga dowiesz się, jak podzielić dane szeregów czasowych usługi LuckyTemplates na niezbędne składniki. Możesz obejrzeć pełny film tego samouczka na dole tego bloga .
Dane szeregów czasowych są wszędzie, od miar tętna po ceny jednostkowe towarów w sklepach, a nawet w modelach naukowych. Podział tych danych na istotne części może być korzystny, zwłaszcza przy przygotowywaniu wykresów raportów i prezentacji.
Metoda dekompozycji szeregów czasowych tego bloga pomoże Ci znaleźć lepszy sposób prezentacji danych podczas opisywania trendów, sezonowości lub nieoczekiwanych zdarzeń. To także świetny krok w przód do prognozowania w usłudze LuckyTemplates .
Spis treści
Rodzaje wykresów
Na powyższym obrazku znajduje się kilka wykresów, w tym Actuals , Trends , Seasonality i Noise . Jedną z najlepszych cech tego elementu wizualnego jest to, że na każdym wykresie występują spadki .
Ta funkcja może się przydać, gdy chcesz podkreślić pewne kluczowe czynniki , które wpływają na trendy, takie jak dochód i zawód w trendzie zakupowym konsumentów.
To samo dotyczy określania wzorców sezonowych , które mogą opisywać miesięczne lub kwartalne zmiany wzrostu firmy.
Doskonale nadają się również do określania fluktuacji danych, takich jak poziomy szumów resztkowych w badaniach naukowych i tym podobnych. Na przykład na poniższym wykresie możemy zobaczyć wzrost poziomów rezydualnych w ciągu ostatnich dziesięciu lat, co daje nam pewien wgląd w potencjalny trend.
Zrozumienie złożonych ruchów danych w długim okresie jest znacznie łatwiejsze, gdy przedstawisz je za pomocą powyższych wykresów. Przetwarzanie wszystkich informacji i rozpoznawanie wzorców i trendów przed tobą jest o wiele łatwiejsze.
W rezultacie zwiększa to zainteresowanie i konwersację wokół raportu lub prezentacji danych. Pomaga również zrozumieć, co dzieje się ze sprzedażą, produkcją lub czymś innym.
Zestaw danych szeregów czasowych usługi LuckyTemplates
Pokażę ci dwa sposoby na rozbicie tej serii danych, która została utworzona w Python Scrip Editor. Nauczę Cię również, jak stworzyć wizualizację w Pythonie przy użyciu tych samych informacji. Na koniec dam ci wyobrażenie o tym, co musisz umieścić w Power Query.
Poniżej znajduje się nasz przykładowy zestaw danych z kolumną dat miesięcznych od 1985 do 2018 wraz z kolumną wartości produkcji maszyny.
Skrypt Pythona
Następnie przejdziemy do Python Script Editor i dodamy kod do dwóch kolumn naszego zestawu danych. Kod będzie importował pandy jako pd , bibliotekę do manipulacji danymi i matplotlib.pylot jako plt , który pokazuje nasze wizualizacje. A dla naszego rozkładu sezonowego będzie to import pakietu statsmodels i tsa.seasonal .
Zmienna w 4. linii pokazuje, gdzie są zapisane nasze dane, aw 5. linii zauważysz, że zmieniłem nazwę naszego zbioru danych na df , ponieważ łatwiej jest pisać. A w 11. wierszu upewniłem się, że data została ustawiona na datę i godzinę, a następnie ustawiłem indeks jako datę 12.
Dekompozycja sezonowa szeregów czasowych w usłudze LuckyTemplates
Aby dokonać rozkładu sezonowego, musimy mieć indeks, który jest szeregiem czasowym lub indeksem daty i godziny. W ten sposób ustawimy indeks danych jako datę i pierwszą kolumnę.
Chcemy również ustawić częstotliwość danych na początek miesiąca ( MS ) za pomocą zmiennej df obok funkcji freq , jak pokazano w 13. wierszu poniżej.
Na koniec używamy plt.show , aby zobaczyć, co stworzyliśmy. A jeśli to uruchomimy, otrzymamy wynik poniżej.
Teraz mamy nasz sezonowy rozkład. Jak widać na powyższym obrazku, ma on nasze wartości rzeczywiste , trendy , sezonowość i wartości resztkowe . Te wykresy dostarczą wielu informacji na temat tego, co dzieje się z Twoją sprzedażą lub produkcją w czasie.
Tworzenie wizualizacji z danymi szeregów czasowych usługi LuckyTemplates
Wróćmy do tej strony głównej, aby pokazać, jak utworzyłem te wykresy w danych. Następnie przejdziemy do Transform i zobaczymy nasz oryginalny zestaw danych poniżej, który dotyczy produkcji elektrycznej.
Jak widać, stworzyłem trzy tabele dla Seasonality , Residuals i Trends . Trudno było je zmieścić na jednym stole, więc podzieliłem je na trzy. Ale łatwo jest skopiować i wkleić kod naszych danych.
Sezonowość
Jeśli przejdziemy do tabeli Produkcja elektryczna, zobaczysz, że ma ona kolumny sezonowości, daty i produkcji. Kolumna sezonowości pokaże wahania w czasie. Omówimy etapy jego tworzenia.
Jeśli przejdziemy do Zastosowanych kroków , zobaczysz, że między innymi awansowałem już nagłówki i zmieniłem nazwy kolumn. To, co tutaj zrobimy, to kliknięcie kroku Uruchom skrypt Pythona .
Jak widać na poniższym obrazku, zrobiliśmy prawie to samo, co dla naszej wizualizacji, kiedy tworzyliśmy ją w Python Visual. Wprowadziliśmy nasze potrzebne biblioteki, w tym pandas i statsmodels.tsa.seasonal oraz funkcję season_decompose .
Ponownie zapisaliśmy również naszą zmienną zestawu danych jako df , aby ułatwić pisanie i utworzyliśmy datę. Aby upewnić się, że to data, wyodrębniliśmy kolumnę daty, a następnie użyliśmy pd.to_datetime. Następnie zapisaliśmy go na df .
Następnie zmieniliśmy częstotliwość na Month Start ( MS ), ponieważ chcieliśmy przekazać te daty funkcji sezonowej _decompose .
Zamiast wykreślać naszą funkcję, wyciągnęliśmy część sezonową, przekazaliśmy do naszego zestawu danych i użyliśmy . sezonowe tylko po to, aby wydobyć dane sezonowe. Na koniec zresetowaliśmy indeks, abyśmy mogli ponownie zobaczyć datę.
Teraz, jeśli kliknę OK, zobaczysz, że otrzymujesz oryginalny zestaw danych, a następnie df, za którym stoimy.
Jeśli klikniemy na Tabela (zaznaczona na powyższym obrazku) i otworzymy ją, otrzymamy poniższą tabelę sezonowości produkcji. Jeśli chcesz utworzyć tabelę podobną do tej, po prostu skopiuj skrypt, który pokazałem ci wcześniej.
pozostałości
Przejdźmy teraz do Residuals, gdzie jedyną rzeczą, którą zmieniłem, była metoda lub punkt po season_decompose .
Brak resetowania indeksu
Jeśli nie zresetujemy indeksu i nie klikniemy OK , nasz skrypt zwróci błąd. Jeśli więc umieścimy # przed df.reset_index w ostatnim wierszu naszego skryptu, spowoduje to poniższą tabelę. Jak widać na obrazku, brakuje indeksu i kolumny daty.
W związku z tym musimy zresetować indeks, ponieważ zwraca on datę, która działałaby jako ten indeks. Więc jeśli usuniemy to # , zwróci mi ramkę danych, w wyniku czego powstanie poniższa tabela, która ma teraz kolumnę daty.
I możesz użyć tej samej metody dla Trend, dzięki czemu jest to naprawdę łatwy skrypt, do którego możesz uzyskać dostęp w dowolnym momencie.
Raporty zarządzania zapasami przedstawiające trendy w
zarządzaniu sprzedażą detaliczną i prognozowaniu popytu Raporty w usłudze LuckyTemplates
Wskazówki dotyczące wizualizacji danych w usłudze LuckyTemplates dotyczące analizy trendów KPI
Wniosek
Teraz znasz świetny sposób na podzielenie efektów wizualnych. Za pomocą prostego skryptu możesz rozpocząć tworzenie wizualizacji danych szeregów czasowych sezonowości, trendu i pozostałości w usługach LuckyTemplates i Python .
Za pomocą tej metody dekompozycji szeregów czasowych usługi LuckyTemplates można opisywać dane dotyczące trendów sprzedaży , sezonowości wzrostu i zmian lub nieoczekiwanych zdarzeń. To także świetne narzędzie do prognozowania. A najlepsze jest to, że możesz łatwo skopiować i wkleić ten skrypt dla dowolnych posiadanych danych szeregów czasowych.
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.