Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Ten samouczek wynika z innego pytania na dotyczącego normalizacji danych . Techniki, których cię nauczę, będą ważne w pozbywaniu się anomalii , które mogą skomplikować sprawę podczas analizy danych . Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
Czasami podczas przeprowadzania analizy w usłudze LuckyTemplates może być konieczne uwzględnienie sprzedaży w weekendy lub święta pochodzące z różnych krajów. Wyzwanie polega na tym, że jest to święto państwowe w danym kraju, ale nie w innych krajach. Trudno będzie znormalizować te dane dotyczące sprzedaży podczas raportowania, biorąc pod uwagę różne dni w poszczególnych krajach. W tym miejscu do gry wchodzą techniki normalizacji danych .
Celem jest zebranie wszystkich różnych sprzedaży i umieszczenie ich z powrotem w rzeczywistych dniach roboczych kraju raportującego.
To dość wyjątkowy przykład techniki analizy czasowej w usłudze LuckyTemplates. Niemniej jednak jest to bardzo przydatne, jeśli masz do czynienia z konkretnym scenariuszem dotyczącym ograniczonych danych lub braku danych w twoich nieprzetworzonych informacjach.
Spis treści
Przykładowa normalizacja danych dla sprzedaży w różne dni
Najważniejszą rzeczą, którą chcę omówić w tym samouczku, są sposoby zapisania logiki w formule w celu zmiany pozycji dnia raportowania lub wyników w określonym dniu.
Spójrzmy na tę tabelę i naprawdę skupmy się na przykładzie. Jeśli pracujesz z czymś podobnym, gdzie musisz przenieść wyniki z jednego dnia na drugi, ten samouczek pomoże.
W raporcie możesz zobaczyć datę oraz dzień w kolumnach Date i DaysOfWeekName . Będziesz także mógł zobaczyć całkowitą liczbę sprzedaży dla tego konkretnego dnia w kolumnie Całkowita sprzedaż .
Teraz opracowałem logikę, aby przenieść dane sprzedaży z soboty i niedzieli do danych sprzedaży z poniedziałku . Dzieje się tak, ponieważ chcę zarejestrować te weekendowe sprzedaże w dni powszednie (od poniedziałku do piątku). Zaktualizowane dane dotyczące sprzedaży można zobaczyć w poniższej kolumnie Łączna sprzedaż w dni inne niż weekendy .
Dodatkowo chciałem, aby ta tabela była dynamiczna, dlatego dodałem selektor danych, w którym można łatwo zmienić przedział czasowy danych sprzedaży. Po wybraniu odpowiedniego przedziału czasowego dane w kolumnie Total Sales Non Weekend Days aktualizują się automatycznie.
Oprócz tego chcę rozgałęzić się na inne obliczenia, takie jak sumy skumulowane, średnie ruchome i tak dalej. Jak widać, dodałem skumulowaną sumę przym. i kolumny Sprzedaż skumulowana . Musiałem tylko nieco zmienić kolejność i przejść do niektórych obliczeń DAX, aby rozwiązać te bardzo szczegółowe spostrzeżenia.
Wykonywanie sprzedaży poza weekendem
Teraz pokażę ci, jak opracować i skonfigurować obliczenia całkowitej sprzedaży poza weekendem. Jest to kluczowa rzecz w tym samouczku dotyczącym normalizacji danych.
Mam tutaj kilka zmiennych ( ) do obliczeń Weekend Check i WorkdayCheck . To, co tutaj robię, polega na określeniu, które z nich w danym kontekście to weekendy, a które to poniedziałki.
Wracając do mojej tabeli dat, utworzyłem kolumnę Typ dnia przy użyciu bardzo prostej logiki. Jeśli więc dzień nie jest sobotą ani niedzielą, nazwę go Dniem roboczym . Jeśli jest to sobota (6) lub niedziela (0), nazwę ją Weekend .
Teraz, po pierwszej części formuły, omówię tę część.
Tak więc, jeśli WeekendCheck ma wartość true, co oznacza, że jest weekend, wyniki dla tego są puste. Następnie, jeśli WorkdayCheck jest równy false lub wybrana wartość równa Monday jest false, zwraca Total Sales .
Jeśli WorkdayCheck ma wartość true, co oznacza, że jest poniedziałek, uruchomię tę logikę tutaj.
Ta część jest połączeniem funkcji i . Po pierwsze, otrzyma sumę całkowitej sprzedaży z poniedziałku oraz sprzedaży weekendowej. Funkcja FILTR prześledzi wszystkie daty i zwróci tylko te daty, które są większe niż bieżąca data odjęta przez trzy .
Zasadniczo po prostu przenoszę całkowitą sprzedaż z soboty i niedzieli na poniedziałek, używając kombinacji technik, takich jak instrukcje i różne funkcje. Tak działa normalizacja danych dla tego typu analiz.
Ta sama technika będzie bardzo przydatna, gdy pracujesz na wakacjach lub coś w tym stylu. Musisz tylko zmienić tutaj niektóre rzeczy, takie jak HolidayChecks zamiast WeekendChecks. Niemniej jednak jest to podobna logika i zawsze możesz zastosować to rozwiązanie do tych scenariuszy.
Tworzenie sumy skumulowanej
Następną rzeczą, której chcę cię nauczyć, jest tworzenie skumulowanej sumy całkowitej sprzedaży i całkowitej sprzedaży poza weekendami.
Jedną rzeczą, którą można zauważyć, jest to, że skumulowane łączne dane z weekendów w tej kolumnie będą zawsze linią płaską, ponieważ tak naprawdę nie ma tam żadnych danych bez względu na przedział czasowy.
W związku z tym stworzyłem wizualizację, która porównuje skumulowaną łączną korektę ze skumulowaną sprzedażą.
To kolejna interesująca technika, którą możesz wykorzystać w ciągu kilku dni podczas normalizacji danych. Spójrzmy na poniższy wzór.
Najpierw utworzyłem tabelę sprzedaży korygującej, odtwarzając kolumny Data i Całkowita sprzedaż w dni inne niż weekendy za pomocą funkcji .
Następnie dodałem funkcję . Jak widać, tabela sprzedaży z korektą jest umieszczona wewnątrz funkcji FILTRUJ . Zamiast przeglądać wszystkie daty, umieściłem skorygowane łączne dni wolne od sprzedaży. Wreszcie, używając SUMX , będzie iterować każdego dnia i ustalać datę mniejszą lub równą maksymalnej dacie. Następnie policzy kolumny dla sprzedaży znormalizowanej .
Ta technika normalizacji danych jest bardzo przydatna, gdy pracujesz w wielu krajach. Jak widać, jest to naprawdę skuteczny sposób na znormalizowanie sprzedaży we wszystkich różnych regionach w raporcie.
Pokaż dni przed lub po wybranej dacie za pomocą usługi LuckyTemplates
Pokaż wyniki do bieżącej daty lub określonej daty w usłudze LuckyTemplates
Jak pracować z wieloma datami w usłudze LuckyTemplates
Wniosek
W samouczku wspomniałem o wielu przydatnych technikach, które pozwolą ci przeprowadzić kilka unikalnych analiz związanych z czasem w usłudze LuckyTemplates. Przeszedłem przez wiele różnych funkcji języka DAX, takich jak funkcja , niektóre funkcje tabeli i inne proste filtry z funkcją .
Jeśli chcesz dowiedzieć się więcej na temat różnych technik analizy czasowej w usłudze LuckyTemplates, polecam zajrzeć do naszego modułu kursu w LuckyTemplates online, który jest przeznaczony specjalnie do tego typu analiz.
Miłej pracy z tym szczegółowym filmem.
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.