Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Podczas pracy z obliczonymi danymi czasami konieczne będzie porównanie różnych zestawów danych. Pokażę ci, jak to zrobić, łącząc różne funkcje tabeli. Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
Funkcja jest najlepszą rzeczą do użycia w takich przypadkach. Niektórzy mogą również powiedzieć, że jest równie przydatny do porównywania obliczonych danych. Ale kiedy już dowiesz się, jak używać funkcji PRZECIĘCIE , wynika z tego, co będziesz mógł zastosować również do funkcji WYJĄTEK w swoich obliczeniach.
Spis treści
Przykładowe dane
Aby pokazać, co potrafi INTERSECT , pokażę, jak porównać klientów z dwóch różnych okresów.
W poniższym przykładzie mam krajalnicę dat, która pomaga mi określić przedział czasowy, którego potrzebuję. Mam też kolumnę dla stanów, w których klienci składają zamówienia. Oczywiście może to być zupełnie inny wymiar w zależności od spostrzeżeń, które próbujesz uzyskać.
Mam również swój całkowity przychód dla każdego stanu, który jest również pokazany na wizualizacji.
Teraz chcę zobaczyć, ilu klientów, którzy dokonali zakupu w określonym dniu w zeszłym roku, dokonało również zakupu w tym samym dniu w tym roku. Oznacza to, że patrzę na dwie konkretne listy klientów, którzy dokonali zakupu tego samego dnia, ale w różnych latach . Stamtąd dowiem się, ilu klientów pojawia się na obu listach.
Porównanie klientów z dwóch okresów
Zanim będę mógł porównać te dwie listy klientów, muszę najpierw wymyślić łączną liczbę klientów .
Całkowita liczba klientów obejmuje tych, którzy dokonali zakupów w różnych sklepach w różnych stanach w określonym przedziale czasowym. Użyłem prostej formuły, aby uzyskać ten wynik.
Użyłem funkcji , ponieważ wyświetla pojedynczą listę unikalnych wartości. W tym przypadku pokaże nam klientów, którzy kupili produkty w określonym przedziale czasowym.
Użyłem również funkcji . Spowoduje to policzenie liczby unikalnych wartości z listy.
Odwołuję się do tabeli Sales dla tego środka.
Dlaczego zamiast tego nie użyć tabeli Customer?
Jeśli odniosę się bezpośrednio do tabeli Customer, skończę liczyć tylko każdego klienta, niezależnie od przedziału czasowego. Muszę się upewnić, że używany jest właściwy kontekst. Korzystając z tabeli Sales , nie tylko pozyskuję klientów, ale także informacje, gdzie i kiedy dokonali zakupu.
Teraz, gdy mam już Total Customers , mogę wymyślić listę klientów z tego samego dnia, ale z ubiegłego roku. W tym miejscu środek staje się nieco bardziej skomplikowany.
Pozwólcie, że przejdę do każdej części tego środka krok po kroku.
Pamiętaj, że próbuję zmienić kontekst tabeli. Właśnie dlatego zamierzam użyć funkcji .
to znana funkcja, ponieważ używam jej w moich przykładach przez większość czasu. Zmienia kontekst konkretnego obliczenia. Z drugiej strony CALCULATETABLE zmienia kontekst całej tabeli .
Ponieważ chcę zmienić ramy czasowe, użyję funkcji .
Używanie CALCULATETABLE pozwala mi dodawać parametry filtru . Używając funkcji DATESBETWEEN , mogę określić przedział czasowy, który wypada 365 dni poniżej daty i . Krótko mówiąc, przesuwa ramy czasowe z powrotem do zeszłego roku i tworzy stamtąd kolejną listę klientów.
Ponownie używam funkcji LICZ.LICZ. , aby obliczyć liczbę klientów po zastosowaniu dodatkowych filtrów.
Teraz, gdy mam dwie listy, mogę przenieść te miary do funkcji INTERSECT .
Funkcja INTERSECT wirtualnie przejrzy listę, do której się odwołuje. W tym przypadku jest to indeks nazw klientów. Przejdzie przez każdego z tych klientów i porówna ich z drugą listą sprzed roku.
Porównując obliczone dane, patrzy na te, które pojawiają się na obu listach. Na przykład poniższa tabela pokazuje, że 224 klientów dokonało zakupów tego samego dnia w dwóch różnych latach w Kalifornii.
Jak zmaksymalizować wykorzystanie funkcji INTERSECT – zaawansowany język DAX
Twórz raporty w LuckyTemplates, aby pokazać odchylenia i spostrzeżenia
Analiza nowych klientów przy użyciu zaawansowanego języka DAX
Wniosek
Mamy nadzieję, że możesz teraz wyobrazić sobie inne scenariusze, w których funkcja INTERSECT może być używana do porównywania dwóch zestawów obliczonych danych.
Możesz nawet przedstawić porównanie w procentach i zastosować techniki rozgałęziania miar. Możesz spojrzeć na klientów, którzy nie wrócili i wysłać im materiały marketingowe.
To naprawdę pokazuje, ile wglądu możesz uzyskać, gdy już opanujesz korzystanie z różnych funkcji języka DAX w usłudze LuckyTemplates.
Wszystkiego najlepszego,
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.