Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Jak wielu z was już wie, bardzo lubię pokazywać, jak można zastosować aby odkrywać spostrzeżenia, które w przeszłości były trudne do znalezienia, a także łatwo je prezentować. Cóż, to kolejny tego przykład i świetny sposób na segmentowanie lub grupowanie wyników, zamiast pokazywania samych wyników bez kontekstu. Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
W tym przykładzie drążę wyniki dotyczące zakresu klientów. Zamiast po prostu pokazywać ogólny wynik sprzedaży, chcę zobaczyć, czy klient znalazł się w czołówce wyników , a następnie chcę zobaczyć, jak zmienia się to w czasie. To dość potężna rzecz.
Chcemy ustalić, ile przychodów lub zysków rocznie można przypisać naszym 10 lub 50 najlepszym klientom. Ta technika jest dokładnie taka, jak byś to zrobił. Możliwość pokazania, jak zmienia się to w czasie, jest również wglądem w jakość. Możliwość pokazania, czy to wzrasta, czy maleje w jakikolwiek znaczący sposób, może zapewnić wgląd w zrównoważony rozwój sprzedaży. Z takich spostrzeżeń można wyprowadzić wiele działań związanych z marketingiem lub działaniami operacyjnymi.
Spis treści
Tworzenie grup dynamicznych w LuckyTemplates
W tym samouczku połączymy szereg technik w usługach LuckyTemplates i DAX, aby przeprowadzić dość zaawansowaną analizę. Mamy już informacje o naszej sprzedaży w czasie i wiemy, kim są nasi klienci. Ale powiedzmy, że chcesz zrozumieć, jaka część naszej sprzedaży pochodzi od naszych klientów z pierwszej piątki, od pierwszej piątki do dwudziestki, a następnie od reszty naszych klientów.
Czasami konieczne będzie utworzenie tych grup dynamicznych, aby można było zobaczyć, czy w czasie występuje trend. Nie tylko chcesz ocenić te grupowania, ale tak naprawdę chcesz je ocenić w czasie.
Jest to bardzo trudne, zwłaszcza jeśli pracujesz w programie Excel. Będziesz musiał napisać dość zaawansowaną formułę i użyć zaawansowanej logiki, takiej jak RANKX w LuckyTemplates. Ale jeśli naprawdę dobrze rozumiesz język DAX, możesz napisać formułę, której napisanie wcale nie zajmuje dużo czasu, a następnie staje się wzorcem, którego możesz używać wielokrotnie. Przejdźmy przez kroki, jak możesz to osiągnąć.
Tworzenie grup na podstawie rankingu
Pierwszą rzeczą, którą musimy zrobić, to przejść do naszego modelu danych i utworzyć grupy naszych klientów na podstawie ich rankingu sprzedaży. W tym przykładzie uszeregujemy sprzedaż naszych Top 5 , Top 5 do 20 i pozostałych naszych klientów .
Stworzymy tabelę i nazwiemy ją Grupami Klientów, a następnie umieścimy w tych wymiarach: pierwszy z nich to Top 5, następny to Rank 5 – 20, a ostatni to The Rest.
Następnym krokiem jest utworzenie zakresu, abyśmy umieścili kolumny MIN i MAX. Następnie wypełnimy zakres dla tych trzech grup i klikniemy Załaduj, aby zakończyć konfigurowanie naszego stołu.
Wróćmy do naszego modelu danych, aby znaleźć tabelę, którą właśnie utworzyliśmy. Jest to tabela pomocnicza, która nie ma związku z resztą modelu danych i nie jest połączona z żadną inną tabelą. Zamierzamy po prostu użyć tej tabeli, aby przeforsować logikę w naszych obliczeniach, aby uzyskać wyniki, których potrzebujemy w naszej mierze.
Określanie całkowitej sprzedaży
Wróćmy do naszego interfejsu w sekcji raportu, a następnie napiszmy nową miarę. Mamy już Całkowitą sprzedaż, która jest prostą sumą naszych całkowitych przychodów. To jest prosta, bezpośrednia formuła, której użyliśmy do uzyskania całkowitej sprzedaży:
Wynik naszej całkowitej sprzedaży wynosi 154 481 404,20 USD. Ten wynik został przefiltrowany dla lat 2014, 2015 i 2016.
To jest nasza łączna sprzedaż w całym czasie, który jest obecnie filtrowany. Ale to, co chcemy zobaczyć, to Całkowita sprzedaż oparta na klientach, którzy byli naszymi Top 5, Top 5 do 20 i całą resztą. Aby to osiągnąć, musimy napisać dość zaawansowaną formułę DAX .
Określanie całkowitej sprzedaży każdej grupy
Zamierzamy utworzyć nową miarę i nazwać ją Customer Sales by Group. Jak zawsze zaczynamy od OBLICZ, ponieważ bez funkcji OBLICZ nic się nie dzieje. Następnie dodajemy Całkowitą sprzedaż, ponieważ to jest to, co podsumowujemy.
Następnie przejdziemy do innej linii i użyjemy funkcji FILTER . Musimy utworzyć tabelę do filtrowania. W tym przypadku jest stosunkowo oczywiste, że musimy przefiltrować tabelę nazw klientów.
Musimy przejrzeć każdego klienta i ocenić, jaki jest jego ranking, a następnie sprawdzić, czy jego ranking jest powyżej, czy poniżej MIN i MAX, które właśnie stworzyliśmy.
Następnym krokiem jest ponowne użycie funkcji LICZ. i FILTR. Następnie wybierz Grupy klientów, czyli tabelę, którą właśnie utworzyliśmy.
Używanie zaawansowanej logiki z RANKX w LuckyTemplates
Następnie będziemy przeglądać tę tabelę przy użyciu stosunkowo zaawansowanej logiki RANKX w usłudze LuckyTemplates. Obliczamy naszą łączną sprzedaż na górze, ale nasza tabela grup klientów jest w rzeczywistości rankingiem. Musimy uzyskać ranking każdego z tych indywidualnych klientów, a następnie sprawdzić, czy należą oni do którejkolwiek z grup znajdujących się w tabeli Grupy klientów.
Aby uzyskać ranking, musimy użyć funkcji RANKX i wszystkich nazw klientów. Następnie uszeregujemy je według całkowitej sprzedaży, a następnie wybierzemy DESC, aby uszeregować je jako 1 dla najwyższej i 200 dla najniższej. Następnie zamkniemy go kwotą większą niż MIN dla klientów najwyżej sklasyfikowanych.
Następnie przejdziemy do innego wiersza, ponieważ pracujemy tutaj z dwoma elementami logiki. Użyjemy RANKX i podobnej logiki, której użyliśmy powyżej, ale wtedy z wartością mniejszą lub równą MAX. Potem zamkniemy COUNTROWS . Chcemy się upewnić, że logika COUNTROWS działa, więc zapiszemy również wartość większą od zera, a następnie klikniemy Enter.
Sprawdzanie wyników RANKX w LuckyTemplates
Skończyliśmy pisać obliczenia, więc zobaczmy, co faktycznie robi. Przeciągniemy utworzoną przez nas miarę do tabeli i zobaczymy, czy faktycznie otrzymamy wynik.
Pierwszą rzeczą, którą musimy sprawdzić, jest suma. Czy suma jest dokładnie taka sama jak łączna sprzedaż, którą wymyśliliśmy wcześniej? Tak to jest.
Teraz przeanalizujmy, co robi każde obliczenie. Aby osiągnąć ten konkretny wynik, obliczyliśmy łączną sprzedaż, a następnie utworzyliśmy tabelę każdego klienta, odwołując się do kolumny Nazwa klienta. W ramach tej iteracji oceniliśmy każdego klienta, czy jego ranga jest większa niż MIN i mniejsza lub równa MAX.
Jest to dość zaawansowany DAX, ponieważ ta grupa w ogóle nie istniała w danych. Ale teraz obliczamy sprzedaż dla naszych Top 5, Top 5 do 20 i reszty.
Sortowanie tabeli i wizualizacja danych
Teraz, gdy część pisania jest zakończona, posortujemy tabelę, która jest obecnie posortowana w porządku alfabetycznym. Po prostu klikniemy kartę Modelowanie i klikniemy Sortuj według kolumny. Posortujemy po prostu według MAX, abyśmy patrzyli na grupy w uporządkowany sposób.
Możemy sprawić, że te dane będą jeszcze lepsze. Ponieważ jest dynamiczny, możemy umieścić inny kontekst w tym obliczeniu, używając lat, aby zobaczyć sprzedaż według grupy w danym roku.
W ten sposób będziemy mogli zobaczyć trendy. Po prostu weźmiemy rok, umieścimy go w naszej tabeli i zamienimy to w macierz. Teraz możemy zobaczyć podział sprzedaży według grup w latach 2014, 2015 i 2016.
Możemy teraz stworzyć wizualizację z tych liczb. Możemy pobrać nazwy i grupy naszych klientów, a następnie przeciągnąć je na obszar roboczy. Możemy teraz wizualizować nasze Top 5, Top 5 – 20 i resztę.
Wniosek
Ten wynik nie byłby możliwy w żaden inny sposób, gdybyś nie rozumiał, jak napisać kod, który zrobiliśmy wcześniej. Jeśli to nie ma pełnego sensu za pierwszym razem, przejrzyj to kilka razy i spróbuj wprowadzić to do modelu, nad którym obecnie pracujesz. Będziesz zdumiony zastosowaniami tej techniki w różnych scenariuszach.
Ponadto, jeśli dopiero zaczynasz pracę z językiem DAX, możesz zapoznać się z moim kursem online , w którym kompleksowo omówiono wszystko, czego potrzebujesz, aby wdrożyć język DAX we własnych modelach usługi LuckyTemplates.
Powodzenia w tej technice – w przypadku jakichkolwiek komentarzy i przemyśleń daj mi znać poniżej.
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.