Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Będę mówić o dynamicznej segmentacji przy użyciu parametrów dynamicznych, ponieważ widziałem, jak członkowie pytali o to wiele razy na forum wsparcia LuckyTemplates. Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
Wyzwaniem jest ustalenie, które obszary najpierw podzielić. Musiałbyś także znaleźć sposób na wprowadzenie parametrów dynamicznych do swojej formuły. Uproszczę to wszystko na przykładzie, który tutaj pokażę.
Spis treści
Tworzenie parametru warunkowego
Pierwszą rzeczą, której potrzebuję, byłby parametr. W tym przypadku stworzyłem parametr Customer Rank .
Stworzyłem ten parametr, przechodząc do Modelowania, a następnie klikając Nowy parametr.
Parametr „co by było, gdyby” automatycznie utworzyłby dla mnie tabelę. Tworzy również miarę dla dokonanego przeze mnie wyboru.
Kiedy przeciągnę to do mojego raportu, pokaże to, jakiego wyboru dokonam we fragmentatorze.
Najważniejszą rzeczą do zapamiętania jest to, że parametry powinny dzielić wyniki za każdym razem, gdy przeprowadzasz segmentację niestandardową .
Tak więc poza parametrem Customer Rank mam też informacje o miejscach, w których znajdują się sklepy.
Kontekst obliczeń jest jednym z kluczowych czynników wpływających na prawidłowe wykonanie. Jest tu również dodatkowy kontekst pokazujący, gdzie znajdują się sklepy.
Teraz chcę oddzielić moje przychody, porównując moich najlepszych klientów i moich najniższych klientów. Chcę też, aby zarówno te górne, jak i dolne grupy były dynamiczne. W tym miejscu pojawiają się parametry dynamiczne.
Stosowanie parametrów dynamicznych
Tak więc wyniki muszą się zmieniać w zależności od tego, jak chcę spojrzeć na dane. Oznacza to, że jeśli zmienię fragmentator dla Customer Rank , dane w tabeli również powinny się zmienić.
Pierwszą rzeczą, którą zamierzam zrobić, to użyć formuły, aby umieścić moich najlepszych klientów w tabeli.
Stworzyłem kolumnę, używając funkcji dla całkowitego dochodu , a następnie używając funkcji jako funkcji rankingowej. TOPN zwraca również wirtualną tabelę opartą na wynikach rankingu.
Dodałem tutaj kontekst, gdy obliczamy całkowity przychód , ponieważ patrzę tylko na klientów z najwyższej półki. Ranking ten jest określany na podstawie wartości rankingu klienta .
Korzystając z TOPN , przeanalizuję wszystkie dane klientów. Zachowałoby to jednak kontekst tylko dla 4 najlepszych, ponieważ jest to parametr ustawiany w tabeli. To wartość, którą ustawiłem w krajalnicy.
Mogę przenieść mój krajalnik do 3, a wyniki również musiałyby się zmienić i odzwierciedlać tylko dane dla pierwszej trójki.
Chcę też spojrzeć na moich najniższych klientów, więc dodam to do mojej tabeli.
Ponieważ umieściłem tam moich najniższych klientów, ważne jest również, aby pamiętać, że potrzebowałbym całkowitej liczby klientów na sklep w dowolnym przedziale czasowym.
Aby uzyskać całkowitą liczbę klientów , użyłem funkcji .
Pamiętaj, że to tylko przykładowe dane, więc liczby, które uzyskam na podstawie tego wzoru, mogą wydawać się małe i nierealne. Ale to obliczenie zadziałałoby również w przypadku większych częstotliwości, gdy zostanie zastosowane w rzeczywistych scenariuszach.
Oto formuła, której użyłem, aby zdobyć najniższych klientów. Zauważ, że jest bardzo podobny do tego, którego użyłem dla najlepszych klientów , ale z kilkoma drobnymi poprawkami.
Użyłem tutaj również funkcji CALCULATE i TOPN . Ale zamiast po prostu wpisać Ranking Klienta , użyłem różnicy między Łączną Liczbą Klientów a Wartością Rankingu Klienta .
Następnie zamiast po prostu umieszczać i Customer Names , musiałem dodać logikę. Ponieważ otrzymuję najniższych klientów zamiast najlepszych, użyję ASC zamiast DESC .
Poprzednia formuła przechodziła przez każdego pojedynczego klienta, aby uzyskać tych najlepszych. Ale ponieważ pozyskuję najniższych klientów, oznacza to, że zlicza również przypadki, w których sprzedaż była zerowa .
Muszę się upewnić, że klienci zaliczani do najniższych również dokonali zakupu. Dlatego dodałem, że wartość powinna być większa niż 0 .
Z tego powodu moje dane pokazują teraz, ilu klientów faktycznie dokonało zakupu. W tym pierwszym wierszu widać, że 11 klientów kupiło coś w tym konkretnym sklepie w określonym przedziale czasowym.
W tej części może to być dość trudne, głównie dlatego, że TOPN tworzy już wirtualny stół, ale tworzę również w nim kolejny wirtualny stół. Ta wirtualna tabela dotyczy znacznie mniejszego podzbioru klientów, a nie klientów jako całości.
Robię więc inny ranking tutaj na końcu wzoru na całkowity przychód . I jak wspomniałem wcześniej, używam ASC zamiast DESC .
Dzięki tym formułom mam teraz dodane parametry dynamiczne do segmentacji dynamicznej.
Wizualizacja wyników
Technika, której użyłem, mogłaby potencjalnie zostać wykorzystana do znacznie większych zbiorów danych. Oznacza to, że aby lepiej zrozumieć wyniki, warto mieć kilka wizualizacji, które je prezentują.
Zacznę od prostego wykresu, który może pokazać porównanie najlepszych i najniższych klientów dla każdego sklepu.
Mogę to również zmienić i użyć skumulowanego wykresu słupkowego na wypadek, gdyby liczby były wystarczająco duże i byłyby lepiej wyświetlane w ten sposób.
Dzięki tym wizualizacjom mogę uzyskać lepszy wgląd w liczby. To na przykład pokazuje, które sklepy są bardziej zagrożone. Widzę, które sklepy mają bardzo mało klientów, co skutkuje niskimi przychodami.
Segmentacja dynamiczna: jak podzielić klientów na grupy przy użyciu zaawansowanych
technik segmentacji klientów języka DAX przy użyciu modelu danych —
przykład segmentacji usługi LuckyTemplates i DAX przy użyciu zaawansowanego języka DAX w usłudze LuckyTemplates
Wniosek
Dane, których tutaj użyłem, mają bardzo niską częstotliwość, ale wyobraź sobie możliwości zastosowania ich do większych zestawów danych. Ta technika może również segmentować inne informacje i dodawać tak wiele różnych parametrów oprócz tylko najlepszych i najniższych klientów lub lokalizacji sklepów.
Ten przykład pokazuje, jak pracować z miarami również wewnątrz miar. Takie techniki dają niesamowity wgląd w dane, niezależnie od tego, gdzie są stosowane.
Wszystkiego najlepszego,
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.