Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym wnikliwym samouczku chcę przedstawić funkcję GROUPBY w usłudze LuckyTemplates. Pokażę różne sposoby korzystania z tej funkcji języka DAX. Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
Szczerze mówiąc, nie używałem funkcji GROUPBY zbyt często, głównie dlatego, że istnieje kilka sposobów rozwiązywania problemów w LuckyTemplates przy użyciu innych funkcji tabel. Na przykład dość często korzystałem z funkcji SUMMARIZE, aby osiągnąć to, co chciałem osiągnąć.
Jedną z rzeczy, która sprawia, że funkcja GROUPBY jest wyjątkowa, jest pewnego rodzaju składnia.
Co najważniejsze, chcę wprowadzić nową perspektywę wydajności za pomocą funkcji GROUPBY . Ta funkcja języka DAX może znacznie przyspieszyć tworzenie formuł, zwłaszcza w przypadku niewielkich problemów z wydajnością innych funkcji tabelowych.
Spis treści
Tworzenie tabel za pomocą funkcji GROUPBY
Funkcja próbuje pogrupować określone wymiary w danych. Utworzy tabelę, fizyczną lub wirtualną, w oparciu o elementy wewnątrz modelu danych.
W moim modelu mam dane dla Sales , Customers , Dates , US Regions oraz Products.
Mogę pogrupować te dane, umieszczając filtry ze wszystkich tych różnych tabel. Na przykład, jeśli chcę wypracować kilka unikalnych spostrzeżeń na produkt według stanu, będę musiał obliczyć maksymalną kwotę sprzedaży na produkt na stan dla konkretnego klienta. Trudno jest przeprowadzić tę analizę bez przeprowadzenia pewnego rodzaju agregacji w ramach funkcji oceny. Dlatego nauczę Cię innego sposobu tworzenia tej agregacji poza użyciem funkcji .
Przestudiuj poniższy wzór.
Przede wszystkim muszę odwołać się do tabeli. W tym przypadku odniosłem się do tabeli sprzedaży, ponieważ potrzebuję odniesienia do innych wymiarów z dwóch różnych tabel przeglądowych. To jest powód, dla którego mam produkty [nazwa produktu] w formule, a także według stanu. Ta część formuły będzie łączyć dane zarówno według poziomu produktu, jak i stanu.
Interesujące jest to, że nie mogę umieścić miary wewnątrz tej części. Muszę użyć składni podobnej do funkcji iteracyjnej, której użyłem. Następnie spójrz, gdzie umieściłem funkcję CURRENTGROUP w formule.
Muszę uruchomić logikę iteracyjną w każdym wierszu w określonych tabelach, które skonfigurowałem. Z punktu widzenia wydajności iteruje grupowanie względem każdego pojedynczego wiersza w tabeli Sales . Jestem prawie pewien, że tak to działa. Mógłbym dowiedzieć się więcej na ten temat po dalszych testach, ale jak dotąd to wszystko, co robi w oparciu o definicję Microsoftu.
Pokażę ci jeszcze jeden ciekawy spostrzeżenie. Jeśli wstawię do formuły miarę przychodu, nie zwróci ona wyniku i zostanie wyświetlona jako błąd. Oznacza to tylko, że muszę napisać to w bardzo określonej składni formuły, aby uzyskać nową tabelę.
Wreszcie, mogę powiększyć stół, ponieważ nie jest ograniczony. Mogę nawet dodawać różne funkcje i tworzyć różne kolumny przy użyciu podobnej logiki.
Opracowanie funkcji GROUPBY wewnątrz zmiennej
Chcę wrócić do formuły Max Product Sales By State i pokazać inną technikę.
Zamiast używać funkcji GROUPBY w tabeli kalkulatora, mogę umieścić ją wewnątrz zmiennej. Tym razem nazwałem zmienną ProductStates .
Korzystając z tej formuły, chcę znaleźć różnych klientów w tej samej wirtualnej tabeli i obliczyć maksymalną sprzedaż produktów według stanu. Dlatego zamierzam znaleźć najwyższą kwotę sprzedaży produktu dla klienta, a następnie spojrzeć na dane dla każdego innego stanu.
Przede wszystkim zrobię agregację i dlatego umieściłem wirtualną tabelę GROUPBY wewnątrz funkcji .
Następnie uruchomię kilka funkcji iteracyjnych w wirtualnej tabeli, a następnie obliczę sprzedaż w każdym wierszu. Formuła zwróci tylko maksymalne wyniki, ponieważ użyłem zagregowanej tabeli wirtualnej wewnątrz funkcji iteracyjnej MAXX .
Sprawdź, co się stanie, gdy wybiorę konkretnego klienta tutaj.
Jak wynika z raportu, maksymalna sprzedaż produktów klienta według stanu wynosi około 68 000 USD. Możesz to zobaczyć w pierwszym wierszu następnej tabeli. Ponadto w tabeli widoczne są różne nazwy produktów, które kupił klient oraz stan. Całkowita sprzedaż tylko dla tego klienta wynosi około 193 000 USD.
W przypadku innych klientów tabela za każdym razem zwraca poprawny wynik. Mamy nadzieję, że daje dobry przegląd rzeczy, które możesz zrobić za pomocą funkcji GROUPBY .
Grupuj klientów dynamicznie według ich rankingu w/RANKX w usłudze LuckyTemplates
Używaj języka DAX do segmentowania i grupowania danych w usłudze LuckyTemplates
Praca z funkcjami iteracyjnymi w języku DAX
Wniosek
Tym z Was, którzy chcą tego spróbować, polecam poeksperymentować z różnymi możliwościami funkcji GROUPBY . Możesz go użyć do stworzenia pewnego rodzaju agregacji i zobaczyć, co się pojawi.
To dobra funkcja, ale osobiście wolę używać funkcji SUMMARIZE , ponieważ jest dla mnie łatwiejsza. Jest to jednak całkowicie moja osobista opinia. Zawsze możesz wypróbować inną funkcję i sprawdzić, czy Ci odpowiada na podstawie Twoich modeli.
Mam nadzieję, że nadal nauczyłeś się czegoś o tej konkretnej funkcji. Nie zapomnij sprawdzić LuckyTemplates TV, aby znaleźć wiele innych wspaniałych treści.
Z poważaniem.
Sama
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.