Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Ten samouczek przeprowadzi Cię przez COLUMNSTATISTICS() — nową funkcję języka DAX, która jest prawie całkowicie nieudokumentowana. Został on dodany do usługi LuckyTemplates w sierpniu 2021 r. Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
Ta funkcja może służyć do szybkiego tworzenia metadanych dla każdej tabeli w modelu danych, w tym listy pól, minimalnej, maksymalnej i maksymalnej długości oraz liczby unikatowych wartości (liczności) dla każdego pola. Istnieją jednak pewne bardzo unikalne aspekty tego, jak ta funkcja może i nie może być używana, które również omawiam na tym blogu.
Eksperymentowałem z tą nową funkcją języka DAX i chcę pokazać, co znalazłem i co z nią robiłem.
Skonfigurujemy testową bazę danych za pomocą narzędzia LuckyTemplates Practice Dataset . Więc włączymy to i utworzymy mały trzyletni zestaw danych ze standardowym modelem schematu gwiaździstego sprzedaż-produkty-klienci.
Teraz przyjrzyjmy się, jak ta funkcja działa, aw niektórych przypadkach, jak nie działa.
Spis treści
Korzystanie z nowej funkcji języka DAX COLUMNSTATISTICS
Najpierw utworzę nową tabelę, aby pokazać, co generuje ta funkcja. Utwórzmy więc tabelę obliczeniową i nazwijmy ją Col Stats . Zauważysz, że podczas pisania funkcja IntelliSense go nie rozpoznaje, co od samego początku jest trochę czerwoną flagą. Otrzymujemy również ten komunikat z informacją, że wykryto zależność cykliczną.
Jeśli myślisz o tym, co robi ta funkcja, przechodzi przez każdą z tabel w modelu i tworzy statystyki dotyczące pól. A więc to, co tutaj robi, to właściwie próba stworzenia statystyk na tej samej tabeli, tabeli Col Stats. Tworzy tę cykliczną zależność.
To nie zadziała. Więc moją następną myślą było, zamiast tworzyć to jako fizycznie obliczoną tabelę, co by było, gdybyśmy stworzyli ją jako obliczoną wirtualną tabelę, aby nie zapętlała się sama w sobie w cyklicznej zależności?
Przejdźmy więc do miar, stwórzmy nową miarę i spróbujmy tutaj czegoś prostego. Spróbujemy policzyć wiersze tej tabeli Col Stats.
Teraz spróbujmy umieścić to w wizualizacji karty. Jak widać, to działa. Mamy 71 wierszy w tej kolumnie statystyki stabilne. Oblicza prawidłowo w tym środowisku wirtualnym.
Następnie przyjrzyjmy się, jak możemy wyodrębnić te dane. Jeśli możemy utworzyć tabelę, być może możemy zrobić to jako zapytanie DAX.
W tym celu wchodzimy do DAX Studio , ponieważ będziemy chcieli zapisać to do pliku, a DAX Studio wykonuje to naprawdę niezłą robotę. Ustawiliśmy nasze dane wyjściowe tutaj na Excel i utworzymy statyczną tabelę Excel. Następnie wykonujemy zapytanie DAX. Zapytania DAX, które tworzą tabele, zaczynają się od EVALUATE. W rzeczywistości działa i zwraca plik Excel z 71 wierszami.
Wracając do usługi LuckyTemplates w naszym przykładowym modelu danych, weźmiemy utworzoną przez nas tabelę programu Excel. Wciągnijmy to i widzimy, że otrzymujemy to Query1 i dokładnie to, co mówi, że zamierza zrobić, czyli wygenerować informacje o każdej kolumnie w każdej tabeli.
Następnie możemy przekształcić te dane. Najpierw po prostu idziemy Użyj pierwszego wiersza jako nagłówków . Następnie bierzemy tę tabelę Query1 i zmieniamy jej nazwę na Column Statistics . Następnie kliknij Zamknij i zastosuj.
Następnie na nowej stronie bierzemy nazwę tabeli i przeciągamy ją do fragmentatora. Weźmy resztę danych i wciągnijmy je do tabeli. A więc teraz mamy coś, co jest całkiem przydatne. Więc zamiast wracać do widoku tabeli i szukać potrzebnych pól, możesz po prostu klikać w trakcie swojego rozwoju. Możesz zobaczyć wszystkie statystyki podsumowujące dla wszystkich kolumn.
Funkcje tabel DAX w LuckyTemplates
Jak korzystać z funkcji COUNTROWS DAX w tabelach wirtualnych
LuckyTemplates Funkcja DAX ALL — jak to działa
Wniosek
Jedną z super fajnych rzeczy jest to, że ponieważ wszystko to znajduje się w fizycznej tabeli, w miarach języka DAX , możesz teraz odwoływać się do tego. Możesz policzyć swoje tabele i liczbę pól na tabelę. W wirtualnych tabelach możesz tworzyć listy nazw kolumn i przeprowadzać różnego rodzaju kontrole struktury swojego modelu.
Myślę więc, że jeśli będziemy nadal z tym eksperymentować, znajdziemy nowe i lepsze zastosowania. Jeśli masz jakieś inne odkrycia, których dokonałeś w odniesieniu do STATYSTYKI KOLUMNOWEJ, chciałbym usłyszeć je w komentarzach.
Możesz obejrzeć pełny samouczek wideo poniżej, aby uzyskać więcej informacji.
Wszystkiego najlepszego!
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.