Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku zostanie zaprezentowane narzędzie VertiPaq Analyzer Metrics w DAX Studio oraz sposób, w jaki pomaga on w optymalizacji kodów DAX. Każda metryka zostanie omówiona, abyś zrozumiał, w jaki sposób każda z nich może poprawić wydajność Twoich kodów.
To jest metryka analizatora VertiPaq.
Spis treści
Zakładka Tabele analizatora VertiPaq
Pierwsza metryka to karta Tabele lub Ogólny widok tabeli. Na tej karcie możesz zobaczyć kolumnę Kardynalność . Odnosi się do liczby unikalnych wartości w tabeli. To najważniejsza kolumna w Twoim modelu danych i zapytaniu DAX .
Jeśli spojrzysz na tabelę DimCustomer , znajdziesz tam 20 unikalnych wartości. Oznacza to, że istnieje 20 odrębnych klientów o niepowtarzalnych wartościach.
To jest przykładowe zapytanie języka DAX.
Wykorzystuje funkcję do liczenia wierszy różnych tabel. Liczba wierszy odpowiada liczności utworzonej w tabeli.
Kolumny dla rozmiaru danych
Następna kolumna po Cardinality nazywa się Table . Pokazuje, ile pamięci zajmuje tabela. Im większy rozmiar danych, tym więcej uwagi potrzebuje. Kolumna Col Size to suma kolumn Data , Dictionary i Hierarchy Size .
Kolumny Data , Dictionary i Hierarchy Size pokazują odpowiednio całkowity rozmiar skompresowanych danych, kolumn zakodowanych w słowniku i automatycznie generowanych kolumn hierarchii.
Dalej znajduje się kolumna Kodowanie , która pokazuje zastosowany typ kodowania. Kodowanie wartości i skrótu występuje we wszystkich tabelach, dlatego wynik pokazuje „Wiele”.
Naruszenia integralności referencyjnej zostaną również pokazane w kolumnie Naruszenia RI . Naruszenia występują, gdy wartość istnieje w tabeli faktów , ale nie istnieje w tabeli wymiarów .
Kolumna Rozmiar hierarchii użytkownika pokazuje rozmiar hierarchii zdefiniowanych przez użytkownika. Rozmiar relacji oparty na wielu stronach ustawienia jeden-do-wielu będzie również pokazany w kolumnie Rozmiar relacji .
Następnie masz kolumny %DB . Ta kolumna pokazuje, ile zajmuje tabela jako procent całkowitego rozmiaru wszystkich tabel.
Na przykładzie widać, że tabela DimCustomer zajmuje prawie 66% całkowitego rozmiaru tabeli. Procent twojej bazy danych do twojej tabeli faktów powinien być większy niż tabele wymiarów .
To są procenty:
Ponieważ ten przykład nie zawiera wielu danych, nie można użyć kolumn Segmenty i Partycje ; będzie dotyczyć tylko większych tabel.
Ostatnia kolumna na karcie nosi nazwę Kolumny . Po prostu pokazuje kolumny liczbowe w tabeli. Kolumny Typ danych i Tabela % nie mają zastosowania do ogólnego widoku tabeli.
Wewnątrz tabeli FactSales
To jest ogólna tabela danych FactSales.
Każda kolumna w tabeli ma swoje własne informacje. Ogólny poziom tabeli ma na przykład różne kolumny, takie jak Liczność , Rozmiar kolumny itp.
W tym przykładzie zauważysz, że liczność SalesKey jest równa liczności tabeli. To dlatego, że SalesKey nie ma powtarzających się wartości i jest unikalną wartością.
Kolumna Rozmiar kolumny jest równie ważna jak poziom tabeli. Pokazuje sumę kolumn Data , Dictionary i Hierarchy Size .
Możesz również zobaczyć, że zastosowaną metodą kodowania jest Hash Encoding , która tworzy odrębną listę wartości.
Jeśli spojrzysz na wiersz Quantity , zobaczysz, że używa on metody Hash Encoding , nawet jeśli typem danych jest liczba całkowita.
Powodem tego jest to, że usługi SQL Server Analysis Services skonfigurowały metodę określania najlepszej metody kompresji.
Kolumna Tabela % pokazuje kolumnę jako procent całkowitego rozmiaru tabeli. W przykładzie SalesKey ma największy rozmiar tabeli, co ma sens, ponieważ ma najwyższą liczność i rozmiar kolumny.
Podobnie kolumna Baza danych % pokazuje procent tabeli lub kolumny w tabeli jako procent całej bazy danych.
Zobaczysz, że tabela FactSales stanowi 46,8% całkowitego rozmiaru modelu danych. Kolumna SalesKey wewnątrz tabeli FactSales zajmuje 15% całkowitego rozmiaru bazy danych.
Ponieważ ten przykład zawiera tylko niewielką ilość danych, będziesz mieć tylko jeden segment i partycję. To samo dotyczy kolumny Kolumny . Liczba kolumn w widoku kolumnowym zawsze będzie wynosić jeden.
Zakładka Kolumny analizatora VertiPaq
Karta Kolumny ma łatwiejszy format wyświetlania danych . Zawiera bardziej szczegółowe informacje niż karta Tabele .
Zauważysz, że ma podobne kolumny jak karta Tabele .
Zakładka Kolumny umożliwia sortowanie dowolnych kolumn. W tym przykładzie jest on sortowany według Liczności, która jest oznaczona małym trójkątem. Kolumna Wiersze pokazuje, ile wierszy znajduje się w tabeli.
Jak widać, FactSales-SalesKey ma 15 000 wierszy i liczność. Wszystkie klucze podstawowe mają wiersze, które są równe odpowiadającej im liczności.
Jeśli liczba wierszy nie jest równa liczbie liczności, tabela będzie miała powtarzające się wartości.
Jeśli spojrzysz na FactSales-CustomerKey , zauważysz, że ma liczność 801 i rozmiar kolumny prawie 1,1 miliona.
Oznacza to, że należy go zoptymalizować i skompresować. Aby go zoptymalizować, przejdź do pliku LuckyTemplates i otwórz tabelę DimCustomer .
Kolumna CustomerKey jest ciągiem danych. Jak widać, wartości zaczynają się od litery C, po której następuje liczba. Kliknij opcję Zamień wartości , aby zmienić wartości w kolumnie.
Znajdź wartość C i zmień ją na pustą. Następnie zmień typ danych na liczbę całkowitą.
Zrób to samo dla kolumny CustomerKey w tabeli Fact . Kliknij Zastosuj i wróć do DAX Studio. Następnie kliknij opcję Wyświetl metryki, aby ponownie załadować język DAX, a następnie posortuj go według liczności.
Rozmiar kolumny został teraz zmniejszony do 46 372 z 1,1 miliona. Jeśli spojrzysz na widok tabeli, zobaczysz, że rozmiar kolumny również spadł do 46 372.
Jeśli zrobisz to samo z SalesPersonKey, który ma rozmiar kolumny prawie 1,1 miliona, możesz zmniejszyć go do 5540.
Zmiana wartości typu łańcuchowego lub tekstowego na typ całkowity może zoptymalizować język DAX, aby działał lepiej.
Optymalizuj funkcje języka DAX dzięki temu nowemu kursowi
Proste transformacje usługi LuckyTemplates w celu uzyskania bardziej zoptymalizowanych danych
Optymalizuj formuły usługi LuckyTemplates przy użyciu zaawansowanego języka DAX
Wniosek
Optymalizacja języka DAX rozpoczyna się w DAX Studio za pomocą narzędzia VertiPaq Analyzer. W metrykach analizatora zobaczysz, jak działają tabele i kolumny, i określisz, która jednostka wymaga większej optymalizacji i ulepszenia.
Jeśli chcesz dowiedzieć się, która część kodu spowalnia działanie Twojego kodu, użyj narzędzia VertiPaq Analyzer. Z pewnością poprawi to Twój DAX.
Nickligh
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.