Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku dowiesz się, jak używać narzędzia VertiPaq Analyzer w DAX Studio do optymalizowania modelu danych w usłudze LuckyTemplates.
VertiPaq Analyzer to narzędzie wbudowane w DAX Studio , które wydobywa istotne informacje o modelach tabelarycznych z punktu widzenia optymalizacji.
Aby uruchomić VertiPaq Analyzer, przejdź do karty Zaawansowane w DAX Studio. Następnie kliknij opcję Wyświetl metryki .
Spowoduje to otwarcie nowego panelu u dołu. Panel VertiPaq Analyzer Metrics zawiera listę wszystkich tabel w modelu tabelarycznym.
Każda kolumna zawiera istotne informacje dotyczące Twojego modelu danych, takie jak:
Spis treści
Metryki analizatora VertiPaq modelu danych w usłudze LuckyTemplates
Tych różnych metryk można używać podczas analizowania tabel w modelu danych . W tym przykładzie zauważysz, że tabela Sales zużywa największą ilość %DB.
Przewiń do skrajnej lewej kolumny tabeli w analizatorze VertiPaq. Gdy klikniesz tabelę, będziesz mógł przejść do informacji zawartych w jej kolumnach.
Pozwala to zidentyfikować kolumny, które są niezbędne do celów analitycznych. Możesz także zdecydować się na usunięcie niepotrzebnych kolumn z modelu danych. Oszczędza to pamięć RAM i optymalizuje wykonywane obliczenia.
Na przykład kolumna Klucz sprzedaży online zużywa łącznie 83 MB pamięci RAM. Jeśli ta kolumna nie jest przydatna do celów raportowania, możesz ją usunąć, aby zwolnić miejsce.
W sekcji Kodowanie widać, że kodowanie wartości jest stosowane do kolumny Klucz sprzedaży online. Stosowanie kodowania słownikowego nie ma sensu, ponieważ ta kolumna zawiera tylko unikalne wartości. Zapisany indeks nadal będzie równy swojej wartości.
Nie będzie to przydatne podczas kompresowania kolumny, dlatego usługi Analysis Services pomijają kodowanie słownika. Dlatego sekcja Słownik zajmuje tylko 120 KB.
Kodowanie słownika, procenty przechowywania i rozmiar hierarchii użytkowników
Z perspektywy czasu, jeśli spojrzysz na kolumnę Numer zamówienia sprzedaży, zobaczysz, że jej sekcja Słownik zajmuje więcej miejsca niż sekcja Dane.
Sekcja Dane przechowuje indeks lub wartość wskaźnika dla każdego wiersza w kolumnie. Ponieważ kolumna Numer zamówienia sprzedaży przechowuje większość swoich danych w postaci indeksów, cały nacisk jest pochłaniany przez Słownik.
Rozmiar kolumny pokazuje sumę sekcji Dane, Słownik i Hierarchia. W sekcji Typ danych kolumna Numer zamówienia sprzedaży jest przechowywana jako ciąg znaków, dlatego używane jest kodowanie słownikowe.
Następnie, jeśli przewiniesz do skrajnej prawej części VertiPaq Analyzer, możesz zobaczyć dane procentowe.
Tabela % pokazuje ilość miejsca zajmowanego przez kolumnę w odniesieniu do tabeli. Natomiast % DB pokazuje ilość miejsca zajmowanego przez kolumnę w odniesieniu do całej bazy danych.
Przechodząc do tabeli Produkty, widać, że jako jedyna ma wartość dla Rozmiaru hierarchii użytkowników.
Rozmiar hierarchii użytkownika pokazuje ilość miejsca zajmowanego przez hierarchie utworzone w DAX Studio.
Naruszenia RI modelu danych w LuckyTemplates
Zakładka Column w VertiPaq Analyzer umożliwia przeglądanie danych w formacie tabeli-kolumny.
Umożliwia sortowanie według kolumn, co ułatwia identyfikację, która kolumna w całym zbiorze danych zużywa najwięcej pamięci RAM.
Zakładka Relacje umożliwia przeglądanie głównej przyczyny naruszeń RI .
Jeśli Twój kod DAX zawiera naruszenie RI, VertiPaq Analyzer umieści cyfrę 1 czerwoną czcionką w sekcji Naruszenia RI. Jeśli jednak rozwiniesz tabelę z naruszeniem, nie będziesz w stanie zobaczyć, co jest jego przyczyną.
Zamiast tego informacje te można znaleźć na karcie Relacje.
W tym przykładzie tabela Sales pokazuje, że między kluczem produktu tabeli sprzedaży a kluczem produktu tabeli produktów brakuje 2183 kluczy. Powoduje to 10 milionów nieprawidłowych wierszy w tabeli Sales i 153 przykładowych naruszeń.
Strona Relacje w programie VertiPaq Analyzer umożliwia identyfikację brakujących kluczy między tabelą Fakty a tabelą wymiarów.
Możesz również dokładnie sprawdzić te informacje za pomocą języka DAX.
Po uruchomieniu kodu wyniki rzeczywiście pokazują, że 10 milionów wierszy ma puste wartości klucza produktu.
Zakładka Podsumowanie w analizatorze VertiPaq
Karta Podsumowanie zawiera podstawowe ogólne informacje o modelu danych.
Rozmiar całkowity pokazuje całkowitą ilość pamięci RAM zużywanej przez model danych. Data analizy odnosi się do ostatniego kliknięcia opcji Wyświetl metryki w DAX Studio.
Zgodność odnosi się do wersji Analysis Services używanej w bieżącym pliku. Na koniec serwer pokazuje numer portu hosta lokalnego używany przez usługi Analysis Services do łączenia się z DAX Studio.
Wniosek
Analizator VertiPaq to narzędzie wydajności i analizy zawarte w usłudze Microsoft LuckyTemplates. Umożliwia analizowanie modelu danych raportu lub zestawu danych usługi LuckyTemplates w celu zrozumienia struktury danych i sposobu ich używania.
Analizator VertiPaq udostępnia kilka wskaźników, które mogą pomóc w zrozumieniu wydajności i wydajności modelu danych. Analizując te metryki, możesz zidentyfikować potencjalne problemy z modelem danych, takie jak duże tabele, mała gęstość danych lub nieefektywne typy danych, i podjąć kroki w celu zoptymalizowania modelu w celu uzyskania lepszej wydajności.
Wszystkiego najlepszego,
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.