Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Pierwszym filarem rozwoju LuckyTemplates jest ładowanie i transformacja danych. Z tego samouczka dowiesz się o 12 elementach danych usługi LuckyTemplates, które należy skonfigurować i zapamiętać przed utworzeniem raportu.
Ta lista kontrolna jest ważna przede wszystkim, ponieważ zapewnia sprawne opracowanie raportu . Pamiętaj, aby przestrzegać tych najlepszych praktyk.
Spis treści
1. Wyłącz określone funkcje
Przede wszystkim zaleca się wyłączenie funkcji automatycznej daty/godziny w usłudze LuckyTemplates. Można to zrobić na dwa sposoby: możesz wyłączyć tę funkcję globalnie lub wyłączyć ją dla bieżącego pliku.
Wyłączenie go globalnie oznacza, że bieżące i wszystkie przyszłe pliki nie będą miały tej funkcji. Zrób to, przechodząc do Plik, a następnie Opcje i ustawienia . W obszarze Ładowanie globalne i danych usuń zaznaczenie pola Automatyczny dzień/godzina dla nowych plików w obszarze Analiza czasowa.
Aby wyłączyć tylko bieżący plik, przejdź do tej samej karty Opcje i poszukaj Bieżący plik . Na karcie Ładowanie danych odznacz pole Automatyczna data/godzina .
Kolejną funkcją do wyłączenia jest Automatyczne wykrywanie nowych relacji . Znajduje się również w Bieżącym pliku w sekcji Relacje.
2. Podświetlanie krzyżowe vs filtrowanie krzyżowe
Istnieją dwa sposoby interakcji z wizualizacjami w raportach usługi LuckyTemplates . Interakcje te można filtrować krzyżowo lub wyróżniać krzyżowo. Podświetlanie krzyżowe jest domyślnie włączone w usłudze LuckyTemplates.
Aby zmienić tę opcję, przejdź ponownie do Plik, a następnie Opcje i ustawienia. W sekcji Bieżący plik w sekcji Ustawienia raportu możesz zmienić domyślną interakcję wizualną z podświetlania krzyżowego na filtrowanie krzyżowe .
Oto jak to będzie wyglądać. W przypadku podświetlania krzyżowego można zauważyć, że po kliknięciu jednego kanału na pierwszym wykresie słupkowym drugi wykres słupkowy podświetla wybraną część dla każdego słupka.
Podświetlona część pozostaje w ciemnym kolorze, podczas gdy niezaznaczona część pozostaje w jasnym kolorze.
Jeśli klikniesz inny kanał, zobaczysz, że długość każdego jasnego słupka na drugim wykresie słupkowym nie zmienia się. Tylko podświetlone fragmenty przesuwają się w zależności od wybranego kanału.
Z drugiej strony w przypadku filtrowania krzyżowego długość każdego paska zmienia się, gdy przechodzisz z jednego kanału do drugiego.
Jest to zalecana opcja do użycia podczas tworzenia raportów w usłudze LuckyTemplates.
3. Oddzielanie zestawów danych usługi LuckyTemplates od raportu
Musisz opracować i opublikować zestawy danych w samodzielnym pliku PBIX.
Jedną z zalet oddzielnego publikowania zestawów danych jest możliwość korzystania z procesu zatwierdzania w usłudze LuckyTemplates w celu promowania i certyfikowania zestawów danych.
Idealną praktyką jest wybranie i zatwierdzenie zestawu danych, najlepiej certyfikowanego, podczas opracowywania nowego raportu.
4. Dedykowana Tabela Dat
Następną konfiguracją przedrozwojową, którą musisz wykonać, jest upewnienie się, że Twój raport ma dedykowaną tabelę Daty .
Jako przykład możesz użyć rozszerzonej tabeli dat dostępnej na forum LuckyTemplates, do której możesz uzyskać dostęp za pomocą tego . Po uzyskaniu do niego dostępu skopiuj i wklej kod M do pustego zapytania.
Kolejną rzeczą do zrobienia jest oznaczenie tabeli Daty jako tabeli dat, aby umożliwić korzystanie z obliczeń analizy czasowej w LuckyTemplates.
Musisz także upewnić się, że tabela Daty jest ciągła (jeden wiersz dziennie) i całkowicie zakrywa krawędzie tabeli Faktów.
Pamiętaj, aby zawsze dodawać pełne lata do tabeli Daty. Dobrym rozwiązaniem jest również dodanie dodatkowego przyszłego roku do tabeli Daty, aby umożliwić prognozowanie przy użyciu obliczeń analizy czasowej.
Jeśli Twoja tabela Daty ma więcej dni niż chcesz pokazać w raporcie, możesz kontrolować wizualizacje za pomocą fragmentatorów. Możesz użyć kolumny IsAfterToday lub kolumny Przesunięcie w okienku Filtr.
5. Sprawdzanie przed utworzeniem
Przed rozpoczęciem i utworzeniem raportu należy najpierw sprawdzić, czy w ogóle trzeba go robić. Zadaj sobie te pytania:
I co najważniejsze, czy naprawdę musisz zaczynać od zera?
6. Przemieszczanie i odwoływanie się do danych usługi LuckyTemplates
Podczas ładowania płaskiej tabeli danych fakty i wymiary mogą znajdować się w innej tabeli, na przykład w pliku programu Excel. W takim przypadku przenieś je do sekcji Zapytanie przemieszczania i zmień jego nazwę. Po zakończeniu możesz odznaczyć opcję Włącz ładowanie .
Następnie utwórz odniesienie dla każdej tabeli faktów i tabel odnośników i odpowiednio zmień ich nazwy.
Edytuj każde odwołanie i zachowaj tylko potrzebne kolumny. Pamiętaj, aby usunąć duplikaty.
I na koniec zorganizuj swój model danych. Umieść podobne dane we własnych grupach.
7. Zgłoś wydajność
Jednym z największych czynników wpływających na wydajność jest ilość danych.
Zmniejsz ilość danych do załadowania tak bardzo, jak to możliwe. Zawsze postępuj zgodnie z aksjomatem: jeśli czegoś nie potrzebujesz, nie odbieraj go . Łatwiej jest dodać nowe rzeczy do raportu niż usunąć.
Kiedy umieszczasz zbyt wiele rzeczy w raporcie, płacisz karę za wydajność. Dlatego zaleca się filtrowanie u źródła.
Jeśli nie możesz tego zrobić u źródła, możesz użyć dodatku Power Query . Użyj opcji automatycznego filtrowania , aby załadować niezbędne wiersze. I użyj opcji Wybierz kolumny lub Usuń kolumny , aby załadować niezbędne kolumny.
Pomiędzy Wybierz kolumny i Usuń kolumny, najlepiej użyć tego pierwszego. Opcja Wybierz kolumny ułatwia pobieranie dodatkowych kolumn w usłudze LuckyTemplates, jeśli zajdzie taka potrzeba w przyszłości.
8. Składanie zapytań dla danych usługi LuckyTemplates
Składanie zapytań to próba połączenia kilku etapów selekcji i przekształcania danych przez usługę LuckyTemplates w jedno zapytanie źródła danych.
Aby określić, czy zapytanie jest składane, należy kliknąć prawym przyciskiem myszy okienko Zastosowane kroki, a następnie spojrzeć na opcję Wyświetl zapytanie natywne .
Jeśli ta opcja nie jest wyszarzona po kliknięciu prawym przyciskiem myszy kroku dodatku Power Query, oznacza to, że używane jest składanie zapytań. Jeśli jest wyszarzona, oznacza to, że zapytanie nie jest składane.
Oto przykład, jak to wygląda. Krok Nawigacja w tej demonstracji nie ma wyszarzonej opcji Wyświetl zapytanie natywne. W związku z tym używane jest składanie zapytań.
Jeśli ta opcja jest zaznaczona, zostanie wyświetlona prosta instrukcja wyboru języka SQL.
W tym przykładzie kroki Filtrowane wiersze i Zastąpiona wartość mają już odfiltrowane dane. Dlatego podczas przeglądania kroków zapytania natywnego filtrowanych wierszy i wartości zastępowanych instrukcje pokażą większe zwinięcie trzech zapytań w jedno.
To jest LuckyTemplates, które mówi, że najlepszym sposobem na wprowadzenie danych do modelu jest zwrócenie się do źródła, które zrobi to za Ciebie.
Oto inne ważne punkty dotyczące składania zapytań, o których należy pamiętać:
9. Tryb łączności
Przed rozpoczęciem tworzenia raportu wybierz właściwy tryb łączności. Tryb importu jest ustawieniem domyślnym i należy go używać, gdy jest to możliwe, ponieważ zapewnia najlepszą wydajność raportu. Tryb zapytań bezpośrednich może być używany, jeśli potrzebne są aktualne dane, ale może to negatywnie wpłynąć na wydajność.
Dostęp do trybu Live Connection można uzyskać za pomocą istniejących modeli hurtowni danych (np. wielowymiarowych kostek SSAS).
10. Lokalizacja transformacji danych
Ważne jest również, aby znać właściwą lokalizację transformacji danych.
Najlepszym miejscem do ich wykonania jest źródło. Jeśli nie możesz ich wykonać w źródle, wykonaj je w dodatku Power Query . Jeśli nie możesz ich wykonać w dodatku Power Query, wykonaj je w języku DAX.
Wykonuj transformacje danych tak daleko, jak to możliwe, i tak daleko w dół, jak to konieczne.
Jeśli możesz wprowadzać korekty w Power Query, byłoby to lepsze niż w DAX. Jeśli nie jest to dynamiczne w kontekście sesji raportu, rozważ zrobienie tego w dodatku Power Query, aby uprościć język DAX i zwiększyć wydajność raportu .
A jeśli chodzi o kształt twoich tabel, postaraj się, aby tabele faktów były długie i cienkie, podczas gdy tabele wymiarów powinny być krótkie i szerokie.
11. Nazewnictwo i typy danych
Kilka sprawdzonych rozwiązań dotyczących nazewnictwa polega na użyciu spójnych schematów nazewnictwa, które są łatwe do zrozumienia. W razie potrzeby zmień nazwy wszystkich elementów raportu, aby zachować zgodność ze spójnym standardem nazewnictwa. Te elementy obejmują między innymi tabele, zapytania, kolumny i kroki dodatku Power Query.
Jest to ważne, ponieważ pozwala użytkownikom niezaangażowanym w proces tworzenia raportu łatwo zrozumieć, co dzieje się w raporcie.
Chociaż usługa LuckyTemplates doskonale radzi sobie z przypisywaniem prawidłowych typów danych, mogą być potrzebne pewne poprawki. Oto ważne punkty, o których należy pamiętać w przypadku typów danych:
12. Szczegółowość danych usługi LuckyTemplates
Ostatnią pozycją na tej liście kontrolnej konfiguracji przed programowaniem jest szczegółowość .
Powinieneś dążyć do pozyskiwania danych z zachowaniem spójnej szczegółowości. Łącząc różne poziomy szczegółowości w rozwiązaniu, użyj dodatku Power Query lub języka DAX, aby odpowiednio przydzielić dane referencyjne.
Oto przykład:
Główne dane Sales są na poziomie dziennym, co oznacza, że ich szczegółowość jest dzienna. Dane referencyjne budżetu są na poziomie miesięcznym, więc ich szczegółowość jest miesięczna. Musisz to ujednolicić. Oba dane powinny być podane w dniach lub miesiącach.
Wniosek
Ta szczegółowa lista kontrolna zawiera wszystko, czego potrzebujesz do opracowania raportu od samego początku. Będą chwile, kiedy będziesz chciał od razu zacząć od swojego raportu.
Ale pośpiech może najprawdopodobniej zająć więcej czasu. Istnieje większe prawdopodobieństwo napotkania wybojów i pułapek. Wcześniejsze przejrzenie każdego elementu pozwoli Ci zaoszczędzić dużo czasu na dłuższą metę.
Greg
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.