Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W ciągu ostatnich kilku miesięcy przedstawiłem kilka samouczków prezentujących najlepsze praktyki tworzenia raportów LuckyTemplates dla każdego z czterech filarów LuckyTemplates. Na tym blogu chciałem skorzystać z okazji i przedstawić moją osobistą listę top 10. Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
To będzie trochę inne niż tradycyjne top 10. Zamiast top 10, wybrałem 10 moich ulubionych. Na doskonały raport LuckyTemplates składa się tak wiele składników, że naprawdę trudno było wybrać tylko 10. Ale zanim do tego przejdę, chcę podkreślić trzy opcjonalne ustawienia , które moim zdaniem są niezbędne w każdym raporcie LuckyTemplates .
Pierwszy to Wyłącz automatyczną datę/godzinę . Można to zrobić za każdym razem dla bieżącego pliku lub globalnie dla wszystkich nowych plików. Globalnie jest zalecane.
Dalej jest Wyłącz automatyczne wykrywanie relacji . Niestety tej opcji nie można ustawić globalnie, więc trzeba ją dostosować dla każdego pliku.
Na koniec włączyliśmy filtrowanie krzyżowe . Nie można tego również ustalić globalnie, ale jest to bardziej zależne od odbiorców i powinno być dostosowywane dla poszczególnych raportów, w zależności od tego, jak konsumenci chcą przeglądać swoje dane. Preferuję filtrowanie krzyżowe przez cały czas.
Spis treści
10 najlepszych praktyk dotyczących opracowywania raportów usługi LuckyTemplates
1 – Dedykowana i oznaczona tabela dat
Po ustawieniu tych trzech opcji moim ulubionym numerem jeden jest użycie dedykowanej tabeli dat i oznaczenie jej jako takiej . Jest to dosłownie pierwsza rzecz, którą zapewniam za każdym razem, gdy opracowuję lub przeglądam raport usługi LuckyTemplates, i nie mogę jej wystarczająco polecić.
Twoja tabela Daty powinna zawierać pełne lata i jeden wiersz dziennie. Uważam, że przesunięcia roku, kwartału, miesiąca, tygodnia i dnia są niezwykle przydatne i rzadko rozwijają się bez nich.
2 – Przemieszczanie i odwoływanie się do danych
Dalej są dane przemieszczania i odwoływania się z wielu powodów. Ładowanie lub umieszczanie danych w postaci nieprzekształconej tabeli zmaksymalizuje wydajność ładowania i zminimalizuje obciążenie źródła danych. Tworzenie lub odwoływanie się do tabel faktów i wymiarów zgodnie z potrzebami na podstawie danych etapu zminimalizuje lub złagodzi brakujące relacje. Jako bonus zapewnia to, że będziesz musiał samodzielnie tworzyć i edytować relacje między tabelami, co może tylko poprawić twój mentalny obraz modelu danych.
Jeśli więc przejdę do dodatku Power Query, zobaczę, że mam zaimportowaną płaską tabelę jako zapytanie pośrednie. Jeśli kliknę go prawym przyciskiem myszy, zobaczymy, że mam włączone ładowanie wyłączone.
Stwórzmy po prostu odniesienie do tego dla innej tabeli, więc kliknę go prawym przyciskiem myszy, utworzę odniesienie i zmienię jego nazwę na Kierunki. Następnie przejdę do kolumny Kierunki, zaznaczę tylko ją, kliknę prawym przyciskiem myszy i Usuń inne kolumny.
Następnie klikam prawym przyciskiem myszy stąd i usuwam duplikaty. A potem posortuję kolumnę.
3 – Zmniejsz ilość danych
Następną najlepszą praktyką jest zmniejszanie wolumenu danych . Możesz filtrować swoje dane idealnie u źródła, aby uniknąć nawet ładowania wierszy lub kolumn danych, które nie są niezbędne do udzielenia odpowiedzi na konkretne pytania, które są celem Twojego raportu.
Jeśli nie możesz dostosować źródła, możesz użyć list rozwijanych filtrów wierszy, aby usunąć niepotrzebne wiersze i przycisku Wybierz kolumny w dodatku Power Query, aby usunąć niepotrzebne kolumny z modelu danych.
4 – Schemat gwiazdy lub układ wodospadu dla modelu danych
Następny to Star Schema , który jest idealną strukturą Twojego modelu danych. Zawsze należy dążyć do jak najprostszego modelu danych z wymiarami lub tabelami wyszukiwania powyżej lub wokół tabeli faktów. Znaczenie tego wodospadu lub układu gwiazdy jest nie do przecenienia, ponieważ poprawia tylko mentalny obraz modelu danych. Często pozwala również na najlepszą możliwą wydajność języka DAX i grafiki.
5 – Użyj relacji 1-do-wielu
Jeśli chodzi o relacje, staraj się, aby wszystkie relacje były typu jeden-do-wielu , przy czym Jeden kończy się w wymiarze, a Wiele w tabeli faktów. Jeśli możesz, unikaj relacji dwukierunkowych, chyba że ustaliłeś, że Twój model naprawdę ich potrzebuje i że naprawdę rozumiesz ich zastosowanie.
Pamiętaj, że możesz mieć tylko jedną aktywną relację między dowolnymi dwiema tabelami, ale nie możesz mieć wielu nieaktywnych relacji.
6 – Używaj pełnego nazewnictwa zmiennych
Jeśli chodzi o pełne nazewnictwo zmiennych , zawsze starałem się kodować pod kątem przejrzystości i uważam, że używanie pełnych nazw zmiennych naprawdę pomaga, aby mój kod był przejrzysty. Kiedy używam pełnych nazw zmiennych, rzadko muszę dodawać komentarze wyjaśniające i znacznie zmniejsza to proste błędy w moim kodzie, gdy wybiorę niewłaściwą zmienną.
Używam również przedrostka podkreślenia w nazwach moich zmiennych. Zwiększa czytelność i poprawia typ headless zapewniany przez IntelliSense.
7- Użyj SWITCH TRUE zamiast zagnieżdżonych instrukcji IF
Kolejną dobrą praktyką w raportowaniu LuckyTemplates, którą gorąco polecam, jest użycie . Jak powiedziałem wcześniej, staram się kodować dla przejrzystości i uważam, że jednym z najlepszych sposobów na to jest unikanie używania zagnieżdżonych instrukcji .
Spójrzmy na przykład tutaj z użyciem zagnieżdżonej instrukcji IF.
Zamiast tego wolę używać logiki SWITCH TRUE, zwłaszcza przy użyciu zmiennych powyżej. Instrukcja SWITCH TRUE i konstrukcja RETURN Result są bardziej przejrzyste niż w przypadku użycia zagnieżdżonej instrukcji IF.
Formuła wykorzystująca SWITCH TRUE jest dla mnie znacznie łatwiejsza do odczytania.
8 – Użyj techniki rozgałęziania miar
Część mojej listy 10 najlepszych najlepszych praktyk w raportowaniu usługi LuckyTemplates to rozgałęzianie miar . To jeden z najlepszych sposobów opracowywania obliczeń w języku DAX. Zaczynasz od prostych lub podstawowych miar i tworzysz złożone obliczenia.
Uważam, że rozgałęzianie miary jest jedną z najlepszych technik pisania przejrzystego kodu. Znacznie ułatwia debugowanie złożonych obliczeń, ponieważ poszczególne komponenty można łatwo dodać do tabeli sprawdzania poprawności na stronie roboczej.
Rzućmy okiem na poniższy przykład. Moją podstawową miarą jest tutaj Łączna liczba przesyłek, która jest prostym LICZNIKIEM. Mogę przejść do Przesyłek o standardowym poziomie usług, co jest prostym OBLICZENIEM przy użyciu miary opartej na Łącznej liczbie przesyłek.
9 – Użyj opcji FORMAT/OGÓLNE do wizualnego określania rozmiaru lub odstępów
Jestem wielkim zwolennikiem spójności i często stwierdzam, że konsumenci raportu komentują najpierw małe różnice w wyrównaniu rozmiaru lub odstępach, a nie dane. Tak więc jednym z najlepszych sposobów osiągnięcia tego celu jest użycie sekcji Ogólne w okienku Format w celu ustawienia określonych wartości pikseli dla X, Y, szerokości i wysokości na wielokrotności 10. Zapewnia to spójność i myślę, że wygląda to lepiej.
Weźmy jako przykład tę kartę Przesyłki morskie . Oczywiście ma inne ustawienie rozmiaru niż karta Przesyłki lotnicze.
Jeśli rozwinę okienko Wizualizacje do okienka Format i otworzę sekcję Ogólne, zobaczymy, że X, Y, szerokość i wysokość są ustawione jako wielokrotności 10.
10 – Rozwój od pierwszego stołu
Ostatnim, ale nie najmniej ważnym elementem jest programowanie na pierwszym miejscu . Jedną z najczęściej pomijanych prawd dotyczących wielu elementów wizualnych w usłudze LuckyTemplates jest to, że tak naprawdę są to po prostu tabele renderowane na różne sposoby.
Sam wielokrotnie wspominał w swoich samouczkach, że jednym z najlepszych sposobów zapewnienia, że wizualizacja przedstawia żądane dane, jest utworzenie najpierw tabeli, która wyświetla ją poprawnie. Następnie utwórz kopię tabeli i zmień typ wizualny kopii na żądany typ, taki jak wykres słupkowy lub warstwowy.
Projektowanie usługi LuckyTemplates — najlepsze wskazówki dotyczące pulpitów nawigacyjnych
Wskazówki dotyczące projektowania raportów usługi LuckyTemplates — najlepsze praktyki
3 najważniejsze wskazówki dotyczące organizowania modeli usługi LuckyTemplates
Wniosek
To tyle, jeśli chodzi o moje 10 najlepszych sprawdzonych metod tworzenia raportów usługi LuckyTemplates oraz trzy ulubione opcje. Zalecam wypróbowanie wszystkich tych technik podczas tworzenia własnych raportów.
Mam nadzieję, że będzie to pomocne w Twojej podróży z usługą LuckyTemplates. Sprawdź poniższe linki, aby uzyskać więcej powiązanych treści
Wszystkiego najlepszego!
Greg
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.