Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku omówię cztery ukryte pułapki w usłudze LuckyTemplates, które mogą zniszczyć model danych i/lub raport. Pokażę Ci nie tylko, jak uniknąć tych problemów podczas tworzenia raportów LuckyTemplates, ale także jak stworzyć kompleksowy szablon, który skutecznie poradzi sobie z nimi wszystkimi i przyspieszy rozwój LuckyTemplates. Możesz obejrzeć pełny film z tego samouczka na dole tego bloga.
Spis treści
4 jeźdźców apokalipsy LuckyTemplates w tworzeniu raportów LuckyTemplates
Automatyczne wykrywanie relacji
Pierwszą pułapką podczas tworzenia raportów usługi LuckyTemplates jest automatyczne wykrywanie relacji . Spowoduje to przeniesienie podejmowania decyzji dotyczących modelowania danych z poziomu oceny i wiedzy specjalistycznej do zautomatyzowanego procesu w ramach usługi LuckyTemplates. Myślę, że Microsoft powinien przywrócić Clippy z lat 90., aby przynajmniej dać ci uczciwe ostrzeżenie i pozwolić ci zatwierdzić, czy chcesz, aby robili coś z twoim modelem danych, czy nie.
To jest prawdziwy przykład z pracy, którą moja przyjaciółka wykonywała w ramach wyzwania danych 15. Umieściła tę tabelę Total Wins w nowszym modelu danych i zapomniała wyłączyć Relacje automatycznego wykrywania.
W rezultacie zbudował w tej tabeli trzy relacje niewłaściwego typu w niewłaściwym kierunku i dodał relacje dwukierunkowe zamiast relacji jednokierunkowych. Stworzyło to wiele niejasności w jej modelu i podważyło dokładność jej DAX-a.
Jeśli to nie mówi ci, że powinieneś to wyłączyć, nie jestem pewien, co to zrobi. Ponadto, jeśli masz włączone automatyczne wykrywanie relacji i umieszczasz w swoim modelu odłączoną tabelę, na przykład wartości zbioru dla krajalnicy, ale nie chcesz, aby była połączona z modelem danych, automatycznie połącz je i zasadniczo pozbądź się bezużytecznego odłączonego elementu tej tabeli, który próbowałeś osiągnąć.
Automatyczna data/godzina
Drugą rzeczą, o której chcę porozmawiać, jest Auto Date/Time . Myślę, że jest to funkcja, która miała pomóc początkującym, którzy nie byli świadomi zawiłości dedykowanych tabel dat.
Ta funkcja tworzy pojedynczą tabelę dat dla każdej z dat i model danych po jednej stronie relacji jeden-do-wielu. Może więc w niektórych przypadkach utworzyć pięć lub sześć różnych tabel dat w twoim modelu. Oznacza to również, że jest tworzony w taki sposób, że musisz radzić sobie z datami w dziwnym formacie hierarchicznym. Nie tylko zaśmieca model, ale utrudnia pracę z nim.
Przejdźmy więc do usługi LuckyTemplates. Zamierzamy utworzyć plik szablonu, wyłączyć wszystkie te funkcje w szablonie, a następnie zapisać ten szablon z innymi funkcjami. Możemy to otworzyć za każdym razem, gdy odtworzymy nowy raport i zignorujemy tych czterech jeźdźców.
Teraz, jeśli przejdziemy do Opcji i Ustawień, zobaczysz w Globalnym, że nie ma sposobu, aby wyłączyć automatyczne wykrywanie relacji. Jedynym sposobem na wyłączenie tego jest ładowanie danych w bieżącym pliku. Tak więc, jeśli nie tworzysz szablonu, musisz to wyłączyć za każdym razem. A jeśli nie pamiętasz, stworzy to niektóre z tych złych relacji.
Więc wyłącz to, a także automatyczną datę / godzinę. Ponadto upewnij się, że opcja Wykrywanie typów kolumn i nagłówków dla źródeł nieustrukturyzowanych jest również wyłączona, co w Power Query może powodować problemy, szczególnie w przypadku plików CSV, ponieważ ocenia tylko na podstawie pierwszych kilkuset wierszy. Ponownie podejmuje złe decyzje, które potencjalnie mogą powodować problemy podczas tworzenia raportów usługi Power BI.
Możesz także wyłączyć automatyczną datę/godzinę na całym świecie, co oznacza, że pokonaliśmy pierwszych dwóch jeźdźców tuż za bramą.
Idąc dalej, umieścimy tabelę dat w naszym szablonie. Tabela dat, której używam, to niesamowita tabela rozszerzonych dat Melissy, którą można znaleźć na forum LuckyTemplates.
Teraz przechodzimy do LuckyTemplates, przechodzimy do Strona główna, Nowe źródło, a następnie Puste zapytanie . Następnie, jeśli przejdziemy do Edytora zaawansowanego, możemy wkleić kod tabeli Extended Date.
I w tym momencie musimy podjąć decyzję. Ponieważ używamy szablonu, nie wiemy, jak będzie wyglądać tabela faktów. W każdym raporcie będzie inaczej.
I tak, jeśli twoje tabele faktów mają zwykle dość stały czas trwania, możesz utworzyć dynamiczną datę początkową i końcową dla tabeli dat. Jednak to, co zwykle robię w tej sytuacji, to po prostu używam roku, o którym wiem, że nie jest poprawny, ale wiem, że jeśli zapomnę wejść i zmienić rzeczy, da mi to naprawdę dziwne rezultaty. Następnie pobudzi moją pamięć i przypomni mi, żebym wszedł i dopasował daty w mojej tabeli dat do mojej tabeli faktów.
Więc w tym przykładzie wstawię tutaj 1950. Zawsze chcemy używać pełnego roku w naszej tabeli dat, więc wstawię ją do końca 1950 roku. Załóżmy, że rok podatkowy zaczyna się 1 lipca.
Następnie klikamy Invoke, a ona buduje dla nas tę tabelę Date. Później, gdy poznamy kształt czasu trwania naszych tabel faktów, po prostu wejdziemy tutaj i zmienimy te daty. Zaktualizuje tabelę dat, aby pasowała do tych czasów trwania.
Oznaczanie tabel dat podczas tworzenia raportów usługi LuckyTemplates
Teraz chcę porozmawiać o tabelach dat znakowania . To jeden z innych jeźdźców, z którymi jeszcze nie mieliśmy do czynienia. W tabeli dat możesz to zrobić w widoku modelu lub w widoku tabeli. Zwykle robię to w widoku tabeli.
Poprosi Cię o podanie pola, które chcesz zweryfikować. W rozszerzonej tabeli dat będzie to zawsze pole Data .
Po naciśnięciu przycisku sprawdzania poprawności wykonuje kolejno sześć czynności. Potwierdza, że pole Data zawiera unikatowe wartości, że nie zawiera wartości pustych, że zawiera ciągłe wartości dat oraz że jeśli jest to pole typu Data/godzina (które w tym przypadku nie jest, jest to pole typu Data). Gdyby było to pole Data/Godzina, potwierdziłoby to, że ma ten sam znacznik czasu dla każdego wpisu tej daty.
Co więcej, pozbywa się automatycznych hierarchii dat, o których mówiłem wcześniej. Pozwala również na prawidłowe działanie niektórych funkcji, które oczekują ciągłej, zweryfikowanej daty w ramach funkcji inteligencji czasowej. W niektórych przypadkach funkcje te nie będą działały poprawnie bez odpowiednio oznaczonej tabeli dat oraz zweryfikowanego pola daty.
Tak więc oznaczanie tabeli dat robi wszystkie te dobre rzeczy i robimy to w szablonie. Nawet jeśli zmienimy czas trwania daty początkowej i końcowej, nadal pozostanie ona zaznaczoną tabelą dat.
Automatyczne podsumowanie
Ostatnią rzeczą, którą chcemy zrobić, jest Automatyczne podsumowanie .
Ostatnią rzeczą, którą chcemy zrobić, jest Automatyczne podsumowanie . Jeśli przejdziemy do naszego widoku pola, zobaczymy znaki sumowania obok wszystkich naszych pól liczbowych. Zobaczysz w Narzędziach kolumn, że umieszcza sumę sumy obok wszystkich. Zakłada, że wie, co chcemy z nimi zrobić.
To prowadzi do kwestii miar niejawnych i jawnych. Ponownie nie chcesz przekazywać tego procesu decyzyjnego do usługi LuckyTemplates, jeśli chcesz tworzyć jawne miary, i chcesz wyłączyć te funkcje Sum. W natywnej usłudze LuckyTemplates nie ma możliwości wyłączenia ich wszystkich jednocześnie.
Następnie masz żmudne zadanie przejrzenia każdego z nich, do którego dodano to podsumowanie, i przejścia do narzędzi kolumn, a następnie kliknięcia Nie podsumowuj . Kiedy to zrobisz, zobaczysz, że usuwa znak sumowania.
Zauważysz jednak, że ta tabela dat zawiera wiele takich automatycznych podsumowań. Możesz się zastanawiać, czy istnieje prostszy sposób na zrobienie tego. Odpowiedź brzmi: tak, jest – możesz użyć Tabular Editor 3 (TE3).
Zamierzamy skorzystać z zaawansowanego trybu skryptowego w TE3, aby po prostu wyłączyć to wszystko naraz. W tym celu przechodzimy do Macros a następnie klikamy na Turn off Summarization for Entire Model . Zobaczysz, że jest to po prostu stosunkowo krótki skrypt C-sharp.
Następnie wracamy do TOM Explorera, klikamy nasz model danych, klikamy prawym przyciskiem myszy Makra, a następnie klikamy Wyłącz podsumowanie dla całego modelu. A to wyłączyło podsumowanie dla całej naszej tabeli dat za pomocą zaledwie kilku kliknięć. To po prostu niesamowita funkcja w TE3.
Oprócz tych czterech jeźdźców musisz zrobić jeszcze jedną ważną rzecz. Musisz ukryć kluczowe pola po stronie tabeli faktów relacji. Aby to zrobić, musisz przejść przez nie indywidualnie i ukryć każdy z nich w natywnym LuckyTemplates. Ale możesz także napisać skrypt do TE3 i za pomocą zaledwie dwóch kliknięć wszystko zostanie wykonane poprawnie w twoim szablonie.
Po znokautowaniu tych czterech jeźdźców, ułatwiamy sobie życie z punktu widzenia rozwoju, pod względem motywów i tła. Możesz stworzyć coś takiego – szablon z logo Twojej firmy, kolorem tła itp. Następnie możesz zapisać go jako szablon PBIT, a nie jako plik PBX. Kiedy otworzysz ten plik, uzyskasz dobre miejsce startowe dla swojego projektu ze wszystkimi czterema jeźdźcami wyłączonymi i „pokonanymi”.
Najlepsze praktyki dotyczące opracowywania raportów usługi LuckyTemplates
Najlepsze praktyki usługi LuckyTemplates dotyczące raportów i wizualizacji
Modelowanie danych w usłudze LuckyTemplates: porady i najlepsze praktyki
Wniosek
Na tym blogu pokazałem Ci cztery ukryte pułapki w LuckyTemplates, jak ich uniknąć, oraz więcej wskazówek dotyczących szybkiego i łatwego tworzenia raportów. Mamy nadzieję, że daje to trochę do myślenia i pokazuje, jak skonfigurować podobny szablon i uniknąć niektórych z tych głównych pułapek podczas tworzenia raportów usługi LuckyTemplates .
Dzięki!
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.