Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
LuckyTemplates to potężne narzędzie do wizualizacji danych i analizy biznesowej, które umożliwia użytkownikom łączenie się z różnymi źródłami danych, tworzenie interaktywnych raportów i pulpitów nawigacyjnych oraz udostępnianie ich innym osobom. W dzisiejszym blogu przyjrzymy się najpotężniejszemu wywołaniu funkcji w usłudze LuckyTemplates.
To wywołanie funkcji znacznie rozszerzy możliwości usługi LuckyTemplates i przeniesie wizualizację i analizę danych na wyższy poziom. Pozwoliłoby to podnieść możliwości analityczne usługi LuckyTemplates o kilka stopni i robić niesamowite rzeczy w kontekście struktury usługi LuckyTemplates. Możesz obejrzeć pełny film z tego samouczka na dole tego bloga.
Spis treści
Wywołanie funkcji zestawu danych w usłudze LuckyTemplates: przegląd problemów
Ten przykładowy problem pochodzi z witryny o nazwie Excel BI Nightly Power Query Challenge , którą prowadzi VJ Verma. Każdej nocy zgłasza problem, a społeczność go rozwiązuje i dyskutuje między członkami.
W przykładzie pytanie ma bardzo prostą konstrukcję z podanymi górnymi i dolnymi granicami. Pomiędzy tymi dwiema liczbami musimy obliczyć liczbę liczb pierwszych w tym zakresie.
Chociaż koncepcja jest dość prosta i bezpośrednia, o wiele trudniej jest ją zaimplementować w usłudze LuckyTemplates. To dlatego, że wśród 800 funkcji M i około 400 nie ma funkcji, która bezpośrednio pozwala nam określić, czy liczba jest liczbą pierwszą w usłudze LuckyTemplates.
Zamiast tego zagłębimy się w wywołanie zestawu danych , które jest sposobem na przejście z Power Query do R lub Pythona, wykonanie instrukcji, a następnie bezproblemowy powrót do Power Query i kontynuowanie naszej analizy.
Weźmy dane z wyzwania Excel BI i zacznijmy działać.
Zmiana typu danych
Poniżej pokazano dolną i górną granicę.
Te dane są w formacie tekstowym i musimy je zamienić na liczby całkowite. Aby to zrobić, kliknij dwukrotnie wiersz nagłówka ( dolny limit lub górny limit) . W opcjach, które się pojawią, wybierz Zmień typ , a następnie wybierz opcję Liczba całkowita.
Następnym krokiem jest utworzenie nowej kolumny dla wszystkich liczb między dolną a górną granicą. Następnie przestawimy kolumnę, aby utworzyć listę.
Przejdź do zakładki Dodaj kolumnę i wybierz Kolumnę niestandardową , ponieważ nie ma możliwości zrobienia tego bezpośrednio przez interfejs użytkownika.
Utwórz prosty kod M i utwórz kolumnę o nazwie Liczba. Użyj funkcji List.Numbers , która zwraca listę liczb z podaniem wartości początkowej, liczby i opcjonalnej wartości przyrostowej.
Ustaw wartość początkową jako [Dolna granica] i liczbę jako [Górna granica] – [Dolna granica] + 1, aby uwzględnić punkt N. Upewnij się, że nie został wykryty żaden błąd składniowy. Kliknij OK.
Powinna pojawić się nowa kolumna z Listami. Kliknij listę , aby zobaczyć liczby w zakresie na dole.
Na przykład, jeśli klikniemy listę w pierwszym wierszu, otrzymamy listę zawierającą liczby od 10 do 45.
Kliknij strzałkę obok opcji Numer i kliknij opcję Rozwiń do nowych wierszy.
Następnie kliknij ikonę formatu po lewej stronie numeru i zmień format na liczbę całkowitą.
W tym momencie chcemy ustalić, czy każda z tych liczb jest pierwsza, czy nie. Ponownie nie ma możliwości zrobienia tego bezpośrednio w usłudze LuckyTemplates. Moglibyśmy zaprogramować serię kroków, które określiłyby liczby pierwsze, ale oto prostszy sposób na zrobienie tego w Pythonie.
Pakiet liczb pierwszych R
W R istnieją różne pakiety . Są to dodatki, które możemy wbudować w program w celu realizacji określonych funkcji, równoważnych z niestandardowymi wizualizacjami lub narzędziami zewnętrznymi w usłudze LuckyTemplates.
METACRAN przedstawia katalog wszystkich zatwierdzonych pakietów R. Istnieje ponad 18 800 aktywnych pakietów w języku R, ale możemy również załadować je bezpośrednio ze strony dewelopera. Oznacza to, że możemy wykonać dowolną analizę w ramach programu, znajdując odpowiedni pakiet.
W naszym przypadku będziemy szukać i próbować znaleźć coś, co określi, czy liczba jest pierwsza.
Wpisz prime w polu wyszukiwania.
Wybierz pierwszy pakiet o nazwie primes – Fast Functions for Prime Numbers . Jest to pakiet, który sprawdza, czy liczba jest liczbą pierwszą i generuje sekwencję liczb pierwszych.
Wstawianie pakietu R Prime przy użyciu wywołania funkcji zestawu danych w usłudze LuckyTemplates
Wróć do LuckyTemplates i kliknij Uruchom skrypt R na wstążce .
Pojawi się kreator Run R Script .
Znak krzyżyka (#), który jest wskaźnikiem komentarza, mówi, że zmienna „ dataset” zawiera dane wejściowe dla skryptu. Pozwala nam czyścić, porządkować i kształtować nasze dane, a także dodawać kolumny i obracać elementy. Jak tylko wywołamy dataset , wszystko, co zrobiliśmy do tego momentu, zostanie wprowadzone do R. To samo dotyczy Pythona – zestaw danych działa tak samo.
Możemy wykorzystać całą naszą wiedzę na temat Power Query i wykonać tam całe nasze kształtowanie przed wywołaniem R. Jest to bardzo pomocne, ponieważ nie musimy uczyć się żadnych funkcji R, które robią to samo, co w Power Query. Zasadniczo możemy przejść bezpośrednio do części analitycznej, którą dzisiaj zademonstrujemy.
Zacznijmy od zainstalowania pakietu . Możemy użyć polecenia install.packages , ale w tym przypadku użyjemy biblioteki .
Wpisz bibliotekę i wywołaj pakiet liczb pierwszych . Jest to równoznaczne z przeniesieniem niestandardowej wizualizacji w usłudze LuckyTemplates z usługi AppSource.
Następnie utwórz tabelę o nazwie df dla ramki danych i przypisz do niej tabelę zestawu danych .
W Power Query nasz zestaw danych składa się ze wszystkiego, od źródła do zmienionego typu 1 i właśnie to przypisaliśmy df.
Utwórz nową kolumnę odpowiadającą kolumnie obliczeniowej w usłudze LuckyTemplates, wpisując df$isprime . Zwróć uwagę, że znak dolara ( $ ) w R jest podobny do nawiasów kwadratowych w usłudze LuckyTemplates.
Isprime będzie naszą nazwą kolumny i przypiszemy do niej funkcję is_primes z pakietu liczb pierwszych . Następnie wywołamy kolumnę Number z df .
To pobiera kolumnę liczbową i przepuszcza ją przez funkcję is_prime , aby powiedzieć PRAWDA, jeśli liczba jest liczbą pierwszą, i FAŁSZ w przeciwnym razie. Następnie funkcja wstawi wartość PRAWDA lub FAŁSZ w kolumnie isprime w tabeli df .
Na koniec wywołaj tabelę df . Kliknij OK.
Widzimy, że df pojawia się w okienku Zastosowane kroki . Po kliknięciu na nią powinniśmy zobaczyć kolumnę isprime zawierającą klasyfikację PRAWDA lub FAŁSZ.
Filtrowanie liczb pierwszych
Następnie usuniemy wiersze dla liczb, które nie są liczbami pierwszymi. Kliknij strzałkę obok isprime , aby otworzyć filtr. Odznacz FAŁSZ , abyśmy mogli policzyć liczby pierwsze.
Kliknij OK, a następnie przejdź do zakładki Strona główna i wybierz opcję Grupuj według .
Otwórz opcję Zaawansowane . W wyskakującym oknie pogrupuj według dolnego limitu i dodaj grupę dla górnego limitu. Następnie utwórz kolumnę o nazwie Count i ustaw Count Rows jako operację zliczania liczby PRAWDA. Kliknij OK.
To da wynik podobny do tego z wyzwania.
Tworzenie stale aktualizowanego praktycznego zestawu danych w usłudze LuckyTemplates
Trzy sposoby używania skryptu języka R w usłudze LuckyTemplates
R dla usługi LuckyTemplates | Przewodnik dla początkujących
Wniosek
Podsumowując, wywołanie zestawu danych jest najpotężniejszym wywołaniem funkcji w usłudze LuckyTemplates i jest cennym narzędziem dla każdego użytkownika, który chce uzyskać wgląd w swoje dane. To pojedyncze, proste wywołanie funkcji usługi LuckyTemplates pozwala radykalnie rozszerzyć możliwości analityczne programu, dosłownie udostępniając setki tysięcy dodatkowych funkcji na wyciągnięcie ręki z poziomu dodatku Power Query.
Wiedząc, jak prawidłowo korzystać z tej funkcji, można łatwo manipulować i analizować duże zestawy danych, co prowadzi do bardziej efektywnych i bogatych w informacje wizualizacji. Dzięki spostrzeżeniom uzyskanym dzięki tej funkcji będziesz w stanie podejmować decyzje na podstawie danych i poprawić ogólne zrozumienie swoich danych.
Wszystkiego najlepszego,
Brian Juliusz
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.