Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku omówiono typowy problem z analizą czasu dotyczący tworzenia tabeli kalendarza usługi LuckyTemplates zawierającej tylko dni wolne. Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
W przypadku analizy czasowej tworzenie stołu świątecznego jest dziwnym tematem na początek, ale jest jednym z podstawowych wymagań, aby rozszerzyć standardową tabelę dat.
Istnieją trzy sposoby, aby tabela kalendarza usługi LuckyTemplates zawierała tylko dni wolne.
Spis treści
Sposoby tworzenia świątecznego stołu
Oto różne sposoby tworzenia stołu świątecznego w usłudze LuckyTemplates.
1. Skorzystaj z czyjegoś świątecznego stołu
Pierwszym jest po prostu skorzystanie z czyjegoś świątecznego stołu.
Istnieje witryna internetowa z publicznymi zestawami danych, zwana Kaggle , której można używać w różnych projektach lub do tworzenia tabeli wymiarów.
Na tej stronie można znaleźć zestaw danych o świętach federalnych z lat 1966-2020.
Jeśli znajdziesz potrzebny przedział czasu, możesz go pobrać do dodatku Power Query .
Oto jak to zrobić:
Najpierw przejdź do Get Data , a następnie do Text/CSV .
Następnie wyciągnij plik i kliknij Przekształć dane .
Następnie wyświetli indeks, datę i święto, czyli to, czego potrzebujesz na świątecznym stole.
Zauważ, że w kolumnie Data są 484 różne daty, ale tylko 483 unikalne. Stół świąteczny, podobnie jak stół daty , wymaga, aby wszystkie jego wpisy były unikalne . Więc może być podwójne święto.
Można to zmienić, klikając Daty, a następnie Usuń duplikaty .
Dzięki temu będziesz mieć tylko unikalne rekordy.
Tabela indeksów nie jest konieczna, w przeciwieństwie do Date i Holiday. Możesz go po prostu ukryć za pomocą opcji Wybierz kolumny , a następnie odznacz pole indeksu.
Masz teraz nowy stół.
Zmień nazwę na „ usholidays 1966-2020 ”, naciśnij Enter, a następnie naciśnij Apply .
2. Pobieranie danych z Internetu
Drugie podejście polega na pobieraniu danych z sieci.
Najpierw znajdź stronę internetową, taką jak Calendarpedia , która zawiera datę, święto i dzień tygodnia.
Następnie wróć do Power Query, wybierz New Source , a następnie Web .
Następnie wprowadź adres URL witryny w odpowiednim miejscu.
Następnie wyświetli żądane informacje, podobne do tych, które widzisz w Tabeli 1.
Wyniki zostaną pobrane i pokazane, ale wymagają trochę czyszczenia, ponieważ nie ma nagłówków. W pierwszym i ostatnim wierszu znajdują się niepotrzebne dane. Możesz również zobaczyć, że istnieje „zaobserwowany” problem.
Oto jak to naprawić:
Najpierw przejdź do Usuń wiersz i wybierz Usuń górne wiersze .
Następnie przejdź do Użyj pierwszego wiersza jako nagłówków .
Wpisz „1”, aby usunąć pierwszy wiersz, i kliknij OK.
Następnie zmień nagłówek z Federal Holiday na Holiday , aby tabela miała taki sam format jak tabela 1966-2020. Następnie upewnij się, że kolumna Data ma format daty.
Po tych zmianach usuń jeden rząd od dołu.
W tabeli widać, że są święta takie jak 4 i 5 lipca. W takim przypadku weekendy nie są konieczne, więc będziesz musiał usunąć je ze stołu.
Aby je usunąć, kliknij przycisk rozwijany w kolumnie Dzień tygodnia, odznacz weekendy, a następnie kliknij OK.
Przejdź do Święta, wybierz Zastąp wartości, a następnie zamień znacznik „(obserwowane)” na nic. To samo dotyczy gwiazdki w Dniu Prezydenta.
Następnie przejdź do Wybierz kolumny .
Odznacz dzień tygodnia.
Na koniec zmień nazwę zapytania „ Wakacje 2021 ”.
Możesz uruchomić ten sam proces, jeśli potrzebujesz roku lub dwóch. Jeśli będziesz dużo prognozować i chcesz uzyskać daty od 2021 do 2029, będziesz musiał powtórzyć więcej niż jeden raz.
3. Zrób skrobak do sieci
Ostatnim podejściem jest stworzenie skrobaka internetowego, który automatycznie pobiera te dane ze strony, którą już wciągnąłeś na 2021 rok.
Najpierw przejdź do New Source i wybierz Blank Query .
Następnie przejdź do Edytora zaawansowanego .
W polu Źródło określ liczbę lat, które chcesz uwzględnić w zapytaniu. Spróbuj wpisać 2021-2029, a jeśli nie ma błędów, kliknij Gotowe .
Spowoduje to utworzenie kolumny z listami lat, które chcesz pobrać.
Następnie przekonwertuj to na tabelę i kliknij OK .
Po przekonwertowaniu go na tabelę zmień nagłówek na Year, a nazwę zapytania na Holiday Grab.
Następnie przejdź do zapytania Holiday 2021 i kliknij Edytor zaawansowany, aby przekształcić go w funkcję.
Zamiast chwytać jedną stronę, możesz przejść do „(Rok jako numer) jako tabela” i podać symbol funkcji „=>”.
Następnie, jeśli spojrzysz na adres URL, określa on 2021. Witryna powtarza swój wzorzec dla adresów URL z 2021, 2022 i tak dalej. Zamiast ustawiać ten wpis jako statyczny, zmień 2021 na „&Number.ToText(Year)&” .
Spowoduje to utworzenie parametru zamiast „2021”.
Następnie wprowadź rok, który chcesz pobrać, powiedzmy 2021, a następnie kliknij Invoke .
Automatycznie zostaje wciągnięty.
Teraz wróć do zapytania Holiday Grab, wybierz opcję Dodaj kolumnę i wybierz opcję .
Wybierz Wakacje 2021 jako zapytanie funkcyjne. Musisz także wybrać Rok . Po zakończeniu kliknij OK .
Jeśli pojawi się pytanie o prywatność, kliknij Kontynuuj .
Wybierz „Ignoruj sprawdzanie poziomów prywatności dla tego pliku” i kliknij Zapisz .
Teraz rozwiń datę i święto za pomocą przycisku rozwijania, a następnie kliknij OK .
Przejdź do Wybierz kolumny i odznacz Rok, aby wyjąć kolumnę Rok.
Zmień nagłówki tak, aby pasowały do tabeli z 1966 r.
Zmień również nazwę zapytania na Święta 2021-2029. Następnie zastosuj zmiany zapytania.
Teraz przejdź do Dołącz zapytania i wybierz Dołącz zapytania jako nowe .
Ustaw „Święta 2021-2029” jako tabelę podstawową i „wakacje 1966-2020” jako tabelę, aby dołączyć tabelę podstawową. Kliknij OK.
Kliknij Zamknij i Zastosuj po zakończeniu wprowadzania zmian.
Następnie spójrz na tabelę Append1 i zmień jej nazwę na Holiday.
Masz teraz tabelę kalendarza usługi LuckyTemplates dla dni wolnych . To jest teraz twoja ulepszona tabela dat z ponad 50-letnimi wakacjami.
Jak przenieść dane do MS Excel
Aby przenieść go z usługi LuckyTemplates do tabeli MS Excel, kliknij Święto, a następnie kliknij Kopiuj tabelę.
Wklej go do programu Microsoft Excel i zapisz jako stół świąteczny.
Istnieją inne sposoby wydobycia go z usługi LuckyTemplates. Możesz wyodrębnić go z DeckStudio, jeśli masz duży stół lub możesz go wyodrębnić z wizualizacji.
Wniosek
Oto trzy metody, które pomogą Ci stworzyć dobrą i wydajną tabelę kalendarza LuckyTemplates zawierającą dni wolne.
Każda metoda jest inna i niepowtarzalna, ale zapewnia wszystko, czego potrzebujesz do ulepszonej tabeli dat.
Wszystkiego najlepszego,
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.