Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku pokażemy szczegółowy przykład, dlaczego zawsze musimy używać Edytora zapytań w usłudze LuckyTemplates i co możemy osiągnąć, korzystając z niego.
Za najlepszą praktykę uważa się, aby zawsze najpierw wprowadzać dane do Edytora zapytań.
Pokażemy to i udowodnimy, przeglądając kilka przykładów i problemów, które możemy napotkać, oraz sposób, w jaki dane będą wyglądać, gdybyśmy nie korzystali z Edytora zapytań.
Spis treści
Dlaczego zawsze musisz używać edytora zapytań w LuckyTemplates
Możemy teraz zaimportować te dane do naszego modelu danych, klikając opcję Pobierz dane . Ta opcja ułatwia importowanie plików w naszym modelu danych. Jednak tak naprawdę nie zalecamy tego robić, ponieważ zawsze powinniśmy najpierw oczyścić i zoptymalizować nasze dane w Edytorze zapytań .
Aby pokazać przykład, dlaczego wprowadzanie naszych danych bezpośrednio do naszego modelu danych nie jest dobrym pomysłem, zaimportujmy przykładowy plik, klikając Pobierz dane i kliknij skoroszyt programu Excel .
W tym przykładzie użyjemy tego przykładowego pliku danych programu Excel dotyczącego operacji produkcyjnych . Kliknij dwukrotnie plik, aby przenieść go do naszego modelu danych.
W Nawigatorze wybierzemy tę tabelę Operation_Data i klikniemy przycisk Załaduj .
Następnie natychmiast zatwierdzi naszą tabelę do naszego modelu danych. W tym miejscu możemy napotkać kilka problemów. Dzieje się tak, ponieważ zatwierdzenie pliku danych, który nie jest jeszcze zoptymalizowany, może zawierać błędy, których nie byliśmy w stanie dostosować ani naprawić przed osiągnięciem naszego modelu danych.
Możemy go po prostu zamknąć, klikając przycisk Zamknij .
Następnie będzie nadal zatwierdzać te niezoptymalizowane dane z błędami w naszym modelu danych.
Patrząc na te dane w naszej tabeli danych, możemy zobaczyć, jak masywna jest ta tabela. Nie tak chcemy, aby nasze dane były w naszym LuckyTemplates. Prawdopodobnie jest też wiele zbędnych kolumn lub informacji, których nie potrzebujemy w tej tabeli, które należy najpierw usunąć. Chcemy mieć zoptymalizowane i czyste tabele, aby móc zbudować model wokół naszych danych.
To tylko niektóre z wielu powodów, dla których zawsze powinniśmy najpierw wprowadzać nasze dane do Edytora zapytań.
Transformacja danych za pomocą edytora zapytań w usłudze LuckyTemplates
Ten inny przykładowy arkusz kalkulacyjny wygląda nieporządnie z perspektywy usługi LuckyTemplates. Jeśli spojrzymy na to, nie ma nic dobrego, co moglibyśmy zrobić w LuckyTemplates z tymi wszystkimi minitabelami, zbędnymi tytułami i kilkoma nieistotnymi informacjami. Tak więc najpierw musimy wprowadzić to do Edytora zapytań. Następnie spróbuj zoptymalizować i wyczyścić.
Pokażę ci, jak skutecznie wyczyścić ten arkusz kalkulacyjny lub arkusz kalkulacyjny, nakładając na siebie przekształcenia. Ponownie, nie przenoś danych bezpośrednio do naszej usługi LuckyTemplates. Zawsze najpierw przekształcaj lub czyść dane w Edytorze zapytań.
Aby otworzyć Edytor zapytań, po prostu kliknij opcję Przekształć dane .
W Edytorze zapytań zaimportuj plik, klikając Nowe źródło . Następnie wybierz typ pliku, o który chcesz zapytać. W tym przykładzie klikniemy skoroszyt programu Excel , ponieważ chcemy wysłać zapytanie do arkusza kalkulacyjnego lub pliku arkusza.
Następnie wybierz plik, do którego chcesz wysłać zapytanie. W tym przykładzie wyślemy zapytanie do pliku programu Excel w telefonie iPhone6 .
Musimy wyczyścić cały arkusz, więc wybierzemy Arkusz1 i klikniemy przycisk OK .
Następnie zobaczymy wszystkie te zbędne kolumny, informacje i wartości null, które musimy wyczyścić. To świetny przykład pokazujący, co możemy osiągnąć w Edytorze zapytań. W kolejnych krokach wyczyścimy i zoptymalizujemy tę tabelę.
Najpierw zmieńmy nazwę naszej tabeli. W sekcji Właściwości zmień nazwę tej tabeli na Sales Data .
Następnie możemy rozpocząć czyszczenie tego arkusza kalkulacyjnego na wiele różnych sposobów iw różnych kolejności. W tym samouczku zaczniemy od usunięcia wartości null.
1. Usuwanie wartości zerowych
Możemy łatwo usunąć wartości puste, klikając ikonę strzałki w dół przy kolumnach z wartościami pustymi.
Następnie odznacz (null) w opcji Filtry i kliknij przycisk OK .
Teraz zobaczymy, że wartości null zniknęły.
2. Usuwanie zbędnych informacji
Następną rzeczą, którą możemy zrobić, to usunąć zbędne informacje w tych wierszach naszej tabeli. Obecnie mamy ItemNumber , ProductName , ClassificationGroup i pewien zakres dat. Usuniemy te powtórzenia i zamiast tego przeniesiemy pierwszy wiersz do nagłówka.
Aby to zrobić, kliknij kartę Przekształć . Następnie wybierz opcję Użyj pierwszego wiersza jako nagłówków .
W rezultacie te elementy stały się naszymi rzeczywistymi nagłówkami, czyli tym, czym powinny być.
Następnie możemy teraz usunąć te same elementy z naszych wierszy, odznaczając je w naszych filtrach . W przypadku kolumny ItemNumber możemy odznaczyć opcję ItemNumber w jej filtrach.
Zaletą tego jest to, że automatycznie ukrywa wszystkie te konkretne elementy przed innymi sąsiednimi kolumnami w tych wierszach. Jak widać, te zbędne elementy w innych kolumnach również zniknęły. Mamy teraz czystszą tabelę danych.
3. Odwracanie kolumn w usłudze LuckyTemplates
Kolejną rzeczą, którą możemy tutaj naprawić, są kolumny z wieloma datami. Zamiast tego możemy umieścić je w jednej kolumnie. Możemy to zrobić przez odwrócenie kolumn .
Najpierw wybierz kolumny, których nie chcemy cofnąć. Następnie kliknij prawym przyciskiem myszy ostatnią wybraną kolumnę i wybierz opcję Unpivot Other Columns .
Mamy teraz nasze daty w jednej kolumnie, a kwotę sprzedaży również w innej kolumnie.
Możemy teraz zmienić nazwy tych kolumn na Dates i Sales Amount .
Kliknij ikonę typu danych po lewej stronie kolumny Kwota sprzedaży . Następnie zmień jego typ danych na Liczba całkowita .
Podobnie kliknij ikonę typu danych po lewej stronie kolumny Daty . Następnie zmień jego typ danych na Date .
4. Usuwanie błędów w edytorze Power Query
W niektórych przypadkach możemy napotkać błędy podczas czyszczenia naszych danych. W tym przykładzie mamy błędy w kolumnach Daty .
Wynika to z posiadania wartości tekstowych przed zmianą typu danych kolumn na Date . Jak pokazano na poniższym przykładzie, w kolumnie Data znajduje się podsumowanie informacji .
Możemy łatwo usunąć te błędy, klikając prawym przyciskiem myszy naszą kolumnę Daty i wybierając opcję Usuń błędy .
W rezultacie usunie wszystkie te błędy, więc nie będziemy ich już mieć na naszym stole. Nasz stół jest teraz znacznie czystszy.
5. Przekształcenie zapytania w rzeczywistą tabelę
Na koniec musimy przekształcić je z zapytania w rzeczywistą tabelę i zatwierdzić. Po prostu kliknij opcję Zamknij i zastosuj na karcie Strona główna .
Mamy teraz idealną i zoptymalizowaną tabelę dla LuckyTemplates. Ta tabela wygląda świetnie pod względem uruchamiania wszystkich naszych formuł i wzorców języka DAX.
Wniosek
Podsumowując, wzięliśmy brzydki arkusz danych i przekształciliśmy go w udoskonaloną tabelę, która jest doskonale zoptymalizowana pod kątem usługi LuckyTemplates. Możemy teraz zbudować wokół niego model.
Mamy nadzieję, że ten samouczek wyjaśnił, co możemy osiągnąć za pomocą Edytora zapytań w usłudze LuckyTemplates i dlaczego zawsze powinniśmy najpierw przenosić nasze dane do Edytora zapytań. Nawet jeśli mamy tylko małą tabelę, może być coś tak małego, jak zmiana nazwy kolumny lub typu danych kolumny. Chcielibyśmy najpierw przyzwyczaić się do robienia rzeczy w Edytorze zapytań, abyśmy mogli pracować z różnymi transformacjami i procedurami czyszczenia, aby rozpocząć optymalizację naszych danych.
Wszystkiego najlepszego,
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.