Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku zademonstruję, w jaki sposób można przekształcić niechlujnie ułożone dane w bardziej uporządkowany format. Jest na to dość łatwy sposób, który będzie niezwykle użyteczny i ma wiele różnych zastosowań. Zamierzamy użyć modulo Power Query. Możesz obejrzeć pełny film z tego samouczka na dole tego bloga.
Moja żona zeszła do biura i powiedziała, że skopiowała kilka adresów z zaproszenia w kalendarzu i skończyło się na wklejeniu w tym formacie. Miała 28 adresów e-mail i nazwisk, które kończyły się w tego rodzaju dziwnym, ułożonym w stos formacie. Była to lista nazwisk z mnóstwem cytatów, przecinków, śmieci i adresów e-mail. Chciała wiedzieć, jak użyć dodatku Power Query, aby uzyskać lepszy format.
Przejdźmy więc do dodatku Power Query i zobaczymy surowe dane. Zachowajmy nienaruszone dane i po prostu odwołujmy się do nich. Ten plik referencyjny nazwiemy TestData .
Pierwszą rzeczą, którą zamierzamy zrobić, jest dodanie indeksu i dla tych celów tak naprawdę nie ma znaczenia, czy jest to indeks od zera, czy od jedynki. W tej demonstracji po prostu użyjemy indeksu od zera. Łatwo jest kliknąć bez konieczności przechodzenia przez inne opcje.
Będzie to wymagało obrotu, ponieważ przestawia pobiera wiersze i zamienia je w kolumny. W tym przypadku chcemy wziąć ten zestaw wierszy i przekształcić je w trzy kolumny – jedną dla imienia, jedną dla nazwiska i jedną dla adresu e-mail.
Zamierzamy obrócić te w kolumnach, ale musimy mieć sposób, aby przestawny wiedział, który element trafia do której kolumny. W tym miejscu pojawia się Power Query Modulo.
Spis treści
Obsługa skumulowanych danych za pomocą dodatku Power Query Modulo
Modulo daje nam resztę, gdy dzielimy określoną liczbę. Aby uzyskać dostęp do Modulo, przechodzimy do zakładki Dodaj kolumnę, następnie znajdziemy Standard, kliknij strzałkę rozwijaną i przewiń w dół.
Kiedy klikamy na Modulo, pojawia się wyskakujące okienko z pytaniem o liczbę kolumn, które chcemy. W tym przypadku potrzebujemy trzech kolumn.
Jeśli podzielimy trzy przez trzy, otrzymamy jedynkę z resztą zerową. Trzy do czterech daje resztę z jednego, trzy do pięciu daje resztę z dwóch, a potem trzy do sześciu daje nam resztę zerową. Tak więc tworzy ten ładny powtarzający się wzór, którego możemy użyć do naszego obrotu.
Ale zanim to zrobimy, wyczyśćmy dane. Możemy to zrobić na dwa sposoby. Jednym z nich jest to, że możemy po prostu zastąpić wartości. Na przykład w przypadku cytatów możemy po prostu umieścić tam cytat, a następnie zastąpić go niczym. Zajmie i wyczyści te cytaty.
Innym sposobem na zrobienie tego, kiedy wszyscy możemy to jednocześnie wyczyścić i zapisać kilka kroków, jest użycie funkcji o nazwie Text.Remove . Najpierw dodajemy kolumnę niestandardową, a następnie spisujemy wszystkie wartości, których chcemy się pozbyć.
Jak widać, to wszystko ładnie i łatwo czyści. I tak, teraz możemy pozbyć się tej początkowej kolumny, a następnie przenieść tę kolumnę niestandardową.
Możemy teraz wykonać nasz obrót w sposób czysty. Bierzemy Modulo, przechodzimy do Transform, a następnie Pivot Column i zamierzamy obrócić się na Custom, ale nie chcemy, żeby się agregował. Wybieramy więc Nie agreguj i klikamy OK.
Po prostu zastępujemy go tymi wartościami w kolumnie. Następnie tworzy dla nas te trzy kolumny. Widzimy tam nazwisko, imię i adres e-mail, ale nie jest to dokładnie taki format, jaki chcemy.
Aby to naprawić, możemy wziąć te kolumny, a następnie wykonać Fill Up .
A teraz mamy te dodatkowe rzędy ze względu na powtarzający się wzór Modulo.
Możemy łatwo się tego pozbyć, usuwając naprzemienne rzędy. Możemy to zrobić w opcji Usuń wiersze.
Możemy powiedzieć, że pierwszy rząd do usunięcia to dwa. Następnie usuń drugi i trzeci rząd, a następnie zachowaj czwarty i wykonaj powtarzający się wzór.
Możesz teraz zobaczyć, że wszystkie prawidłowe dane zostały wyczyszczone w przyjemny sposób i nadal mamy 28 oryginalnych adresów e-mail.
Teraz możemy pozbyć się kolumny Index i odpowiednio zmienić nazwy nagłówków kolumn.
Funkcje LuckyTemplates Modulo i Integer-Divide DAX
Power Query Najlepsze praktyki dotyczące modelu danych
Power Query M: naprzemienny wzorzec 0-1 w tabeli dat
Wniosek
Możesz to zobaczyć za pomocą sztuczki Modulo, a następnie obracania danych i odrobiny czyszczenia, jest to dość łatwe. Gdy już to zrozumiesz, prawdopodobnie zajmie to tylko około minuty.
Miejmy nadzieję, że dzięki temu zyskałeś jeszcze kilka pomysłów i narzędzi. Możesz także sprawdzić mój następny samouczek . W związku z tym przyjrzymy się bliżej niektórym rzeczom, które omówiliśmy w tym samouczku, a także przyjrzymy się, jak możemy zautomatyzować ten proces w powtarzalny sposób, używając niestandardowych funkcji. Pokażę ci również kilka fajnych sztuczek do debugowania twoich niestandardowych funkcji.
Mam nadzieję, że uznałeś to za pomocne. Możesz obejrzeć cały film poniżej i sprawdzić poniższe linki, aby uzyskać więcej powiązanych treści.
Wszystkiego najlepszego!
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.