Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Dzisiaj chcę pokazać Ci grupę bezpłatnych zasobów zarówno dla członków LuckyTemplates, jak i osób niebędących członkami, które, jak sądzę, okażą się niezwykle przydatne. W tym zbiorze zasobów można również znaleźć przydatne narzędzie do tworzenia losowych zbiorów danych. Możesz obejrzeć pełny film z tego samouczka na dole tego bloga.
Spis treści
Co jest w środku Najlepsza kolekcja zasobów usługi LuckyTemplates
W ramach tego zasobu chcę zademonstrować w szczególności Randomizer danych , który jest narzędziem, o którym myślę, że nawet nasi członkowie nie są świadomi.
Jedną z rzeczy, które zrobiliśmy, aby ułatwić wszystkim, jest zgrupowanie tych zasobów w , dzięki czemu nie musisz pobierać każdego z nich osobno. Jeśli jesteś członkiem, będziesz mógł od razu do niego wskoczyć. Jeśli nie, po prostu poprosi o Twój adres e-mail, a następnie udostępni link do miejsca, w którym możesz pobrać wszystkie zasoby.
Ta kolekcja zasobów zawiera wiele przydatnych rzeczy. Mamy przewodnik po formułach języka DAX i kolejny przewodnik dotyczący optymalizacji języka DAX .
Dostępna jest również rozszerzona tabela dat opracowana przez jednego z naszych ekspertów, Melissę de Korte. To niezwykle wszechstronna i zaawansowana tabela dat dla usługi LuckyTemplates. Mamy również ściągawkę , w jaki sposób możesz korzystać z tej rozszerzonej tabeli dat.
Ta ściągawka to krótki przewodnik po przykładowych wartościach dla każdego pola, typach danych oraz sposobach sortowania każdego pola w usłudze LuckyTemplates.
Mamy też inną grupę najlepszych raportów usługi LuckyTemplates , które możesz przeglądać i pobierać, aby zobaczyć, jak zostały one połączone.
Mamy również szereg zasobów do planowania wdrażania , wdrażania i licencjonowania .
Mamy też cały cykl prac kursowych nad poradnikiem dla początkujących do LuckyTemplates i DAX. Samo to jest około sześciu godzin oczywiście pracy.
Otrzymasz również trzy z naszych najpopularniejszych serii warsztatów. Dotyczą zaawansowanego budżetowania , efektywnego raportowania usługi LuckyTemplates oraz wykrywania i analizowania wartości odstających . Myślę, że możesz stać się całkiem kompetentny w LuckyTemplates, korzystając z zasobów tego pakietu.
Ale rzeczą, którą chcę podkreślić w tej kolekcji, jest coś, co nazywa się LuckyTemplates Data Randomizer . Po prostu przejdź do kolekcji zasobów i pobierz ten plik xlsb.
Gdzie używać Randomizera danych
Przejdź do pobierania , a następnie otwórz plik w programie Excel. To świetnie nadaje się do tworzenia losowego zestawu danych, który można wykorzystać na różne sposoby. Na przykład członkowie forum LuckyTemplates (lub na jakimkolwiek innym forum) używają przykładowego pliku PBIX, jeśli ich informacje są poufne i mogą być bardzo trudne do zamaskowania.
To, co możesz zrobić, to użyć tego narzędzia do opracowania reprezentatywnego zestawu danych przy użyciu losowych nazw, losowych adresów i przypadkowych dat, ale zgodnie z wymaganiami konkretnego zestawu danych. Jest to reprezentatywne bez żadnych informacji poufnych.
Ponadto możesz chcieć opracować zestaw danych do testowania niektórych kodów. Jeśli na przykład usługa LuckyTemplates wywołuje skrypt języka R w celu sprawdzenia, czy dystrybucja jest normalna, możesz chcieć wygenerować niektóre dystrybucje normalne lub nienormalne, aby sprawdzić, czy kod działa.
Jest to również dobre, jeśli uczysz LuckyTemplates i chcesz tworzyć przykłady do quizów lub testów. Możesz go stworzyć według dowolnych parametrów.
Jak działa Randomizer danych
Zobaczmy, jak to działa. Utwórzmy otwarty arkusz i nazwijmy go Test . Następnie kliknij RANDOM LISTS , który jest dodatkiem stworzonym przez randomizator danych.
Jak widać, ma kilka prostych opcji i kilka dość skomplikowanych. Najpierw omówię te proste.
Możesz po prostu wybrać liczbę wierszy, które chcesz utworzyć. Możesz także wybrać, czy chcesz, aby były wyjątkowe, czy nie.
Powiedzmy, że chcemy 500 wierszy. Ponieważ tworzymy tabelę faktów, odznaczymy pole dla unikalnych elementów.
Możemy tworzyć liczby całkowite lub dziesiętne.
Możemy również użyć opcji wyjścia, aby wyprowadzić dane do określonej komórki, nowego arkusza lub ostatniej kolumny i miejsca w istniejącym skoroszycie.
Przejdźmy więc do listy Liczby , wprowadź 0 jako minimum i 1000 jako maksimum.
Następnie umieśćmy wyjście w A1.
Teraz mamy 500 unikalnych liczb losowych.
To samo możemy zrobić z datami. Utwórzmy listę dat i użyjmy początku tego roku jako daty POCZĄTKU, a końca tego roku jako daty KOŃCA.
Musimy tylko sformatować te liczby w formacie daty.
Mamy teraz 500 przypadkowych dat w granicach tego roku.
Zauważ, że jeśli utworzymy listę liczb lub listę dat, stworzy to jednolity rozkład, w którym istnieje równe prawdopodobieństwo wyciągnięcia dowolnej liczby z tego zakresu.
Tworzenie listy ważonej z losowego zbioru danych
Możemy również utworzyć listę ważoną. Spowoduje to wyświetlenie monitu o podanie różnych segmentów dystrybucji i wagi, jaką chcesz umieścić w każdym segmencie.
Jedyną funkcją, która jest naprawdę, bardzo pomocna oprócz tych, które ci pokazałem, jest połączona lista . Jest tu cała gama fałszywych danych, takich jak nazwiska, numery telefonów, adresy, adresy e-mail, kraje, regiony, produkty, nazwy firm i kanały dystrybucji. Możesz nawet dodać do tego własną listę.
Aby pokazać, jak to działa, przeprowadźmy analizę nastrojów. Weźmy tę listę (pozytywną, neutralną i negatywną) skopiowaną do naszej listy testowej .
Umieśćmy go w trzeciej kolumnie naszej utworzonej listy, a następnie kliknij Linked list .
Spowoduje to utworzenie 500 nastrojów o jednolitym rozkładzie opartym na tej liście.
Jedną z zalet tego rozwiązania jest możliwość ważenia w locie. Powiedzmy, że chcesz 3 razy więcej pozytywnych odpowiedzi niż negatywnych lub neutralnych. To, co możesz zrobić, to umieścić w kolumnie jeszcze dwa pozytywy, skopiować ją ponownie, kliknąć Linked list i umieścić wyniki w kolumnie F.
Spowoduje to utworzenie tych samych 500 rekordów, ale trzykrotnie większą liczbę pozytywów. Możesz to dostosować, aby utworzyć listę ważoną w locie i utworzyć dowolny zestaw danych.
Kolejną rzeczą, którą tu mamy, są dane geograficzne . Możesz przeglądać kody pocztowe, długości i szerokości geograficzne oraz adresy. Można ich używać do tworzenia symulowanych danych geograficznych.
Tworzenie modelu danych z losowego zbioru danych
Jeśli próbujesz utworzyć cały model danych za pomocą tego narzędzia losowego zestawu danych, możesz utworzyć tylko tabelę faktów, a następnie przejść do usługi LuckyTemplates i Power Query. Tabele wymiarów można tworzyć na podstawie tabeli faktów, odwołując się do unikalnych rekordów wymiarów i wyciągając je.
Innym sposobem jest zbudowanie dodatkowych arkuszy z unikalnymi przedmiotami i zasadniczo zbudowanie ich jako tabel wymiarów. Gdy to zaimportujesz, zaimportujesz zarówno tabele faktów, jak i tabele wymiarów, a następnie połączysz je w usłudze LuckyTemplates.
Wniosek
Randomizer danych jest naprawdę bardzo prosty, jeśli chodzi o tworzenie losowego zestawu danych, gdy już go opanujesz. Możesz dodać informacje, aby dostosować je do typu zestawów danych, które chcesz wygenerować.
Naprawdę mam nadzieję, że rzucisz okiem na tę kolekcję zasobów usługi LuckyTemplates. Niezależnie od Twojego poziomu wiedzy lub doświadczenia z LuckyTemplates, znajdziesz tutaj coś, co będzie dla Ciebie niezwykle cenne i pomocne.
Jeśli podobały Ci się treści omówione w tym konkretnym samouczku, nie zapomnij zasubskrybować kanału telewizyjnego LuckyTemplates i sprawdź resztę naszej witryny, aby uzyskać więcej zasobów edukacyjnych.
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.