Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W dzisiejszym blogu dowiesz się, jak używać LuckyTemplates do dzielenia kolumn przez ograniczniki przy użyciu języka DAX. Jest to coś, co prawdopodobnie wiesz, jak łatwo zrobić za pomocą dodatku Power Query, i ogólnie jest to najlepszy sposób na zrobienie tego.
Jednak ze względu na dynamiczny charakter problemu i specyficzne uwarunkowania modelu danych istnieją sytuacje, w których użycie języka DAX zapewnia lepsze rozwiązanie. Możesz obejrzeć pełny film z tego samouczka na dole tego bloga.
Spis treści
Przykładowy problem
To jest przykładowy problem w usłudze LuckyTemplates.
Masz listę około 600 tytułów filmów i chcesz zidentyfikować wśród nich najpopularniejsze słowa. Aby to zrobić, użyjesz suwaka parametrów pokazanego poniżej, aby obliczyć słowa z każdego tytułu.
W suwaku możesz ustawić, ile najlepszych słów chcesz zwrócić. W tym samouczku załóżmy, że ustawiłeś go na pięć słów.
Twoim następnym celem jest zwrócenie każdego tytułu, który zawiera co najmniej jedno z pięciu wybranych słów. Może się to wydawać proste, ale jest to trochę trudniejsze, niż się wydaje. Oto kroki, aby osiągnąć te cele.
Kroki, jak podzielić kolumny za pomocą ograniczników
W tej sekcji nauczysz się, jak rozwiązać dany problem, dzieląc kolumny w języku DAX. Pierwszym krokiem jest otwarcie danych filmu, klikając drugą ikonę po lewej stronie, a następnie Film w okienku pól.
Na liście filmów, które się pojawią, musisz pomyśleć o sposobach podzielenia tytułów na poszczególne słowa.
Jednym z możliwych rozwiązań jest użycie dwóch wirtualnych tabel , jak pokazano poniżej. Tabela 1 to jednokolumnowa tabela zawierająca N górnych słów zdefiniowanych przez suwak. Druga tabela to wirtualna kolumna słów w każdym tytule filmu.
Następnie, korzystając z dwóch wirtualnych tabel, możesz użyć funkcji , aby określić, które słowa są między nimi wspólne. Następnie wykonaj na tym wirtualnym stole, aby wiedzieć, czy ta liczba jest większa lub równa jeden.
Jeśli odpowiedź brzmi „tak”, to przynajmniej jedno z docelowych słów znajduje się w tytule filmu. I to są tytuły, które chcemy zachować w ostatecznym wyniku.
Znajdowanie przydatnych narzędzi podziału kolumn usługi LuckyTemplates w przewodniku SQLBI DAX
Aby zastanowić się, jak możesz to zaimplementować, możesz zapoznać się z przewodnikiem SQLBI DAX, przechodząc do narzędzi zewnętrznych, a następnie przewodnika DAX .
Na tej stronie możesz wyszukiwać funkcje według typu, klikając Grupy.
W obszarze Funkcje możesz zacząć od opcji Tekst , aby sprawdzić, czy istnieją funkcje tekstowe podobne do dzielenia kolumn przez ograniczniki. Ułatwiłoby to sprawę, ale niestety w języku DAX nie ma niczego, co odpowiadałoby temu.
Zamiast tego użyjesz , które robią to samo, co podział przez ogranicznik.
Funkcje hierarchii rodzic-dziecko
Funkcje hierarchii nadrzędny-podrzędny lub funkcje PATH są zwykle używane w sytuacjach hierarchicznych. Załóżmy, że potrzebujesz analizy HR, w której masz dyrektora generalnego firmy, kierowników na poziomie dyrektorskim, kierowników naczelnych oddziałów i tak dalej.
Funkcje PATH mogą wyrażać tę hierarchię w określony sposób i przechodzić przez nią tam i z powrotem. Jest to tradycyjne zastosowanie funkcji hierarchii nadrzędny-podrzędny, ale dowiesz się, że ma ona również kilka bardzo przydatnych właściwości do manipulowania tekstem i języka DAX.
Korzystanie z niej jest o wiele trudniejsze niż w przypadku usługi LuckyTemplates, ale mamy nadzieję, że ułatwimy ten proces, udostępniając rozwiązanie krok po kroku. Jest to przydatna technika do nauczenia się, która udostępnia rodzinę funkcji języka DAX, które są niezwykle wydajne.
Podzielona kolumna usługi LuckyTemplates w języku DAX
Funkcje hierarchii rodzic-dziecko obejmują kilka kroków, ale warto się im przyjrzeć, ponieważ te pięć funkcji jest naprawdę potężnych i elastycznych.
Aby rozpocząć, wróć do stołu i kliknij filmu w okienku pól.
Utwórz ścieżkę filmu za pomocą polecenia , jak pokazano poniżej.
To polecenie zastępuje każdą spację pionową kreską.
Ścieżki muszą być formatowane w ten sam sposób w usłudze LuckyTemplates, więc zazwyczaj odbywa się to w usłudze Power Query. Jednak zrobiłeś to w ten sposób, aby zobaczyć polecenia , które różnią się od poleceń M w dodatku Power Query.
Funkcja SUBSTITUTE tworzy potrzebną strukturę ścieżki, podczas gdy polecenie usuwa wszelkie początkowe lub końcowe spacje, które mogłyby wpłynąć na nasze wyniki
Twoja druga kolumna obliczeniowa to Długość ścieżki. Jest to proste polecenie w funkcji , które stosuje się do ścieżki filmu. Powie ci, ile elementów znajduje się na tej ścieżce, więc w tym przypadku jest to liczba słów w tytule.
To samo polecenie można wykorzystać do określenia np. liczby osób w łańcuchu zgłoszeń. Ale ten przypadek to tylko zwykłe liczenie słów.
Następną rzeczą do zrobienia jest przejście do Indeksu maksymalnej ścieżki w panelu Pola. Następnie utwórz tabelę obliczeniową, która przechodzi przez całą tabelę filmów, usuwa filtry i oblicza maksymalną długość ścieżki, aby poznać najdłuższy tytuł w bazie danych.
Korzystając z funkcji , możesz wygenerować serię indeksów ze ścieżką od jednej do maksymalnej liczoną przez jedynki.
Tak powinien wyglądać twój stół. Za chwilę zobaczysz, dlaczego jest to cenne.
Na razie wróć do usługi LuckyTemplates i kliknij Najważniejsze słowa w ścieżce filmowej w okienku pól.
Skupimy się na tej wirtualnej tabeli, której ogólnym rozwiązaniem był pokazany wcześniej diagram Venna.
Podzielmy to, aby lepiej zrozumieć. W poniższych wierszach użyliśmy wirtualnej tabeli dla pierwszych N słów, zgodnie z poniższymi obliczeniami.
Następnie kolumna podzielona przez ogranicznik jest obliczana w poniższych wierszach.
Następnie zastosowaliśmy przecięcie tych dwóch kolumn. Jeśli to przecięcie jest większe od zera, przypiszemy mu jedynkę lub zero. W końcu zwróciliśmy wynik.
Podczas pracy ze złożonymi tabelami wirtualnymi najłatwiej jest przejść do Edytora tabelarycznego , w którym można zmaterializować te tabele wirtualne w zapytaniu języka DAX. W tym celu musisz skupić się na liniach wyróżnionych poniżej.
Więc skopiuj ten kod i pozostaw go w naszym schowku na następne kroki.
Przetwarzanie podzielonych kolumn usługi LuckyTemplates za pomocą edytora tabelarycznego 3
W Narzędziach zewnętrznych kliknij Edytor tabelaryczny 3 . Możesz również użyć do tego DAX Studio, ale Edytor tabelaryczny jest zalecany ze względu na dodatkowe funkcje debugowania i inne przydatne możliwości. W przypadku zapytań DAX DAX Studio również będzie działać dobrze i jest całkowicie bezpłatne.
Po powrocie do edytora tabelarycznego utwórz nowe zapytanie języka DAX, klikając ikonę papieru na wstążce. Wpisz EVALUATE w wierszu 1, wklej skopiowany kod, a następnie naciśnij klawisz F5.
Otrzymasz tabelę z Film Path i Max Path dla pierwszych dwóch kolumn. W przypadku trzeciej kolumny użyjesz polecenia i ścieżki filmu, aby określić, jakie jest pierwsze słowo dla każdego przyrostu indeksu ścieżki, od jednego do dziewięciu.
Ten kod zwraca pierwsze słowo przedstawione w trzeciej kolumnie.
Spróbuj obejrzeć konkretny film, klikając ikonę Filtr w tytule kolumny Filmy [Ścieżka filmu] . Na przykład weź taki, który jest trochę dłuższy, powiedzmy Captain America: The Winter Soldier.
W dolnej części okna widać, że EVALUATE zwróciło 1000 wierszy .
Pobierz wszystkie wiersze , a następnie wróć i ponownie przefiltruj Filmy [Ścieżka filmu] dla Kapitana Ameryki.
Wyszukaj Kapitan Ameryka: Zimowy Żołnierz. Zaznacz odpowiednie pole i kliknij Zamknij.
To, co dokładnie robi dla każdego tytułu, to przejście i zastosowanie indeksów od jednego do dziewięciu, jak widać w drugiej kolumnie, a następnie zastosowanie tego do polecenia .
Jak widać, pierwszy przedmiot to Kapitan , drugi to Ameryka , trzeci to The , czwarty to Winter , a ostatni to Soldier . Kiedy dojdziesz od sześciu do dziewięciu, jest po prostu pusty, ponieważ przekroczył liczbę słów w tym konkretnym tytule.
To, co utworzyłeś, to kolumna z podziałem według ograniczników, która jest dokładnie taka sama jak podział według ograniczników w dodatku Power Query.
W usłudze LuckyTemplates widać, że polecenie uruchamiane przez przecięcie i instrukcja JEŻELI. Tak więc, jeśli wrócisz do swojego zestawu danych i otworzysz okienko Filtry, zobaczysz, że Słowo najpopularniejsze w filmie jest filtrowane tak, że jest równe jeden.
Zasadniczo mówi to, że wszystko w prawej tabeli (Film), które ma słowo znajdujące się na liście docelowej w lewej tabeli, zostanie wymienione w górnych wierszach. Z drugiej strony te, które są zerowe, zostaną umieszczone w dół.
Power Automate Podziel funkcję i
tablice Podział kolumn usługi LuckyTemplates Samouczek Power Query: Jak podzielić wielowierszowe komórki programu Excel w usłudze LuckyTemplates
Tworzenie rozdzielanej listy w usłudze Power Query — samouczek edytora zapytań
Wniosek
Z tego bloga dowiedziałeś się, jak dzielić kolumny za pomocą separatora w języku DAX. To narzędzie okaże się bardzo pomocne, gdy Twoja sytuacja jest bardzo dynamiczna lub Twój model danych nie obsługuje tego w Power Query.
Ponadto przykładowy problem, nad którym pracowałeś, jest dobrą ilustracją niezwykłej mocy poleceń PATH i tego, jak możesz ich użyć do rozwiązywania problemów w nietradycyjny sposób.
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.