Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku pokażę, w jaki sposób prezentowanie klastrów w danych umożliwia uzyskiwanie znacznie lepszych spostrzeżeń, niż gdybyś miał tylko wykres punktowy z mnóstwem umieszczonych tam informacji. Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
Omówię kilka zaawansowanych technik języka DAX, które należy wykorzystać w połączeniu z modelem danych. Jeśli dobrze je wykorzystasz, znacznie otworzą się przed Tobą możliwości analityczne i będziesz mógł naprawdę efektywnie prezentować spostrzeżenia.
W tym konkretnym przykładzie próbuję sprawdzić, czy istnieje jakiś powód, dla którego obserwujemy pewne grupowanie naszych klientów na podstawie ich wyników .
Nakładając pewną logikę (w ramach formuły języka DAX) na tabelę pomocniczą, jestem w stanie sklasyfikować, czy klient jest dobry, w porządku, słaby czy świetny.
Następnie, używając tego nowego wymiaru na moim wykresie punktowym, mogę sprawdzić, czy na podstawie właśnie zaimplementowanej logiki pojawia się jakieś grupowanie wyników.
Spis treści
Jak wizualizować klastry w danych
W tej wizualizacji patrzymy na każdego klienta w naszym zbiorze danych. Jest wielu klientów i analizujemy klientów na podstawie ich marży zysku w całkowitej sprzedaży. Po prawej stronie mamy grupę klientów osiągających wysokie wyniki lub klientów o wyższej marży.
Aby to osiągnąć, musimy stworzyć logikę, która pozwoli nam zwizualizować te skupiska informacji i zbudować tę logikę na podstawie grupy zysku, w której znajdują się ci klienci.
Kluczową rzeczą jest to, że te grupy zysku w rzeczywistości nie istnieją w modelu danych, więc musimy zbudować tę logikę, a następnie ją nałożyć.
Ten przykład to tylko jeden z wielu sposobów, w jakie możemy to zrobić. Moglibyśmy przyjrzeć się wzrostowi zysków, wzrostowi marży i wielu innym rzeczom, w których potrzebujemy dowolnego rodzaju logiki i wprowadzić ją tutaj. Następnie możemy zidentyfikować dowolny wzorzec lub grupę informacji, które mogą naprawdę wydobyć dla nas pewien wgląd.
Wewnątrz modelu danych
Patrząc na model danych, pierwszą rzeczą, na którą należy zwrócić uwagę, jest to, że utworzyliśmy tutaj tabelę pomocniczą. Tabela pomocnicza jest czasami używana jako tabela parametrów, ale w tym przypadku użyjemy logiki, która integruje tabelę pomocniczą z naszym podstawowym modelem.
Wewnątrz naszego stołu pomocniczego analizujemy, w której grupie klientów na podstawie rentowności znajdują się ci klienci.
Na przykład, jeśli klient wygenerował ponad 25 000 dolarów zysku, to będzie głównym klientem, podczas gdy ci między 20 000 a 25 000 dolarów będą dobrymi klientami i tak dalej.
Integracja logiki z wymiarem
W tabeli klientów wykorzystujemy tabelę pomocniczą, a następnie budujemy pewną logikę.
Niektórzy z was mogą pomyśleć, że lepiej jest rozwinąć całą tę logikę w tej kolumnie obliczeniowej — tak, absolutnie — ale czasami uważam to za niepraktyczne, zwłaszcza gdy tabela wspierająca zawiera, powiedzmy, 10 różnych elementów logiki, nad którymi trzeba pracować .
Tak, można po prostu opracować bardzo skomplikowaną kolumnę obliczeniową, ale myślę, że o wiele łatwiej byłoby umieścić je w tabeli pomocniczej, a następnie napisać prostą logikę, taką jak ta, która by je zintegrowała.
W tej logice tutaj OBLICZYMY, w której grupie znajduje się każdy klient. Grupa zostanie zwrócona przez funkcję WARTOŚCI , a następnie funkcja FILTER tworzy iterację w celu iteracji logiki.
Następnie, dla każdego klienta tutaj, jaki jest całkowity zysk ; czy mieści się między MIN a MAX którejkolwiek z naszych grup. Jeśli tak, zwróć tę grupę. I tak tworzymy te Grupy Zysków .
Tworzenie Wizualizacji
Teraz, gdy mamy ten wymiar, możemy go użyć w naszych wizualizacjach, aby zidentyfikować te klastry. Utworzymy więc wykres punktowy , a następnie przeniesiemy nasze marże zysku na oś Y i sprzedaż na oś X .
Ale jeśli przeciągniemy Customer Name , zobaczymy tutaj, że utworzyliśmy pewne informacje, ale tak naprawdę nie pokazują one żadnej wartości. Prezentowałoby się znacznie lepiej, gdybyśmy tworzyli klastry informacji.
Aby to zrobić, po prostu wypełniamy punkty i zmieniamy kilka kolorów danych, aby niektóre się wyróżniały. Dokonując tych prostych dostosowań, możemy łatwo zidentyfikować i wyodrębnić znacznie więcej informacji z naszych elementów wizualnych .
Tabela pomocnicza to naprawdę kluczowa koncepcja do poruszania się i zrozumienia podczas korzystania z usługi LuckyTemplates , ponieważ możemy ją zintegrować na wiele sposobów.
Istnieje wiele sposobów identyfikacji klastrów na podstawie różnych wskaźników, ponieważ istnieje tak wiele różnych scenariuszy, których analizy mogą wymagać nasze dane.
Użyj języka DAX do segmentacji i grupowania danych w usłudze LuckyTemplates
Znajdź wzorce w swoich danych za pomocą logiki wewnętrznej przy użyciu usługi LuckyTemplates i języka DAX
Segmentacja dynamiczna: jak podzielić klientów na grupy przy użyciu zaawansowanego języka DAX
Wniosek
W tej technice jest trochę, ale prezentowanie klastrów w danych za pomocą logiki jest naprawdę potężne i istnieje wiele sposobów replikacji tego w innych scenariuszach lub we własnych danych.
To właśnie chcę, abyś wydobył z tego samouczka, który stworzyłem, ponieważ możliwości analityczne rosną wykładniczo wokół tego typu techniki.
Jest to zaawansowana technika, więc nie przejmuj się zbytnio, jeśli od razu nie ma to sensu, ale zdecydowanie wypróbuj ją. Szybko przekonasz się, że odkryjesz kilka naprawdę interesujących spostrzeżeń, których wcześniej nie miałeś.
Dzięki!
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.