Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Równoległe wykresy współrzędnych są użytecznym narzędziem wizualizacji używanym do przedstawiania relacji między wieloma zmiennymi współdzielącymi te same dane liczbowe. W usłudze LuckyTemplates wykresy te są tworzone przy użyciu bardzo prostego kodu w języku Python, którego można używać i łatwo tworzyć oraz stylizować.
W dzisiejszym blogu nauczymy się, jak tworzyć wielowymiarowe lub równoległe wykresy współrzędnych za pomocą Pythona . Przeprowadzimy ten proces krok po kroku, od przygotowania danych po dostosowanie wykresu w celu uzyskania lepszej czytelności. Możesz obejrzeć pełny film tego samouczka na dole tego bloga .
Spis treści
Równoległe wykresy współrzędnych w Pythonie: przykład 1
To nasza pierwsza działka. Pokazuje nasze trzy zmienne — zmienną A, B i C oraz dwie linie reprezentujące pozycje 1 i 2.
Oznacza to, że mamy dwa zestawy danych, jeden dla elementu 1, a drugi dla elementu 2. A dla każdego zestawu danych mamy trzy zmienne.
Przyjrzyjmy się danym, aby lepiej zrozumieć strukturę wykresu.
Zacznij od zaznaczenia wykresu. Kliknij Dane.
Powinna pojawić się tabela z bardzo prostymi danymi. Został utworzony przy użyciu opcji wstawiania tabeli. Widzimy, że w kolumnach znajdują się Zmienne A, B i C dla każdego elementu, które są oddzielone w każdym wierszu.
Mamy proste dane, ale możemy je przekształcić w coś bardzo wymownego. Na przykład na naszym wykresie możemy stwierdzić, że związek między danymi jest dość „niski”.
Aby to zilustrować, możemy porównać ten wykres z naszymi danymi. Zmienna B w pozycji 1 wynosi 100 i 115 w pozycji 2, jak pokazano na wykresie.
Możemy również określić, w jaki sposób pozycje i zmienne są powiązane. Na przykład możemy łatwo zobaczyć, że Zmienna A jest niższa niż B, a C jest najniższa spośród trzech.
Kod fabuły Pythona
Przejdźmy teraz do kodu Pythona użytego do rzeczywistego wykresu.
Zacznij od wybrania elementu graficznego Python z okienka Wizualizacje .
Zaznacz nasz pierwszy wykres, aby otworzyć edytor skryptów Pythona .
Najpierw importujemy matplotlib.pyplot i zapisujemy jako zmienną plt.
Następnie wprowadzamy funkcje pandas.plotting . Pandas służy jako biblioteka do manipulacji danymi w usłudze LuckyTemplates. Jest używany głównie do manipulowania danymi, ale ma również funkcje kreślenia.
Zaimportujmy współrzędne_równoległe z pandas.plotting . Współrzędne_równoległe będą podstawową funkcją tworzenia wykresu.
Tworzenie fabuły w Pythonie
W wierszu 13. dokumentujemy to, co zamierzamy zrobić, pisząc # make a plot.
Używamy współrzędnych_równoległych i przekazujemy zestaw danych.
W wierszu 3 widzimy, że zestaw danych jest tworzony za pomocą funkcji pandas.DataFrame ( ) . Następnie dodajemy Pozycję, Zmienną A, Zmienną B i Zmienną C, które są następnie odzwierciedlane na naszej liście Wartości .
W wierszu 4 zestaw danych jest deduplikowany za pomocą dataset.drop_duplicates ( ).
Możemy przejść do panelu Wizualizacje , aby zobaczyć dodane przez nas wartości .
Usunięcie którejkolwiek z tych wartości wpłynie na nasze efekty wizualne. Na przykład, jeśli usuniemy zmienną C, współrzędne odpowiednio się zmienią, pokazując nam, jak działają wartości .
Przywróćmy naszą Zmienną C , zaznaczając pole obok niej w obszarze Dane w okienku Pola .
Następnie przekaż funkcję parallel_coordinates , która przyjmuje kilka różnych argumentów. W naszym przypadku pobiera zestaw danych i element, który zapewni typ i wymiar z naszego zestawu danych.
Jeśli usuniemy element z naszej funkcji i uruchomimy go, wizualizacja nie będzie działać.
Otrzymamy błąd skryptu Pythona mówiący, że funkcji parallel_coordinates ( ) brakuje 1 wymaganego argumentu pozycyjnego, którym jest kolumna_klasy.
Dodajmy więc przedmiot z powrotem. Ponieważ jest pozycyjny, nie musimy zapisywać współrzędnych klasy. Po zakończeniu możemy uruchomić kod.
Wyświetlanie fabuły w Pythonie
Następnym krokiem jest pokazanie fabuły, więc w linii 16 dokumentujemy, co zamierzamy zrobić, pisząc # pokaż fabułę.
Przypomnijmy, że wcześniej zaimportowaliśmy plik matplotlib.pyplot i zapisaliśmy go jako plt. Zrobiliśmy to, ponieważ potrzebujemy funkcji plt.show() , aby pokazać nasz wykres.
Równoległe wykresy współrzędnych w Pythonie: przykład 2
Nasz drugi wykres to zestaw danych tęczówki pokazujący długość_płatka, szerokość_płatka, długość_przegrody i szerokość_przegrody. Ma trochę więcej stylu w porównaniu do pierwszego wykresu.
Ten zestaw danych został utworzony przy użyciu kodu w języku Python.
Aby zobaczyć nasze dane, kliknij Przekształć dane i przejdź do iris_dataset.
Zestaw danych zawiera kolumny dla wymiarów — długość działki , szerokość działki , długość płatka i szerokość płatka . Posiada również kolumnę dla typu gatunku .
Kod zestawu danych w języku Python
Nasze dane zostały łatwo wprowadzone przy użyciu kodu Pythona. Przejdź do źródła , aby wyświetlić skrypt Pythona.
Nasz kod w Pythonie ma tylko dwie linie. W pierwszym wierszu zaimportowaliśmy seaborn i zapisaliśmy go jako zmienną sns . Nazwaliśmy nasz zestaw danych jako iris_dataset i użyliśmy zmiennej sns do załadowania zestawu danych za pomocą funkcji sns.load_dataset('iris') .
Kliknij OK, aby uzyskać dane, które widzieliśmy powyżej. Poruszaj się po danych, a po zakończeniu możemy zamknąć zestaw danych, przechodząc do opcji Zamknij i zastosuj > Zamknij .
Stylizowanie działek w Pythonie
Aby otworzyć edytor skryptów Pythona dla naszego bardziej stylizowanego wykresu, kliknij nasz drugi wykres.
Zaczynamy od zaimportowania matplotlib.pyplot jako plt.
Następnie używamy funkcji plt.style.use („dark_background”), aby nadać styl wizualizacji.
Możemy łatwo dostosować tło w oparciu o nasz preferowany styl, korzystając z odniesienia do arkusza stylów matplotlib . W naszym przypadku użyliśmy ciemnego tła.
Spróbujmy również użyć ggplot , który jest często używanym stylem.
Jeśli go uruchomimy, otrzymamy wizualizację, która wygląda tak.
Następnie załaduj funkcję pandas dla wykresu, importując współrzędne równoległe z pliku pandas.plotting.
Aby stworzyć fabułę, wprowadzamy zestaw danych i ustawiamy nasz gatunek jako klasę .
W porównaniu z naszym pierwszym wykresem dodajemy dodatkowy parametr, którym jest mapa kolorów , aby uzyskać różne kolory. Przekaż to, używając zmiennej matplotlib, plt.get_cmap.
Istnieje wiele zmiennych kolorów matplotlib do wyboru w referencji mapy kolorów matplotlib .
Na przykład obecnie używamy zestawu 2 z jakościowych map kolorów, ale możemy go również zmienić na inne kolory, takie jak hsv z cyklicznych map kolorów.
Kliknij Uruchom, aby uzyskać wykres, który wygląda tak.
Hsv nie wygląda zbyt dobrze na naszych danych, ale możemy się bawić, dopóki nie znajdziemy najbardziej odpowiedniej mapy kolorów dla naszej fabuły.
Korelacja w Pythonie: przewodnik po tworzeniu
zestawów danych wizualnych w pandach za pomocą ProfileReport() | Python w LuckyTemplates
Funkcja Seaborn w Pythonie do wizualizacji dystrybucji zmiennej
Wniosek
W tym samouczku omówiliśmy podstawy tworzenia równoległych wykresów współrzędnych w Pythonie. Przeszliśmy przez proces przygotowania danych, tworzenia wykresu i dostosowywania wykresu dla lepszej czytelności.
Równoległe wykresy współrzędnych są potężnym narzędziem do wizualizacji wielowymiarowych danych i mogą być używane w różnych dziedzinach, w tym w finansach, inżynierii i uczeniu maszynowym. Teraz, gdy wiemy, jak tworzyć wykresy współrzędnych równoległych w Pythonie , możemy zacząć ich używać do lepszego zrozumienia i wizualizacji własnych danych.
Wszystkiego najlepszego,
Gaelim Holland
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.