Jak ustawić ramkę danych według jednej lub wielu kolumn?

Gdy próbujesz zrozumieć dużą ramkę DataFrame w Pandas, możesz potrzebować podzbiorów według kolumn i wierszy. W tym samouczku pokażemy najbardziej rozpowszechnione przypadki użycia partycjonowania kolumn w DataFrame.

Zaczniemy od skonfigurowania naszego przykładowego DataFrame, co zrobimy, uruchamiając następujący kod Pythona w naszym ulubionym środowisku (dla uproszczenia używam Anacondy i Jupyter Lab).

import pandas as pd # import the pandas library

languages = ({"language": [ "Python", "C-Sharp", "Javascript","PHP"] ,
         "avg_difficulty_level": [3, 2, 2, 1],
              "avg_salary": [120, 100, 120, 80],
          "applications": [10,15,14,20]})

# Now let's convert our dict to a DataFrame

languages = pd.DataFrame.from_dict(languages)

Przyjrzyjmy się teraz naszym pierwszym wierszom Dataframe za pomocą metody head().

languages.head()

Jak widać, jest to dość prosta ramka DataFrame, której użyjemy jako przykładu w tym poście:

  język avg_difficulty_level średnia_wynagrodzenie Aplikacje
0 Pyton 3 120 10
1 C-Sharp 2 100 15
2 JavaScript 2 120 14
3 PHP 1 80 20

Filtrowanie pojedynczej kolumny

Zaczniemy od najprostszego przypadku, który polega na podzbiorze jednej kolumny z naszego zbioru danych. Uruchomienie następującego polecenia spowoduje utworzenie obiektu serii:

Według nazwy / etykiety

languages["language"]

Wynikiem jest seria:

0 Pythona
1 C-ostry
2 Javascript
3 PHP
Nazwa: język, dtype: obiekt
type(languages["language"])

pandas.core.series.seria

Według indeksu

Następujące polecenie zwróci również serię zawierającą pierwszą kolumnę

languages.iloc[:,0]

Zaznaczanie wielu kolumn

Wg nazwy

Podczas przekazywania listy kolumn Pandy zwrócą ramkę DataFrame zawierającą część danych.

languages[["language", "applications"]]
  język Aplikacje
0 Pyton 10
1 C-Sharp 15
2 JavaScript 14
3 PHP 20

Według etykiety (z loc)

df.loc[:,["language","applications"]]

Wynik będzie podobny.

Według indeksu

Teraz pobierzmy wiele kolumn za pomocą indeksu:

languages.iloc[: ,[0,3]]
  język Aplikacje
0 Pyton 10
1 C-Sharp 15
2 JavaScript 14
3 PHP 20

Według warunku

W tym przypadku pokażemy tylko kolumny, których nazwa odpowiada określonemu wyrażeniu. Użyjemy całkiem przydatnej metody filtrowania :

languages.filter(axis = 1, like="avg")

Uwagi:

  1. możemy również filtrować według określonego wyrażenia regularnego (regex).
  2. Możemy zastosować parametr axis=0 do filtrowania według określonej wartości wiersza.

Filtruj określone wiersze według stanu

Oto całkiem prosty sposób na podzbiór DataFrame zgodnie z wartością wiersza:

languages[(languages["applications"] > 15)]

Mamy tylko jeden wynik:

languages[(languages["applications"] > 15)]
  język avg_difficulty_level średnia_wynagrodzenie Aplikacje
3 PHP 1 80 20

Messenger nie może otworzyć załącznika lub linku? Oto co robić

Messenger nie może otworzyć załącznika lub linku? Oto co robić

Messenger nie może otworzyć załącznika lub linku? Dowiedz się, jak rozwiązać ten problem dzięki sprawdzonym krokom i wskazówkom.

Jak utworzyć grupę kontaktów lub listę dystrybucyjną w programie Outlook

Jak utworzyć grupę kontaktów lub listę dystrybucyjną w programie Outlook

Dowiedz się, jak szybko stworzyć grupę kontaktów w Outlook, aby efektywnie zarządzać swoimi wiadomościami e-mail. Oszczędzaj czas z naszą szczegółową instrukcją.

[NAPRAWIONO] Błąd 740 Żądana operacja wymaga podwyższenia systemu Windows 10

[NAPRAWIONO] Błąd 740 Żądana operacja wymaga podwyższenia systemu Windows 10

Dowiedz się, jak rozwiązać problem z błędem 740 żądana operacja wymaga podniesienia Windows 10 problemów z rozwiązaniami przedstawionymi w tym artykule.

Jak włączyć lub wyłączyć uprawnienia witryny w Microsoft Edge

Jak włączyć lub wyłączyć uprawnienia witryny w Microsoft Edge

Jeśli chcesz mieć większą kontrolę nad tym, które witryny próbują uzyskać dostęp na Twoim komputerze, oto jak skutecznie zarządzać uprawnieniami witryny w Microsoft Edge.

5 najlepszych emulatorów PS4 dla systemu Windows 10/11 do zainstalowania w 2022 r.

5 najlepszych emulatorów PS4 dla systemu Windows 10/11 do zainstalowania w 2022 r.

Poznaj najlepsze emulatory PS4 na PC, które pozwolą Ci grać w gry na konsole PlayStation 4 za darmo na komputerach z Windows.

Jak naprawić „Nieznany wyjątek oprogramowania (0xe0434352)”?

Jak naprawić „Nieznany wyjątek oprogramowania (0xe0434352)”?

Odkryj możliwe rozwiązania, aby naprawić błąd wyjątku nieznanego oprogramowania (0xe0434352) w systemie Windows 10 i 11 podany tutaj…

Jak usunąć animacje z prezentacji PowerPoint

Jak usunąć animacje z prezentacji PowerPoint

Jak usunąć animacje z prezentacji PowerPoint, aby dostosować ją do profesjonalnych standardów. Oto przydatne wskazówki.

Napraw niedziałające Wicked Whims 6 łatwych rozwiązań

Napraw niedziałające Wicked Whims 6 łatwych rozwiązań

Radzenie sobie z Wicked Whims, które nie działają w Sims 4. Wypróbuj 6 skutecznych rozwiązań, takich jak aktualizacja modów i więcej.

Napraw kontroler PS4 nie ładuje się [8 łatwych ROZWIĄZAŃ]

Napraw kontroler PS4 nie ładuje się [8 łatwych ROZWIĄZAŃ]

Odkryj jak naprawić problem z kontrolerem PS4, który się nie ładuje. Sprawdź 8 prostych rozwiązań, w tym testy kabli, portów oraz reset kontrolera.

Operacja nie została zakończona pomyślnie, ponieważ plik zawiera wirusa [NAPRAWIONO]

Operacja nie została zakończona pomyślnie, ponieważ plik zawiera wirusa [NAPRAWIONO]

Dowiedz się, jak naprawić Operacja nie zakończyła się pomyślnie, ponieważ plik zawiera wirusa Windows 11/10 i nie można otworzyć żadnego pliku…