Oto typowe pytanie dotyczące analizy danych, które od czasu do czasu otrzymujemy:
Mam arkusz kalkulacyjny z ponad 100 000 wierszy arkusza kalkulacyjnego Excel, który zawiera wiele informacji o klientach, które muszę wyczyścić z duplikatów. Szacuję, że ręczne przetarcie listy zajmie mi kilka dni. Kolega powiedział mi, że najprawdopodobniej będę potrzebować makra Excela, aby to zrobić. Nasz informatyk, który jest zaznajomiony z rozwojem makr, jest na urlopie, więc muszę rozwiązać ten problem sam. Czy istnieje sposób na rozwiązanie tego problemu bez znajomości programowania?
Tak, istnieje sposób na rozwiązanie tego problemu w programie Excel i nie wymaga to biegłości w programowaniu w języku Visual Basic. Przejdźmy dalej i rozwiążmy to naprawdę szybko.
Usuń zduplikowane wiersze programu Excel
Oto jak pozbyć się niepotrzebnych wpisów w arkuszu kalkulacyjnym:
- Najpierw utwórz kopię skoroszytu, aby mieć kopię zapasową na wypadek, gdyby coś poszło nie tak.
- Następnie otwórz arkusz kalkulacyjny programu Excel.
- Na górnej Wstążce kliknij kartę Dane .
- Teraz idź dalej i wybierz zakres danych, który chcesz wyczyścić. Upewnij się, że wybrałeś również nagłówki tabeli, jeśli są dostępne.
- W sekcji Narzędzia danych naciśnij przycisk Usuń duplikaty .
- Teraz przejdź dalej i sprawdź odpowiednią kolumnę, która pomoże ci określić, czy wpis na twojej liście jest zduplikowany. W naszym przypadku, korzystając z naszego demonstracyjnego zestawu danych Sales Targets, użyjemy pierwszych 3 kolumn do zidentyfikowania zduplikowanych wierszy.

- Naciśnij OK .
- Zostanie wyświetlony komunikat wyszczególniający liczbę wpisów usuniętych i zachowanych w tabeli.

- Naciśnij OK i sprawdź poprawność zmodyfikowanego zestawu danych.
- Jeśli jesteś zadowolony z wyniku, zapisz plik. W przeciwnym razie możesz cofnąć swoją zmianę ( Edycja >> Cofnij ).
Zaawansowane wskazówki:
- Podobna funkcja jest dostępna w programie Excel PowerQuery, który umożliwia przekształcanie znacznie większych zestawów danych.
- Jeśli znasz język Python, możesz łatwo usunąć zduplikowane wiersze ze zbioru danych za pomocą biblioteki Pandas.
Ciesz się analizą danych 😉