Iată o întrebare tipică de analiză a datelor pe care o primim din când în când:
Am o foaie de calcul cu peste 100.000 de rânduri foaie de calcul Excel care are o grămadă de informații despre clienți pe care trebuie să le curăț pentru duplicate. Aș estima că va dura câteva zile pentru a curăța manual lista. Un coleg mi-a spus că cel mai probabil voi avea nevoie de o macrocomandă Excel pentru a face asta. Tipul nostru IT, care este familiarizat cu dezvoltarea Macro, este în concediu, așa că trebuie să rezolv singur acest lucru. Există vreo modalitate de a rezolva această problemă fără să știi cum să programezi?
Da, există o modalitate de a rezolva acest lucru în Excel și nu va fi nevoie să fii priceput cu programarea Visual Basic. Să mergem mai departe și să rezolvăm asta foarte repede pentru tine.
Ștergeți rândurile duplicate Excel
Iată cum să scapi de intrările inutile din foaia de calcul:
- Mai întâi, faceți o copie a registrului de lucru, astfel încât să aveți o copie de rezervă în cazul în care ceva nu merge bine.
- Apoi deschideți foaia de calcul Excel.
- În Panglica de sus, apăsați fila Date .
- Acum mergeți mai departe și selectați intervalul de date pe care doriți să îl curățați. Asigurați-vă că selectați și antetele tabelului, dacă sunt disponibile.
- În secțiunea Instrumente de date, apăsați butonul Eliminați duplicatele .
- Acum, mergeți mai departe și verificați coloana relevantă care vă va ajuta să determinați dacă o intrare din lista dvs. este duplicată. În cazul nostru, utilizând setul nostru de date demo privind Țintele de vânzări, vom folosi primele 3 coloane pentru a identifica rândurile duplicate.

- Apăsați OK .
- Va fi afișat un mesaj care detaliază numărul de intrări eliminate și cele păstrate în tabel.

- Apăsați OK și inspectați setul de date modificat pentru corectitudine.
- Dacă sunteți mulțumit de rezultat, mergeți mai departe și salvați fișierul. În caz contrar, puteți anula modificarea ( Editare >> Anulare ).
Sfaturi avansate:
- Capacitate similară este disponibilă în Excel PowerQuery, care vă permite să transformați seturi de date semnificative mai mari.
- Dacă sunteți familiarizat cu limbajul Python, puteți elimina cu ușurință rândurile duplicate dintr-un set de date folosind biblioteca Pandas.
Bucurați-vă de analiza datelor dvs. 😉