Python에서 샘플 데이터 세트를 로드하는 방법

이번 포스트에서는 파이썬에서 샘플 데이터셋을 불러오는 방법에 대해 알아보겠습니다. 이것은 가장 매력적인 주제처럼 보이지 않을 수도 있지만 실제로는 매우 중요합니다. 이상적으로는 새로운 개념을 배울 때 연습할 수 있는 Python 데이터 세트가 있을 것입니다. 이 블로그 하단에서 이 튜토리얼의 전체 비디오를 볼 수 있습니다.

코드를 공유하거나 수행 한 작업을 문서화하거나 도움 이 필요한 경우 일반적으로 사용 가능한 데이터 세트를 사용하여 최소한으로 재현할 수 있는 예제를 작성하는 것이 좋습니다 .

인터넷의 다른 누군가가 실행하고 도움을 줄 수 있는 사전 번들 코드 또는 스크립트를 갖게 될 것입니다. 이러한 최소한의 재현 가능한 예제를 생성하지 않으면 스택 오버플로와 같은 곳에서 불이 붙을 수 있으며 익숙하지 않은 경우 약간의 충격이 될 수 있습니다.

Python에서 샘플 데이터 세트를 로드하는 방법

이러한 최소한으로 재현 가능한 예제를 빌드하고 데이터 세트를 가져오는 몇 가지 방법을 살펴보겠습니다. 미리 만들어진 데이터 세트를 Python으로 로드하고 해당 코드를 공유하는 데 사용할 수 있는 몇 가지 패키지가 있습니다.

가장 일반적인 세 ​​가지 패키지를 살펴보겠습니다. 빈 Jupyter 노트북을 실행하고 시작하겠습니다.

Python에서 샘플 데이터 세트를 로드하는 방법

목차

Sklearn에서 Python의 데이터 세트 로드

첫 번째로 살펴볼 것은 Sklearn 입니다 . Anaconda를 사용하는 경우 다운로드할 필요가 없습니다. Python에 대해 더 많은 도움이 필요한 경우 LuckyTemplates에 등록할 수 있는

나는 당신이 패키지와 같은 것에 대해 이미 알고 있다고 가정하고 거기에서 갈 것입니다. 우리는 pandas와 Sklearn, 특히 dataset 하위 모듈을 가져올 것입니다.

Python에서 샘플 데이터 세트를 로드하는 방법

우리는 이러한 데이터 세트 중 몇 가지를 가져올 것입니다. 기계 학습 데이터 라이브러리인 Scikit-learn 은 이를 장난감 데이터 세트라고 부릅니다. 주택 가격 데이터 세트인 Boston을 로드할 것입니다. 이것을 가져올 때 데이터 프레임으로 가져와야 합니다.

데이터와 열이 Scikit-learn 데이터 세트에서 온다는 것을 실제로 지정하고 기능 변수와 대상 변수를 분리해야 합니다.

Python에서 샘플 데이터 세트를 로드하는 방법

우리는 이것을 데이터 프레임으로 가져와 작동하고 다른 작업을 수행할 수 있습니다. Panda는 LuckyTemplates 사용자가 알고 있는 훌륭한 패키지입니다.

Vega 데이터 세트에서 Python의 데이터 세트 로드

우리가 배울 수 있는 또 다른 옵션은 Vega 데이터 세트 패키지입니다. 이것은 Anaconda에서 사용할 수 없지만 PIP를 통해 설치할 수 있습니다. 이것은 Vega 데이터 세트를 설치하고 로컬 데이터 모듈을 설치하거나 가져오기 위해 명령줄에 입력할 내용입니다.

Python에서 샘플 데이터 세트를 로드하는 방법

이들 중 일부는 실제로 얻을 수 있지만 웹 연결이 필요합니다. 로컬 데이터를 가져와 실행하여 로컬에 설치된 것을 가져올 것입니다.

Python에서 샘플 데이터 세트를 로드하는 방법

보시다시피 꽤 많은 데이터 세트가 있습니다. 이들 중 일부는 시계열이고 일부는 범주형 또는 연속형 변수가 있습니다. 헤드 메서드를 실행할 수 있도록 데이터 프레임에서 자동차 데이터 세트를 선택해 보겠습니다.

Python에서 샘플 데이터 세트를 로드하는 방법

이제 사용하고 공유할 수 있는 또 다른 샘플 데이터 세트가 있습니다.

Python에서 샘플 데이터 세트를 로드하는 방법

Seaborn에서 Python으로 데이터 세트 로드

Seaborn은 Anaconda 배포판에서 사용할 수 있는 또 다른 패키지입니다. 기본적으로 Seaborn은 데이터 시각화로 가장 잘 알려져 있지만 사용할 수 있는 몇 가지 훌륭한 샘플 데이터 세트도 있습니다. 이것이 데이터 세트를 얻기 위해 입력할 내용입니다.

Python에서 샘플 데이터 세트를 로드하는 방법

보시다시피 여기에는 꽤 많은 데이터 세트가 있습니다. 계속해서 penguins 데이터 세트를 사용하고 처음 몇 행을 다시 가져옵니다.

Python에서 샘플 데이터 세트를 로드하는 방법

결과는 우리가 연습할 또 다른 데이터 세트입니다.

Python에서 샘플 데이터 세트를 로드하는 방법

여기서 아이디어는 연습할 데이터 세트를 갖는 것이 아닙니다. 누락된 값이 있거나, 데이터 세트를 삭제하는 데 문제가 있거나, 범주형 변수를 채우고 싶거나, 민감한 데이터를 제공하지 않고 다른 사람에게 예를 보여주고 싶은 경우 공개적으로 액세스할 수 있는 데이터 세트 중 정말 정말 쉬운 데이터 세트 중 하나를 사용할 수 있습니다. 사람들이 사용하고 공유할 수 있도록. 이것이 최소한으로 재현 가능한 예의 아이디어입니다.

Python 스크립팅을 사용하는 LuckyTemplates LuckyTemplates에서 날짜 테이블 Python 만들기
: LuckyTemplates 사용자를 위한 Python I 설치 및 설정 방법
- LuckyTemplates 교육 플랫폼의 새 과정

결론

요약하면 샘플 데이터 세트를 찾을 수 있는 세 곳이 있습니다. Scikit-learn은 기계 학습 패키지입니다. 전환하기가 조금 어렵지만 기계 학습과 관련된 작업을 수행하는 경우 여기를 방문하십시오. Vega 데이터 세트는 특히 웹에서 데이터 세트를 가져오는 방법을 사용하는 경우 상당히 많은 수의 데이터 세트를 가지고 있지만 로드하기가 상대적으로 어렵기 때문에 PIP를 사용해야 하고 Anaconda와 함께 사전 설치되어 있어야 합니다. Seaborn은 데이터 프레임을 로드하고 샘플 데이터 세트 및 재현 가능한 예제를 사용할 때 많은 다재다능함을 가지고 있기 때문에 최적의 장소입니다.

Stack Overflow에는 최소 재현 가능한 예제 또는 MRE를 작성하는 방법에 대한 자습서도 있으므로 온라인에 게시하려는 경우 확인하십시오.

좋은 데이터 세트를 얻을 수 있는 곳을 알고 좋은 MRE를 공유하는 것은 분석가로서 갖추어야 할 정말 중요한 기술입니다.

이 특정 튜토리얼에서 다루는 내용이 마음에 드셨다면 LuckyTemplates TV 채널을 구독하십시오. 저와 다양한 콘텐츠 작성자가 항상 제공하는 엄청난 양의 콘텐츠가 있습니다. 모두 LuckyTemplates 및 Power Platform을 사용하는 방식을 개선하는 데 전념하고 있습니다.

Leave a Comment

SharePoint의 계산된 열 | 개요

SharePoint의 계산된 열 | 개요

SharePoint에서 계산된 열의 중요성과 목록에서 자동 계산 및 데이터 수집을 수행하는 방법을 알아보세요.

Power Apps에서 변수 만들기: 컬렉션 작업

Power Apps에서 변수 만들기: 컬렉션 작업

컬렉션 변수를 사용하여 Power Apps에서 변수 만드는 방법 및 유용한 팁에 대해 알아보세요.

Microsoft Flow HTTP 트리거 | Power Automate 자습서

Microsoft Flow HTTP 트리거 | Power Automate 자습서

Microsoft Flow HTTP 트리거가 수행할 수 있는 작업과 Microsoft Power Automate의 예를 사용하여 이를 사용하는 방법을 알아보고 이해하십시오!

Power Automate 흐름: 사용법 및 유형 설명

Power Automate 흐름: 사용법 및 유형 설명

Power Automate 흐름 및 용도에 대해 자세히 알아보세요. 다양한 작업 및 시나리오에 사용할 수 있는 다양한 유형의 흐름에 대해 설명합니다.

흐름에서 Power Automate 종료 작업 제어

흐름에서 Power Automate 종료 작업 제어

조건이 충족되지 않는 경우 흐름에서 작업을 종료하는 Power Automate 종료 작업 컨트롤을 올바르게 사용하는 방법을 알아봅니다.

PowerApps 시작 기능: 앱에서 다른 서비스를 시작하는 방법

PowerApps 시작 기능: 앱에서 다른 서비스를 시작하는 방법

PowerApps 실행 기능에 대해 자세히 알아보고 자신의 앱에서 바로 웹사이트, 전화, 이메일 및 기타 앱과 같은 기타 서비스를 실행하십시오.

Power Automate의 HTTP 요청 – 소개

Power Automate의 HTTP 요청 – 소개

타사 애플리케이션 통합과 관련하여 Power Automate의 HTTP 요청이 작동하는 방식을 배우고 이해합니다.

Power Automate Desktop: 마우스 클릭 보내기 기능을 사용하는 방법

Power Automate Desktop: 마우스 클릭 보내기 기능을 사용하는 방법

Power Automate Desktop에서 Send Mouse Click을 사용하는 방법을 알아보고 이것이 어떤 이점을 제공하고 흐름 성능을 개선하는지 알아보십시오.

PowerApps 변수: 컨텍스트 및 전역 변수 식별

PowerApps 변수: 컨텍스트 및 전역 변수 식별

PowerApps 변수의 작동 방식, 다양한 종류, 각 변수가 앱에 기여할 수 있는 사항을 알아보세요.

Power Automate에서 실행할 데스크톱 흐름 예약

Power Automate에서 실행할 데스크톱 흐름 예약

이 자습서에서는 Power Automate를 사용하여 웹 또는 데스크톱에서 작업을 자동화하는 방법을 알려줍니다. 데스크톱 흐름 예약에 대한 포괄적인 가이드를 제공합니다.