Python 데이터 세트: 반복 가능한 코드 적용

이 블로그에서는 반복 가능한 코드 또는 함수를 Python 데이터 세트 에 적용하여 동일한 유형의 출력을 생성하는 방법을 배웁니다 . 이렇게 하면 서로 다른 데이터 세트에서 특정 데이터를 가져오는 데 더 효율적이고 노력을 덜 들이는 데 도움이 됩니다. 이 튜토리얼에서는 이전에 예제로 생성한 기존 코드를 활용할 것입니다.

또한 데이터 세트의 원본 버전이 손상되지 않도록 데이터 세트의 복사본을 만드는 방법, 반복 가능한 코드를 사용하여 라이브러리 및 함수를 가져오는 방법, LuckyTemplates에서 시각화를 만드는 방법을 배웁니다 .

이 블로그의 경우 항상 CSV 파일을 가져와서 LuckyTemplates로 가져오는 것이 좋습니다 . 또한 필요한 경우를 대비하여 이 CSV 파일을 가져와 LuckyTemplates에 바로 배치하는 방법도 보여드리겠습니다.

목차

LuckyTemplates에서 CSV 파일 가져오기

CSV 파일을 LuckyTemplates로 가져오려면 가장 먼저 홈 리본에서 " 데이터 가져오기 " 메뉴를 클릭해야 합니다 .

Python 데이터 세트: 반복 가능한 코드 적용

클릭하면 드롭다운 메뉴가 나타나고 메뉴에서 " Text/CSV " 옵션을 선택해야 합니다 .

Python 데이터 세트: 반복 가능한 코드 적용

" Text/CSV " 옵션을 선택하면 LuckyTemplates로 가져올 파일을 선택할 수 있는 창이 열립니다. 이 예에서는 IMDB Dataset 파일을 사용하겠습니다 . 

Python 데이터 세트: 반복 가능한 코드 적용

IMDB Dataset.csv 파일을 열면 해당 파일 내의 데이터를 표시하는 다른 창이 표시됩니다. 이 파일에는 많은 양의 데이터가 포함되어 있기 때문에 일부 데이터만 미리 볼 수 있습니다.

이 파일에서 가장 먼저 할 일은 파일을 변환하는 것입니다. 그렇게 하려면 창 오른쪽 하단에 있는 " 데이터 변환 " 옵션을 클릭하기만 하면 됩니다.

Python 데이터 세트: 반복 가능한 코드 적용

Python 데이터 세트의 복사본 만들기

이 데이터세트를 변경하기 전에 원본 데이터세트의 복사본을 만드는 것이 중요합니다. 이렇게 하려면 데이터 세트를  마우스 오른쪽 버튼으로 클릭하기 만 하면 됩니다.

Python 데이터 세트: 반복 가능한 코드 적용

그런 다음 메뉴에서 " 복사 "를 선택합니다.

Python 데이터 세트: 반복 가능한 코드 적용

마지막으로 쿼리 패널 을 마우스 오른쪽 버튼으로 클릭한 다음 옵션에서 " 붙여넣기 "를 선택합니다.

Python 데이터 세트: 반복 가능한 코드 적용

이러한 단계를 적용한 후 쿼리 패널 에 원본 IMDB 데이터 세트 의 복사본이 있어야 합니다 .

Python 데이터 세트: 반복 가능한 코드 적용

Python 스크립트를 실행하여 데이터 세트 변환

CSV 파일을 변환하면 많은 양의 Python 데이터 세트를 더 작은 데이터 세트로 나눌 수 있습니다. 이 파일에 일부 Python 스크립트를 적용하여 이를 수행할 수 있습니다.

그러나 먼저 헤더가 제대로 정렬되어 있는지 확인해야 합니다. 메뉴를 클릭한 다음 " 첫 행을 머리글로 사용 " 옵션을 찾아 클릭합니다.

Python 데이터 세트: 반복 가능한 코드 적용

" 첫 번째 행을 헤더로 사용 " 옵션을 클릭하면 이제 헤더가 " 리뷰 " 및 " 감정 "인 이전 첫 번째 행의 데이터로 변경됩니다.

Python 데이터 세트: 반복 가능한 코드 적용

다음으로 변환 메뉴로 이동하여 옵션의 " 스크립트 " 그룹 에서 " 파이썬 스크립트 실행 " 옵션을 클릭합니다 .

Python 데이터 세트: 반복 가능한 코드 적용

그런 다음 " Python 스크립트 실행 " 창이 팝업됩니다. 이 창에서 사용 중인 현재 파일을 변환하기 위해 원하는 Python 스크립트를 실행할 수 있습니다. 이 예에서는 다음 코드를 실행하여 데이터 세트를 더 작게 만들 것입니다.

Python 데이터 세트: 반복 가능한 코드 적용

데이터 세트에서 .iloc 함수를 사용하여 IMDB 데이터 세트에서 특정 행과 열을 선택했습니다. 그런 다음 매개변수에서 IMDB 데이터 세트의 처음 500개 행 과 모든 열을 모두 선택했습니다 . " dataset " 이라는 변수에 저장했습니다 .

스크립트를 실행하면 이전 단계에서 생성한 변수인 "데이터 세트"가 표시됩니다. 여기에는 Python 스크립트를 사용하여 변경한 데이터가 포함되어 있습니다.

Python 데이터 세트: 반복 가능한 코드 적용

데이터 세트 확인

데이터 세트 테이블을 열려면 열 아래의 " 테이블 " 을 클릭 하십시오 .

Python 데이터 세트: 반복 가능한 코드 적용

이제 이 데이터 세트가 500개 행 으로 줄어드는 것을 볼 수 있습니다 .

Python 데이터 세트: 반복 가능한 코드 적용

Python 데이터 세트를 500개의 행으로 분류했으므로 이제 필요한 라이브러리를 가져옵니다. IMDB Dataset의 콘텐츠를 변경할 때와 동일한 절차를 사용하여 이를 수행합니다. 이는 특정 시나리오에서 더 적은 변경으로 코드를 관리할 수 있는지 확인하기 위한 것입니다.

반복 가능한 코드를 사용하여 라이브러리 및 함수 가져오기

라이브러리를 가져오려면 노트북으로 돌아가서 필요한 라이브러리를 복사해 보겠습니다. 이 튜토리얼 이전에 복사하려는 라이브러리를 이미 생성했음을 명심하십시오. 함수를 반복 가능한 코드로 사용하는 것에 대한 아이디어를 명확하게 얻기 위해 이것을 재사용하고 있습니다.

Python 데이터 세트: 반복 가능한 코드 적용

라이브러리가 복사되면 " Python 스크립트 실행 " 창에 붙여넣고 스크립트 끝에  " from collections import Counter " 행을 포함하는 것을 잊지 마십시오 .

Python 데이터 세트: 반복 가능한 코드 적용

그런 다음 노트북에서 데이터 정리 기능을 복사하여 LuckyTemplates의 Python 스크립트에 추가합니다.

Python 데이터 세트: 반복 가능한 코드 적용

라이브러리 아래에 추가하겠습니다. 

Python 데이터 세트: 반복 가능한 코드 적용

방금 추가한 함수를 호출하는 코드도 복사합니다.

Python 데이터 세트: 반복 가능한 코드 적용

그런 다음 LuckyTemplates의 Python 스크립트에 붙여넣습니다.

Python 데이터 세트: 반복 가능한 코드 적용

데이터 테이블 생성

이제 데이터 정리 기능을 호출하는 코드를 추가했으므로 " df2 "를 " dataset "로, " title "을 " review "로 변경해야 합니다 . 데이터 세트에서 변경한 사항으로 인해 이 작업을 수행했습니다.

" dataset "에 500개 행의 데이터를 저장했기 때문에 "df2"를 "dataset"로 변경했습니다 . 그런 다음 "제목"은 열의 헤더를 변경한 결과 "리뷰"로 업데이트했습니다.

이 코드를 추가하면 단어 빈도에 대한 data1 , 바이그램 빈도에 대한 data2 , 트라이그램 빈도에 대한 data3 인 3개의 테이블을 얻거나 생성할 수 있습니다 .

Python 데이터 세트: 반복 가능한 코드 적용

이 변경된 IMDB 데이터 세트(2) 의 또 다른 복사본을 만들어 나중에 다른 테이블을 열 수도 있습니다 .

Python 데이터 세트: 반복 가능한 코드 적용

이제 IMDB Dataset(2) 에서 data1 테이블을 열어보겠습니다 . 

Python 데이터 세트: 반복 가능한 코드 적용

data1 테이블이  열리면 단어 목록과 빈도를 볼 수 있습니다.

Python 데이터 세트: 반복 가능한 코드 적용

보시다시피 Jupyter Notebook에서 가져온 반복 가능한 코드를 사용하여 기본 데이터 세트에서 특정 절차를 수행할 수 있습니다. 이러한 반복 가능한 코드를 사용하여 Python 데이터 세트를 변환하고 코드를 다시 입력하지 않고도 단어 빈도, 바이그램 빈도 및 트라이그램 빈도에 대한 테이블을 생성할 수 있습니다 .

IMDB Dataset (3) 에서 data2 테이블을 열어 바이그램 빈도를 살펴보겠습니다.

Python 데이터 세트: 반복 가능한 코드 적용

바이그램 빈도 테이블에서 목록에 포함된 " br "을 볼 수 있습니다. 이것은 아마도 HTML 코드에 연결되어 있을 것입니다. 돌아가서 다른 것을 추가할 수 있지만 이 튜토리얼에서는 그렇게 하지 않을 것입니다.

이제 반복 가능한 코드의 도움으로 데���터가 로드되었으므로 LuckyTemplates에서 데이터에 대한 시각화를 시작할 수 있습니다. 예를 들어, 각 단어의 빈도에 대한  막대 그래프입니다 .

Python 데이터 세트: 반복 가능한 코드 적용


파이썬 사용자 정의 함수 |
LuckyTemplates에서 Python을 사용하는 LuckyTemplates 의 Python 목록 및 For 루프 개요
| 데이터 세트 및 문자열 함수

결론

요약하면 반복 가능한 코드는 적은 노력으로 데이터 세트에서 특정 절차를 수행하는 데 도움이 될 수 있습니다. 반복 가능한 코드를 활용하여 LuckyTemplates에서 Python 데이터 세트를 변환하는 방법을 배웠습니다 . 또한 .iloc 함수를 사용하여 데이터 세트를 변경할 때 선택할 행과 열을 지정할 수 있었습니다 .

또한 데이터 세트의 복사본을 만들고 막대 그래프를 사용하여 시각화를 만들었습니다. 이 시각화는 반복 가능한 코드의 도움으로 만들고 변경한 Python 데이터 세트를 기반으로 합니다.

모두 제일 좋다,

갤림

Leave a Comment

SharePoint의 계산된 열 | 개요

SharePoint의 계산된 열 | 개요

SharePoint에서 계산된 열의 중요성과 목록에서 자동 계산 및 데이터 수집을 수행하는 방법을 알아보세요.

Power Apps에서 변수 만들기: 컬렉션 작업

Power Apps에서 변수 만들기: 컬렉션 작업

컬렉션 변수를 사용하여 Power Apps에서 변수 만드는 방법 및 유용한 팁에 대해 알아보세요.

Microsoft Flow HTTP 트리거 | Power Automate 자습서

Microsoft Flow HTTP 트리거 | Power Automate 자습서

Microsoft Flow HTTP 트리거가 수행할 수 있는 작업과 Microsoft Power Automate의 예를 사용하여 이를 사용하는 방법을 알아보고 이해하십시오!

Power Automate 흐름: 사용법 및 유형 설명

Power Automate 흐름: 사용법 및 유형 설명

Power Automate 흐름 및 용도에 대해 자세히 알아보세요. 다양한 작업 및 시나리오에 사용할 수 있는 다양한 유형의 흐름에 대해 설명합니다.

흐름에서 Power Automate 종료 작업 제어

흐름에서 Power Automate 종료 작업 제어

조건이 충족되지 않는 경우 흐름에서 작업을 종료하는 Power Automate 종료 작업 컨트롤을 올바르게 사용하는 방법을 알아봅니다.

PowerApps 시작 기능: 앱에서 다른 서비스를 시작하는 방법

PowerApps 시작 기능: 앱에서 다른 서비스를 시작하는 방법

PowerApps 실행 기능에 대해 자세히 알아보고 자신의 앱에서 바로 웹사이트, 전화, 이메일 및 기타 앱과 같은 기타 서비스를 실행하십시오.

Power Automate의 HTTP 요청 – 소개

Power Automate의 HTTP 요청 – 소개

타사 애플리케이션 통합과 관련하여 Power Automate의 HTTP 요청이 작동하는 방식을 배우고 이해합니다.

Power Automate Desktop: 마우스 클릭 보내기 기능을 사용하는 방법

Power Automate Desktop: 마우스 클릭 보내기 기능을 사용하는 방법

Power Automate Desktop에서 Send Mouse Click을 사용하는 방법을 알아보고 이것이 어떤 이점을 제공하고 흐름 성능을 개선하는지 알아보십시오.

PowerApps 변수: 컨텍스트 및 전역 변수 식별

PowerApps 변수: 컨텍스트 및 전역 변수 식별

PowerApps 변수의 작동 방식, 다양한 종류, 각 변수가 앱에 기여할 수 있는 사항을 알아보세요.

Power Automate에서 실행할 데스크톱 흐름 예약

Power Automate에서 실행할 데스크톱 흐름 예약

이 자습서에서는 Power Automate를 사용하여 웹 또는 데스크톱에서 작업을 자동화하는 방법을 알려줍니다. 데스크톱 흐름 예약에 대한 포괄적인 가이드를 제공합니다.