Python 데이터 세트: 반복 가능한 코드 적용

Python 데이터 세트: 반복 가능한 코드 적용

이 블로그에서는 반복 가능한 코드 또는 함수를 Python 데이터 세트 에 적용하여 동일한 유형의 출력을 생성하는 방법을 배웁니다 . 이렇게 하면 서로 다른 데이터 세트에서 특정 데이터를 가져오는 데 더 효율적이고 노력을 덜 들이는 데 도움이 됩니다. 이 튜토리얼에서는 이전에 예제로 생성한 기존 코드를 활용할 것입니다.

또한 데이터 세트의 원본 버전이 손상되지 않도록 데이터 세트의 복사본을 만드는 방법, 반복 가능한 코드를 사용하여 라이브러리 및 함수를 가져오는 방법, LuckyTemplates에서 시각화를 만드는 방법을 배웁니다 .

이 블로그의 경우 항상 CSV 파일을 가져와서 LuckyTemplates로 가져오는 것이 좋습니다 . 또한 필요한 경우를 대비하여 이 CSV 파일을 가져와 LuckyTemplates에 바로 배치하는 방법도 보여드리겠습니다.

목차

LuckyTemplates에서 CSV 파일 가져오기

CSV 파일을 LuckyTemplates로 가져오려면 가장 먼저 홈 리본에서 " 데이터 가져오기 " 메뉴를 클릭해야 합니다 .

Python 데이터 세트: 반복 가능한 코드 적용

클릭하면 드롭다운 메뉴가 나타나고 메뉴에서 " Text/CSV " 옵션을 선택해야 합니다 .

Python 데이터 세트: 반복 가능한 코드 적용

" Text/CSV " 옵션을 선택하면 LuckyTemplates로 가져올 파일을 선택할 수 있는 창이 열립니다. 이 예에서는 IMDB Dataset 파일을 사용하겠습니다 . 

Python 데이터 세트: 반복 가능한 코드 적용

IMDB Dataset.csv 파일을 열면 해당 파일 내의 데이터를 표시하는 다른 창이 표시됩니다. 이 파일에는 많은 양의 데이터가 포함되어 있기 때문에 일부 데이터만 미리 볼 수 있습니다.

이 파일에서 가장 먼저 할 일은 파일을 변환하는 것입니다. 그렇게 하려면 창 오른쪽 하단에 있는 " 데이터 변환 " 옵션을 클릭하기만 하면 됩니다.

Python 데이터 세트: 반복 가능한 코드 적용

Python 데이터 세트의 복사본 만들기

이 데이터세트를 변경하기 전에 원본 데이터세트의 복사본을 만드는 것이 중요합니다. 이렇게 하려면 데이터 세트를  마우스 오른쪽 버튼으로 클릭하기 만 하면 됩니다.

Python 데이터 세트: 반복 가능한 코드 적용

그런 다음 메뉴에서 " 복사 "를 선택합니다.

Python 데이터 세트: 반복 가능한 코드 적용

마지막으로 쿼리 패널 을 마우스 오른쪽 버튼으로 클릭한 다음 옵션에서 " 붙여넣기 "를 선택합니다.

Python 데이터 세트: 반복 가능한 코드 적용

이러한 단계를 적용한 후 쿼리 패널 에 원본 IMDB 데이터 세트 의 복사본이 있어야 합니다 .

Python 데이터 세트: 반복 가능한 코드 적용

Python 스크립트를 실행하여 데이터 세트 변환

CSV 파일을 변환하면 많은 양의 Python 데이터 세트를 더 작은 데이터 세트로 나눌 수 있습니다. 이 파일에 일부 Python 스크립트를 적용하여 이를 수행할 수 있습니다.

그러나 먼저 헤더가 제대로 정렬되어 있는지 확인해야 합니다. 메뉴를 클릭한 다음 " 첫 행을 머리글로 사용 " 옵션을 찾아 클릭합니다.

Python 데이터 세트: 반복 가능한 코드 적용

" 첫 번째 행을 헤더로 사용 " 옵션을 클릭하면 이제 헤더가 " 리뷰 " 및 " 감정 "인 이전 첫 번째 행의 데이터로 변경됩니다.

Python 데이터 세트: 반복 가능한 코드 적용

다음으로 변환 메뉴로 이동하여 옵션의 " 스크립트 " 그룹 에서 " 파이썬 스크립트 실행 " 옵션을 클릭합니다 .

Python 데이터 세트: 반복 가능한 코드 적용

그런 다음 " Python 스크립트 실행 " 창이 팝업됩니다. 이 창에서 사용 중인 현재 파일을 변환하기 위해 원하는 Python 스크립트를 실행할 수 있습니다. 이 예에서는 다음 코드를 실행하여 데이터 세트를 더 작게 만들 것입니다.

Python 데이터 세트: 반복 가능한 코드 적용

데이터 세트에서 .iloc 함수를 사용하여 IMDB 데이터 세트에서 특정 행과 열을 선택했습니다. 그런 다음 매개변수에서 IMDB 데이터 세트의 처음 500개 행 과 모든 열을 모두 선택했습니다 . " dataset " 이라는 변수에 저장했습니다 .

스크립트를 실행하면 이전 단계에서 생성한 변수인 "데이터 세트"가 표시됩니다. 여기에는 Python 스크립트를 사용하여 변경한 데이터가 포함되어 있습니다.

Python 데이터 세트: 반복 가능한 코드 적용

데이터 세트 확인

데이터 세트 테이블을 열려면 열 아래의 " 테이블 " 을 클릭 하십시오 .

Python 데이터 세트: 반복 가능한 코드 적용

이제 이 데이터 세트가 500개 행 으로 줄어드는 것을 볼 수 있습니다 .

Python 데이터 세트: 반복 가능한 코드 적용

Python 데이터 세트를 500개의 행으로 분류했으므로 이제 필요한 라이브러리를 가져옵니다. IMDB Dataset의 콘텐츠를 변경할 때와 동일한 절차를 사용하여 이를 수행합니다. 이는 특정 시나리오에서 더 적은 변경으로 코드를 관리할 수 있는지 확인하기 위한 것입니다.

반복 가능한 코드를 사용하여 라이브러리 및 함수 가져오기

라이브러리를 가져오려면 노트북으로 돌아가서 필요한 라이브러리를 복사해 보겠습니다. 이 튜토리얼 이전에 복사하려는 라이브러리를 이미 생성했음을 명심하십시오. 함수를 반복 가능한 코드로 사용하는 것에 대한 아이디어를 명확하게 얻기 위해 이것을 재사용하고 있습니다.

Python 데이터 세트: 반복 가능한 코드 적용

라이브러리가 복사되면 " Python 스크립트 실행 " 창에 붙여넣고 스크립트 끝에  " from collections import Counter " 행을 포함하는 것을 잊지 마십시오 .

Python 데이터 세트: 반복 가능한 코드 적용

그런 다음 노트북에서 데이터 정리 기능을 복사하여 LuckyTemplates의 Python 스크립트에 추가합니다.

Python 데이터 세트: 반복 가능한 코드 적용

라이브러리 아래에 추가하겠습니다. 

Python 데이터 세트: 반복 가능한 코드 적용

방금 추가한 함수를 호출하는 코드도 복사합니다.

Python 데이터 세트: 반복 가능한 코드 적용

그런 다음 LuckyTemplates의 Python 스크립트에 붙여넣습니다.

Python 데이터 세트: 반복 가능한 코드 적용

데이터 테이블 생성

이제 데이터 정리 기능을 호출하는 코드를 추가했으므로 " df2 "를 " dataset "로, " title "을 " review "로 변경해야 합니다 . 데이터 세트에서 변경한 사항으로 인해 이 작업을 수행했습니다.

" dataset "에 500개 행의 데이터를 저장했기 때문에 "df2"를 "dataset"로 변경했습니다 . 그런 다음 "제목"은 열의 헤더를 변경한 결과 "리뷰"로 업데이트했습니다.

이 코드를 추가하면 단어 빈도에 대한 data1 , 바이그램 빈도에 대한 data2 , 트라이그램 빈도에 대한 data3 인 3개의 테이블을 얻거나 생성할 수 있습니다 .

Python 데이터 세트: 반복 가능한 코드 적용

이 변경된 IMDB 데이터 세트(2) 의 또 다른 복사본을 만들어 나중에 다른 테이블을 열 수도 있습니다 .

Python 데이터 세트: 반복 가능한 코드 적용

이제 IMDB Dataset(2) 에서 data1 테이블을 열어보겠습니다 . 

Python 데이터 세트: 반복 가능한 코드 적용

data1 테이블이  열리면 단어 목록과 빈도를 볼 수 있습니다.

Python 데이터 세트: 반복 가능한 코드 적용

보시다시피 Jupyter Notebook에서 가져온 반복 가능한 코드를 사용하여 기본 데이터 세트에서 특정 절차를 수행할 수 있습니다. 이러한 반복 가능한 코드를 사용하여 Python 데이터 세트를 변환하고 코드를 다시 입력하지 않고도 단어 빈도, 바이그램 빈도 및 트라이그램 빈도에 대한 테이블을 생성할 수 있습니다 .

IMDB Dataset (3) 에서 data2 테이블을 열어 바이그램 빈도를 살펴보겠습니다.

Python 데이터 세트: 반복 가능한 코드 적용

바이그램 빈도 테이블에서 목록에 포함된 " br "을 볼 수 있습니다. 이것은 아마도 HTML 코드에 연결되어 있을 것입니다. 돌아가서 다른 것을 추가할 수 있지만 이 튜토리얼에서는 그렇게 하지 않을 것입니다.

이제 반복 가능한 코드의 도움으로 데���터가 로드되었으므로 LuckyTemplates에서 데이터에 대한 시각화를 시작할 수 있습니다. 예를 들어, 각 단어의 빈도에 대한  막대 그래프입니다 .

Python 데이터 세트: 반복 가능한 코드 적용


파이썬 사용자 정의 함수 |
LuckyTemplates에서 Python을 사용하는 LuckyTemplates 의 Python 목록 및 For 루프 개요
| 데이터 세트 및 문자열 함수

결론

요약하면 반복 가능한 코드는 적은 노력으로 데이터 세트에서 특정 절차를 수행하는 데 도움이 될 수 있습니다. 반복 가능한 코드를 활용하여 LuckyTemplates에서 Python 데이터 세트를 변환하는 방법을 배웠습니다 . 또한 .iloc 함수를 사용하여 데이터 세트를 변경할 때 선택할 행과 열을 지정할 수 있었습니다 .

또한 데이터 세트의 복사본을 만들고 막대 그래프를 사용하여 시각화를 만들었습니다. 이 시각화는 반복 가능한 코드의 도움으로 만들고 변경한 Python 데이터 세트를 기반으로 합니다.

모두 제일 좋다,

갤림


파이썬에서 자기란 무엇인가: 실제 사례

파이썬에서 자기란 무엇인가: 실제 사례

파이썬에서 자기란 무엇인가: 실제 사례

R에서 RDS 파일을 저장하고 로드하는 방법

R에서 RDS 파일을 저장하고 로드하는 방법

R의 .rds 파일에서 개체를 저장하고 로드하는 방법을 배웁니다. 이 블로그에서는 R에서 LuckyTemplates로 개체를 가져오는 방법도 다룹니다.

첫 N 영업일 재방문 – DAX 코딩 언어 솔루션

첫 N 영업일 재방문 – DAX 코딩 언어 솔루션

이 DAX 코딩 언어 자습서에서는 GENERATE 함수를 사용하는 방법과 측정값 제목을 동적으로 변경하는 방법을 알아봅니다.

LuckyTemplates에서 다중 스레드 동적 시각적 개체 기술을 사용한 인사이트 쇼케이스

LuckyTemplates에서 다중 스레드 동적 시각적 개체 기술을 사용한 인사이트 쇼케이스

이 자습서에서는 다중 스레드 동적 시각적 개체 기술을 사용하여 보고서의 동적 데이터 시각화에서 통찰력을 만드는 방법을 다룹니다.

LuckyTemplates의 컨텍스트 필터링 소개

LuckyTemplates의 컨텍스트 필터링 소개

이 기사에서는 필터 컨텍스트를 살펴보겠습니다. 필터 컨텍스트는 모든 LuckyTemplates 사용자가 처음에 배워야 하는 주요 주제 중 하나입니다.

LuckyTemplates 온라인 서비스에서 앱을 사용하기 위한 최고의 팁

LuckyTemplates 온라인 서비스에서 앱을 사용하기 위한 최고의 팁

LuckyTemplates Apps 온라인 서비스가 다양한 소스에서 생성된 다양한 보고서 및 인사이트를 관리하는 데 어떻게 도움이 되는지 보여주고 싶습니다.

시간 경과에 따른 이익 마진 변화 분석 - LuckyTemplates 및 DAX를 사용한 분석

시간 경과에 따른 이익 마진 변화 분석 - LuckyTemplates 및 DAX를 사용한 분석

LuckyTemplates에서 측정 분기 및 DAX 수식 결합과 같은 기술을 사용하여 수익 마진 변경을 해결하는 방법을 알아봅니다.

DAX Studio의 데이터 캐시에 대한 구체화 아이디어

DAX Studio의 데이터 캐시에 대한 구체화 아이디어

이 자습서에서는 데이터 캐시의 구체화 아이디어와 결과 제공 시 DAX 성능에 미치는 영향에 대해 설명합니다.

LuckyTemplates를 사용한 비즈니스 보고

LuckyTemplates를 사용한 비즈니스 보고

지금까지 Excel을 계속 사용하고 있다면 지금이 비즈니스 보고 요구 사항에 LuckyTemplates를 사용하기 시작하는 가장 좋은 시기입니다.

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것