Python을 사용한 텍스트 분석: 품사 식별 방법

이 블로그에서는 Python을 사용하여 텍스트 분석을 수행하여 LuckyTemplates 내의 텍스트 데이터에서 품사를 식별하는 방법을 보여줍니다 . 텍스트 분석을 위해 Python을 사용하는 단계를 다루고 텍스트 분석 프로젝트를 시작하는 데 도움이 되는 예제와 팁을 제공합니다. 이 블로그 하단에서 이 튜토리얼의 전체 비디오를 볼 수 있습니다.

목차

소스 데이터

이 자습서에서는 평가할 텍스트가 포함된 즉시 사용 가능한 단어 구름을 사용합니다. 이것은 아래 이미지의 왼쪽에 표시됩니다. 오른쪽에는 형용사나 동사와 같은 다양한 품사를 식별하는 필터가 있습니다. 

Python을 사용한 텍스트 분석: 품사 식별 방법

부사, 명사, 다양한 유형의 명사 또는 동사, 동사 기반인 단어를 걸러낼 수 있습니다. 이는 마케팅 캠페인을 만들고 고객 리뷰에서 단어를 찾을 때 매우 유용합니다. 

파워 쿼리 편집기 를 열어 시작하겠습니다 . 

원본 데이터에는 ID, 나이, 제목 및 리뷰 텍스트에 대한 열이 있습니다. 검토 텍스트 열에 초점을 맞추고 텍스트 분석을 수행하기 위해 구문 분석할 것입니다. 분석에 유용할 수 있는 다른 범주도 있습니다.

Python을 사용한 텍스트 분석: 품사 식별 방법

Python을 사용한 텍스트 분석

가져온 일반 데이터부터 시작하겠습니다. 가장 먼저 할 일은 데이터가 많기 때문에 행을 필터링하는 것이고 텍스트 분석을 할 때 시간이 걸립니다. 

데이터를 필터링하려면 텍스트 분석을 조금 더 빠르게 하기 위해 처음 50개 행을 가져옵니다. 

Python을 사용한 텍스트 분석: 품사 식별 방법

필터링되면 Python 스크립트 변환실행 으로 이동합니다. 코드가 많지 않기 때문에 여기에 모든 것을 코딩할 것입니다. 

Python을 사용한 텍스트 분석: 품사 식별 방법

패키지 가져오기

Python 스크립트 편집기 를 사용하여 Python 텍스트 분석을 위한 두 개의 패키지를 가져와 보겠습니다 . 변수 pd로 저장할 데이터 조작 라이브러리인 " pandas as pd"를 가져올 것입니다 . 그런 다음 " from text blob " 단어 사이에 대문자를 사용하여  " TextBlob 가져오기"를 수행합니다 .

우리는 항상 문서 문자열을 넣어 우리가 하는 일을 문서화할 수 있습니다. 우리 패키지 위에 #bring in the essential library를 작성합시다 .

Python을 사용한 텍스트 분석: 품사 식별 방법

변수 이름 바꾸기

스크립트의 첫 번째 줄에는 # 'dataset'이 이 스크립트에 대한 입력 데이터를 보유한다고 말하는 LuckyTemplates에서 제공하는 이 줄이 있습니다. 이 줄은 데이터를 데이터 세트라고 합니다. 

"데이터 세트"를 작성하는 데 너무 오래 걸리므로 변경하겠습니다. #change the dataset 변수를 입력 하고 다음 줄에 df = dataset을 입력합니다.

Python을 사용한 텍스트 분석: 품사 식별 방법

이제 변수를 작성하는 것이 더 짧습니다. 

텍스트 분석하기

텍스트 분석을 진행해 보겠습니다. 검토 텍스트는 개별 셀이 있는 열에 있음을 기억하십시오. 이 설정은 우리가 분석을 수행할 수 있도록 모든 텍스트를 함께 원하기 때문에 실제로 도움이 되지 않습니다. 

그러나 공백 없이 연결되는 것을 원하지 않으므로 큰따옴표 안에 공백을 두고 코드를 시작하겠습니다 .  

그런 다음 .join을 추가 하고 데이터 세트를 보유하는 df 변수를 사용하여 리뷰 텍스트 열을 분리해 보겠습니다 . 열을 분리하는 대괄호 표기법 안에 'Review Text'를 입력  합니다 .

이 코드는 모든 것을 조인하지만 저장해야 하므로 단어라는 변수를 생성하겠습니다 .

Python을 사용한 텍스트 분석: 품사 식별 방법

모든 단어가 함께 있으면 텍스트 블롭을 사용하여 단어 분석을 시작할 수 있습니다. 

가장 먼저 할 일은 텍스트 blob에 단어를 전달하는 데 필요한 blob 변수를 사용하여 품사를 만드는 것입니다 . 우리는 그 텍스트 blob을 사용하고 우리의 words 인 텍스트를 전달할 것입니다 . 이것은 blob = TextBlob(단어)로 입력됩니다 .

이제 해당 blob이 있으므로 blob.tags를 사용하여 parts_of_speech 변수를 생성합니다 . 태그는 각 품사의 약어입니다. 

다음에 할 일은 우리가 가져온 Pandas를 사용하여 이것을 데이터 프레임으로 저장하는 것입니다. pd.DataFrame 과 동일한 데이터 라고 하고 parts_of_speech 를 가져옵니다 . 

Python을 사용한 텍스트 분석: 품사 식별 방법

확인을 클릭하여 코드를 실행해 보겠습니다. 코드를 실행한 후 변수 테이블을 가져와야 합니다. 데이터 세트 또는 원본 데이터 가 있습니다 . 데이터df 도 있습니다 . 

Python을 사용한 텍스트 분석: 품사 식별 방법

의도한 결과를 얻지 못한 경우 코드에서 발생할 수 있는 몇 가지 오류를 방지할 수 있는 다양한 방법을 보여줍니다.

Python에서 텍스트 분석을 위한 코드 수정

때때로 우리는 관련된 텍스트의 형식을 변경하는 데 매우 명시적이어야 할 수 있습니다. 

df 변수를 호출하고 대괄호 표기법 안에 있는 '리뷰 텍스트 '를 분리한 다음 .astype('str') 을 사용하여 유형을 문자열로 변경 하면 됩니다 . 그런 다음 이것을 df 변수 에 다시 저장하십시오 . 

Python을 사용한 텍스트 분석: 품사 식별 방법

확인을 클릭하여 코드를 다시 실행합니다. 이전에 얻은 것과 동일한 결과를 얻어야 합니다.

이제 데이터가 어떻게 보이는지 확인하기 위해 가져온 마지막 변수인  데이터를 열고 싶습니다 .

Python을 사용한 텍스트 분석: 품사 식별 방법

우리는 모든 말을 품사로 구분해야 합니다. 아직 열 이름을 지정하지 않았지만 쉽게 지정할 수 있습니다. 

Python을 사용한 텍스트 분석: 품사 식별 방법

이 동일한 텍스트 분석의 이전 버전에서는 첫 번째 열을 Word 로 , 두 번째 열을 Abbreviation 이라고 했습니다 . 

Python을 사용한 텍스트 분석: 품사 식별 방법

품사 쿼리 에서 이러한 약어에 해당하는 실제 단어를 가져와 모두 함께 연결합니다.

Python을 사용한 텍스트 분석: 품사 식별 방법

이제 Close & Apply 를 해보자 . 

Python을 사용한 텍스트 분석: 품사 식별 방법

우리가 수행한 단계를 통해 간단한 Python 코드 를 사용하여 식별한 다양한 품사를 필터링할 수 있었습니다 . LuckyTemplates에서 텍스트가 속하는 품사 범주에 따라 텍스트를 쉽게 필터링할 수 있는 시각적 개체를 제공합니다. 

Python을 사용한 텍스트 분석: 품사 식별 방법


Python의 텍스트 분석 | Python 사용자 정의 함수 소개
| LuckyTemplates의 Python 목록 및 For 루프 개요

결론

데이터 분석가 로서 많은 양의 구조화되지 않은 텍스트 데이터에서 통찰력과 의미를 추출해야 할 필요성에 직면할 수 있습니다. 학습한 내용은 텍스트 분석을 통해 텍스트 데이터를 이해하는 데 유용한 접근 방식입니다.

이제 텍스트를 단어 및 문장과 같은 더 작은 단위로 쉽게 분해한 다음 패턴 및 관계에 대해 이러한 단위를 분석할 수 있습니다. Python 및 LuckyTemplates에서 텍스트 분석을 사용하여 이러한 모든 목표를 달성할 수 있습니다. 

모두 제일 좋다,

Leave a Comment

SharePoint의 계산된 열 | 개요

SharePoint의 계산된 열 | 개요

SharePoint에서 계산된 열의 중요성과 목록에서 자동 계산 및 데이터 수집을 수행하는 방법을 알아보세요.

Power Apps에서 변수 만들기: 컬렉션 작업

Power Apps에서 변수 만들기: 컬렉션 작업

컬렉션 변수를 사용하여 Power Apps에서 변수 만드는 방법 및 유용한 팁에 대해 알아보세요.

Microsoft Flow HTTP 트리거 | Power Automate 자습서

Microsoft Flow HTTP 트리거 | Power Automate 자습서

Microsoft Flow HTTP 트리거가 수행할 수 있는 작업과 Microsoft Power Automate의 예를 사용하여 이를 사용하는 방법을 알아보고 이해하십시오!

Power Automate 흐름: 사용법 및 유형 설명

Power Automate 흐름: 사용법 및 유형 설명

Power Automate 흐름 및 용도에 대해 자세히 알아보세요. 다양한 작업 및 시나리오에 사용할 수 있는 다양한 유형의 흐름에 대해 설명합니다.

흐름에서 Power Automate 종료 작업 제어

흐름에서 Power Automate 종료 작업 제어

조건이 충족되지 않는 경우 흐름에서 작업을 종료하는 Power Automate 종료 작업 컨트롤을 올바르게 사용하는 방법을 알아봅니다.

PowerApps 시작 기능: 앱에서 다른 서비스를 시작하는 방법

PowerApps 시작 기능: 앱에서 다른 서비스를 시작하는 방법

PowerApps 실행 기능에 대해 자세히 알아보고 자신의 앱에서 바로 웹사이트, 전화, 이메일 및 기타 앱과 같은 기타 서비스를 실행하십시오.

Power Automate의 HTTP 요청 – 소개

Power Automate의 HTTP 요청 – 소개

타사 애플리케이션 통합과 관련하여 Power Automate의 HTTP 요청이 작동하는 방식을 배우고 이해합니다.

Power Automate Desktop: 마우스 클릭 보내기 기능을 사용하는 방법

Power Automate Desktop: 마우스 클릭 보내기 기능을 사용하는 방법

Power Automate Desktop에서 Send Mouse Click을 사용하는 방법을 알아보고 이것이 어떤 이점을 제공하고 흐름 성능을 개선하는지 알아보십시오.

PowerApps 변수: 컨텍스트 및 전역 변수 식별

PowerApps 변수: 컨텍스트 및 전역 변수 식별

PowerApps 변수의 작동 방식, 다양한 종류, 각 변수가 앱에 기여할 수 있는 사항을 알아보세요.

Power Automate에서 실행할 데스크톱 흐름 예약

Power Automate에서 실행할 데스크톱 흐름 예약

이 자습서에서는 Power Automate를 사용하여 웹 또는 데스크톱에서 작업을 자동화하는 방법을 알려줍니다. 데스크톱 흐름 예약에 대한 포괄적인 가이드를 제공합니다.