Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Bu blogda, LuckyTemplates'da metin verilerindeki konuşma bölümlerini belirlemek için Python kullanarak nasıl metin analizi yapacağınızı göstereceğiz . Python'u metin analizi için kullanma adımlarını ele alacağız ve kendi metin analizi projelerinize başlamanıza yardımcı olacak örnekler ve ipuçları vereceğiz. Bu eğitimin tam videosunu bu blogun alt kısmından izleyebilirsiniz.

İçindekiler

Kaynak Veriler

Bu eğitimde, değerlendireceğimiz metinleri içeren, kullanıma hazır bir kelime bulutu kullanacağız. Bu, aşağıdaki görüntünün sol tarafında gösterilmiştir. Sağ tarafta, örneğin sıfatlar veya fiiller gibi konuşmanın farklı bölümlerini tanımlayan filtrelerimiz var. 

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Zarf, isim, farklı isim veya fiil türleri ve fiil tabanları olan kelimeleri filtreleyebiliriz. Bu, bir pazarlama kampanyası oluştururken ve müşteri incelemelerinizde kelimeler ararken çok kullanışlıdır. 

Power Query düzenleyicimizi açarak başlayalım . 

Kaynak verilerimizde kimlikler, yaş, unvan ve inceleme metni için sütunlarımız var. Metni İncele sütununa odaklanacağız ve metin analizimizi yapmak için onu ayrıştıracağız. Analizimizde faydalı olabilecek başka kategoriler de var.

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Python Kullanarak Metin Analizi

Getirdiğimiz normal verilerle başlayalım. İlk yapacağımız şey satırları filtrelemek olacak çünkü çok fazla verimiz var ve metin analizi yaptığımızda zaman alıyor. 

Verilerimizi filtrelemek için, metin analizini biraz daha hızlı yapmak için ilk 50 satırı alın. 

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Filtrelendikten sonra, Python betiğini Dönüştür ve Çalıştır'a gidin . Çok fazla kod olmadığı için burada her şeyi kodlayacağız. 

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Paketleri İçe Aktarma

Python betik düzenleyicimizi kullanarak Python metin analizimiz için iki paket getirelim . Veri işleme kitaplığımız pd değişkeni olarak kaydedilecek olan pandaları pd olarak içe aktaracağız ” . Ardından “ from text blob , kelimeler arasına büyük harflerle  “ TextBlob'u import” edeceğiz .

Bir belge dizisi koyarak ne yaptığımızı her zaman belgeleyebiliriz. Paketlerimizin üzerine gerekli kütüphaneleri #bring in yazalım .

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Değişkeni Yeniden Adlandırmak

Komut dosyamızın ilk satırında, LuckyTemplates tarafından sağlanan # 'dataset' bu komut dosyası için giriş verilerini tutar diyen bir satır var. Bu satır, verilerimizin veri kümesi olarak adlandırıldığını söylüyor. 

Bunu değiştirelim çünkü “veri kümesi” yazmak çok uzun sürüyor. Sonraki satıra #change dataset değişkenini ve df = dataset yazın .

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Şimdi değişkenimizi yazmak daha kısa. 

Metin Analizini Yapmak

Metin çözümlememize devam edelim. İnceleme metinlerimizin tek tek hücreler içeren bir sütunda olduğunu hatırlayın. Bu kurulum bize pek yardımcı olmuyor çünkü üzerinde bir analiz yapabilmek için tüm metinleri bir arada istiyoruz. 

Ancak boşluk olmadan birleştirilmesini istemiyoruz, o yüzden kodumuza çift tırnak içinde boşluk bırakarak başlayalım .  

Ardından .join'i ekleyelim ve veri setini tutan df değişkenimizi kullanarak inceleme metni sütunumuzu izole edelim . Sütunu izole eden köşeli parantez gösteriminin içine yerleştirilmiş  'Review Text' yazın .

Bu kod her şeyi birleştirecek, ancak onu kaydetmemiz gerekiyor, bu yüzden word adında bir değişken oluşturalım .

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Tüm kelimeleri bir araya getirdikten sonra, kelimeleri analiz etmeye başlamak için metin bloğumuzu kullanabiliriz. 

Yapılacak ilk şey , kelimeleri bir metin bloğuna iletmek için ihtiyaç duyduğumuz blob değişkenini kullanarak konuşma bölümlerimizi oluşturmaktır . Bu metin blobunu kullanacağız ve sözlerimiz olan metni geçireceğiz . Bu , blob = TextBlob(words) şeklinde yazılır .

Artık bu blob'a sahip olduğumuza göre, onu alıp blob.tags'ı kullanarak parts_of_speech değişkenimizi oluşturacağız . Etiketler, konuşmanın her bir bölümünün kısaltmaları olacaktır. 

Bundan sonra yapacağımız şey, getirdiğimiz Pandaları kullanarak bunu bir veri çerçevesi olarak kaydetmek . 

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Tamam diyerek kodumuzu çalıştıralım. Kodumuzu çalıştırdıktan sonra, değişkenlerimizin bir tablosunu almalıyız. Veri kümesine veya orijinal verilerimize sahibiz . Ayrıca verilerimiz ve df var . 

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

İstenen sonuçları alamadıysanız, kodda alabileceğiniz bazı hataları önlemenin farklı yollarını size göstereceğiz.

Python'da Metin Analizi İçin Kodu Düzeltme

Bazen ilgilendiğimiz metnin biçimini değiştirirken çok açık olmamız gerekebilir. 

Bunu, df değişkenimizi çağırarak, köşeli parantez içindeki 'Review Text'i ayırarak ve ardından .astype('str') kullanarak türü dizgelere çevirerek yapabiliriz . Ardından bunu df değişkenine yeniden kaydedin . 

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Kodu yeniden çalıştırmak için Tamam'ı tıklayın . Daha önce aldığımız sonuçların aynısını almalıyız.

Şimdi, neye benzediğini görmek için getirdiğimiz son değişken olan  data'mızı açmak istiyoruz .

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Tüm sözlerimizi konuşma bölümlerine göre ayırmalıyız. Sütunlarımıza henüz isim vermedik ama bunu kolayca yapabiliriz. 

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Aynı metin analizinin eski versiyonunda, ilk sütunu Word ve ikincisini Abbreviation olarak adlandırdım . 

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Konuşma Bölümleri sorgusunda , bu kısaltmalar için olan gerçek kelimeleri getirir ve hepsini birbirine bağlarız.

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Şimdi Kapatıp Uygulayalım

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?

Yaptığımız adımlar, basit bir Python kodu kullanarak tanımladığımız konuşmanın farklı bölümlerini filtrelememize izin verdi . Bize LuckyTemplates'da metnimizi konuşma kategorisinin hangi bölümlerine ait olduklarına göre kolayca filtreleyebileceğimiz bu görseli veriyor. 

Python Kullanarak Metin Analizi: Konuşmanın Bölümlerini Nasıl Belirlersiniz?


Python'da Metin Analizi | Giriş
Python Kullanıcı Tanımlı Fonksiyonlar | LuckyTemplates'da Python Listesine ve For Loop'a Genel Bakış

Çözüm

Bir veri analisti olarak , büyük miktarda yapılandırılmamış metin verisinden içgörü ve anlam çıkarma ihtiyacıyla karşılaşabilirsiniz. Öğrendiğiniz şey, metin analizi yoluyla metin verilerini anlamak için yararlı bir yaklaşımdır.

Artık metni kolayca sözcükler ve cümleler gibi daha küçük birimlere ayırabilir ve ardından bu birimleri kalıplar ve ilişkiler açısından analiz edebilirsiniz. Python ve LuckyTemplates'da metin analizini kullanarak tüm bu hedeflere ulaşabilirsiniz. 

Herşey gönlünce olsun,

Leave a Comment

Excel Hücrelerini Metne Sığdırma: 4 Kolay Çözüm

Excel Hücrelerini Metne Sığdırma: 4 Kolay Çözüm

Excel hücrelerini metne sığdırmak için güncel bilgileri ve 4 kolay çözümü keşfedin.

Bir Excel Dosyasının Boyutu Nasıl Küçültülür – 6 Etkili Yöntem

Bir Excel Dosyasının Boyutu Nasıl Küçültülür – 6 Etkili Yöntem

Bir Excel Dosyasının Boyutunu Küçültmek için 6 Etkili Yöntem. Hızlı ve kolay yöntemler ile verilerinizi kaybetmeden yer açın.

Pythonda Self Nedir: Gerçek Dünyadan Örnekler

Pythonda Self Nedir: Gerçek Dünyadan Örnekler

Python'da Self Nedir: Gerçek Dünyadan Örnekler

Rde Bir RDS Dosyası Nasıl Kaydedilir ve Yüklenir

Rde Bir RDS Dosyası Nasıl Kaydedilir ve Yüklenir

R'de bir .rds dosyasındaki nesneleri nasıl kaydedeceğinizi ve yükleyeceğinizi öğreneceksiniz. Bu blog aynı zamanda R'den LuckyTemplates'a nesnelerin nasıl içe aktarılacağını da ele alacaktır.

İlk N İş Günü Tekrar Ziyaret Edildi – Bir DAX Kodlama Dili Çözümü

İlk N İş Günü Tekrar Ziyaret Edildi – Bir DAX Kodlama Dili Çözümü

Bu DAX kodlama dili eğitiminde, GENERATE işlevinin nasıl kullanılacağını ve bir ölçü başlığının dinamik olarak nasıl değiştirileceğini öğrenin.

LuckyTemplatesda Çok İş Parçacıklı Dinamik Görsel Tekniği Kullanarak Öngörüleri Sergileyin

LuckyTemplatesda Çok İş Parçacıklı Dinamik Görsel Tekniği Kullanarak Öngörüleri Sergileyin

Bu eğitici, raporlarınızdaki dinamik veri görselleştirmelerinden içgörüler oluşturmak için Çok Kanallı Dinamik Görseller tekniğinin nasıl kullanılacağını kapsayacaktır.

LuckyTemplatesda İçeriği Filtrelemeye Giriş

LuckyTemplatesda İçeriği Filtrelemeye Giriş

Bu yazıda, filtre bağlamından geçeceğim. Filtre bağlamı, herhangi bir LuckyTemplates kullanıcısının başlangıçta öğrenmesi gereken en önemli konulardan biridir.

LuckyTemplates Çevrimiçi Hizmetindeki Uygulamaları Kullanmak İçin En İyi İpuçları

LuckyTemplates Çevrimiçi Hizmetindeki Uygulamaları Kullanmak İçin En İyi İpuçları

LuckyTemplates Apps çevrimiçi hizmetinin çeşitli kaynaklardan oluşturulan farklı raporların ve içgörülerin yönetilmesine nasıl yardımcı olabileceğini göstermek istiyorum.

Fazla Mesai Kâr Marjı Değişikliklerini Analiz Edin - LuckyTemplates ve DAX ile Analitik

Fazla Mesai Kâr Marjı Değişikliklerini Analiz Edin - LuckyTemplates ve DAX ile Analitik

LuckyTemplates'da ölçü dallandırma ve DAX formüllerini birleştirme gibi teknikleri kullanarak kâr marjı değişikliklerinizi nasıl hesaplayacağınızı öğrenin.

DAX Studioda Veri Önbellekleri İçin Materyalleştirme Fikirleri

DAX Studioda Veri Önbellekleri İçin Materyalleştirme Fikirleri

Bu öğreticide, veri önbelleklerini gerçekleştirme fikirleri ve bunların DAX'ın sonuç sağlama performansını nasıl etkilediği tartışılacaktır.