Pythonda Lemmatizasyon | Başlangıç ​​Kılavuzu

Bu eğitimde, bir kelimenin farklı öğelerini bir araya getirmek için kullanılan bir yöntem olan Python'da lemmatizasyonu tartışacağız . Lemmatizasyon ayrıca kelime çekimini azaltmayı amaçlar ve bir kelimenin kök veya temel biçimini sağlamaya odaklanır ki bu lemma kelimesinin anlamıdır.

İçindekiler

Lemmatizasyon ve Stemming

Lemmatizasyon , kelimelerdeki çekimleri azaltma işlevi de gören gövdeye benzer. Tek fark, lemmatizasyonun sonuç olarak sözlük tabanlı kelimeleri kullanmasıdır.

Öte yandan, gövde çıkarma , çekimli bir sözcükten yalnızca ekleri kaldırır, bu da var olmayan sözcüklerle sonuçlanabilir.

Örneğin, etüd kelimesinin kökünden yararlanırsak , etüd kelimesinden es ekini kaldırmayı amaçladığından, bir çıktı olarak studio kelimesini verecektir .

Öte yandan, lemmatizasyondan yararlanılırsa, bir kelimenin temel şeklini sağlamaya odaklandığından kelime çalışması sonuç olarak verilecektir.

Lemmatizasyonu Kullanırken Dikkate Alınması Gerekenler

  • Sözlük tabanlı kelimeler kullanır. Bir kelimenin kökü veya temel hali anlamına gelen lemma terimi ile lemmatizasyon, bir kelimenin sadece çekimlerini kaldırmaktan ziyade kelimenin temel şeklini sağlamayı amaçlar.
  • Temel bir kelime bulmak tamamen konuşmanın bölümlerine bağlıdır. Konuşmanın bölümlerini belirtmeden), lemmatizasyon iyi performans göstermeyebilir ve aradığınız sonucu alamayabilirsiniz.
  • Stemming'den daha yavaştır ama daha güçlüdür. Lemmatizasyon, kelimeler üzerinde gerçekleştirmek için bir algoritma izlemediğinden ve konuşmanın bölümlerini sağlama ihtiyacından dolayı, gövdeye göre daha yavaş kabul edilir. Ancak, sonuçlar için sözlük tabanlı sözcükleri kullanması açısından daha güçlüdür. 
  • Kök kelimeyi aramada daha yüksek doğruluğa sahiptir. Lemmatizasyon, çekimli bir kelimeden sonuçları düzenlerken sözlük tabanlı kelimeler kullandığından, doğru çıktılar alma şansınız daha yüksek olacaktır.

Python'da Lemmatizasyona Hazırlık Aşaması

Lemmatizasyonu uygulamaya geçmeden önce, Word kitaplığını textblob'dan içe aktararak başlayalım .

Python'da Lemmatizasyon |  Başlangıç ​​Kılavuzu

Daha sonra bir word nesnesi oluşturacağız. 

Python'da Lemmatizasyon |  Başlangıç ​​Kılavuzu

Word nesnesi oluşturmak için w adında bir değişken oluşturduk . Ardından, ahtapot kelimesinin çoğul hali olan ahtapot kelime nesnemizi içeren Word kütüphanesini sakladık . Word kitaplığını kullanarak bir öğeyi iletirken, o öğeyi tek tırnak içine almanın önemli olduğunu unutmayın.

Az önce oluşturduğumuz word nesnesini tutup tutmadığını görmek için w değişkenini başlatalım .

Python'da Lemmatizasyon |  Başlangıç ​​Kılavuzu

w değişkenini çalıştırdıktan sonra , sonuç olarak kelime nesnesi ahtapotunu elde ederiz.

Python'da Lemmatizasyonu Uygulamak

Ardından, .lemmatize işlevini kullanarak lemmatizasyon uygulayacağız . 

Python'da Lemmatizasyon |  Başlangıç ​​Kılavuzu

Bu adımda, kelime nesnesi ahtapotunu tutan w değişkenini kullandık ve lemmatize etmek için .lemmatize fonksiyonunu kullandık . Sonuç olarak, ahtapot kelimesinin kök veya temel şekli olan ahtapot kelimesini aldık .

Bundan sonra, better kelimesiyle lemmatizasyon yapmayı deneyelim .

Python'da Lemmatizasyon |  Başlangıç ​​Kılavuzu

Önceki örnekte, kelime nesnemizi ahtapottan better olarak güncelledik . Daha sonra .lemmatize fonksiyonu ile lemmatize ettik . Böylece elde ettiğimiz sonuç, kullandığımız kelime nesnesi ile aynıdır.

.lemmatize işlevini kullanırken, konuşmanın bir bölümünden geçerek sözcükleştirme şeklini değiştirebilirsiniz. Örnek olarak, konuşma bölümlerinde sıfat anlamına gelen .lemmatize işlevine  a'yı aktarmayı deneyelim .

Python'da Lemmatizasyon |  Başlangıç ​​Kılavuzu

.lemmatize işlevine konuşmanın bir bölümünü ekledikten sonra, sonuç olarak temel kelimeyi iyi hale getirebiliyoruz .

Word nesnemizi yeniden run olarak değiştirelim . Ayrıca konuşmanın .lemmatize işlevine aktaracağımız kısmını fiil anlamına gelen v olarak değiştirelim.

Python'da Lemmatizasyon |  Başlangıç ​​Kılavuzu

Değişiklikleri yaptıktan ve .lemmatize fonksiyonunu başlattıktan sonra, sonuç olarak çalışan kelimenin kök kelimesini aldık . Lemmatize edicilerin çoğu, az önce .lemmatize işlevini kullanırken yaptığımız yöntemleri gerçekleştirme yeteneğine sahip değildir.

Bununla birlikte, .lemmatize işlevi, bir kelimenin temel biçimini elde etmek için Python'da belirli türde metin analizi gerçekleştirirken kullanılacak önemli bir araçtır .


LuckyTemplates'da Python Komut Dosyası Nasıl Kullanılır
Python'da Örnek Veri Kümeleri Nasıl Yüklenir
Python Kullanıcı Tanımlı İşlevler | Genel Bakış

Çözüm

Kısaca, Python'da lemmatizasyonun kullanımını ve nasıl çalıştığını anlayabiliyoruz . Lemmatize etmenin kök salmaya olan benzerliğini ve farklılıklarını da tartıştık . Ayrıca Word kitaplığını ve .lemmatize işlevini nasıl kullanacağımızı kullanarak bir sözcük nesnesi oluşturabiliyoruz .

Ayrıca, .lemmatize işlevinde konuşmanın farklı bölümlerini nasıl uygulayacağımızı öğrendik. Günlük metin analizi görevlerinizde lemmatizasyon uygulamak, belirli bir kelimenin temel kelimesini aramak için harcadığınız zamanı ve çabayı azaltmanıza büyük ölçüde yardımcı olacaktır.

Herşey gönlünce olsun,

Gaellim

Leave a Comment

Excel Hücrelerini Metne Sığdırma: 4 Kolay Çözüm

Excel Hücrelerini Metne Sığdırma: 4 Kolay Çözüm

Excel hücrelerini metne sığdırmak için güncel bilgileri ve 4 kolay çözümü keşfedin.

Bir Excel Dosyasının Boyutu Nasıl Küçültülür – 6 Etkili Yöntem

Bir Excel Dosyasının Boyutu Nasıl Küçültülür – 6 Etkili Yöntem

Bir Excel Dosyasının Boyutunu Küçültmek için 6 Etkili Yöntem. Hızlı ve kolay yöntemler ile verilerinizi kaybetmeden yer açın.

Pythonda Self Nedir: Gerçek Dünyadan Örnekler

Pythonda Self Nedir: Gerçek Dünyadan Örnekler

Python'da Self Nedir: Gerçek Dünyadan Örnekler

Rde Bir RDS Dosyası Nasıl Kaydedilir ve Yüklenir

Rde Bir RDS Dosyası Nasıl Kaydedilir ve Yüklenir

R'de bir .rds dosyasındaki nesneleri nasıl kaydedeceğinizi ve yükleyeceğinizi öğreneceksiniz. Bu blog aynı zamanda R'den LuckyTemplates'a nesnelerin nasıl içe aktarılacağını da ele alacaktır.

İlk N İş Günü Tekrar Ziyaret Edildi – Bir DAX Kodlama Dili Çözümü

İlk N İş Günü Tekrar Ziyaret Edildi – Bir DAX Kodlama Dili Çözümü

Bu DAX kodlama dili eğitiminde, GENERATE işlevinin nasıl kullanılacağını ve bir ölçü başlığının dinamik olarak nasıl değiştirileceğini öğrenin.

LuckyTemplatesda Çok İş Parçacıklı Dinamik Görsel Tekniği Kullanarak Öngörüleri Sergileyin

LuckyTemplatesda Çok İş Parçacıklı Dinamik Görsel Tekniği Kullanarak Öngörüleri Sergileyin

Bu eğitici, raporlarınızdaki dinamik veri görselleştirmelerinden içgörüler oluşturmak için Çok Kanallı Dinamik Görseller tekniğinin nasıl kullanılacağını kapsayacaktır.

LuckyTemplatesda İçeriği Filtrelemeye Giriş

LuckyTemplatesda İçeriği Filtrelemeye Giriş

Bu yazıda, filtre bağlamından geçeceğim. Filtre bağlamı, herhangi bir LuckyTemplates kullanıcısının başlangıçta öğrenmesi gereken en önemli konulardan biridir.

LuckyTemplates Çevrimiçi Hizmetindeki Uygulamaları Kullanmak İçin En İyi İpuçları

LuckyTemplates Çevrimiçi Hizmetindeki Uygulamaları Kullanmak İçin En İyi İpuçları

LuckyTemplates Apps çevrimiçi hizmetinin çeşitli kaynaklardan oluşturulan farklı raporların ve içgörülerin yönetilmesine nasıl yardımcı olabileceğini göstermek istiyorum.

Fazla Mesai Kâr Marjı Değişikliklerini Analiz Edin - LuckyTemplates ve DAX ile Analitik

Fazla Mesai Kâr Marjı Değişikliklerini Analiz Edin - LuckyTemplates ve DAX ile Analitik

LuckyTemplates'da ölçü dallandırma ve DAX formüllerini birleştirme gibi teknikleri kullanarak kâr marjı değişikliklerinizi nasıl hesaplayacağınızı öğrenin.

DAX Studioda Veri Önbellekleri İçin Materyalleştirme Fikirleri

DAX Studioda Veri Önbellekleri İçin Materyalleştirme Fikirleri

Bu öğreticide, veri önbelleklerini gerçekleştirme fikirleri ve bunların DAX'ın sonuç sağlama performansını nasıl etkilediği tartışılacaktır.