什麼是 Python 中的自我:真實世界的例子
什麼是 Python 中的自我:真實世界的例子
在本教程中,我們將討論Python中的詞形還原,這是一種用於將單詞的不同元素組合在一起的方法。詞形還原還旨在減少詞的變形,並專注於提供詞的詞根或基本形式,這就是詞引理的意思。
目錄
詞形還原與詞乾化
詞形還原類似於詞幹提取,它也可以減少單詞的變形。唯一的區別是詞形還原使用基於字典的單詞作為結果。
另一方面,詞幹提取只會從變形詞中刪除詞綴,這可能會導致不存在的詞。
例如,如果我們對單詞studies使用詞幹提取,它會將單詞studi作為輸出,因為它旨在從單詞studies中刪除後綴es。
另一方面,如果使用詞形還原,則將給出單詞研究,因為它側重於提供單詞的基本形式。
使用詞形還原時要考慮的事項
Python 中詞形還原的準備階段
在我們繼續實施詞形還原之前,讓我們首先從textblob導入Word庫。
之後,我們將創建一個單詞對象。
為了創建一個單詞對象,我們創建了一個名為w的變量。然後我們存儲了包含單詞對象的單詞庫,即octopi,即章魚一詞的複數形式。 請注意,在使用 Word 庫傳遞元素時,用單引號將該元素括起來很重要。
讓我們初始化變量w以查看它是否包含我們剛剛創建的單詞對象。
執行w變量後,我們得到了單詞對象octopi作為結果。
在 Python 中實現詞形還原
接下來,我們將使用.lemmatize函數來實現詞形還原。
在此步驟中,我們使用了保存單詞對象octopi的w變量,並利用.lemmatize函數應用詞形還原。結果,我們得到了octopus這個詞,它是octopi這個詞的詞根或基本形式。
之後,讓我們嘗試對單詞better應用詞形還原。
在前面的示例中,我們將 word 對像從octopi更新為better。然後我們用.lemmatize函數對它進行詞形還原。因此,我們得到的結果與我們使用的單詞對象相同。
在使用 .lemmatize 函數時,您可以通過傳入詞性來改變其詞形還原的方式。例如,讓我們嘗試將a傳遞給 .lemmatize 函數,它代表詞性中的形容詞。
將詞性添加到 .lemmatize 函數後,我們能夠得到好的基本詞作為結果。
讓我們再次將 word 對象更改為running。我們還將傳遞給 .lemmatize 函數的詞性更改為代表動詞的v 。
進行更改並初始化 .lemmatize 函數後,我們得到了 running 作為結果運行的單詞的詞根。大多數詞形還原器無法執行我們剛剛使用 .lemmatize 函數執行的方法。
但是,在 Python 中執行某些類型的文本分析以獲取單詞的基本形式時,.lemmatize 函數是一個非常有用的工具。
如何在 LuckyTemplates 中使用 Python 腳本
如何在 Python 中加載樣本數據集
Python 用戶定義函數 | 概述
結論
簡而言之,我們能夠理解詞形還原在Python中的用法及其工作原理。我們也討論了詞乾化與詞乾化的相似點和不同點。我們還能夠使用Word庫以及如何使用.lemmatize函數創建一個 word 對象。
此外,我們還學習瞭如何在 .lemmatize 函數中應用不同的詞性。在日常文本分析任務中實施詞形還原將極大地幫助您減少搜索特定詞的基本詞的時間和精力。
一切順利,
蓋林
什麼是 Python 中的自我:真實世界的例子
您將學習如何在 R 中保存和加載 .rds 文件中的對象。本博客還將介紹如何將對像從 R 導入 LuckyTemplates。
在此 DAX 編碼語言教程中,了解如何使用 GENERATE 函數以及如何動態更改度量標題。
本教程將介紹如何使用多線程動態可視化技術從報告中的動態數據可視化中創建見解。
在本文中,我將貫穿過濾器上下文。篩選上下文是任何 LuckyTemplates 用戶最初應該了解的主要主題之一。
我想展示 LuckyTemplates Apps 在線服務如何幫助管理從各種來源生成的不同報告和見解。
了解如何在 LuckyTemplates 中使用度量分支和組合 DAX 公式等技術計算利潤率變化。
本教程將討論數據緩存物化的想法,以及它們如何影響 DAX 在提供結果時的性能。
如果直到現在你還在使用 Excel,那麼現在是開始使用 LuckyTemplates 來滿足你的業務報告需求的最佳時機。
什麼是 LuckyTemplates 網關?所有你必須知道的